Hromadný jev – skutečnosti, které se opakovaně vyskytují v masovém měřítku (obvykle minimálně 30 záznamů); hromadné jevy vlastnostmi převažují individuální a náhodné
Statistický soubor – množina prvků se stanovenými vlastnostmi (množina osob)
Rozsah statistického souboru – počet jednotek statistického souboru (značení – n, N)
- Základní soubor – všechny jednotky předmětem zkoumání, značíme N (populace)
- Výběrový soubor – vzorek ze základního souboru, značíme n (výběr)
Statistická jednotka – prvek statistického souboru, individuální nositel vlastností
Statistický znak – označení určité vlastnosti jednotky statistického souboru (stáří, váha)
Hodnota statistického znaku (pozorování) – míra dané vlastnosti / znaku u každé jednotky
Odměna (varianta) statistického znaku – hodnota ve smyslu vyjádření stupně dané vlastnosti
Způsob vyjádření
- slovní (kategoriální, kvalitativní)
- číselné (numerické, kvantitativní)
Typ vztahů mezi obměnami a hodnotami proměnné
- nominální (jmenné) – nelze hierarchicky uspořádat (pohlaví, jméno)
- ordinální (pořadové) – slovní i číselné, možné hierarchicky uspořádat (dosažené vzdělání, hodnost)
- metrické (měřitelné) – vždy číselné, lze je porovnávat, mohou být záporné (teplota, zisk)
- kardinální (stěžejní) – metrické proměnné, pouze kladné hodnoty (věk, výška)
Počet variant, kterých proměnné nabývají
- alternativní – nabývají pouze dvou obměn
- množné – nabývají více než dvou obměn
Počet hodnot, kterých proměnné nabývají
- diskrétní (nespojité) – nabývají mnoho hodnot intervalu (počet dětí v rodině)
- spojité (kontinuální) – nabývají všech hodnot z intervalu (spotřeba elektrické energie, příjem…)
Tabulka intervalového rozdělení četností – pro zpracování diskrétní proměnné s obměnami nebo spojité proměnné
Druhy grafů
- polygon četností – spojnicový graf, vhodný pro znázornění prostého rozdělení četností
- histogram četností – sloupkový graf, vhodný pro znázornění intervalového rozdělení četností
- výsečový graf – piechart, vhodný pro znázornění četností nominální proměnné
- sloupkový graf – barchart, vhodný pro znázornění četností nominální proměnné
- stem-and-leaf graf – vhodný pro znázornění numerické proměnné s velkým množstvím obměn
- krabicový graf – vhodný pro znázornění extrémních hodnot a kvartilů, určení numerického znaku ve dvou či více souborech
Bodový odhad – nahrazení neznámé hodnoty parametru základního souboru, vhodnost odhadů posuzujeme podle jeho vlastností
Vlastnosti bodového odhadu
- nevychýlenost (nezkreslenost)
- konzistence
- vydatnost
- výběrová charakteristika má být tzv. postačující
Intervalový odhad – konstrukce náhodného intervalu
Testové kritérium (t) – vhodná charakteristika, která má při platnosti H0 známé pravděpodobné rozdělení
Kritický obor (W) – tvořen hodnotami testového kritéria, které jsou při platnosti H0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá
Obor přijetí (V) – je tvořen všemi hodnotami testového kritéria mimo kritický obor
Hladina významnosti α (pravděpodobnost chyby I. druhu) – sýčkování, pravděpodobnost že nezamítneme H0 ačkoliv platí
β (pravděpodobnost chyby II. druhu) – pravděpodobnost, že nezamítneme H0 ačkoliv neplatí
Síla testu (1 – β) – pravděpodobnost správného zamítnutí H0
Test dobré shody – k ověření shody mezi teoretickým a empirickým rozdělením, použitelný pouze pro velké výběry
Podle vlastnosti rozdělení, kterou popisují, rozeznáváme:
- charakteristiky polohy
- charakteristiky jsou funkcí všech hodnot
- aritmetický průměr (prostý / vážený)
- harmonický průměr (prostý / vážený)
- geometrický průměr (prostý / vážený)
- kvadratický průměr (prostý / vážený)
- charakteristiky nejsou funkcí všech hodnot
- modus
- kvantily
- médián
- tercily, kvartily, kvintily, sextily, septily, oktávily, nonily, decily, percentily
- charakteristiky jsou funkcí všech hodnot
- charakteristiky variability
- míry absolutní variability
- ff
- míry absolutní variability
- charakteristiky šikmosti
- charakteristiky špičatosti