testování Hypotéz je forma statistického usuzování, která používá data ze vzorku vyvodit závěry o populaci parametr nebo populace, rozdělení pravděpodobnosti. Za prvé, předběžný předpoklad je o parametru nebo distribuci. Tento předpoklad se nazývá nulová hypotéza a je označen H0. Poté je definována alternativní hypotéza (označená Ha), která je opakem toho, co je uvedeno v nulové hypotéze., Postup testování hypotéz zahrnuje použití vzorových dat k určení, zda lze H0 odmítnout. Pokud je H0 odmítnut, statistický závěr je, že alternativní hypotéza Ha je pravdivá.
například předpokládejme, že rozhlasová stanice vybírá hudbu, kterou hraje, na základě předpokladu, že průměrný věk posluchače je 30 let. K určení, zda je tento předpoklad platný, by mohl být proveden test hypotézy s nulovou hypotézou danou jako H0: μ = 30 a alternativní hypotézou uvedenou jako Ha: μ ≠ 30., Na základě vzorku jednotlivců z posluchače, vzorek průměrný věk, x, lze vypočítat a použít k určení, zda existuje dostatek statistických důkazů k odmítnutí H0. Koncepčně je hodnota vzorku, která je “ blízká „30, v souladu s nulovou hypotézou, zatímco hodnota vzorku znamená, že“ není blízko “ 30, poskytuje podporu alternativní hypotéze. To, co je považováno za „blízké“ a „nezavřené“, je určeno použitím distribuce vzorkování x.,
V ideálním případě postup testování hypotéz vede k přijetí H0, pokud je H0 pravdivý, a odmítnutí H0, pokud je H0 nepravdivý. Bohužel, protože testy hypotéz jsou založeny na vzorových informacích, je třeba zvážit možnost chyb. Chyba typu I odpovídá odmítnutí H0, když je H0 skutečně pravdivý, a chyba typu II odpovídá přijetí H0, když je H0 nepravdivý. Pravděpodobnost chyby typu I je označena α a pravděpodobnost chyby typu II je označena β.,
Při použití hypotéza-testování postup k určení, pokud nulová hypotéza by měla být zamítnuta, osoba provádějící test hypotézy určuje maximální přípustnou pravděpodobnost tvorby chyb I. typu, tzv. hladina významnosti pro test. Společné volby pro úroveň významu jsou α = 0,05 a α = 0,01. Ačkoli většina aplikací testování hypotéz řídí pravděpodobnost chyby typu I, ne vždy řídí pravděpodobnost chyby typu II., Graf známý jako křivka provozní charakteristiky může být konstruován tak, aby ukázal, jak změny velikosti vzorku ovlivňují pravděpodobnost chyby typu II.
koncept známý jako hodnota p poskytuje vhodný základ pro vyvozování závěrů v aplikacích testování hypotéz. Hodnota p je měřítkem toho, jak pravděpodobné jsou výsledky vzorku, za předpokladu, že je pravdivá nulová hypotéza; čím menší je hodnota p, tím menší je pravděpodobnost výsledků vzorku. Pokud je hodnota p menší než α, lze nulovou hypotézu odmítnout; v opačném případě nelze nulovou hypotézu odmítnout., Hodnota p se často nazývá pozorovaná úroveň významnosti testu.
test hypotézy lze provést na parametrech jedné nebo více populací, stejně jako v různých jiných situacích. V každém případě proces začíná formulací nulových a alternativních hypotéz o populaci. Kromě populačního průměru jsou k dispozici postupy testování hypotéz pro populační parametry, jako jsou proporce, odchylky, standardní odchylky a mediány.,
Hypotéza testy jsou také prováděny v regresní a korelační analýza k určení, zda regresní vztah a koeficient korelace jsou statisticky významné (viz níže Regresní a korelační analýza). Dobro-of-fit test odkazuje na hypotézu testu, ve kterém nulová hypotéza je, že populace má určité rozdělení pravděpodobnosti, jako je normální rozdělení pravděpodobnosti. Neparametrické statistické metody zahrnují také řadu postupů testování hypotéz.