Hypothesis testing is een vorm van statistische gevolgtrekking die gebruik maakt van gegevens uit een steekproef om conclusies te trekken over een populatie parameter of een populatie kansverdeling. Ten eerste wordt een voorzichtige aanname gemaakt over de parameter of distributie. Deze aanname wordt de nulhypothese genoemd en wordt aangeduid met H0. Een alternatieve hypothese (aangeduid met Ha), die het tegenovergestelde is van wat in de nulhypothese wordt gesteld, wordt dan gedefinieerd., De hypothese-testprocedure omvat het gebruik van steekproefgegevens om te bepalen of H0 al dan niet kan worden afgewezen. Als H0 wordt afgewezen, is de statistische conclusie dat de alternatieve hypothese Ha waar is.neem bijvoorbeeld aan dat een radiostation de muziek selecteert die het speelt op basis van de aanname dat de gemiddelde leeftijd van het luisterpubliek 30 jaar is. Om te bepalen of deze aanname geldig is, zou een hypothese test kunnen worden uitgevoerd met de nulhypothese gegeven als H0: μ = 30 en de alternatieve hypothese gegeven als Ha: μ ≠ 30., Op basis van een steekproef van personen uit het luisterpubliek kan de gemiddelde leeftijd van de steekproef, x, worden berekend en gebruikt om te bepalen of er voldoende statistisch bewijs is om H0 af te wijzen. Conceptueel is een waarde van het steekproefgemiddelde dat “dicht” bij 30 is consistent met de nulhypothese, terwijl een waarde van het steekproefgemiddelde dat “niet dicht” bij 30 is ondersteuning biedt voor de alternatieve hypothese. Wat als “dichtbij” en “niet dichtbij” wordt beschouwd, wordt bepaald aan de hand van de bemonsteringsverdeling van x.,
idealiter leidt de hypothese-testprocedure tot de aanvaarding van H0 wanneer H0 waar is en de afwijzing van H0 wanneer H0 onwaar is. Helaas, aangezien hypothesetests gebaseerd zijn op steekproefinformatie, moet rekening worden gehouden met de mogelijkheid van fouten. Een type I-fout komt overeen met het afwijzen van H0 wanneer H0 eigenlijk waar is, en een type II-fout komt overeen met het accepteren van H0 wanneer H0 onwaar is. De kans op het maken van een type I-fout wordt aangeduid met α, en de kans op het maken van een type II-fout wordt aangeduid met β.,
bij het gebruik van de hypothese-testprocedure om te bepalen of de nulhypothese moet worden afgewezen, specificeert de persoon die de hypothese test uitvoert de maximaal toelaatbare kans op het maken van een type I-fout, het significantieniveau voor de test. Gemeenschappelijke keuzes voor het significantieniveau Zijn α = 0,05 en α = 0,01. Hoewel de meeste toepassingen van hypothesen de kans op het maken van een type I-fout controleren, controleren ze niet altijd de kans op het maken van een type II-fout., Een grafiek die bekend staat als een werkende-karakteristieke kromme kan worden geconstrueerd om te laten zien hoe veranderingen in de steekproefgrootte van invloed zijn op de kans op het maken van een type II fout.
een concept dat bekend staat als de p-waarde biedt een handige basis voor het trekken van conclusies in toepassingen die hypothesen testen. De p-waarde is een maat voor de waarschijnlijkheid van de resultaten van de steekproef, ervan uitgaande dat de nulhypothese waar is; hoe kleiner de p-waarde, hoe minder waarschijnlijk de resultaten van de steekproef zijn. Als de p – waarde kleiner is dan α, kan de nulhypothese worden afgewezen; anders kan de nulhypothese niet worden afgewezen., De p-waarde wordt vaak het waargenomen significantieniveau voor de test genoemd.
een hypothese test kan worden uitgevoerd op parameters van een of meer populaties en in een verscheidenheid van andere situaties. In elk geval begint het proces met de formulering van nul-en alternatieve hypothesen over de bevolking. Naast het populatiegemiddelde zijn er ook hypothesen-testprocedures beschikbaar voor populatieparameters zoals proporties, varianties, standaardafwijkingen en medianen.,
hypothesetests worden ook uitgevoerd in regressie-en correlatieanalyse om te bepalen of de regressierelatie en de correlatiecoëfficiënt statistisch significant zijn (zie hieronder regressie-en correlatieanalyse). Een goodness-of-fit test verwijst naar een hypothese test waarin de nulhypothese is dat de populatie een specifieke kansverdeling heeft, zoals een normale kansverdeling. Niet-parametrische statistische methoden omvatten ook een verscheidenheid van hypothese-testprocedures.