Hypotese-test er en form for statistisk inferens, der bruger data fra en stikprøve til at drage konklusioner om en befolkning parameter eller en befolkning sandsynlighedsfordeling. For det første foretages en foreløbig antagelse om parameteren eller distributionen. Denne antagelse kaldes nulhypotesen og betegnes med H0. En alternativ hypotese (betegnet Ha), som er det modsatte af det, der er angivet i nulhypotesen, defineres derefter., Hypotesetestproceduren involverer anvendelse af prøvedata til at bestemme, om H0 kan afvises eller ej. Hvis H0 afvises, er den statistiske konklusion, at den alternative hypotese Ha er sand.Antag for eksempel, at en radiostation vælger den musik, den spiller, baseret på antagelsen om, at gennemsnitsalderen for dets lyttepublikum er 30 år. For at afgøre, om denne antagelse er gyldig, kunne en hypotesetest udføres med nulhypotesen givet som H0: = = 30 og den alternative hypotese givet som Ha: 30 30 30., Baseret på en prøve af individer fra det lyttende publikum, prøven middelalder, can, kan beregnes og bruges til at bestemme, om der er tilstrækkelig statistisk bevis for at afvise H0. Begrebsmæssigt er en værdi af prøvemidlet, der er “tæt” på 30, i overensstemmelse med nulhypotesen, mens en værdi af prøvemidlet, der er “ikke tæt” på 30, understøtter den alternative hypotese. Hvad der betragtes som “tæt” og “ikke tæt” bestemmes ved hjælp af prøveudtagningsfordelingen af..,
ideelt set fører hypotesetestproceduren til accept af H0, når H0 er sand, og afvisningen af H0, når H0 er falsk. Desværre, da hypotesetest er baseret på prøveinformation, skal muligheden for fejl overvejes. En type i-fejl svarer til at afvise H0, når H0 faktisk er sandt, og en type II-fejl svarer til at acceptere H0, når H0 er falsk. Sandsynligheden for at lave en type i-fejl betegnes med α, og sandsynligheden for at lave en type II-fejl betegnes med β.,
Ved brug af hypotesetestproceduren for at bestemme, om nulhypotesen skal afvises, specificerer den person, der udfører hypotesetesten, den maksimale tilladte Sandsynlighed for at lave en type i-fejl, kaldet niveauet af betydning for testen. Fælles valg for niveauet af betydning er α = 0,05 og 0 = 0,01. Selvom de fleste anvendelser af hypotesetestning kontrollerer sandsynligheden for at lave en type i-fejl, kontrollerer de ikke altid sandsynligheden for at lave en type II-fejl., En graf kendt som en driftskarakteristisk kurve kan konstrueres for at vise, hvordan ændringer i prøvestørrelsen påvirker sandsynligheden for at lave en type II-fejl.
et koncept kendt som p-værdi giver et praktisk grundlag for at drage konklusioner i hypotese-test applikationer. P-værdien er et mål for, hvor sandsynligt prøveresultaterne er, forudsat at nulhypotesen er sand; jo mindre p-værdien er, desto mindre sandsynligt er prøveresultaterne. Hvis p-værdien er mindre end α, kan nulhypotesen afvises; ellers kan nulhypotesen ikke afvises., P-værdien kaldes ofte det observerede niveau af betydning for testen.
en hypotesetest kan udføres på parametre for en eller flere populationer såvel som i en række andre situationer. I hvert tilfælde begynder processen med formulering af null og alternative hypoteser om befolkningen. Ud over den gennemsnitlige befolkning, hypotese-testprocedurer er tilgængelige for populationsparametre såsom proportioner, afvigelser, standardafvigelser, og medianer.,
hypotesetest udføres også i Regressions-og korrelationsanalyse for at bestemme, om regressionsforholdet og korrelationskoefficienten er statistisk signifikante (se nedenfor Regressions-og korrelationsanalyse). En godhed-of-fit-test refererer til en hypotesetest, hvor nulhypotesen er, at befolkningen har en specifik sandsynlighedsfordeling, såsom en normal sandsynlighedsfordeling. Ikke-parametriske statistiske metoder involverer også en række hypotesetestprocedurer.