hypotesetesting er en form for statistisk inferens som bruker data fra et utvalg til å trekke slutninger om en populasjon parameter eller en befolkning sannsynlighetsfordeling. Først en foreløpig antakelse er gjort om parameter eller distribusjon. Denne antakelsen er kalt null-hypotesen, og er merket med H0. En alternativ hypotese (Ha merket), som er det motsatte av det som er uttalt i nullhypotesen, er da definert., Den hypotese-testing prosedyren innebærer bruk av eksempel på dataene for å avgjøre hvorvidt eller ikke H0 kan forkastes. Hvis H0 er avvist, er det statistisk konklusjon er at den alternative hypotesen Ha er sant.
For eksempel, anta at en radiokanal, velger musikk, skuespill basert på antagelsen om at den gjennomsnittlige alderen på sin lytter publikum er 30 år. For å avgjøre om denne antakelsen er gyldig, en hypotesetest kan bli utført med nullhypotesen er gitt som H0: μ = 30 og den alternative hypotesen gitt som Ha: μ ≠ 30., Basert på et utvalg av personer fra de lyttende publikum, utvalgsgjennomsnittet alder, x, kan beregnes og brukes til å fastslå om det er tilstrekkelig statistisk bevis for å forkaste H0. Konseptuelt, en verdi av utvalget mener at det er «i nærheten» til 30 er i samsvar med nullhypotesen, mens en verdi av utvalget mener at det er «ikke i nærheten av» 30 gir støtte for den alternative hypotesen. Hva som regnes som «nær» og «ikke i nærheten av» bestemmes ved hjelp av prøvetaking distribusjon av x.,
Ideelt sett hypotese-testing prosedyre fører til aksept av H0 når H0 er sann, og forkaste H0 når H0 er feil. Dessverre, siden hypotese tester er basert på eksempel informasjon, muligheten for feil må være vurdert. En type i feil tilsvarer å forkaste H0 når H0 er faktisk sant, og en type II-feil tilsvarer aksepterer H0 når H0 er feil. Sannsynligheten for å gjøre en type i-feil er merket med α, og sannsynligheten for å gjøre en type II-feil er merket med β.,
I å bruke hypotese-testing prosedyre for å avgjøre om nullhypotesen skal forkastes, den personen som gjennomfører hypotesetest angir maksimalt tillatt sannsynligheten for å gjøre en type i-feil, kalt nivå av betydning for testen. Vanlige valgene for nivået av betydning er α = 0.05 og α = 0.01. Selv om de fleste programmer av hypotesetesting kontroll sannsynligheten for å gjøre en type i-feil, de gjør ikke alltid kontroll sannsynligheten for å gjøre en type II feil., En graf som er kjent som en drifts-karakteristisk kurve kan være konstruert for å vise hvordan endringer i prøven størrelse påvirker sannsynligheten for å gjøre en type II feil.
Et konsept som kalles p-verdien gir en praktisk grunnlag for å trekke konklusjoner i hypotese-testing av applikasjoner. P-verdien er et mål på hvor sannsynlig det er at prøveresultatene er, gitt at nullhypotesen er sann; jo mindre p-verdi, jo mindre sannsynlig er det at prøveresultatene. Hvis p-verdien er mindre enn α, nullhypotesen kan forkastes, ellers nullhypotesen ikke kan forkastes., P-verdien er ofte kalt den observerte nivå av betydning for testen.
En hypotesetest kan utføres på parametere av en eller flere bestander samt i en rekke andre situasjoner. I hvert tilfelle, prosessen begynner med formulering av null og alternative hypoteser om befolkningen. I tillegg til befolkningen mener, hypotese-testing av prosedyrer er tilgjengelige for befolkningen parametere som proporsjoner, avvik, standard avvik, og medians.,
Hypotese tester er også gjennomført i regresjons-og korrelasjonsanalyse for å finne ut om regresjon forhold og korrelasjonskoeffisienten er statistisk signifikante (se nedenfor Regresjons-og korrelasjonsanalyse). En godhet-of-fit test refererer til en hypotese om test der nullhypotesen er at befolkningen har en bestemt sannsynlighetsfordeling, for eksempel en normal sannsynlighetsfordeling. Nonparametric statistiske metoder også innebære en rekke hypotese-testing av prosedyrer.