Il test di ipotesi è una forma di inferenza statistica che utilizza i dati di un campione per trarre conclusioni su un parametro di popolazione o una distribuzione di probabilità di popolazione. Innanzitutto, viene fatta un’ipotesi provvisoria sul parametro o sulla distribuzione. Questa ipotesi è chiamata ipotesi nulla ed è indicata con H0. Viene quindi definita un’ipotesi alternativa (indicata Ha), che è l’opposto di quanto affermato nell’ipotesi nulla., La procedura di test di ipotesi prevede l’utilizzo di dati di esempio per determinare se H0 può essere rifiutato o meno. Se H0 viene rifiutato, la conclusione statistica è che l’ipotesi alternativa Ha è vera.
Ad esempio, supponiamo che una stazione radio selezioni la musica che riproduce in base al presupposto che l’età media del suo pubblico di ascolto sia di 30 anni. Per determinare se questa ipotesi è valida, un test di ipotesi potrebbe essere condotto con l’ipotesi nulla data come H0: μ = 30 e l’ipotesi alternativa data come Ha: μ 3 30., Sulla base di un campione di individui del pubblico in ascolto, l’età media del campione, x, può essere calcolata e utilizzata per determinare se vi sono prove statistiche sufficienti per rifiutare H0. Concettualmente, un valore della media del campione che è “vicino “a 30 è coerente con l’ipotesi nulla, mentre un valore della media del campione che è” non vicino” a 30 fornisce supporto per l’ipotesi alternativa. Ciò che è considerato “vicino” e “non vicino” è determinato utilizzando la distribuzione di campionamento di x.,
Idealmente, la procedura di test di ipotesi porta all’accettazione di H0 quando H0 è vero e al rifiuto di H0 quando H0 è falso. Sfortunatamente, poiché i test di ipotesi si basano su informazioni di esempio, è necessario considerare la possibilità di errori. Un errore di tipo I corrisponde al rifiuto di H0 quando H0 è effettivamente vero e un errore di tipo II corrisponde all’accettazione di H0 quando H0 è falso. La probabilità di commettere un errore di tipo I è indicata da α e la probabilità di commettere un errore di tipo II è indicata da β.,
Nell’utilizzare la procedura di test di ipotesi per determinare se l’ipotesi nulla deve essere respinta, la persona che conduce il test di ipotesi specifica la probabilità massima consentita di commettere un errore di tipo I, chiamato livello di significatività per il test. Le scelte comuni per il livello di significatività sono α = 0,05 e α = 0,01. Sebbene la maggior parte delle applicazioni di test di ipotesi controllino la probabilità di commettere un errore di tipo I, non sempre controllano la probabilità di commettere un errore di tipo II., Un grafico noto come curva caratteristica di funzionamento può essere costruito per mostrare come i cambiamenti nella dimensione del campione influenzano la probabilità di commettere un errore di tipo II.
Un concetto noto come p-value fornisce una base conveniente per trarre conclusioni in applicazioni di test di ipotesi. Il valore p è una misura della probabilità dei risultati del campione, supponendo che l’ipotesi nulla sia vera; più piccolo è il valore p, meno probabile è il risultato del campione. Se il valore p è inferiore a α, l’ipotesi nulla può essere respinta; altrimenti, l’ipotesi nulla non può essere respinta., Il valore p è spesso chiamato il livello di significatività osservato per il test.
Un test di ipotesi può essere eseguito su parametri di una o più popolazioni e in una varietà di altre situazioni. In ogni caso, il processo inizia con la formulazione di ipotesi nulle e alternative sulla popolazione. Oltre alla media della popolazione, sono disponibili procedure di test di ipotesi per parametri di popolazione come proporzioni, varianze, deviazioni standard e mediane.,
I test di ipotesi sono condotti anche nell’analisi di regressione e correlazione per determinare se la relazione di regressione e il coefficiente di correlazione sono statisticamente significativi (vedi sotto Analisi di regressione e correlazione). Un test di bontà di adattamento si riferisce a un test di ipotesi in cui l’ipotesi nulla è che la popolazione ha una distribuzione di probabilità specifica, come una distribuzione di probabilità normale. I metodi statistici non parametrici comportano anche una varietà di procedure di test di ipotesi.