Testarea ipotezelor este o formă de inferență statistică care utilizează date dintr-un eșantion pentru a trage concluzii despre un parametru al populației sau o distribuție a probabilității populației. În primul rând, se face o presupunere tentativă despre parametru sau distribuție. Această ipoteză se numește ipoteza nulă și este notată cu H0. O ipoteză alternativă (notată Ha), care este opusul a ceea ce este declarat în ipoteza nulă, este apoi definită., Procedura de testare a ipotezelor implică utilizarea datelor de probă pentru a determina dacă H0 poate fi respins sau nu. Dacă H0 este respins, concluzia statistică este că ipoteza alternativă Ha este adevărată.de exemplu, să presupunem că un post de radio selectează muzica pe care o redă pe baza presupunerii că vârsta medie a publicului său de ascultare este de 30 de ani. Pentru a determina dacă această ipoteză este valabilă, s-ar putea efectua un test de ipoteză cu ipoteza nulă dată ca H0: μ = 30 și ipoteza alternativă dată ca Ha: μ ≠ 30., Pe baza unui eșantion de persoane din publicul care ascultă, vârsta medie a eșantionului, x, poate fi calculată și utilizată pentru a determina dacă există suficiente dovezi statistice pentru a respinge H0. Conceptual, o valoare a eșantionului înseamnă că este ” aproape „de 30 este în concordanță cu ipoteza nulă, în timp ce o valoare a eșantionului înseamnă că este” nu aproape ” de 30 oferă suport pentru ipoteza alternativă. Ceea ce este considerat „aproape” și „nu aproape” este determinat prin utilizarea distribuției de eșantionare a lui x.,în mod ideal, procedura de testare a ipotezelor duce la acceptarea H0 atunci când H0 este adevărat și respingerea H0 atunci când H0 este fals. Din păcate, deoarece testele de ipoteză se bazează pe informații de probă, trebuie luată în considerare posibilitatea erorilor. O eroare de tip I corespunde respingerii H0 atunci când H0 este de fapt adevărat, iar o eroare de tip II corespunde acceptării H0 atunci când H0 este fals. Probabilitatea de a face o eroare de tip I este notată cu α, iar probabilitatea de a face o eroare de tip II este notată cu β.,în utilizarea procedurii de testare a ipotezelor pentru a determina dacă ipoteza nulă ar trebui respinsă, persoana care efectuează testul de ipoteză specifică probabilitatea maximă admisibilă de a face o eroare de tip I, numită nivelul de semnificație pentru test. Opțiunile comune pentru nivelul de semnificație sunt α = 0,05 și α = 0,01. Deși majoritatea aplicațiilor de testare a ipotezelor controlează probabilitatea de a face o eroare de tip I, ele nu controlează întotdeauna probabilitatea de a face o eroare de tip II., Un grafic cunoscut ca o curbă caracteristică de operare poate fi construit pentru a arăta modul în care modificările dimensiunii eșantionului afectează probabilitatea de a face o eroare de tip II.
un concept cunoscut sub numele de valoarea p oferă o bază convenabilă pentru a trage concluzii în aplicațiile de testare a ipotezelor. Valoarea p este o măsură a probabilității rezultatelor eșantionului, presupunând că ipoteza nulă este adevărată; cu cât valoarea p este mai mică, cu atât rezultatele eșantionului sunt mai puțin probabile. Dacă valoarea p este mai mică decât α, ipoteza nulă poate fi respinsă; în caz contrar, ipoteza nulă nu poate fi respinsă., Valoarea p este adesea numită nivelul de semnificație observat pentru test.un test de ipoteză poate fi efectuat pe parametrii uneia sau mai multor populații, precum și într-o varietate de alte situații. În fiecare caz, procesul începe cu formularea unor ipoteze nule și alternative despre populație. În plus față de media populației, procedurile de testare a ipotezelor sunt disponibile pentru parametrii populației, cum ar fi proporțiile, variațiile, abaterile standard și mediile.,
testele de ipoteză sunt, de asemenea, efectuate în analiza de regresie și corelație pentru a determina dacă relația de regresie și coeficientul de corelație sunt semnificative statistic (vezi mai jos regresia și analiza de corelație). Un test de bunătate se referă la un test de ipoteză în care ipoteza nulă este că populația are o distribuție de probabilitate specifică, cum ar fi o distribuție normală de probabilitate. Metodele statistice neparametrice implică, de asemenea, o varietate de proceduri de testare a ipotezelor.