le test D’hypothèse est une forme d’inférence statistique qui utilise les données d’un échantillon pour tirer des conclusions sur un paramètre de population ou une distribution de probabilité de population. Tout d’abord, une hypothèse provisoire est faite sur le paramètre ou la distribution. Cette hypothèse est appelée hypothèse nulle et est notée H0. Une hypothèse alternative (notée Ha), qui est à l’opposé de ce qui est indiqué dans l’hypothèse nulle, est alors définie., La procédure de test d’hypothèse consiste à utiliser des données d’échantillon pour déterminer si H0 peut être rejeté ou non. Si H0 est rejeté, la conclusion statistique est que L’hypothèse alternative Ha est vraie.
par exemple, supposons qu’une station de radio sélectionne la musique qu’elle diffuse en supposant que l’âge moyen de son auditoire est de 30 ans. Pour déterminer si cette hypothèse est valide, un test d’hypothèse pourrait être effectué avec L’hypothèse nulle donnée comme H0: μ = 30 et L’hypothèse alternative donnée comme Ha: μ ≠ 30., Sur la base d’un échantillon de personnes du public d’écoute, l’âge moyen de l’échantillon, x, peut être calculé et utilisé pour déterminer s’il existe suffisamment de preuves statistiques pour rejeter H0. Conceptuellement, une valeur de la moyenne de l’échantillon qui est « proche” de 30 est compatible avec l’hypothèse nulle, alors qu’une valeur de la moyenne de l’échantillon qui n’est pas « la fermer” à 30 fournit un support pour l’hypothèse alternative. Ce qui est considéré comme « proche” et « non proche” est déterminé en utilisant la distribution d’échantillonnage de X.,
idéalement, la procédure de test d’hypothèse conduit à l’acceptation de H0 lorsque H0 est vrai et au rejet de H0 lorsque H0 est faux. Malheureusement, étant donné que les tests d’hypothèse sont basés sur des informations d’échantillon, la possibilité d’erreurs doit être considérée. Une erreur de type I correspond au rejet de H0 lorsque H0 est réellement vrai, et une erreur de type II correspond à l’acceptation de H0 lorsque H0 est faux. La probabilité de commettre une erreur de type I est notée α et la probabilité de commettre une erreur de type II est notée β.,
en utilisant la procédure de test d’hypothèse pour déterminer si l’hypothèse nulle doit être rejetée, la personne qui effectue le test d’hypothèse spécifie la probabilité maximale admissible de commettre une erreur de type I, appelée niveau de signification pour le test. Choix communs pour le niveau de signification sont α = 0,05 et α = 0,01. Bien que la plupart des applications de tests d’hypothèses contrôlent la probabilité de commettre une erreur de type I, elles ne contrôlent pas toujours la probabilité de commettre une erreur de type II., Un graphique connu sous le nom de courbe caractéristique de fonctionnement peut être construit pour montrer comment les changements dans la taille de l’échantillon affectent la probabilité de commettre une erreur de type II.
un concept connu sous le nom de valeur p fournit une base pratique pour tirer des conclusions dans des applications de test d’hypothèses. La valeur p est une mesure de la probabilité des résultats de l’échantillon, en supposant que l’hypothèse nulle est vraie; plus la valeur p est petite, moins les résultats de l’échantillon sont probables. Si la p-valeur est inférieure à α, l’hypothèse nulle peut être rejetée; sinon, l’hypothèse nulle ne peut être rejetée., La valeur p est souvent appelée le niveau de signification observé pour le test.
Un test d’hypothèse peut être effectuée sur les paramètres d’une ou de plusieurs populations, ainsi que dans une variété d’autres situations. Dans chaque cas, le processus commence par la formulation d’hypothèses nulles et alternatives sur la population. En plus de la moyenne de la population, des procédures de test d’hypothèses sont disponibles pour les paramètres de la population tels que les proportions, les variances, les écarts-types et les médianes.,
des tests D’hypothèses sont également effectués en analyse de régression et de corrélation pour déterminer si la relation de régression et le coefficient de corrélation sont statistiquement significatifs (voir ci-dessous analyse de régression et de corrélation). Un test de qualité d’ajustement fait référence à un test d’hypothèse dans lequel l’hypothèse nulle est que la population a une distribution de probabilité spécifique, telle qu’une distribution de probabilité normale. Les méthodes statistiques non paramétriques impliquent également diverses procédures de test d’hypothèses.