Test de Shapiro-Wilk

Test de Shapiro-Wilk
Type
Nommé en référence à
Formule

En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].

Théorie

La statistique de test est:

  • x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
  • est la moyenne de l'échantillon;
  • la constante ai est donnée par [2]

et sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.

Pour conclure, est alors comparé à une table[3].

Interprétation

Sachant que l'hypothèse nulle est que la population est normalement distribuée,

  • si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
  • si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.

Voir aussi Q-Q plot ou droite de Henry.

Mise en œuvre

  • shapiro.test() avec R.

Voir aussi

Références

  1. (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, nos 3-4,‎ , p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709).
  2. Shapiro et Wilk 1965, p. 593.
  3. Shapiro et Wilk 1965, p. 605.

Liens externes