Fonction de répartition empirique

100 visualisations d'une fonction de distribution empirique, générées à l'aide de JavaScript

En statistiques, une fonction de répartition empirique est une fonction de répartition qui attribue la probabilité 1/n à chacun des n nombres dans un échantillon.

Soit X1,...,Xn un échantillon de variables iid définies sur un espace de probabilité , à valeurs dans , avec pour fonction de répartition F. La fonction de répartition empirique de l'échantillon est définie par :

est la fonction indicatrice de l'événement A.

Pour chaque ω, l'application est une fonction en escalier, fonction de répartition de la loi de probabilité uniforme sur l'ensemble .

Pour chaque x, la variable aléatoire est une variable aléatoire de Bernoulli, de paramètre p=F(x). Par conséquent, la variable aléatoire , qu'on notera , est distribuée selon une loi binomiale, avec pour moyenne nF(x) et pour variance nF(x)(1 − F(x)). En particulier, Fn(x) est un estimateur non-biaisé de F(x).

Propriétés asymptotiques

pour tout x, presque sûrement.
converge en loi vers une loi normale pour un x fixé.
Le théorème de Berry–Esseen procure le taux de convergence.
presque sûrement.
L' inégalité de Dvoretzky-Kiefer-Wolfowitz procure le taux de convergence.
converge en distribution vers la distribution de Kolmogorov, à condition que F soit continue.
Le test de Kolmogorov-Smirnov de goodness-of-fit est basé sur ce fait.
, en tant que processus indexé par x, converge faiblement dans vers un pont brownien B(F(x)).

Bibliographie

  • (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics, , 998 p. (ISBN 978-0-89871-684-9 et 0-89871-684-5, lire en ligne)
  • van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. (ISBN 0-387-94640-3).