Concentration, loi des grands nombres
Inégalité de Bienaymé-Tchebychev
Soit $X$ une variable aléatoire d'espérance $μ$ (mu) et de variance $V(X)$
Si $δ$ (delta) est un réel strictement positif, alors on a:
$p(|X-μ|≥δ)≤{V(X)}/{δ^2}$
Exemple 1
Jean possède un dé équilibré.
Soit X la variable aléatoire de Bernoulli valant 1 si le résultat du lancer est 3, et valant 0 dans les autres cas.
Montrons à l'aide de l'inégalité de Bienaymé-Tchebychev que: : $p(|X-{1}/{6}|≥0,55)≤0,46$
X est la variable aléatoire de Bernoulli de paramètre $p={1}/{6}$.
On a donc : $E(X)=p={1}/{6}$ et $V(X)=p(1-p)={5}/{36}$
Donc, d'après l'inégalité de Bienaymé-Tchebychev, on a, pour tout $δ$ réel strictement positif: : $p(|X-{1}/{6}|≥δ)≤{{5}/{36}}/{δ^2}$
Soit, en posant $δ=0,55$: $p(|X-{1}/{6}|≥0,55)≤{{5}/{36}}/{0,55^2}$
Or: ${{5}/{36}}/{0,55^2}≈0,459$, et ce nombre est inférieur à 0,46.
Et donc: $p(|X-{1}/{6}|≥0,55)≤0,46$ c.q.f.d.
On notera que $|X-{1}/{6}|≥0,55$ signifie que $X≤{1}/{6}-0,55$ ou ${1}/{6}+0,55≤X$.
Et comme ${1}/{6}-0,55≈-0,38$ et ${1}/{6}+0,55≈0,72$, cela signifie que X prend la valeur 1, ce qui arrive avec une probabilité de ${1}/{6}≈0,17$. Cette valeur est nettement plus faible que 0,46
Par conséquent, la majoration obtenue par l'inégalité de Bienaymé-Tchebychev n'est pas optimale!
Exemple 2
Jean possède un dé équilibré.
Soit S la variable aléatoire comptant le nombre de 3 obtenus sur 600 lancers.
Montrer à l'aide de l'inégalité de Bienaymé-Tchebychev que: : $p(80$<$S$<$120)≥0,79$
Calculer directement $p(80$<$S$<$120)$ et vérifier le résultat précédent.
Corrigé
Les lancers étant indépendants, la variable aléatoire S suit la loi binomiale de paramètres $n=600$ et $p={1}/{6}$.
On a alors: $μ=E(S)=n×p=600×{1}/{6}=100$ et $V(S)=n×p×(1-p)=600×{1}/{6}×{5}/{6}={250}/{3}≈83,33$
Par ailleurs, on note que: : $80$<$S$<$120$ $ ⇔$ $|S-100|$<$20$
Or, d'après l'inégalité de Bienaymé-Tchebychev, on a: : $p(|S-μ|≥δ)≤{V(S)}/{δ^2}$
Soit, en posant $δ=20$: $p(|S-100|≥20)≤{{250}/{3}}/{20^2}$
Et donc: $p(|S-100|≥20)≤0,21$
Et par là: $p(|S-100|$<$20)≥1-0,21$
Soit: $p(80$<$S$<$120)≥0,79$ c.q.f.d.
On calcule directement: $p(80$<$S$<$120)= p(S≤119)-p(S≤80)≈0,982-0,014≈0,97$
Le résultat est largement supérieur à 0,79.
On constate que l'inégalité de Bienaymé-Tchebychev n'est pas optimale!
Inégalité de concentration
Soit $X$ une variable aléatoire d'espérance $μ$ (mu) et de variance $V(X)$
Soit ($X_1$, $X_2$,...,$X_n$) un échantillon de la loi de probabilité de la variable aléatoire X.
Soit la moyenne: $M_n={S_n}/{n}$
Si $δ$ (delta) est un réel strictement positif, alors on a:
$p(|M_n-μ|≥δ)≤{V(X)}/{nδ^2}$
Exemple
Jean possède un dé équilibré.
Soit $M_n$ la variable aléatoire donnant la moyenne des résultats obtenus sur $n$ lancers.
On sait que $E(X)=3,5$ et que $V(X)={17,5}/{6}$
Déterminer, à l'aide de l'inégalité de concentration, la taille $n$ de l'échantillon pour que:
$p(|M_n-3,5|$<$1)≥0,95$
Corrigé
D'après l'inégalité de concentration avec $δ=1$, on a: : $p(|M_n-3,5|≥1)≤{{17,5}/{6}}/{n×1^2}$
D'où: : $1-p(|M_n-3,5|≥1)≥1-{17,5}/{6n}$
Soit: : $p(|M_n-3,5|$<$1)≥1-{17,5}/{6n}$
Donc, pour obtenir : $p(|M_n-3,5|$<$1)≥0,95$, il suffit que : $1-{17,5}/{6n}≥0,95$
Soit: : $0,05≥{17,5}/{6n}$
Soit: : $n≥{17,5}/{6×0,05}$
Et comme ${17,5}/{6×0,05}≈58,3$, un échantillon de taille 59 suffit.
Interprétation.
La moyenne espérée des résultats est de 3,5.
Le fait que l'inégalité de concentration $p(|M_n-3,5|$<$1)≥0,95$ soit vérifiée pour $n≥59$ signifie que, si on lance au moins 59 fois le dé, alors la probabilité que la moyenne des résultats soit strictement comprise entre 2,5 et 4,5 vaut au moins 0,95.
Par passage à la limite dans l'inégalité de concentration, on obtient la propriété qui suit...
Loi faible des grands nombres
Soit $X$ une variable aléatoire d'espérance $μ$ (mu) et de variance $V(X)$
Soit ($X_1$, $X_2$,...,$X_n$) un échantillon de la loi de probabilité de la variable aléatoire X.
Soit la moyenne: $M_n={S_n}/{n}$
Si $δ$ (delta) est un réel strictement positif, alors on a:
$\lim↙{n→+∞}p(|M_n-μ|≥δ)=0$