La Spécialité Maths en Terminale

L'essentiel pour le bac

Concentration, loi des grands nombres

A SAVOIR: le cours sur Concentration, loi des grands nombres

Exercice 2

Une élection oppose deux candidats A et B.
Soit $p$ la proportion d'électeurs, dans la population totale, décidés à voter pour le candidat A.
On souhaite estimer cette proportion $p$ inconnue .
On effectue un sondage auprès de $n$ personnes. On suppose que chaque personne interrogée donne son intention réelle de vote.
La population est suffisamment importante pour assimiler le choix de chaque personne à un tirage aléatoire avec remise.
On note $X_i$ la variable aléatoire qui vaut 1 si la i-ème personne interrogée vote pour A, et 0 sinon.
Soit la moyenne: $M_n={X_1+X_2+...+X_n}/{n}$.

  1. Montrer que, pour tout $p$ dans [0;1], on a: $p(1-p)≤{1}/{4}$
  2. De quelle nature sont chacune des $X_i$? Donner leur espérance et leur variance.
  3. Montrer à l'aide de l'inégalité de concentration que:
    pour tout réel $δ$ strictement positif, on a: $p(M_n-δ$<$p$<$M_n+δ)≥1-{1}/{4nδ^2}$
    Si $f$ est la valeur prise par $M_n$ lors du sondage, on dit alors que l'intervalle $I =]f-δ;f+δ[$ est un intervalle de confiance pour $p$ au niveau de confiance supérieur ou égal à $1-{1}/{4nδ^2}$
  4. Le sondage auprès de $n=1 000$ personnes donne une fréquence de votants pour A égale à $55\%$.
    Un intervalle de confiance pour $p$ est alors $]0,55-δ;0,55+δ[$.
    On veut que cet intervalle de confiance se trouve à un niveau supérieur ou égal à $0,95$.
    Montrer qu'il suffit que $δ≥a$ avec $a≈0,0707$.
  5. On prend $δ=0,071$. Donner alors l'intervalle de confiance de $p$ au niveau supérieur ou égal à $0,95$.
    Peut-on affirmer que $p$ est strictement supérieur à $50\%$ avec un niveau de confiance supérieur à 0,95?
  6. Le candidat A souhaite que l'amplitude de l'intervalle de confiance au seuil de 0,95 soit de $4\%$ maximum. Combien de personnes doit-on interroger au minimum?
Solution...
Corrigé
  1. On pose: $f(p)=p(1-p)$.
    On a: $f(p)=p-p^2$. On reconnaît un trinôme du second degré, avec $a=-1$, $b=1$ et $c=0$.
    Son coefficient dominant $a=-1$ est strictement négatif.
    Donc $f$ admet un maximum atteint en $p=-{b}/{2a}=-{1}/{-2}=0,5$.
    Ce maximum est donc égal à $f(0,5)=0,25$
    Par conséquent, pour tout $p$, en particulier dans [0;1], on a: $p(1-p)≤{1}/{4}$

  2. Chacune des $X_i$ suit la loi de Bernoulli de paramètre $p$.
    Appelons X la variable aléatoire qui suit la loi de Bernoulli de paramètre $p$.
    L'espérance cherchée vaut: $E(X)=p×1+(1-p)×0=p$
    La variance cherchée vaut: $V(X)=p×1^2+(1-p)×0^2-E^2=p-p^2=p(1-p)$.

  3. Les choix des personnes étant indépendants, la liste ($X_1$, $X_2$,...,$X_{n}$) est un échantillon aléatoire de taille $n$ de X.
    $M_n$ est alors la variable aléatoire moyenne de l'échantillon.
    Et par là, d'après l'inégalité de concentration, on obtient, pour tout réel $δ$ strictement positif:
    $p(|M_n-p|≥δ)≤{V(X)}/{nδ^2}$
    Soit: $p(|M_n-p|≥δ)≤{p(1-p)}/{nδ^2}$
    Or on a vu au 1. que: $p(1-p)≤{1}/{4}$
    Donc on en déduit que: $p(|M_n-p|≥δ)≤{1}/{4nδ^2}$
    Et, en considérant l'événement contraire:
    $p(M_n-δ$<$p$<$M_n+δ)≥1-{1}/{4nδ^2}$

  4. Le sondage donne $f=55\%$.
    On veut que l'intervalle de confiance pour $p$ $]0,55-δ;0,55+δ[$ soit à un niveau supérieur ou égal à $0,95$.
    Il suffit donc que $1-{1}/{4nδ^2}≥0,95$
    Soit: $1-{1}/{4×1000×δ^2}≥0,95$
    Donc: $0,05≥{1}/{4000×δ^2}$
    Donc: $δ^2≥{1}/{4000×0,05}$
    Soit: $δ^2≥5×10^{-3}$
    Et, comme $δ$ est strictement positif, on obtient: $δ≥√{5×10^{-3}}$
    Or: $√{5×10^{-3}}≈0,07071$
    Donc il suffit que $δ≥a$ avec $a≈0,0707$.

  5. On prend $δ=0,071$.
    L'intervalle de confiance de $p$ est alors: $]0,55-0,071;0,55+0,071[≈]0,479;0,621[$.
    Interprétation: avant de faire le sondage, on sait que, si $f$ est la fréquence de votants pour A dans l'échantillon que l'on va obtenir, alors la probabilité que l'intervalle de confiance $]f-0,071;f+0,071[$ contienne $p$ est d'au moins 0,95.
    Mais, une fois l'échantillon obtenu, la proportion $p$ peut être n'importe où dans cet intervalle de confiance (elle peut même être en dehors).
    Ici, comme $50\%$ est dans l'intervalle de confiance $]0,479;0,621[$, la proportion $p$ peut en particulier être inférieure à $50\%$.
    Et le fait que l'intervalle $]0,479;0,50[$ soit plus petit que $]0,50;0,621[$ n'a aucune importance!
    Donc on ne peut absolument pas affirmer que $p$ est strictement supérieur à $50\%$ avec un niveau de confiance supérieur à 0,95.
    En fait, avec un intervalle qui contient la valeur $50\%$, on ne sait pas si le candidat est plutôt gagnant ou plutôt perdant.
    Le candidat va donc réclamer un sondage sur un plus grand nombre de personnes pour en réduire l'amplitude, espérant ainsi sortir $50\%$ de cet intervalle...

  6. Le candidat A souhaite que l'amplitude de l'intervalle de confiance soit de $4\%$ maximum.
    Donc on doit avoir: $δ≤2\%$
    Or, comme $1-{1}/{4nδ^2}≥0,95$, on a:
    $0,05≥{1}/{4nδ^2}$
    D'où: $n≥{1}/{4×0,05×δ^2}$
    Et comme $δ≤2\%$, on obtient: $n≥{1}/{4×0,05×0,02^2}$
    Soit: $n≥12\,500$
    On doit interroger au minimum 12 500 personnes.
Réduire...


Pour passer à l'exercice suivant, cliquez sur

Copyright 2013 - maths-bac.com - Toute reproduction interdite - Tous droits réservés.