Passer au contenu principal

Série d'exercices : Concentration, loi des grands nombres

Exercice 1

$20 %$ des habitants d'un pays sont atteints par un virus $C$ .

$1000$ personnes rentrent dans une salle de spectacle.

La population du pays est suffisamment importante pour assimiler l'entrée de chaque personne à un tirage aléatoire avec remise.

Soit $S$ la variable aléatoire comptant le nombre de personnes malades obtenus sur les $1000$ personnes.

  1. Montrer à l'aide de l'inégalité de Bienaymé-Tchebychev que : $p(174<S<226) \geq 076$, .

  2. Calculer directement $p(174<S<226)$ et vérifier le résultat précédent.

  3. L'inégalité de Bienaymé-Tchebychev est-elle optimale?

Exercice 2

Une élection oppose deux candidats A et B. Soit $p$ la proportion d'électeurs, dans la population totale, décidés à voter pour le candidat A.
On souhaite estimer cette proportion $p$ inconnue .
On effectue un sondage auprès de $n$ personnes. On suppose que chaque personne interrogée donne son intention réelle de vote.
La population est suffisamment importante pour assimiler le choix de chaque personne à un tirage aléatoire avec remise.
On note $X_{i}$ la variable aléatoire qui vaut 1 si la i-ème personne interrogée vote pour A, et 0 sinon. Soit la moyenne : $M_{n}=\frac{X_{1}+X_{2}+\ldots+X_{n}}{n}$.

  1. Montrer que, pour tout $p$ dans $[0 ; 1]$, on a : $p(1-p) \leq \frac{1}{4}$

  2. De quelle nature sont chacune des $X_{i}$ ? Donner leur espérance et leur variance.

  3. Montrer à l'aide de l'inégalité de concentration que : pour tout réel $\delta$ strictement positif, on a : $p\left(M_{n}-\delta<p<M_{n}+\delta\right) \geq 1-\frac{1}{4 n \delta^{2}}$.
    Si $f$ est la valeur prise par $M_{n}$ lors du sondage, on dit alors que l'intervalle $I=] f-\delta ; f+\delta[$ est un intervalle de confiance pour $p$ au niveau de confiance supérieur ou égal à $1-\frac{1}{4 n \delta^{2}}$

  4. Le sondage auprès de $n=1000$ personnes donne une fréquence de votants pour A égale à $55 %$. Un intervalle de confiance pour $p$ est alors $] 0,55-\delta ; 0,55+\delta[$.
    On veut que cet intervalle de confiance se trouve à un niveau supérieur ou égal à 0,95 . Montrer qu'il suffit que $\delta \geq a$ avec $a \approx 0,0707$.

  5. On prend $\delta=0,071$. Donner alors l'intervalle de confiance de $p$ au niveau supérieur ou égal à 0,95 . Peut-on affirmer que $p$ est strictement supérieur à $50 %$ avec un niveau de confiance supérieur à 0,95 ?

  6. Le candidat A souhaite que l'amplitude de l'intervalle de confiance au seuil de 0,95 soit de $4 %$ maximum. Combien de personnes doit-on interroger au minimum ?

Exercice 3

Une variable aléatoire X suit la loi binomiale de paramètres $n=500$ et $p=0,7$

  1. Montrer à l'aide de l'inégalité de Bienaymé-Tchebychev que : $p(|X-350| \geq 21) \leq 0,24$.

  2. Déterminer la valeur de $p(|X-350| \geq 21)$ arrondie à 0,001 près.

  3. Écrire en Python une fonction Lbin() qui renvoie une liste de 0 et de 1 simulant une succession de 500 expériences de Bernoulli de paramètre $p=0,7$. On notera que la fonction Lbin() renvoie donc un échantillon de taille 500 associé à la loi de Bernoulli de paramètre 0,7 .

  4. Compléter le programme précédent par une fonction simul( n ) qui produit n échantillons de taille 500 associés à la loi de Bernoulli de paramètre 0,7 . Si $x$ est le nombre de 1 dans l'échantillon courant, alors la fonction simul(n) doit retourner la fréquence d'échantillons qui vérifient $|x-350| \geq 21$.

  5. Candide a obtenu l'affichage suivant :
    $\operatorname{simul}(10) = 0.0$
    $\operatorname{simul}(100) = 0.05$
    $\operatorname{simul}(1000) = 0.035$
    $\operatorname{simul}(10000) = 0.0435$
    $\operatorname{simul}(100000) = 0.04419$
    Quel résultat bien connu ces nombres semblent-ils confirmer ?
    Soyez précis dans vos explications...

Exercice 4

Un virus infecte une partie de la population. On appelle $p$ la proportion de la population porteuse du virus. Plusieurs articles affirment que $32 %$ de la population est atteinte.
Un institut est chargé de vérifier la validité de cette affirmation.
L'institut veut donc déterminer si l'hypothèse « $p=0,32$ » est vraie. $n$ personnes sont testées successivement.
On considère que les tests sont indépendants et parfaitement fiables.
Soit $f$ la fréquence de malades parmi les $n$ personnes.

  1. Supposons que la proposition « $p=0,32$ » soit vraie.
    Soit $M_{n}$ la variable aléatoire donnant la fréquence de malades parmi les $n$ personnes. Montrer à l'aide de l'inégalité de concentration que : $p\left(0,28<M_{n}<0,36\right) \geq 1-\frac{136}{n}$.

  2. Compte tenu du résultat précédent, combien de personnes suffit-il de tester pour que l'on ait l'inégalité : $p\left(0,28<M_{n}<0,36\right) \geq 0,95$.

  3. L'institut teste 2800 personnes, et il constate que 700 sont malades.
    En s'appuyant sur le résultat obtenu au 2 ., l'institut déclare alors que l'affirmation « $32 %$ de la population est atteinte» est fausse.
    Donner un majorant du risque que l'institut se trompe.

  4. Déterminer une valeur précise du risque d'erreur de l'institut (arrondie à $10^{-6}$ près).

  5. L'institut se rend compte qu'une erreur s'est produite lors de la transmission des données de l'étude.
    L'échantillon testé ne contenait pas 700 malades, mais 900 malades.
    L'institut publie alors le communiqué suivant. «Au seuil de $95 %$, nous ne pouvons pas affirmer que les articles qui prétendent que $32 %$ de la population est infectée sont faux». Déterminer la valeur de $p(848 \leq B \leq 944)$, arrondie à 0,001 près, où B est la binomiale de paramètres $n=2800$ et $p=0,32$.
    Expliquer l'affirmation de l'institut.
    Connaît-on la probabilité d'accepter à tort l'hypothèse que $p=32 %$ ?