← Retour aux ressources
Maths complémentaires (option Tle) · Classe de Terminale

Échantillonnage et estimation

Intervalles de confiance et fluctuation d'échantillonnage — programme officiel Terminale générale (option Maths complémentaires)

À propos de cette page
Ce cours de maths complémentaires (option tle) en terminale sur « Échantillonnage et estimation » suit le programme officiel de maths complémentaires (option tle) de terminale. Il présente les définitions, les propriétés et les méthodes essentielles, accompagnées d'exemples résolus pour bien comprendre. Au programme : Population, échantillon et proportion, Fluctuation d'échantillonnage, Loi des grands nombres et convergence, Intervalle de fluctuation à 95 %. Chaque notion est expliquée pas à pas, puis mise en pratique grâce à des exercices interactifs, un QCM et une évaluation corrigée. Idéal pour réviser à son rythme, combler ses lacunes et progresser, en autonomie ou avec un professeur. Cours rédigé par un professeur particulier à Marseille pour aider les élèves de terminale à réussir en maths complémentaires (option tle).
Au programme
1 · Population, échantillon et proportion
2 · Fluctuation d'échantillonnage
3 · Loi des grands nombres et convergence
4 · Intervalle de fluctuation à 95 %
5 · Intervalle de confiance à 95 %
6 · Utilisation de la loi normale dans l'estimation
7 · Taille de l'échantillon et précision
1Population, échantillon et proportion

En statistiques inférentielles, on cherche à tirer des conclusions sur une population entière à partir de l'observation d'une partie de cette population appelée échantillon.

Définitions.
  • Population : ensemble de tous les individus étudiés.
  • Caractère étudié : propriété mesurée sur chaque individu (ex. : être gaucher ou non).
  • Proportion (ou fréquence) $p$ : proportion vraie d'individus ayant la propriété dans la population entière. Cette valeur est souvent inconnue.
  • Échantillon de taille $n$ : groupe de $n$ individus tirés au hasard dans la population.
  • Fréquence observée $f$ : proportion d'individus ayant la propriété dans l'échantillon ; $f$ est une estimation de $p$.
Exemple. On souhaite estimer la proportion $p$ de lycéens pratiquant un sport chaque semaine en France. On interroge un échantillon de $n = 400$ lycéens et on trouve $120$ sportifs. La fréquence observée est $f = \frac{120}{400} = 0{,}30$, soit $30\,\%$. On dit que $f = 0{,}30$ est une estimation de $p$.
Astuce. Plus l'échantillon est grand, plus la fréquence observée $f$ sera proche de la vraie proportion $p$. C'est l'idée centrale de tout ce chapitre.
2Fluctuation d'échantillonnage

Si l'on prélève plusieurs échantillons de même taille $n$ dans la même population, les fréquences observées $f_1, f_2, f_3, \ldots$ varient d'un échantillon à l'autre. Ce phénomène est appelé fluctuation d'échantillonnage.

Définition. La fluctuation d'échantillonnage est la variabilité des fréquences observées d'un échantillon à l'autre, due au hasard du tirage.

On modélise la fréquence observée $f$ comme la réalisation d'une variable aléatoire $F$ (variable fréquence d'échantillonnage). Si chaque individu est tiré indépendamment avec une probabilité $p$ d'avoir la propriété, alors le nombre $X$ d'individus ayant la propriété dans l'échantillon suit une loi binomiale $\mathcal{B}(n, p)$ et $F = \frac{X}{n}$.

On a alors :

Espérance$E(F) = p$
Variance$V(F) = \frac{p(1-p)}{n}$
Écart-type$\sigma(F) = \sqrt{\frac{p(1-p)}{n}}$
Exemple. Avec $p = 0{,}5$ et $n = 100$, l'écart-type de $F$ est $\sigma(F) = \sqrt{\frac{0{,}5 \times 0{,}5}{100}} = \frac{0{,}5}{10} = 0{,}05$. La fréquence observée fluctue typiquement de $\pm 5\,\%$ autour de $p$.
3Loi des grands nombres et convergence

La loi des grands nombres garantit que, lorsque la taille de l'échantillon $n$ tend vers l'infini, la fréquence observée $F$ converge en probabilité vers la vraie proportion $p$.

Loi des grands nombres (version intuitive). Pour tout $\varepsilon > 0$, $$P(|F - p| > \varepsilon) \to 0 \quad \text{quand } n \to +\infty.$$

En pratique, plus $n$ est grand, plus on peut être sûr que $f$ est proche de $p$. Cette convergence justifie l'usage des sondages : un échantillon suffisamment grand fournit une bonne estimation de la réalité.

Attention ! La loi des grands nombres ne dit PAS que la fréquence observée sera exactement égale à $p$ pour un tirage donné. Elle dit seulement que la probabilité d'un grand écart devient très faible quand $n$ est grand.
Astuce. On peut retenir que l'écart-type $\sigma(F) = \sqrt{\frac{p(1-p)}{n}}$ diminue comme $\frac{1}{\sqrt{n}}$ : pour diviser la dispersion par 2, il faut multiplier la taille de l'échantillon par 4.
4Intervalle de fluctuation à 95 %

L'intervalle de fluctuation à 95 % est l'intervalle dans lequel tombe la fréquence observée $F$ avec une probabilité d'au moins $95\,\%$, lorsqu'on connaît la vraie proportion $p$.

Théorème (programme Tle). Si $n \geq 30$ et si $0{,}05 \leq p \leq 0{,}95$, alors $$P\!\left(p - \frac{1}{\sqrt{n}} \leq F \leq p + \frac{1}{\sqrt{n}}\right) \geq 0{,}95.$$
L'intervalle $\left[p - \frac{1}{\sqrt{n}}\;,\; p + \frac{1}{\sqrt{n}}\right]$ est l'intervalle de fluctuation à 95 % de la fréquence $F$.
Exemple. Un sondage affirme que $p = 0{,}4$ des Français aiment le café. Pour un échantillon de $n = 100$ personnes, l'intervalle de fluctuation à 95 % est $$\left[0{,}4 - \frac{1}{\sqrt{100}}\;,\; 0{,}4 + \frac{1}{\sqrt{100}}\right] = [0{,}4 - 0{,}1\;,\; 0{,}4 + 0{,}1] = [0{,}30\;,\; 0{,}50].$$ Si le sondage donne une fréquence hors de cet intervalle, on a des raisons de douter de la valeur $p = 0{,}4$.
Attention ! L'intervalle de fluctuation suppose que $p$ est connue. On s'en sert pour tester si une valeur supposée de $p$ est cohérente avec les données observées. À ne pas confondre avec l'intervalle de confiance, qui suppose que $p$ est inconnue.
5Intervalle de confiance à 95 %

En pratique, la vraie proportion $p$ est inconnue. On dispose seulement d'un échantillon de taille $n$ avec une fréquence observée $f$. On construit alors un intervalle de confiance pour estimer $p$.

Intervalle de confiance à 95 %. Pour $n \geq 30$ et $f \notin \{0, 1\}$, l'intervalle $$I_c = \left[f - \frac{1}{\sqrt{n}}\;,\; f + \frac{1}{\sqrt{n}}\right]$$est un intervalle de confiance à 95 % pour $p$ : si l'on répétait l'opération un très grand nombre de fois, environ $95\,\%$ des intervalles ainsi construits contiendraient la vraie valeur $p$.
À retenir. La demi-largeur de l'intervalle de confiance est $\frac{1}{\sqrt{n}}$. C'est la marge d'erreur de l'estimation. Par exemple, pour $n = 1\,600$, la marge d'erreur est $\frac{1}{\sqrt{1600}} = \frac{1}{40} = 0{,}025$ soit $2{,}5\,\%$.
Exemple. Dans un sondage, on interroge $n = 400$ personnes et on trouve que $f = 0{,}52$ soutiennent une mesure. L'intervalle de confiance à 95 % est $$I_c = \left[0{,}52 - \frac{1}{\sqrt{400}}\;,\; 0{,}52 + \frac{1}{\sqrt{400}}\right] = [0{,}52 - 0{,}05\;,\; 0{,}52 + 0{,}05] = [0{,}47\;,\; 0{,}57].$$On estime donc que la vraie proportion $p$ est comprise entre 47 % et 57 % avec une confiance de 95 %.
Attention ! L'intervalle de confiance à 95 % ne signifie PAS que $p$ appartient à $I_c$ avec une probabilité de 95 %. La vraie proportion $p$ est une constante (pas une variable aléatoire) ; c'est l'intervalle $I_c$ qui est aléatoire.
6Utilisation de la loi normale dans l'estimation

Par le théorème central limite, lorsque $n$ est grand, la fréquence $F = X/n$ suit approximativement une loi normale :

Approximation normale. Pour $n$ grand (en pratique $n \geq 30$) et $0{,}05 \leq p \leq 0{,}95$ : $$F \approx \mathcal{N}\!\left(p, \frac{p(1-p)}{n}\right),$$ et en particulier la variable centrée réduite $$Z = \frac{F - p}{\sqrt{p(1-p)/n}} \approx \mathcal{N}(0, 1).$$

On utilise alors les propriétés de la loi normale centrée réduite $\mathcal{N}(0,1)$ :

$P(-1{,}96 \leq Z \leq 1{,}96) \approx 0{,}95$Intervalle de confiance à 95 %
$P(-2{,}58 \leq Z \leq 2{,}58) \approx 0{,}99$Intervalle de confiance à 99 %

Le programme de Tle simplifie en remplaçant $1{,}96$ par 2 (approximation $\frac{1}{\sqrt{n}} \approx \frac{1{,}96 \sigma}{\sqrt{n}}$ pour $p$ pas trop proche de 0 ou 1). Cette simplification aboutit à la formule $f \pm \frac{1}{\sqrt{n}}$ vue ci-dessus.

Astuce. Pour un intervalle de confiance à 99 %, on utilisera $f \pm \frac{2{,}58}{\sqrt{n(p(1-p))}}$ (non exigé au lycée, mais utile à connaître).
7Taille de l'échantillon et précision

Un problème pratique fréquent : quelle taille $n$ choisir pour obtenir une marge d'erreur inférieure à un seuil $\varepsilon$ donné ?

Méthode. La marge d'erreur de l'intervalle de confiance à 95 % est $\frac{1}{\sqrt{n}}$. Pour avoir une marge $\leq \varepsilon$, on résout $$\frac{1}{\sqrt{n}} \leq \varepsilon \iff \sqrt{n} \geq \frac{1}{\varepsilon} \iff n \geq \frac{1}{\varepsilon^2}.$$
Exemple. Pour une marge d'erreur inférieure à $3\,\%$ (soit $\varepsilon = 0{,}03$) : $$n \geq \frac{1}{(0{,}03)^2} = \frac{1}{0{,}0009} \approx 1\,111.$$ Il faut donc au moins $1\,112$ personnes dans l'échantillon.
Exemple 2.
  • Marge $\leq 5\,\%$ : $n \geq \frac{1}{0{,}05^2} = 400$
  • Marge $\leq 2\,\%$ : $n \geq \frac{1}{0{,}02^2} = 2\,500$
  • Marge $\leq 1\,\%$ : $n \geq \frac{1}{0{,}01^2} = 10\,000$
Attention ! Diviser la marge d'erreur par 2 impose de multiplier la taille de l'échantillon par 4 (et non par 2). La précision s'améliore très lentement : améliorer un sondage coûte cher !
À retenir
En bref :
• La fréquence observée $f$ dans un échantillon de taille $n$ est une estimation de la vraie proportion $p$.
• La fluctuation d'échantillonnage est inévitable ; elle diminue quand $n$ augmente.
Intervalle de fluctuation (p connue) : $\left[p - \frac{1}{\sqrt{n}}\;,\; p + \frac{1}{\sqrt{n}}\right]$ contient $f$ avec probabilité $\geq 95\,\%$.
Intervalle de confiance (p inconnue) : $\left[f - \frac{1}{\sqrt{n}}\;,\; f + \frac{1}{\sqrt{n}}\right]$ contient $p$ « dans 95 % des cas ».
• Pour une marge d'erreur $\leq \varepsilon$, il faut $n \geq \frac{1}{\varepsilon^2}$.
Continuer ce chapitre
Autres chapitres
Bloqué sur ce chapitre ?

Cours particuliers de maths complémentaires (option tle) à Marseille, en présentiel ou à distance — un prof qui s'adapte à ton rythme et reprend ce qui coince.

Réserver un 1er cours → Voir les tarifs