À propos de cette page
Ce cours de spécialité mathématiques en terminale sur « Tests statistiques » suit le programme officiel de spécialité mathématiques de terminale. Il présente les définitions, les propriétés et les méthodes essentielles, accompagnées d'exemples résolus pour bien comprendre. Au programme : Vocabulaire d'un test statistique : hypothèses et décision, Risque de première espèce et niveau de signification, Intervalle de fluctuation asymptotique au seuil de 95 %, Test de conformité sur une proportion (bilatéral). Chaque notion est expliquée pas à pas, puis mise en pratique grâce à des exercices interactifs, un QCM et une évaluation corrigée. Idéal pour réviser à son rythme, combler ses lacunes et progresser, en autonomie ou avec un professeur. Cours rédigé par un professeur particulier à Marseille pour aider les élèves de terminale à réussir en spécialité mathématiques.
Au programme
1 · Vocabulaire d'un test statistique : hypothèses et décision
2 · Risque de première espèce et niveau de signification
3 · Intervalle de fluctuation asymptotique au seuil de 95 %
4 · Test de conformité sur une proportion (bilatéral)
5 · Test unilatéral sur une proportion
6 · Intervalle de confiance pour une proportion
7 · Démarche complète d'un test statistique
1Vocabulaire d'un test statistique : hypothèses et décision
Un test statistique est une méthode qui permet de prendre une décision fondée sur des données, tout en maîtrisant le risque de se tromper. L'idée est de confronter une observation à un modèle probabiliste.
Définitions fondamentales.- Hypothèse nulle $H_0$ : hypothèse que l'on cherche à tester (souvent un modèle de référence, ex. « la proportion est $p_0$ »).
- Hypothèse alternative $H_1$ : ce que l'on conclut si $H_0$ est rejetée.
- Statistique de test : la grandeur calculée sur l'échantillon (souvent la fréquence observée $f$).
- Zone de rejet (zone critique) : ensemble des valeurs de la statistique de test qui conduisent à rejeter $H_0$.
- Zone d'acceptation : valeurs pour lesquelles on ne rejette pas $H_0$.
Exemple introductif. On veut tester si une pièce de monnaie est équilibrée. On pose :
$H_0$ : la pièce est équilibrée ($p = 0{,}5$)
$H_1$ : la pièce n'est pas équilibrée ($p \ne 0{,}5$)
On lance la pièce 100 fois et on observe la fréquence de « pile ». Si cette fréquence est trop loin de 0,5, on rejette $H_0$.
Attention ! « Ne pas rejeter $H_0$ » ne signifie pas « $H_0$ est vraie ». Cela signifie seulement que les données ne fournissent pas assez de preuves pour la rejeter.
2Risque de première espèce et niveau de signification
Lorsqu'on décide de rejeter ou d'accepter $H_0$, on peut commettre deux types d'erreurs.
| Décision \ Réalité | $H_0$ vraie | $H_0$ fausse |
|---|
| On rejette $H_0$ | Erreur de 1re espèce (fausse alarme) | Bonne décision |
| On ne rejette pas $H_0$ | Bonne décision | Erreur de 2e espèce (faux négatif) |
Définition — Risque de première espèce. Le risque de première espèce, noté $\alpha$, est la probabilité de rejeter $H_0$ alors qu'elle est vraie :$$\alpha = P(\text{rejeter }H_0 \mid H_0 \text{ vraie})$$On fixe $\alpha$ avant de faire le test. En général, $\alpha = 5\%$ (ou parfois 1 %).
Astuce. Le niveau de signification $\alpha$ est le « budget erreur » que l'on s'autorise. Plus $\alpha$ est petit, plus on est prudent avant de rejeter $H_0$, mais plus il est difficile de détecter une différence réelle (risque de 2e espèce augmente).
3Intervalle de fluctuation asymptotique au seuil de 95 %
Considérons une variable aléatoire $X \sim \mathcal{B}(n, p)$ et la fréquence observée $F_n = X/n$. Pour $n$ grand, par le théorème central limite, $F_n$ est approximativement normale.
Intervalle de fluctuation au seuil de 95 %. Si $n \ge 30$, $np \ge 5$ et $n(1-p) \ge 5$, alors avec une probabilité d'au moins 95 % :$$F_n \in \left[p - \frac{1}{\sqrt{n}}\,;\, p + \frac{1}{\sqrt{n}}\right]$$C'est l'intervalle de fluctuation (ou de confiance de la loi binomiale) au seuil de 95 %.
Pourquoi $1/\sqrt{n}$ ? On approche par $\mathcal{N}(p, p(1-p)/n)$. L'écart-type de $F_n$ est $\sqrt{p(1-p)/n} \le \frac{1}{2\sqrt{n}}$. La règle des $2\sigma$ donne un demi-intervalle $\le \frac{2}{2\sqrt{n}} = \frac{1}{\sqrt{n}}$. C'est une majoration conservative valable quel que soit $p$.
Exemple. On teste un médicament sur $n = 400$ patients. Sous $H_0$, le taux de guérison est $p = 0{,}7$.
Intervalle de fluctuation : $\left[0{,}7 - \frac{1}{20}\,;\, 0{,}7 + \frac{1}{20}\right] = [0{,}65\,;\, 0{,}75]$.
Si la fréquence observée est $f = 0{,}78$, elle est hors de l'intervalle : on rejette $H_0$ au seuil de 5 %.
4Test de conformité sur une proportion (bilatéral)
Le test de conformité (ou test bilatéral) vérifie si une proportion observée est compatible avec une valeur de référence $p_0$.
Test bilatéral au seuil $\alpha = 5\%$.- Hypothèses : $H_0 : p = p_0$ contre $H_1 : p \ne p_0$.
- Calcul : On observe $f$ sur un échantillon de taille $n$.
- Règle de décision :
Si $f \notin \left[p_0 - \frac{1}{\sqrt{n}}\,;\, p_0 + \frac{1}{\sqrt{n}}\right]$ → on rejette $H_0$.
Sinon → on ne rejette pas $H_0$.
Exemple. Un fabricant annonce que 60 % de ses produits sont de catégorie A. On contrôle un lot de $n = 100$ produits et on trouve $f = 0{,}52$.
$H_0$ : $p = 0{,}6$ ; $H_1$ : $p \ne 0{,}6$.
Intervalle de fluctuation : $[0{,}6 - 0{,}1\,;\, 0{,}6 + 0{,}1] = [0{,}5\,;\, 0{,}7]$.
$f = 0{,}52 \in [0{,}5\,;\, 0{,}7]$ → on ne rejette pas $H_0$ au seuil de 5 %.
Attention ! Le risque de première espèce signifie que, même si $H_0$ est vraie, on la rejetera par erreur dans 5 % des cas. C'est inévitable.
5Test unilatéral sur une proportion
Parfois, on ne cherche à détecter qu'une déviation dans un seul sens (augmentation ou diminution). On utilise alors un test unilatéral.
Test unilatéral à droite au seuil $\alpha = 5\%$.- Hypothèses : $H_0 : p = p_0$ contre $H_1 : p > p_0$.
- Zone de rejet : on rejette $H_0$ si $f > p_0 + \frac{1}{\sqrt{n}}$ (approximation conservatrice).
Astuce — Unilatéral vs bilatéral. Pour un test bilatéral au seuil 5 %, chaque queue a 2,5 % de risque. Pour un test unilatéral au seuil 5 %, toute la zone de rejet est d'un côté (5 %). Le test unilatéral est donc plus « sensible » dans la direction testée.
| Type | $H_1$ | Zone de rejet (approx.) |
|---|
| Bilatéral | $p \ne p_0$ | $f < p_0 - \frac{1}{\sqrt{n}}$ ou $f > p_0 + \frac{1}{\sqrt{n}}$ |
| Unilatéral gauche | $p < p_0$ | $f < p_0 - \frac{1}{\sqrt{n}}$ |
| Unilatéral droit | $p > p_0$ | $f > p_0 + \frac{1}{\sqrt{n}}$ |
Exemple. Un directeur pense que moins de 50 % des élèves réussissent un test. Il interroge $n = 64$ élèves et trouve $f = 0{,}41$.
$H_0 : p = 0{,}5$ ; $H_1 : p < 0{,}5$.
Seuil à gauche : $0{,}5 - \frac{1}{8} = 0{,}375$. Comme $f = 0{,}41 > 0{,}375$, on ne rejette pas $H_0$.
6Intervalle de confiance pour une proportion
Jusqu'ici, $p$ était connu (test de conformité). Dans la pratique, $p$ est inconnu et on souhaite l'estimer à partir d'un échantillon. On construit alors un intervalle de confiance.
Intervalle de confiance au niveau 95 %. Si $n \ge 30$, $nf \ge 5$ et $n(1-f) \ge 5$, alors l'intervalle :$$I_c = \left[f - \frac{1}{\sqrt{n}}\,;\, f + \frac{1}{\sqrt{n}}\right]$$est un intervalle de confiance au niveau 95 % pour $p$. C'est-à-dire : dans 95 % des échantillons, $I_c$ contient la vraie valeur $p$.
Attention ! Interprétation correcte. « L'intervalle de confiance contient $p$ avec probabilité 95 % » signifie que la méthode, répétée de nombreuses fois, produit des intervalles qui capturent $p$ dans 95 % des cas. Pour un intervalle donné, $p$ est soit dedans, soit dehors (pas de probabilité pour un intervalle fixé).
Exemple. Dans un sondage de $n = 900$ personnes, 54 % sont favorables à une réforme ($f = 0{,}54$).
$I_c = \left[0{,}54 - \frac{1}{30}\,;\, 0{,}54 + \frac{1}{30}\right] \approx [0{,}507\,;\, 0{,}573]$.
On estime que la proportion favorable dans la population est dans $[50{,}7\%\,;\, 57{,}3\%]$ avec 95 % de confiance.
7Démarche complète d'un test statistique
Voici la méthode à appliquer systématiquement lors d'un test statistique au baccalauréat.
Méthode en 5 étapes.- Modélisation : Identifier la variable aléatoire, la loi, la taille $n$ de l'échantillon.
- Hypothèses : Énoncer clairement $H_0$ (avec la valeur $p_0$) et $H_1$ (bilatérale ou unilatérale).
- Zone de rejet : Calculer l'intervalle de fluctuation $\left[p_0 - \frac{1}{\sqrt{n}}\,;\, p_0 + \frac{1}{\sqrt{n}}\right]$.
- Observation : Calculer la fréquence observée $f = k/n$ où $k$ est le nombre de succès.
- Conclusion : Si $f$ est dans l'intervalle → on ne rejette pas $H_0$ ; sinon → on rejette $H_0$ au seuil de 5 %.
Exemple complet. Un vaccin avait un taux d'efficacité de 80 %. Un nouveau lot est testé sur $n = 200$ patients ; 152 sont protégés.
Étape 1 : $X \sim \mathcal{B}(200, p)$.
Étape 2 : $H_0 : p = 0{,}8$ ; $H_1 : p \ne 0{,}8$.
Étape 3 : $\left[0{,}8 - \frac{1}{\sqrt{200}}\,;\, 0{,}8 + \frac{1}{\sqrt{200}}\right] \approx [0{,}729\,;\, 0{,}871]$.
Étape 4 : $f = 152/200 = 0{,}76$.
Étape 5 : $0{,}76 \in [0{,}729\,;\, 0{,}871]$ → on ne rejette pas $H_0$. Le lot est conforme au niveau 5 %.
★À retenir
En bref :• Un
test statistique confronte une observation à un modèle : $H_0$ (hypothèse nulle) vs $H_1$ (hypothèse alternative).
• Le
risque de première espèce $\alpha$ est la proba de rejeter $H_0$ à tort, souvent fixé à 5 %.
•
Intervalle de fluctuation au seuil 95 % : $\left[p_0-\frac{1}{\sqrt{n}}\,;\, p_0+\frac{1}{\sqrt{n}}\right]$ — si $f$ en sort, on rejette $H_0$.
•
Test bilatéral : $H_1: p\ne p_0$ (zone de rejet des deux côtés) ;
test unilatéral : $H_1: p>p_0$ ou $H_1: p
• Intervalle de confiance (estimation) : $\left[f-\frac{1}{\sqrt{n}}\,;\, f+\frac{1}{\sqrt{n}}\right]$ — permet d'estimer $p$ inconnu.