À propos de cette page
Ce cours de mathématiques en seconde sur « Statistiques descriptives » suit le programme officiel de mathématiques de seconde. Il présente les définitions, les propriétés et les méthodes essentielles, accompagnées d'exemples résolus pour bien comprendre. Au programme : Population, individu et caractère, Effectifs, fréquences et représentations graphiques, Indicateurs de position : moyenne et médiane, Quartiles et boîte à moustaches. Chaque notion est expliquée pas à pas, puis mise en pratique grâce à des exercices interactifs, un QCM et une évaluation corrigée. Idéal pour réviser à son rythme, combler ses lacunes et progresser, en autonomie ou avec un professeur. Cours rédigé par un professeur particulier à Marseille pour aider les élèves de seconde à réussir en mathématiques.
Au programme
1 · Population, individu et caractère
2 · Effectifs, fréquences et représentations graphiques
3 · Indicateurs de position : moyenne et médiane
4 · Quartiles et boîte à moustaches
5 · Indicateurs de dispersion : étendue, variance et écart-type
6 · Séries groupées en classes
7 · Comparaison de deux séries statistiques
1Population, individu et caractère
En statistiques, on étudie un caractère (ou variable statistique) sur une population. Chaque élément de cette population est appelé individu.
Définitions.
• La population est l'ensemble de tous les individus étudiés.
• Un individu est un élément de la population.
• Le caractère est la propriété que l'on observe sur chaque individu.
• L'effectif total noté N est le nombre total d'individus.
Un caractère peut être :
- Qualitatif : les valeurs sont des catégories (ex. : couleur des yeux, genre musical préféré).
- Quantitatif discret : les valeurs sont des nombres entiers ou isolés (ex. : nombre de frères et sœurs, note sur 20).
- Quantitatif continu : les valeurs peuvent prendre toute valeur dans un intervalle (ex. : taille en cm, masse en kg).
Exemple. Dans une classe de 30 élèves, on relève la taille de chacun. La population est la classe (30 individus), le caractère est la taille (quantitatif continu), et N = 30.
2Effectifs, fréquences et représentations graphiques
On organise les données dans un tableau statistique. Pour chaque valeur xi, on note ni l'effectif (nombre d'individus ayant cette valeur) et fi la fréquence relative.
Fréquence relative. $f_{i} = n_{i} / N$ (souvent exprimée en pourcentage). La somme des effectifs vaut N, la somme des fréquences vaut 1 (ou 100 %).
| Type de caractère | Représentation graphique |
|---|
| Qualitatif | Diagramme circulaire (camembert) ou diagramme en barres |
| Quantitatif discret | Diagramme en bâtons (hauteur = effectif ou fréquence) |
| Quantitatif continu (classes) | Histogramme (aire ∝ effectif) |
Astuce. Dans un histogramme à classes de largeur égale, la hauteur des rectangles est proportionnelle aux effectifs. Si les classes ont des largeurs différentes, la hauteur est la densité = effectif ÷ largeur de classe.
Exemple. Notes obtenues par 25 élèves :
| Note | Effectif ni | Fréquence fi (%) |
|---|
| 8 | 3 | 12 |
| 10 | 7 | 28 |
| 12 | 9 | 36 |
| 14 | 4 | 16 |
| 16 | 2 | 8 |
| Total | 25 | 100 |
3Indicateurs de position : moyenne et médiane
Moyenne. La moyenne d'une série est notée x̄ (lire « x barre »). Si les valeurs sont x1, x2, …, xp avec les effectifs n1, n2, …, np :
$x̄ = (n_{1}\cdot x_{1} + n_{2}\cdot x_{2} + … + n_{p}\cdot x_{p}) / N$
Médiane. On ordonne les valeurs par ordre croissant. La médiane M est la valeur qui partage la série en deux groupes d'effectifs égaux :
• Si N est impair : M est la valeur de rang (N+1)/2.
• Si N est pair : M est la moyenne des valeurs de rang N/2 et N/2+1.
Astuce. La médiane est souvent préférable à la moyenne pour décrire une série avec des valeurs extrêmes (« valeurs aberrantes »), car elle en est peu affectée.
Exemple. Série : 5, 7, 9, 9, 10, 12, 15 (N = 7).
Moyenne : x̄ = (5+7+9+9+10+12+15)/7 = 67/7 ≈ 9,57.
Médiane : rang (7+1)/2 = rang 4 → M = 9.
Attention ! Pour calculer la médiane, il faut d'abord trier les données par ordre croissant. Ne jamais oublier ce tri préalable.
4Quartiles et boîte à moustaches
Quartiles.
• Le premier quartile Q1 est la plus petite valeur telle qu'au moins 25 % des données lui sont inférieures ou égales.
• Le troisième quartile Q3 est la plus petite valeur telle qu'au moins 75 % des données lui sont inférieures ou égales.
• La médiane M est le deuxième quartile Q2.
On utilise le diagramme en boîte (ou boîte à moustaches) pour visualiser la distribution d'une série. Il représente :
- le minimum et le maximum (extrémités des moustaches),
- Q1 et Q3 (côtés de la boîte),
- la médiane M (trait vertical à l'intérieur de la boîte).
Intervalle interquartile. L'intervalle interquartile est [Q1 ; Q3]. Il contient 50 % des données centrales. Sa longueur est Q3 − Q1.
Exemple. Série (triée, N = 12) : 3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16, 18.
• Médiane M = moyenne des valeurs de rang 6 et 7 = (9+10)/2 = 9,5.
• Q1 : on cherche dans les 6 premières valeurs : médiane = (6+7)/2 = 6,5.
• Q3 : on cherche dans les 6 dernières valeurs : médiane = (13+14)/2 = 13,5.
• Intervalle interquartile : [6,5 ; 13,5], longueur = 7.
Astuce. La boîte à moustaches permet de visualiser rapidement si la distribution est symétrique ou asymétrique, et de détecter des valeurs inhabituelles.
5Indicateurs de dispersion : étendue, variance et écart-type
Les indicateurs de dispersion mesurent comment les données sont « écartées » autour d'une valeur centrale.
Étendue. L'étendue est la différence entre la valeur maximale et la valeur minimale : $e = x_{max} - x_{min}$. Elle est simple mais très sensible aux valeurs extrêmes.
Variance et écart-type. Si la série a pour valeurs x1, …, xp d'effectifs n1, …, np et de moyenne x̄ :
$V = (n_{1}(x_{1}-x̄)^{2} + … + n_{p}(x_{p}-x̄)^{2}) / N$
L'écart-type est $σ = \sqrtV$. Il a la même unité que les données.
Attention ! Une petite valeur de σ indique des données regroupées près de la moyenne ; une grande valeur indique des données très dispersées. L'écart-type est toujours positif ou nul (σ = 0 ssi toutes les valeurs sont identiques).
Exemple. Série : 2, 4, 4, 6, 8, 10 (N = 6).
x̄ = (2+4+4+6+8+10)/6 = 34/6 ≈ 5,67.
V = [(2−5,67)²+(4−5,67)²+(4−5,67)²+(6−5,67)²+(8−5,67)²+(10−5,67)²]/6
= [13,45+2,79+2,79+0,11+5,43+18,75]/6 = 43,32/6 ≈ 7,22.
σ ≈ √7,22 ≈ 2,69.
Astuce – formule alternative. $V = (Σ n_{i}\cdot x_{i}^{2}) / N - x̄^{2}$. Cette formule évite de calculer chaque (xi−x̄)² séparément et est souvent plus rapide à la calculatrice.
6Séries groupées en classes
Lorsque les données sont continues ou nombreuses, on les regroupe en classes [a ; b[. On choisit en général des classes de même amplitude.
Centre de classe. Pour une classe [a ; b[, le centre est c = (a+b)/2. On utilise le centre de classe comme valeur représentative de la classe pour calculer la moyenne et l'écart-type.
La fréquence cumulée croissante (FCC) d'une classe est la somme des fréquences de toutes les classes jusqu'à cette classe incluse. Elle permet de lire graphiquement la médiane et les quartiles sur la courbe des fréquences cumulées (ogive).
Exemple. Masses (en kg) de 40 élèves :
| Classe [a ; b[ | Effectif | Centre c | FCC (%) |
|---|
| [45 ; 50[ | 5 | 47,5 | 12,5 |
| [50 ; 55[ | 12 | 52,5 | 42,5 |
| [55 ; 60[ | 14 | 57,5 | 77,5 |
| [60 ; 65[ | 7 | 62,5 | 95,0 |
| [65 ; 70[ | 2 | 67,5 | 100,0 |
Moyenne ≈ (5×47,5 + 12×52,5 + 14×57,5 + 7×62,5 + 2×67,5)/40 = 2237,5/40 ≈ 55,9 kg.
La médiane se lit sur l'ogive au niveau de 50 % (elle est dans la classe [55 ; 60[).
Astuce. Pour lire les quartiles sur l'ogive : Q1 correspond à 25 % des FCC, M à 50 %, Q3 à 75 %.
7Comparaison de deux séries statistiques
Comparer deux séries statistiques nécessite de comparer à la fois leurs indicateurs de position (moyenne, médiane) et de dispersion (étendue, écart-type, intervalle interquartile).
Méthode de comparaison.
1. Calculer x̄, M, Q1, Q3, σ pour chaque série.
2. Comparer les moyennes (ou médianes) : laquelle est la plus élevée ?
3. Comparer les écarts-types (ou intervalles interquartiles) : laquelle est la plus dispersée ?
4. Conclure en répondant précisément à la question posée.
Exemple. Deux classes passent le même test (/20) :
Classe A : x̄A = 12,5 ; σA = 3,2.
Classe B : x̄B = 12,5 ; σB = 1,4.
Conclusion : Les deux classes ont la même moyenne, mais la classe B est plus homogène (écart-type plus faible).
Attention ! Une comparaison incomplète (ne portant que sur la moyenne) peut être trompeuse. Il faut toujours associer un indicateur de position à un indicateur de dispersion.
Astuce. Les boîtes à moustaches côte à côte sont l'outil idéal pour comparer visuellement deux séries : on voit immédiatement la position et la dispersion de chacune.
★À retenir
À retenir — Statistiques descriptives :
• Effectif ni : nombre d'individus pour la valeur xi ; fréquence fi = ni/N.
• Moyenne : x̄ = (Σ ni·xi)/N ; médiane M : valeur centrale (50 % des données en dessous).
• Quartiles : Q1 (25 %) et Q3 (75 %) encadrent 50 % des données.
• Étendue = xmax − xmin ; variance V = (Σ ni(xi−x̄)²)/N ; écart-type σ = √V.
• Classes : on utilise le centre de classe pour calculer moyenne et écart-type.
• Toujours associer un indicateur de position ET un indicateur de dispersion pour comparer deux séries.