← Retour aux ressources
Enseignement scientifique · Classe de 1ʳᵉ

L'enregistrement et la reproduction du son

Numérisation, compression et stockage du signal audio — programme d'Enseignement scientifique de 1re (lycée général)

À propos de cette page
Ce cours de enseignement scientifique en première sur « L'enregistrement et la reproduction du son » suit le programme officiel de enseignement scientifique de première. Il présente les définitions, les propriétés et les méthodes essentielles, accompagnées d'exemples résolus pour bien comprendre. Au programme : Du son au signal électrique, Du signal analogique au signal numérique, La fréquence d'échantillonnage, La quantification et la résolution. Chaque notion est expliquée pas à pas, puis mise en pratique grâce à des exercices interactifs, un QCM et une évaluation corrigée. Idéal pour réviser à son rythme, combler ses lacunes et progresser, en autonomie ou avec un professeur. Cours rédigé par un professeur particulier à Marseille pour aider les élèves de première à réussir en enseignement scientifique.
Au programme
1 · Du son au signal électrique
2 · Du signal analogique au signal numérique
3 · La fréquence d'échantillonnage
4 · La quantification et la résolution
5 · Calcul de la taille d'un fichier audio
6 · La compression des fichiers audio
7 · La reproduction du son
8 · Qualité sonore et critères de choix
1Du son au signal électrique

Le son est une onde mécanique longitudinale : il se propage par vibration des molécules du milieu (air, eau…). Pour enregistrer un son, on doit d'abord le convertir en signal électrique.

Microphone. Un microphone est un capteur qui convertit les vibrations sonores (variations de pression) en variations de tension électrique. Il produit un signal analogique : la tension varie de façon continue dans le temps, comme la pression acoustique.

Le signal électrique ainsi obtenu est une image fidèle du son : ses variations de tension reproduisent les variations de pression de l'onde sonore.

Exemple. Un diaphragme en mouvement dans un microphone dynamique génère une tension qui suit exactement la forme d'onde sonore, avec ses creux (compressions) et ses bosses (raréfactions).
2Du signal analogique au signal numérique

Un signal analogique est continu mais difficile à stocker ou à transmettre sans dégradation. La numérisation consiste à le transformer en une suite de nombres entiers, stockables dans un fichier informatique.

Numérisation (CAN — Convertisseur Analogique-Numérique). La numérisation comprend deux étapes :
1. L'échantillonnage : on mesure la valeur du signal à intervalles de temps réguliers $T_e$ (période d'échantillonnage).
2. La quantification : on arrondit chaque mesure à la valeur entière la plus proche sur une échelle discrète en $n$ bits.

On obtient ainsi une suite de nombres entiers (échantillons) qui représentent le signal d'origine de façon approximée.

Astuce. Plus on mesure souvent (échantillonnage rapide) et plus l'échelle est fine (résolution élevée), meilleure est la qualité du son numérisé — mais plus le fichier est volumineux.
3La fréquence d'échantillonnage

La fréquence d'échantillonnage $f_e$ est le nombre d'échantillons prélevés par seconde. Elle s'exprime en hertz (Hz) ou en kilohertz (kHz).

Théorème de Shannon-Nyquist. Pour reproduire fidèlement un signal de fréquence maximale $f_{max}$, la fréquence d'échantillonnage doit vérifier :$$f_e \geq 2 f_{max}$$Si cette condition n'est pas respectée, le signal est distordu : c'est le repliement spectral (aliasing).

L'oreille humaine perçoit les fréquences jusqu'à environ 20 000 Hz (20 kHz). La norme CD audio impose donc :

Exemple. Le CD audio utilise $f_e = 44\,100\,\text{Hz} = 44{,}1\,\text{kHz}$, soit plus du double de 20 kHz. Cela garantit une reproduction fidèle de toute la plage audible.
UsageFréquence d'échantillonnage
Téléphonie (voix)8 000 Hz
CD audio44 100 Hz
Audio professionnel / DVD48 000 Hz
Studio haute résolution96 000 ou 192 000 Hz
Attention ! Une fréquence d'échantillonnage de 44 100 Hz ne signifie pas que l'on entend jusqu'à 44 100 Hz : d'après Shannon, on restitue fidèlement jusqu'à $f_e / 2 = 22\,050\,\text{Hz}$, largement au-dessus du seuil auditif.
4La quantification et la résolution

Après l'échantillonnage, chaque mesure est arrondie à un niveau entier. La résolution (ou profondeur de bits) est le nombre de bits $n$ utilisés pour coder chaque échantillon.

Nombre de niveaux de quantification. Avec $n$ bits, on dispose de $2^n$ niveaux distincts. Plus $n$ est grand, plus la précision est grande et le bruit de quantification faible.
RésolutionNiveaux possiblesApplication typique
8 bits$2^8 = 256$Téléphonie, anciens systèmes
16 bits$2^{16} = 65\,536$CD audio
24 bits$2^{24} = 16\,777\,216$Studio professionnel
Exemple. Avec 16 bits, la valeur d'un échantillon peut prendre 65 536 niveaux différents. Le bruit de quantification (erreur d'arrondi) est inférieur à $\frac{1}{65\,536}$ de la pleine échelle, soit environ $-96\,\text{dB}$ : il est imperceptible.
Attention ! Confonds pas la fréquence d'échantillonnage (nombre de mesures/s) avec la résolution (précision de chaque mesure). Ce sont deux paramètres indépendants.
5Calcul de la taille d'un fichier audio

Connaître la fréquence d'échantillonnage $f_e$, la résolution $n$ et la durée $d$ permet de calculer la taille brute (non compressée) d'un fichier audio.

Formule de la taille d'un fichier audio. $$\text{Taille (bits)} = f_e \times n \times N_c \times d$$où $f_e$ est la fréquence d'échantillonnage (en Hz), $n$ la résolution (en bits), $N_c$ le nombre de canaux (1 pour mono, 2 pour stéréo) et $d$ la durée (en secondes).Pour obtenir en octets : diviser par 8. Pour obtenir en mégaoctets : diviser encore par $1\,000\,000$ (ou $1\,048\,576$ selon la convention).
Exemple. Un morceau de musique stéréo de 3 min 30 s, enregistré au format CD (44 100 Hz, 16 bits, 2 canaux) :
— Durée : $3 \times 60 + 30 = 210\,\text{s}$
— Taille en bits : $44\,100 \times 16 \times 2 \times 210 = 296\,352\,000\,\text{bits}$
— Taille en octets : $\frac{296\,352\,000}{8} = 37\,044\,000\,\text{octets} \approx 37\,\text{Mo}$
Astuce. Pour un CD audio stéréo 44 100 Hz / 16 bits, le débit est de $44\,100 \times 16 \times 2 = 1\,411\,200\,\text{bits/s} \approx 1411\,\text{kbit/s}$. C'est le débit binaire (bitrate) du signal non compressé.
6La compression des fichiers audio

Les fichiers audio bruts sont volumineux. La compression réduit leur taille en supprimant des données redondantes ou imperceptibles.

Deux types de compression.
  • Compression sans perte (lossless) : aucune information n'est supprimée. La décompression redonne exactement le fichier d'origine. Exemples : FLAC, ALAC. Taille réduite d'environ 30 à 50 %.
  • Compression avec perte (lossy) : on supprime des informations jugées peu perceptibles par l'oreille humaine. Exemples : MP3, AAC, OGG. Réduction de 80 à 90 % possible.

La compression avec perte s'appuie sur la psychoacoustique : certaines fréquences sont masquées par d'autres (effet de masque). On peut les supprimer sans que l'oreille ne perçoive la différence.

Astuce — Le débit binaire (bitrate). Pour les formats compressés, on parle de débit en kbit/s :
  • MP3 128 kbit/s : qualité correcte, faible taille
  • MP3 320 kbit/s : haute qualité, taille plus grande
  • FLAC : sans perte, débit variable (~700–1 000 kbit/s)
Attention ! La compression avec perte est irréversible : une fois le fichier MP3 créé, les informations supprimées ne peuvent être récupérées.
7La reproduction du son

Pour reproduire un son numérique, il faut effectuer l'opération inverse : convertir le signal numérique en signal analogique, puis en vibrations sonores.

Convertisseur Numérique-Analogique (CNA). Le CNA relit la suite de nombres entiers stockés et reconstitue un signal électrique analogique par interpolation. Ce signal est ensuite amplifié et envoyé vers un haut-parleur.
Haut-parleur. Le haut-parleur convertit le signal électrique en vibrations mécaniques. Un courant variable dans une bobine crée un champ magnétique variable qui fait vibrer une membrane, mettant l'air en mouvement : on entend le son.

La chaîne de reproduction complète est donc :

Exemple — chaîne Hi-Fi. Fichier numérique → lecture (lecteur CD ou ordinateur) → CNA → amplificateur → haut-parleurs → oreille humaine.
8Qualité sonore et critères de choix

Le choix d'un format d'enregistrement dépend de l'usage et des contraintes (stockage, bande passante, qualité souhaitée).

CritèreInfluence sur la qualitéInfluence sur la taille
Fréquence d'échantillonnage $f_e$ élevéeMeilleure fidélité des aigusFichier plus volumineux
Résolution $n$ élevéeMoins de bruit de quantificationFichier plus volumineux
Compression avec perteLégère dégradation possibleFichier beaucoup plus petit
Nombre de canaux (stéréo vs mono)Spatialisation du son×2 pour la stéréo
Astuce — Usage pratique.
  • Streaming musical : AAC ou MP3 à 128–320 kbit/s
  • CD audio : WAV 44 100 Hz / 16 bits (sans perte)
  • Enregistrement studio : 96 kHz / 24 bits
  • Archivage haute qualité : FLAC
Attention ! La loi de Shannon fixe une limite : il est inutile d'aller au-delà de $f_e = 48\,\text{kHz}$ pour un usage grand public, car l'oreille humaine ne perçoit pas les fréquences supérieures à 20 kHz.
À retenir
En bref :
• Un microphone convertit le son en signal analogique.
• La numérisation comprend l'échantillonnage (prélèvement à $f_e$ fois par seconde) et la quantification (codage sur $n$ bits, soit $2^n$ niveaux).
Théorème de Shannon : $f_e \geq 2 f_{max}$ pour restituer fidèlement le signal.
Taille d'un fichier (bits) : $f_e \times n \times N_c \times d$.
• La compression sans perte (FLAC) conserve toutes les informations ; la compression avec perte (MP3) supprime les données imperceptibles.
• La reproduction fait appel à un CNA, un amplificateur et un haut-parleur.
Continuer ce chapitre
Autres chapitres
Bloqué sur ce chapitre ?

Cours particuliers de enseignement scientifique à Marseille, en présentiel ou à distance — un prof qui s'adapte à ton rythme et reprend ce qui coince.

Réserver un 1er cours → Voir les tarifs