Qu'est-ce que la numérisation du son ?

La numérisation consiste à convertir un signal sonore analogique en une suite de valeurs numériques discrètes, via un échantillonnage (mesure à intervalles réguliers) et une quantification (codage sur n bits).

Qu'est-ce que la fréquence d'échantillonnage ?

C'est le nombre de mesures (échantillons) effectuées par seconde. Elle est exprimée en hertz (Hz) ou kilohertz (kHz). Le CD audio utilise 44 100 Hz.

Qu'est-ce que la résolution (profondeur de bits) ?

C'est le nombre de bits utilisés pour coder chaque échantillon. Une résolution de 16 bits permet 2¹⁶ = 65 536 niveaux d'amplitude.

Pourquoi compresse-t-on les fichiers audio ?

La compression réduit la taille des fichiers. Elle peut être sans perte (FLAC) ou avec perte (MP3), qui supprime les informations peu perceptibles par l'oreille humaine.

← Retour aux ressources

Enseignement scientifique · Classe de 1ʳᵉ

L'enregistrement et la reproduction du son

Numérisation, compression et stockage du signal audio — programme d'Enseignement scientifique de 1re (lycée général)

À propos de cette page

Ce cours de enseignement scientifique en première sur « L'enregistrement et la reproduction du son » suit le programme officiel de enseignement scientifique de première. Il présente les définitions, les propriétés et les méthodes essentielles, accompagnées d'exemples résolus pour bien comprendre. Au programme : Du son au signal électrique, Du signal analogique au signal numérique, La fréquence d'échantillonnage, La quantification et la résolution. Chaque notion est expliquée pas à pas, puis mise en pratique grâce à des exercices interactifs, un QCM et une évaluation corrigée. Idéal pour réviser à son rythme, combler ses lacunes et progresser, en autonomie ou avec un professeur. Cours rédigé par un professeur particulier à Marseille pour aider les élèves de première à réussir en enseignement scientifique.

Au programme

1 · Du son au signal électrique

2 · Du signal analogique au signal numérique

3 · La fréquence d'échantillonnage

4 · La quantification et la résolution

5 · Calcul de la taille d'un fichier audio

6 · La compression des fichiers audio

7 · La reproduction du son

8 · Qualité sonore et critères de choix

1Du son au signal électrique

Le son est une onde mécanique longitudinale : il se propage par vibration des molécules du milieu (air, eau…). Pour enregistrer un son, on doit d'abord le convertir en signal électrique.

Microphone. Un microphone est un capteur qui convertit les vibrations sonores (variations de pression) en variations de tension électrique. Il produit un signal analogique : la tension varie de façon continue dans le temps, comme la pression acoustique.

Le signal électrique ainsi obtenu est une image fidèle du son : ses variations de tension reproduisent les variations de pression de l'onde sonore.

Exemple. Un diaphragme en mouvement dans un microphone dynamique génère une tension qui suit exactement la forme d'onde sonore, avec ses creux (compressions) et ses bosses (raréfactions).

2Du signal analogique au signal numérique

Un signal analogique est continu mais difficile à stocker ou à transmettre sans dégradation. La numérisation consiste à le transformer en une suite de nombres entiers, stockables dans un fichier informatique.

Numérisation (CAN — Convertisseur Analogique-Numérique). La numérisation comprend deux étapes :
1. L'échantillonnage : on mesure la valeur du signal à intervalles de temps réguliers $T_e$ (période d'échantillonnage).
2. La quantification : on arrondit chaque mesure à la valeur entière la plus proche sur une échelle discrète en $n$ bits.

On obtient ainsi une suite de nombres entiers (échantillons) qui représentent le signal d'origine de façon approximée.

Astuce. Plus on mesure souvent (échantillonnage rapide) et plus l'échelle est fine (résolution élevée), meilleure est la qualité du son numérisé — mais plus le fichier est volumineux.

3La fréquence d'échantillonnage

La fréquence d'échantillonnage $f_e$ est le nombre d'échantillons prélevés par seconde. Elle s'exprime en hertz (Hz) ou en kilohertz (kHz).

Théorème de Shannon-Nyquist. Pour reproduire fidèlement un signal de fréquence maximale $f_{max}$, la fréquence d'échantillonnage doit vérifier :$$f_e \geq 2 f_{max}$$Si cette condition n'est pas respectée, le signal est distordu : c'est le repliement spectral (aliasing).

L'oreille humaine perçoit les fréquences jusqu'à environ 20 000 Hz (20 kHz). La norme CD audio impose donc :

Exemple. Le CD audio utilise $f_e = 44\,100\,\text{Hz} = 44{,}1\,\text{kHz}$, soit plus du double de 20 kHz. Cela garantit une reproduction fidèle de toute la plage audible.

Usage	Fréquence d'échantillonnage
Téléphonie (voix)	8 000 Hz
CD audio	44 100 Hz
Audio professionnel / DVD	48 000 Hz
Studio haute résolution	96 000 ou 192 000 Hz

Attention ! Une fréquence d'échantillonnage de 44 100 Hz ne signifie pas que l'on entend jusqu'à 44 100 Hz : d'après Shannon, on restitue fidèlement jusqu'à $f_e / 2 = 22\,050\,\text{Hz}$, largement au-dessus du seuil auditif.

4La quantification et la résolution

Après l'échantillonnage, chaque mesure est arrondie à un niveau entier. La résolution (ou profondeur de bits) est le nombre de bits $n$ utilisés pour coder chaque échantillon.

Nombre de niveaux de quantification. Avec $n$ bits, on dispose de $2^n$ niveaux distincts. Plus $n$ est grand, plus la précision est grande et le bruit de quantification faible.

Résolution	Niveaux possibles	Application typique
8 bits	$2^8 = 256$	Téléphonie, anciens systèmes
16 bits	$2^{16} = 65\,536$	CD audio
24 bits	$2^{24} = 16\,777\,216$	Studio professionnel

Exemple. Avec 16 bits, la valeur d'un échantillon peut prendre 65 536 niveaux différents. Le bruit de quantification (erreur d'arrondi) est inférieur à $\frac{1}{65\,536}$ de la pleine échelle, soit environ $-96\,\text{dB}$ : il est imperceptible.

Attention ! Confonds pas la fréquence d'échantillonnage (nombre de mesures/s) avec la résolution (précision de chaque mesure). Ce sont deux paramètres indépendants.

5Calcul de la taille d'un fichier audio

Connaître la fréquence d'échantillonnage $f_e$, la résolution $n$ et la durée $d$ permet de calculer la taille brute (non compressée) d'un fichier audio.

Formule de la taille d'un fichier audio. $$\text{Taille (bits)} = f_e \times n \times N_c \times d$$où $f_e$ est la fréquence d'échantillonnage (en Hz), $n$ la résolution (en bits), $N_c$ le nombre de canaux (1 pour mono, 2 pour stéréo) et $d$ la durée (en secondes).Pour obtenir en octets : diviser par 8. Pour obtenir en mégaoctets : diviser encore par $1\,000\,000$ (ou $1\,048\,576$ selon la convention).

Exemple. Un morceau de musique stéréo de 3 min 30 s, enregistré au format CD (44 100 Hz, 16 bits, 2 canaux) :
— Durée : $3 \times 60 + 30 = 210\,\text{s}$
— Taille en bits : $44\,100 \times 16 \times 2 \times 210 = 296\,352\,000\,\text{bits}$
— Taille en octets : $\frac{296\,352\,000}{8} = 37\,044\,000\,\text{octets} \approx 37\,\text{Mo}$

Astuce. Pour un CD audio stéréo 44 100 Hz / 16 bits, le débit est de $44\,100 \times 16 \times 2 = 1\,411\,200\,\text{bits/s} \approx 1411\,\text{kbit/s}$. C'est le débit binaire (bitrate) du signal non compressé.

6La compression des fichiers audio

Les fichiers audio bruts sont volumineux. La compression réduit leur taille en supprimant des données redondantes ou imperceptibles.

Deux types de compression.

Compression sans perte (lossless) : aucune information n'est supprimée. La décompression redonne exactement le fichier d'origine. Exemples : FLAC, ALAC. Taille réduite d'environ 30 à 50 %.
Compression avec perte (lossy) : on supprime des informations jugées peu perceptibles par l'oreille humaine. Exemples : MP3, AAC, OGG. Réduction de 80 à 90 % possible.

La compression avec perte s'appuie sur la psychoacoustique : certaines fréquences sont masquées par d'autres (effet de masque). On peut les supprimer sans que l'oreille ne perçoive la différence.

Astuce — Le débit binaire (bitrate). Pour les formats compressés, on parle de débit en kbit/s :

MP3 128 kbit/s : qualité correcte, faible taille
MP3 320 kbit/s : haute qualité, taille plus grande
FLAC : sans perte, débit variable (~700–1 000 kbit/s)

Attention ! La compression avec perte est irréversible : une fois le fichier MP3 créé, les informations supprimées ne peuvent être récupérées.

7La reproduction du son

Pour reproduire un son numérique, il faut effectuer l'opération inverse : convertir le signal numérique en signal analogique, puis en vibrations sonores.

Convertisseur Numérique-Analogique (CNA). Le CNA relit la suite de nombres entiers stockés et reconstitue un signal électrique analogique par interpolation. Ce signal est ensuite amplifié et envoyé vers un haut-parleur.

Haut-parleur. Le haut-parleur convertit le signal électrique en vibrations mécaniques. Un courant variable dans une bobine crée un champ magnétique variable qui fait vibrer une membrane, mettant l'air en mouvement : on entend le son.

La chaîne de reproduction complète est donc :

Exemple — chaîne Hi-Fi. Fichier numérique → lecture (lecteur CD ou ordinateur) → CNA → amplificateur → haut-parleurs → oreille humaine.

8Qualité sonore et critères de choix

Le choix d'un format d'enregistrement dépend de l'usage et des contraintes (stockage, bande passante, qualité souhaitée).

Critère	Influence sur la qualité	Influence sur la taille
Fréquence d'échantillonnage $f_e$ élevée	Meilleure fidélité des aigus	Fichier plus volumineux
Résolution $n$ élevée	Moins de bruit de quantification	Fichier plus volumineux
Compression avec perte	Légère dégradation possible	Fichier beaucoup plus petit
Nombre de canaux (stéréo vs mono)	Spatialisation du son	×2 pour la stéréo

Astuce — Usage pratique.

Streaming musical : AAC ou MP3 à 128–320 kbit/s
CD audio : WAV 44 100 Hz / 16 bits (sans perte)
Enregistrement studio : 96 kHz / 24 bits
Archivage haute qualité : FLAC

Attention ! La loi de Shannon fixe une limite : il est inutile d'aller au-delà de $f_e = 48\,\text{kHz}$ pour un usage grand public, car l'oreille humaine ne perçoit pas les fréquences supérieures à 20 kHz.

★À retenir

En bref :
• Un microphone convertit le son en signal analogique.
• La numérisation comprend l'échantillonnage (prélèvement à $f_e$ fois par seconde) et la quantification (codage sur $n$ bits, soit $2^n$ niveaux).
• Théorème de Shannon : $f_e \geq 2 f_{max}$ pour restituer fidèlement le signal.
• Taille d'un fichier (bits) : $f_e \times n \times N_c \times d$.
• La compression sans perte (FLAC) conserve toutes les informations ; la compression avec perte (MP3) supprime les données imperceptibles.
• La reproduction fait appel à un CNA, un amplificateur et un haut-parleur.

→Continuer ce chapitre

✏️ Exercices 💬 Compréhension ❓ QCM 🎯 Évaluation

↔Autres chapitres

← La musique et les sons Le corps humain et la santé →

Bloqué sur ce chapitre ?

Cours particuliers de enseignement scientifique à Marseille, en présentiel ou à distance — un prof qui s'adapte à ton rythme et reprend ce qui coince.

Réserver un 1^er cours → Voir les tarifs