La numérisation du son

Agence culturelle Grand Est

Accueil >
Technologie >
Dossiers techniques >
La numérisation du son

Technologie

La qualité du signal audio est étroitement liée à celle du support. Le signal analogique supporte mal les copies et les manipulations : il se dégrade progressivement, par perte d’information.

Le procédé PCM (Pulse Coded Modulation) a été inventé dans les années 1920 par la société Bell Telephon (USA), afin d’augmenter le débit des lignes téléphoniques. Les premières applications à grande échelle n’ont vu le jour qu’à partir des années 1960 pour la téléphonie et les années 70-80 pour l’audio. Le signal numérique est discontinu : il n’est pas défini à tout instant, ni pour toutes les amplitudes. Il se présente sous la forme d’une liste de nombres, codée en binaire (0 et 1).

Échantillonnage et quantification

Échantillonnage

Les vibrations sonores sont transformées en liste de nombres grâce à un convertisseur Analogique/
Numérique (A/D).

Le convertisseur prélève des valeurs du signal à des intervalles de temps réguliers et les transforme en nombre binaire. Il ne lit pas toute la courbe, mais seulement quelques échantillons.

Le nombre d’évènements lus par seconde nous donne la fréquence d’échantillonnage.
Cette fréquence doit être suffisamment grande, afin de préserver la forme originale du signal.

Le théorème de Nyquist-Shannon dit que la fréquence d’échantillonnage doit être égale ou supérieure à 2 fois la fréquence maximale contenue dans ce signal.

Notre oreille perçoit les sons jusqu’environ 20 000 Hz. La fréquence d’échantillonnage doit être au moins de l’ordre de 40 000 Hz.

Fréquences d’échantillonnage normalisées :

32 kHz pour la radio FM en numérique (la bande passante est alors réduite à 15 kHz)
44.1 kHz, 96 kHz pour l’audio professionnel et les CD
48 kHz pour les enregistreurs numériques professionnels et l’enregistrement grand public DAT, Mini disc…

Quantification

En analogique, toutes les valeurs d’amplitude sont possibles ; ce n’est pas le cas en numérique où il y a quantification. Après avoir découpé le signal en échantillons, il faut les mesurer et leur donner une valeur numérique en fonction de leur amplitude.
Pour cela on définit un intervalle de N valeurs destiné à couvrir l’ensemble des valeurs possibles. Ce nombre N est codé en binaire sur 8, 16, 20 ou 24 bits selon la résolution du convertisseur A/N. L’amplitude de chaque échantillon est alors représenté par un nombre entier. Le nombre de bits limite la précision du codage. Plus le nombre de bits utilisés sera grand, meilleure sera la ressemblance avec le signal original.

Codage…

8 bits = 2 puissance 8 soit 256 valeurs
16 bits = 2 puissance 16 soit 65 536 valeurs
20 bits = 2 puissance 20 soit 1 048 576 valeurs
24 bits = 2 puissance 24 soit 16 777 216 valeurs

Les systèmes grand public actuels (CD, DAT) travaillent avec 16 bits, soit 65 536 niveaux (de – 32 768 à + 32 767).
Le standard des nouvelles machines professionnelles ainsi que du DVD sera de : 24 bits – 96 kHz. Ces caractéristiques permettent d’améliorer la dynamique et la bande passante des signaux audio, avec une reproduction encore plus proche de la réalité tout en ayant la possibilité de se livrer à des traitements numériques plus sophistiqués, et ceci sans dégrader le signal.
Le nombre de bits définit également l’amplitude dynamique du signal (6 dB/bit) : Une résolution de 8 bits donnera une dynamique maximale de 8 x 6 = 48 dB ;

16 bits : 16 x 6 = 96 dB ;
24 bits : 24 x 6 = 144 dB.

Plus l’encodage est important, plus la dynamique sera élevée et le bruit de fond limité.

Restitution et filtrage des signaux numériques

Le signal numérique n’a plus la belle allure du signal analogique, car il n’est défini qu’en certains points. L’allure typique d’un signal échantillonné est en forme de marches d’escalier puisqu’il s’agit d’une liste de chiffres (44 100 par seconde et + ou – 32 767 niveaux d’amplitude en 16 bits).

Signal analogique

signal_analogique

signal échantillonnée

signal_echantillonne

Pour redonner une belle allure au signal, il faut le filtrer (le lisser) à l’aide d’un filtre passe-bas.
Ce filtrage peut-être réalisé de façon analogique, avec des circuits électroniques.
Il est toutefois plus performant et plus propre de réaliser un filtrage numérique par interpolation, à l’aide de circuits intégrés spécialisés. Cette opération s’appelle « sur-échantillonnage ou oversampling ». « 4 time oversampling » ( sur-échantillonnage 4 fois) indique l’efficacité et la sophistication du circuit intégré. On peut aller aujourd’hui jusqu’à un sur-échantillonnagede 128 fois.

Transmission du son numérique :
Norme AES/EBU : format professionnel, transmission du signal stéréo sur un câble symétrique en XLR.
Format SPDIF : format grand-public mis au point par Sony et Philips, connexion par câble coaxial asymétrique (avec connecteur cinch) ou optique.
Format TDIF : format professionnel au standard Tascam (Tascam Digital Interface).
Format ADAT : format professionnel de transmission de 8 canaux en fibre optique.

Taille mémoire occupée par le son numérique :
Un enregistrement 44.1 kHz, 16 bits, en stéréo occupe environ 10 Mo par minute.

Avantages du numérique :
La dynamique (plage des amplitudes reproduites de triple piano à triple forte) et la bande passante (plage des fréquences reproduites) sont très bonnes.
Le signal étant codé sous forme de nombres, les parasites ou bruits de fond électriques ou mécaniques n’ont plus d’influence sur la qualité du son.
La copie, le traitement et la mémorisation du signal n’entraînent pas de perte de qualité.
On peut faire plusieurs copies numériques, sans dégradation notoire du signal.
En cas d’erreur de lecture dues aux défectuosités dusupport, aux saletés, aux rayures, aux empreintes dedoigts, aux fluctuations mécaniques (baladeurs), des circuits de détection et de correction d’erreurs entrent automatiquement en service.

double_conversion

Conclusion :
Le son numérique demande une double conversion :
Analogique -> Numérique - Numérique -> Analogique

Note pour aider à la compréhension :
On peut comparer le son numérique à un assemblage de petits cubes de bois.
Le filtrage correspond au papier de verre et à l’enduit de rebouchage qui va permettre d’arrondir les angles. Le sur-échantillonnage X fois correspond au grain du papier de verre : plus le grain sera fin et plus la surface finale sera lisse.

Les étapes de captation et de restitution du son sont et resteront toujours analogiques :
le son est un phénomène analogique par essence.
On ne pourra jamais se passer de microphones, de haut-parleurs ou de casques !

Dernière mise à jour le 21/07/2011