L’information numérique est aujourd’hui de
plus en plus présente dans le quotidien sous la forme
d’ordinateurs, de CD et/ou DVD, de télévisions, de
téléphones, de baladeurs numériques (comme le baladeur
MP3), etc …
Mais comment peut-on expliquer le développement accru
de ce procédé ?
Tout au long de ce dossier nous avons vu que
l’information numérique se départageait de l’information
analogique, principalement par le fait qu’elle est
discontinue, ne prenant qu’un certain nombre de valeurs
strictes sur un intervalle défini. Ce qui peut être vu
comme un défaut est aussi une qualité. Elle permet une
plus grande compacité de l’information et est gage d’une
meilleure conservation de l’information.
La chaîne du son comporte de
nombreuses étapes et transformations, qui sont autant de
risques de dégradations pour le signal sonore.
en analogique : les amplitudes des
signaux sont faibles (environ 1 Volt) ; le moindre
changement - même d'un millième de volt (0,1%) -
provoque une déformation, une distorsion du signal
analogique. Un bruit blanc appelé souffle
s'amplifie avec les années sur les supports à bande
magnétique, ce bruit et le résultat de la perte de
signale dut, par exemple pour les vinyles, au diamant
qui à chaque lecture creuse de plus en plus les sillons
et déforme le signal d'origine.
Chaque copie, chaque appareil
provoque de légères dégradations du signal ; d'où
l'apparition de bruit de fond, perte de dynamique,
distorsion, usure, craquement, ..., bref tous les fléaux
caractéristiques du son analogique.
en numérique : le son est une liste
de 0 (zéro) et de 1 (un). 0 peut être codé par 0 volts
et 1 par 5 volts, ou bien la présence ou l'absence d'un
signal lumineux. Il s'agit donc de niveaux élevés et
très distincts : il est impossible de confondre un 0 et
un 1, et ce même s'il y a 1 volt de perturbation (20%
d'erreur) ! De plus, copier un son numérique équivaut à
copier une liste de nombres et cela, les machines le
font sans erreur. Donc, le numérique permet de
s'affranchir des problèmes de déformation, de pertes,
d'usure, de sensibilité aux parasites, ...
L'usage de l'informatique
permet aussi de mettre en oeuvre des systèmes de
corrections d'erreurs très sophistiqués, au cas où ...
Ces systèmes permettent d'estimer ce qu'aurait du être
le signal en l'absence d'erreur (en vérifiant la
cohérence du signal à un instant donné avec les 5 ou 10
valeurs précédentes). En cas d'incohérence notoire, il y
a substitution du ou des nombres mis en cause par une
estimation : il vaut mieux entendre un signal estimé
plutôt qu'un grand clic !
En résumé, le passage au
numérique permet d'avoir une bande passante étendue, une
dynamique accrue et de s'affranchir des phénomènes
d'usure. De plus elle offre un deuxième grand
avantage : elle ouvre grand et à tous la porte du
traitement du signal, comme la compression des données.
Pour certaines applications
comme la diffusion (télé, radio, internet) cette
quantité d'information est un handicap. C'est le cas du
cinéma avec 6 ou 8 canaux de diffusion et un support
imposé. C'est pourquoi on s'est rapidement attaché à
réduire le nombre d'information en comprimant le son
numérique. Cette compression est un nouveau type de
code, ou codec.
Pour réussir, cette
compression doit être transparente et l'auditeur doit
être incapable de la déceler. Pour atteindre cet
objectif, la réduction de débit audio-numérique s'appuie
sur les propriétés de l'oreille humaine. La
psycho-acoustique et l'étude des sensations et
perceptions auditives ont permis de mettre au point des
systèmes de codage perceptuel du son.
Ils sont basés sur l'effet de
masque. Un son précédé ou suivi par un autre son plus
fort que lui sera en partie ou totalement masqué. Le
niveau de masquage dépend du niveau du son masquant mais
aussi de sa fréquence et de l'intervalle qui le sépare
du son masqué. Il est normal que la fréquence
intervienne dans l'effet de masque puisqu'il dépend
directement de la sensibilité de l'oreille humaine. On
peut faire une analogie entre cette inertie temporelle
de perception auditive et la persistance rétinienne qui
permet au mouvement cinématographique d'exister.
Appliqué à la compression
audio-numérique l'effet de masque permet de ne
transmettre que les sons réellement détectés par
l'oreille. Tous les sons masqués sont éliminés. Le
codeur découpe le signal numérique en bande de fréquence
(filtre en peigne) et analyse le niveau de masquage pour
chaque bande. Il en déduit le niveau de quantification
de chaque bande, où dit autrement, le nombre
d'échantillons non masqués qui doivent être transmis. On
ne retient au final que l'information pertinente pour
l'oreille de l'auditeur.
La compression permet de
réduire le débit binaire dans un rapport de 1 à 6 et
même 1 à 12. Soit une transmission de 25% à 8 %
seulement du signal original. Elle tient compte de la
fréquence d'échantillonnage (32 KHz radio DAB; 44,1 KHz
CD; 48 KHz professionnel).
La compression la plus
connue est sans conteste le MP3, ou MPEG couche III, mis
au point par le CCETT en France et l'IRT en Allemagne. |