On l'a vu, un fichier audio prend une certaine place en mémoire dans l'ordinateur et nécessite un certain débit en cas de transmission avec lecture en direct (en « streaming »), un certain temps en cas de simple téléchargement. La compression consiste à diminuer la taille des fichiers audio afin de faciliter leur stockage et leur transmission, en particulier pour l'écoute de musique en direct sur internet.
Plusieurs techniques de compression existent, certaines sont sans perte, d'autres avec perte.
Définition :
Une technique de compression est sans perte si elle permet de récupérer, après décompression, l'intégralité de l'information obtenue par la numérisation du son.
Exemple :
Le format FLAC, en utilisant des redondances dans les fichiers audio, permet de réduire leur taille de \(30\%\) à \(70\%\) sans perte d'information.
Au contraire, les techniques de compression avec perte ne permettent pas de retrouver l'intégralité du signal numérisé après décompression. La technique la plus utilisée consiste à éliminer du fichier audio les sons qui sont peu audibles par l'oreille humaine :
les sons très graves et les sons très aigus que l'oreille entend peu ;
les sons de faible niveau sonore survenant en même temps que des sons plus forts.
On peut également regrouper des sons de fréquences proches les unes des autres en un seul son plus fort.
Exemple :
Le format mp3 utilise des techniques de compression avec perte d'information. Il peut permettre de réduire d'un facteur environ \(10\) la taille d'un fichier audio. Cependant, le son qu'on obtient en décompressant le fichier n'est pas identique au son initial, une partie de l'information a été perdue dans la compression.
Un bon moyen de comparer les différentes techniques de compression est de calculer le rapport entre la taille du fichier obtenu et celle du fichier d'origine, qu'on appelle le taux de compression.
Exemple :
Avec FLAC, le taux de compression varie entre \(0{,}3\) et \(0{,}7\) (le calcul sera détaillé dans l'activité suivante).
Avec mp3, le taux de compression sera de l'ordre de \(0{,}1\), lorsque la taille est réduite d'un facteur \(10\) comme évoqué dans l'exemple ci-dessus. Nous verrons dans l'activité suivante que cela dépend du type de mp3 utilisé.