dimanche 29 juin 2014

Compression


Il existe divers algorithmes de compression de données pour storage qui cherchent
une réduction en volume; certains sont dits lossy, c’est-à-dire impliquent une perte
de fidélité des données, tandis que d’autres ne le sont pas, donc rendent une image
identique à celle d’origine à la décompression. Qu’en est-il?

La notion de lossy prend tout son sens en référence à l’analogique: un morceau de musique, 
une vidéo, peuvent être enregistrés dans des formats bien assez bons, par
exemple un MP3. On reconnaît tout de même de quoi il s’agit. À l’ère du numérique,
on a affaire à du sans perte, car c’est inhérent à la notion. La compression lossless
exploite le fait qu’il y a des répétitions dans les données, des structures. Une plage
de données totalement aléatoire ne saurait être compressée.

Réduites comment? Prenons l’exemple de l’expédition d’un message FAX. À
la inième ligne, il n’y a rien, donc 1 000 blancs. L’envoyeur ne codera pas pour
les mille, mais indiquera en trois temps qu’il s’agit d’une compression, quil y en a mille, 
et que c’est un blanc. Économie réussie.

L’algorithme de Lempel -Ziv, datant de 1977, repose sur l’idée géniale de compressé
par rapport à un dictionnaire unique à chaque document, qui se décompresse par
les mêmes règles; donc, pas besoin d’expédier le dictionnaire à celui qui décompresse.
Dès qu’un caractère répète, il apparaît comme entrée au dico. Plus la compression avance, 
plus il y a d’économies. (Le produit LZ le plus connu  sera la compression
Zip. Il y a aussi Gzip (Gunzip à la décompression)).

En forme Lempel-Ziv-Welch - les caratères d’origines sont donnés - cet algorithme
fait des adeptes. On s’en sert pour la compression des fichiers GIF, mais sans savoir
que l’algoritheme lui-même faisait l’objet d’un copyright. Ce füt un moment difficile
pour l’évolution du Web, résolu maintenant parce que le copyright s’est épuisé en
2003.

Il existe d’autres algorithmes, bien sür. Les différences font souvent sur  à quel moment,
même a posteriori, déclarer un membre du dico.  C’est à explorer.

Aucun commentaire: