un-nouvel-algorithme-pour-stocker-desphotos-et-vidéo-sanspete-de-qualité
Tous les photographes vous le diront; le plus agaçant et de devoir stocker ses photos sur un support sans que ces dernières ne prennent trop de place. Ils sont souvent contraints d’utiliser des disques durs externes de plusieurs téraoctets, pour s’assurer qu’ils ne pendront jamais leurs précieuses photos.

Un algorithme basé sur le fonctionnement du cerveau humain

Mais ces disques prennent beaucoup de placent et après plusieurs années, un photographe peut se retrouver avec des dizaines, voire des centaines de ces disques. C’est surtout vrai si l’appareil photo est doté d’un capteur de plusieurs mégapixels, comme le nouveau sans miroir de Nikon Z7 – dont le capteur contient 45,7 mégapixels – lequel utilise des cartes XQD pour leur rapidité et leur très grande capacité de stockage.
Mais cela pourrait changer, en effet, une équipe de chercheurs a annoncé qu’un algorithme utilisant une technique d’apprentissage automatique basée sur le cerveau humain pourrait diminuer la quantité de données d’une photo ou d’une vidéo, réduisant ainsi la taille des fichiers multimédias, et en les restaurant sans perdre beaucoup en qualité et d’informations.
Dans cette étude, des chercheurs ont mis au point un algorithme comportant un réseau de neurones récurrent pour compresser et restaurer les données, selon C. Lee Giles, professeur d’information et de technologie David Reese à Penn State et associé de l’Institute for CyberScience. Dans ce cas, l’algorithme, qu’ils ont appelé « algorithme de raffinement itératif », qui met l’accent sur l’étape de décodage ou de restauration, a été en mesure de produire des images restaurées de meilleure qualité que les critères de référence sélectionnés pour cette étude, notamment un système de compression développé par Google, que les chercheurs ont considéré comme le meilleur à l’époque.

Un système de compression utilisant un décodeur de réseau neuronal récurrent

Le succès de ce système en matière de compression de fichiers est dû à l’utilisation d’un décodeur de réseau neuronal récurrent, plutôt que d’un réseau à transmission directe ou d’un décodeur (linéaire) classique. Un réseau de neurones récurrent utilise une mémoire dynamique, ce qui lui permet de stocker des données lors de ses calculs.
Cependant, un réseau de neurones régulier – ou réseau de neurones à transmission directe – ne peut pas stocker de données et ne peut traiter que les informations de manière séquentielle. Grâce à la capacité de mémoire supplémentaire, les réseaux de neurones récurrents peuvent mieux exécuter certaines tâches, telles que la reconnaissance des images.
Un système récurrent a des informations en retour, alors qu’un perceptron multicouche, un réseau de convolution ou un autre type de réseau de neurones similaire sont généralement prédictif, autrement dit, les données ne font que passer, elles ne sont pas stockées en mémoire », a déclaré Giles. David Miller, professeur d’ingénierie électrique et d’informatique, qui travaillait avec Giles, a déclaré que « le principal avantage de la récurrence dans ce contexte de décodage d’image est qu’il exploite les corrélations sur de longues régions spatiales de l’image par rapport à un décodeur d’image conventionnel ».
Un autre avantage de cet algorithme par rapport aux systèmes concurrents est la simplicité de sa conception, ont déclaré les chercheurs, qui ont récemment rendu compte de leurs résultats à la Data Compression Conference (DCC) ; (PDF)
« Nous avons vraiment juste le réseau de neurones récurrent à la fin du processus, comparé à celui de Google, qui inclut les réseaux de neurones récurrents, mais ils sont placés sur plusieurs couches différentes, ce qui augmente la complexité », a déclaré Giles.

Un test permet d’obtenir une qualité supérieure à celle de l’algorithme de Google 

L’un des problèmes de la compression est que, lorsqu’une image ou une vidéo compressée est restaurée, le fichier peut perdre des bits d’information, ce qui peut rendre l’image ou la vidéo floue ou déformée. Les chercheurs ont testé l’algorithme sur plusieurs images et il a été capable de stocker et de reconstruire les images avec une qualité supérieure à celle de l’algorithme de Google et d’autres systèmes de référence.
Les réseaux de neurones organisent leurs «neurones» électroniques de la même manière que le cerveau est composé de réseaux de neurones; cependant, Alexander G. Ororbia, professeur adjoint au Rochester Institute of Technology, dont les travaux de recherche portent sur le développement de systèmes neuronaux et les algorithmes d’apprentissage menant à cette recherche, ont déclaré que les cerveaux électroniques étaient beaucoup plus simples.
« Il est important de se rappeler que ces réseaux neuronaux sont vaguement basés sur le cerveau », a déclaré Ororbia.« Les neurones qui composent un réseau neuronal électronique sont beaucoup plus simples. Les vrais neurones biologiques sont extrêmement complexes. Certains disent que ce réseau neuronal électronique est presque une caricature du réseau neuronal du cerveau. »
Giles a déclaré que l’idée d’utiliser des réseaux de neurones récurrents pour la compression est venue de la nouvelle recherche sur les anciens réseaux de neurones sur le problème de la compression. « Nous avons constaté qu’il n’y avait pas beaucoup d’utilisation du réseau de neurones pour la compression – et nous nous sommes demandé pourquoi », a déclaré Giles. « Il est toujours bon de revenir sur d’anciens travaux pour voir quelque chose qui pourrait s’appliquer aujourd’hui. »

Un test utilisant trois mesures indépendantes

Les chercheurs ont testé la capacité de leur algorithme à compresser et à restaurer une image par rapport au système de Google en utilisant trois mesures indépendantes évaluant la qualité de l’image: le rapport de bruit du signal de crête, l’index de similarité structurelle et l’index de similarité structurelle à plusieurs échelles, qui évaluent la qualité d’image.
« Les résultats de tous les tests et de tous les paramètres montrent que l’algorithme de raffinement itératif proposé dans cette étude a produit des images avec une distorsion inférieure et une qualité perceptuelle plus élevée », a déclaré Ankur Mali, étudiant au doctorat à Penn State, qui a beaucoup travaillé sur la mise en œuvre technique du système.
Bien que tous les réseaux de neurones de compression nécessitent une formation – en insérant des données dans le système pour lui apprendre à exécuter son travail – Giles pense que la conception de l’équipe peut être plus facile à former. « Je suppose que c’est également beaucoup plus rapide en matière de formation », a déclaré Giles.

Un algorithme pouvant être utilisé avec un smartphone ou sur Youtube

Cet algorithme pourrait par exemple être utilisé pour stocker davantage de photos sur un smartphone, ou partager des vidéos sur internet ou sur des plates-formes de réseaux sociaux tels que YouTube et Twitter.
Source : Pennsylvania State University
Crédit photo sur Unsplash :  Zdeněk Macháček