Analyse de la reconnaissance d'images de Google Images

De Vulgum Techus
Aller à : Navigation, rechercher
Lien court vers cette page : https://vt.cx/AriGI
QR code vers cette page : https://vt.cx/AriGI.qr

Présentation

La reconnaissance d'images de Google Images est très performante mais jusqu'à quel point ? Pour le savoir, il peut être intéressant de tester ses capacités de reconnaissance en partant d'une image connue et en la modifiant de façon assez simple jusqu'à ce que cela ne fonctionne plus.

Procédure

L'image originale

L'images choisie est celle d'un excellent auteur Pakistanais, Jamil Ahmad dont le dernier ouvrage sur la partition de 1947 de l'Inde et du Pakistan et les dégâts qu'un découpage territorial sans intelligence ont causés et causent encore et dont nous sommes tous, directement ou indirectement, victimes.

L'image de base, telle qu'elle nous est proposée par Penguin India pour un usage de relation presse, est immédiatement reconnue par Google Images qui en propose de nombreuses versions.

Google-images-jamil-ahmad-010613-v1.jpg

Les interventions sur l'image se font à l'aide d'un logiciel de retouche bitmap tels que ceux proposés dans la rubrique top gratuit, et sont de plusieurs types. Les résultats diffèrent selon les circonstances :

  • recadrage (crop) qui consiste à supprimer des zones entières et généralement rectangulaires
  • inversion horizontale ou verticale de l'image (flip horizontal ou flip vertical)
  • modification de couleurs (remplacement d'une ou plusieurs couleurs majeures)
  • ajout, déformation ou suppression d'éléments avec des outils ad hoc

Recadrage

L'image recadrée et réduite

Le recadrage consiste à sélectionner des zones en bordure et à les supprimer. Cette opération simple est très souvent pratiquée par les graphistes web ou presse. Elle ne suffit toutefois pas pour tromper Google Images. La réduction, quant à elle, n'a pas d'impact notoire, dans ce cas précis, sur les recherches qui affichent le nom de l'auteur reconnu sans, toutefois, trouver d'autres images strictement identiques à des formats différents ce qui, dans ce cas, est logique puisque l'image vient d'être recadrée d'une façon inédite. Google Images propose donc des images similaires c'est à dire proche de l'image originale sans être des copies strictement identiques de différentes tailles comme c'est le cas dans la Version 1 plus haut.

Google-images-jamil-ahmad-010613-v2.jpg

Modification de couleurs

L'image recadrée, réduite et changement de couleur sur le pull

Le changement de couleurs est une opération plus ou moins compliquée selon l'image et les outils dont on dispose. Avec des outils adaptés et gratuits comme GiMP ou IrfanView c'est relativement simple et le résultat encore insuffisant pour poser un réel problème à la reconnaissance d'images telle que la pratique Google.

Google-images-jamil-ahmad-010613-v3.jpg

Flip horizontal

L'image retournée horizontalement sans réduction

L'opération d'inversion horizontale ou verticale de l'image (horizontal/vertical flip) est aussi un moyen simple et rapide pour changer l'aspect d'une image comme le pratique de nombreux graphistes sur les images fixes et les monteurs audiovisuels sur des images animées (pour rendre des pubs moins reconnaissables ou dans le but de se distinguer d'une source sans trop d'efforts par exemple). Dans le premier exemple ci-dessous, le flip seul ne suffit pas à rendre l'image assez différente pour que Google Images ne la reconnaisse pas et c'est l'association recadrage + flip horizontal qui trompe Google Images

Google-images-jamil-ahmad-010613-v4.jpg



L'image retournée horizontalement avec recadrage

Google-images-jamil-ahmad-010613-v5.jpg

Ajout, déformations ou suppression d'éléments

L'image retournée horizontalement avec recadrage, changement de couleur du pull et ajout d'agrafes old style

Ce type d'interventions sur une image lambda ouvre un monde d'options qu'il n'est pas possible de décrire exhaustivement ici mais dont le résumé suffira à aider chacun à trouver les options qui lui conviennent :

  • Ajout : recouvrement de zone par des éléments d'images ou à l'aide de l'outil clone
  • Suppression d'éléments : suppression de zones à l'aide de l'outil gomme ou de l'outil clone
  • Déformation : étirement ou contraction de zones à l'aide des outils le permettant (masques, goo, etc.)

Elle est ici, et à titre d'exemple, illustrée par l'ajout d’agrafes vintage, telles qu'on les trouvait, il y a quelques années encore, dans les cartes nationales d'identités (CNI). Le résultat est sans appel ; l'image n'est plus reconnu et les photos proposées, même approchantes, non pas grand chose à voir avec l'original de départ.

Google-images-jamil-ahmad-010613-v6.jpg

Niveaux de gris

L'image retournée horizontalement avec recadrage et mise en noir et blanc

La transformation d'une image en couleur 24 ou 32 bit vers le niveau de gris, ou plus communément noir et blanc, perturbe aussi beaucoup Google Images qui, en plus de ne pas reconnaître l'image, fait des suggestions assez éloignées de l'image originale en proposant l'acteur Jerzy Radziwiłowicz comme sujet reconnu et en donnant des clichés sans réelles similitudes.

Google-images-jamil-ahmad-010613-v7.jpg

Conclusion

A ce stade des expérimentations, l'algorithme de reconnaissances d'images est très efficace tant que peu de modifications interviennent sur l'image de départ. Cela mène à deux hypothèses :

  • Soit Google bride volontairement la puissance de recherche dans l'un ou plusieurs des objectifs suivants :
    • Se laisser une marge de progression pour annoncer des améliorations programmées comme le font de nombreux éditeurs de logiciels
    • Réserver des recherches plus puissantes à une clientèle prête à les payer
    • Ne pas inquiéter les usagers par des résultats qui laisseraient supposer que plus personne n'est en mesure de tromper Google
  • Soit les algorithmes manquent encore de pertinence et des progrès restent à faire pour qu'ils ne se laissent plus abuser par de simples manipulations comme celles décrites dans cette analyse.

Articles Vulgum Techus

Commentaires

blog comments powered by Disqus