L’IA DeepMind est capable de générer une image réaliste de n’importe quel objet

Images générées par DeepMind

L’intelligence artificielle DeepMind de Google, qui fait souvent parler d’elle, est maintenant capable de construire des images réalistes de n’importe quel objet. 

Ça paraît fou, mais c’est pourtant vrai. Les chercheurs du projet DeepMind ont une nouvelle fois attiré l’attention sur les incroyables capacités de leur IA au travers d’une démonstration qui laisse songeur.

Quelques mois après le scandale des deepfakes, ces IA capables de transposer les visages avec un réalisme bluffant, voila que DeepMind arrive avec la capacité de construire n’importe quelle photo à partir de rien, et le résultat est plus vrai que nature.

Dans un article publié par les ingénieurs de la société, rédigé en collaboration avec les chercheurs de l’Université Heriot-Watt, on nous décrit une intelligence artificielle générant des photos de paysages,  d’aliments ou même d’animaux parfois si réalistes qu’il devient impossible de faire la différence avec une vraie photo.

« Dans ce travail, nous avons entrepris de combler le fossé de fidélité et de variété entre les images générées par [notre système d’IA] et les images du monde réel. Nous trouvons que les techniques actuelles sont suffisantes pour améliorer considérablement le résultat. »

Les chercheurs de DeepMind

Pour parvenir à ce résultat, un algorithme de type GAN (Generative Adversarial Networks) a été développé. Il s’agit d’un algorithme d’apprentissage machine non supervisé, un peu comme celui utilisé pour créer la première œuvre d’art générée par IA vendue aux enchères.

Pour parler plus simplement, il s’agit en fait de deux réseaux neuronaux fonctionnant en parallèle. Le premier est chargé de générer les images tandis que le second les compare à de vraies images du monde réel.

Cependant, les GANs de DeepMind (baptisé d’ailleurs bigGANs), est d’une puissance sans précédent. Il dispose de 158 millions de paramètres dédiés à la génération des images, et les compare à 2048 échantillons d’images à chaque traitement.

La base de données d’échantillons d’image provient d’ImageNET et JFT-300M, soit plus de 300 millions d’images.

Au vu de ces résultats plus qu’impressionnant, on est bien sûr en droit de s’inquiéter des possibilités d’utilisation d’une telle technologie. Utilisée à des fins malfaisantes, les conséquences pourraient s’avérer dramatiques.

Articles similaires