Les surréalistes ont trouvé un successeur. Référence à l’artiste Salvador Dalí et au robot Wall-E des studios Pixar, Dall.E est une IA capable de générer des images à partir de mots.
Développé par l’américain OpenAI, ce réseau de neurones artificiels s’appuie sur 12 milliards de paramètres et une vaste base de données d’images associées à du texte. En utilisant des techniques de traitement naturel du langage et un moteur de rendu 3D, il peut générer une série de visuels.
Parfois improbables, comme un bébé radis en tutu promenant un chien ou un fauteuil en forme d’avocat [photo]. « Dall.E est souvent capable de ”remplir les blancs” lorsque la légende implique que l’image doit contenir un certain détail qui n’est pas explicitement indiqué », notent les chercheurs.
À la mention du lever de soleil, Dall.E va par exemple jusqu’à dessiner les ombres qui s’étirent sous les objets. « Nous constatons que Dall.E est capable de créer des images plausibles pour une grande variété de phrases qui explorent la structure compositionnelle du langage », se réjouissent les chercheurs. Une avancée intéressante pour l’autonomie de l’IA dans le traitement du langage.



