Dans la foulée de ChatGPT, l'IA générative se démocratise pour le meilleur et pour le pire

L’intelligence artificielle générative se démocratise, non sans écueil. Simili-conversations, dessins de synthèse, résumés automatiques... Les cas d'usage des modèles comme ChatGPT ont fait parler, jusqu'à trouver une place future dans les moteurs de recherche - comme souhaitent le faire Google avec son agent Bard et Microsoft, en intégrant l'outil d'OpenAI dans Teams et Bing.

Nathan Mann, avec Marion Garreau

Publié le 10 février 2023 à 08h00

Réservé aux abonnés

Image d'illustration de l'article — Midjourney génère des images à partir de simples instructions textuelles, comme nous l’avons fait ici : « en photo sur un journal dans une ambiance inquiétante ».

Ils sont sur toutes les lèvres. Sur les réseaux sociaux comme dans les repas de famille, les outils d’intelligence artificielle (IA) capables de générer sur demande textes et images ne cessent de fasciner. Il faut dire que les capacités d’écriture de l’agent conversationnel ChatGPT, ou de peinture des algorithmes Dall-E, Midjourney et Stable Diffusion sont à la fois bluffantes et accessibles à tous. Parfois gratuitement. D’où une multiplication des usages de ces nouvelles technologies dans la vie quotidienne et professionnelle, que ce soit pour faire des blagues, passer des examens universitaires, générer des textes de blogs ou même… illustrer un article sur l’intelligence artificielle dans "L’Usine Nouvelle" !

L’agent conversationnel de la société américaine OpenAI, lancé sur une plateforme en ligne en novembre 2022, s’est illustré dans le traitement de texte. Vitrine pour le grand public des progrès réalisés depuis quelques années par les programmes de traitement automatique du langage naturel – où un algorithme entraîné sur des milliards de textes génère du texte –, ChatGPT répond à n’importe quelle question par un texte cohérent. Ce qui permet de remplacer un moteur de recherche et d’automatiser bien des tâches, de l’écriture d’un e-mail au résumé de texte, en passant par des applications créatives comme la rédaction de contes ou de chansons.

Une versatilité qui n'a pas échappé à l'un de ses partenaires historiques, Microsoft, qui a réinvesti plusieurs milliards de dollars dans la société américaine en janvier... avant d'annoncer, en février, le déploiement du modèle dans différentes strates de sa suite logicielle : de l'outil de téléconférences Teams à son moteur de recherche Bing.

Apprentissage par renforcement

Saisissant, l’outil repose sur l’algorithme GPT-3 qui s’appuie sur des technologies d’IA bien maîtrisées. L’apprentissage profond d’abord, pour pouvoir s’entraîner sur d’énormes masses de données. Les "transformers" ensuite, des algorithmes d’apprentissage particuliers, apparus en 2017 et qui ont la capacité d’identifier des détails précis pour contextualiser des données. Une aubaine pour la compréhension du langage !

«Les chercheurs d’OpenAI ont eu recours à une phase d’apprentissage par renforcement, une méthode qui récompense l’algorithme pour chaque bonne réponse afin de le pousser à s’améliorer», détaille Chloé Clavel, enseignante- chercheuse à Télécom Paris. Mais le modèle a aussi bénéficié d’une "intégration poussée de l’humain dans la boucle". Durant l’apprentissage, des opérateurs ont évalué manuellement la pertinence de certaines des réponses fournies par ChatGPT pour lui permettre de s’améliorer. Une méthode statistique ultra-efficace, qui ne fait pas rupture avec les autres modèles d’IA existants, souligne l’experte. Parmi lesquels LaMDA de Google, DialoGPT de Microsoft ou BlenderBot de Meta. Ou encore Bloom, un modèle développé de manière ouverte par des centaines de scientifiques et optimisé pour fonctionner avec le maximum d’idiomes.

Les images artificielles sont elles aussi arrivées en force en 2022. L’entreprise OpenAI a présenté son modèle dessinateur Dall-E 2, la start-up Stability AI a ouvert un outil open source similaire, Stable Diffusion, et la plateforme de discussion en ligne Discord a proposé à ses utilisateurs de s’essayer à l’art artificiel via sa solution Midjourney. Ces outils permettent à tout un chacun de générer les images de leur choix à partir d’instructions textuelles. Ce dont n’ont pas manqué de se saisir artistes et internautes pour laisser libre cours à leur imagination et multiplier les visuels, des plus réalistes aux plus fantaisistes. Découvrant au fur et à mesure les recettes les plus efficaces pour obtenir le résultat souhaité, qu’il s’agisse de donner des détails, de préciser l’ambiance, le style et la structure du document visé, ou de mentionner l’audience visée par une œuvre.

La similarité avec ChatGPT s’explique par une base technologique commune. Les transformers, qui permettent d’analyser les instructions textuelles, sont particulièrement efficaces pour faire des liens entre texte et image, explique Matthieu Cord, chercheur en apprentissage automatique à Sorbonne Université. Pour créer les visuels les plus réalistes possibles, les derniers algorithmes à la mode quittent par ailleurs l’ "adversarial logic" (qui permet à un modèle de s’auto-améliorer en créant des faux avant d’essayer de les reconnaître) au profit de modèles dits "de diffusion", fondés sur l’ajout et le retrait de bruit numérique via des équations différentielles complexes, détaille le chercheur. Qui souligne que "la recherche s’attaque déjà aux vidéos".

Des images bluffantes et sexistes

La rapidité des progrès de l’IA n’en a pourtant pas fait disparaître les biais... Comme l’a testé un jeune papa de la rédaction de L’Usine Nouvelle. Un conte sur un jeune garçon nommé Nino, qualifie par exemple ce dernier de "très curieux et déterminé", tandis que la même requête avec le prénom Nina met en scène une "fillette très jolie et très douce". De même, la chercheuse en IA au sein de l’entreprise Hugging Face, Sasha Luccioni, a montré à partir d’exemples concrets que l’outil de génération d’images Stable Diffusion "amplifie les stéréotypes", notamment racistes et sexistes. Il ne conçoit, par exemple, que des pompiers blancs et des hommes de ménage noirs.

L’application de génération d’avatars Lensa, propulsée en tête des ventes fin 2022, a elle aussi été épinglée pour sa propension à sexualiser ses images féminines. Des clichés qui rappellent que l’IA ne fait qu’apprendre mécaniquement, à partir des milliards d’exemples qui lui sont fournis, sans discernement quant à leur qualité ou leur provenance. Et que la démocratisation des algorithmes créatifs suppose d’y intégrer des garde-fous efficaces.