OpenAI présente une nouvelle version de ChatGPT capable d'analyser des images et de réponses rapides

Lundi 13 mai, l'entreprise américaine OpenAI a présenté la nouvelle version de ChatGPT. Baptisée GPT-4o, elle utilise la caméra des smartphones et des ordinateurs pour analyser des images et peut deviner les expressions de ses utilisateurs. Plus puissant, le programme est aussi capable de réponses orales plus rapides, ce qui donne l'impression de conversations avec un humain. 

Réservé aux abonnés
Image d'illustration de l'article
OpenAI a présenté les nouvelles fonctionnalités de ChatGPT le 13 mai.

Chat GPT avait étonné le monde entier fin 2022 en dissertant sur des sujets aussi divers que variés. Il est maintenant capable de regarder le monde et de donner son avis. Lundi 13 mai, l’entreprise américaine OpenAI a présenté la nouvelle version de son programme conversationnel (chatbot) basé sur l'intelligence artificielle (IA). Baptisée GPT-4o, elle améliore grandement sa capacité de réponse orale aux demandes des utilisateurs et semble prendre le dessus sur les autres modèles du genre comme «Siri» sur les iphones ou les assistants vocaux d’Amazon ou de Google.

Cette avancée est rendue possible par l’augmentation de la puissance du chatbot qui peut répondre aux questions en moins d’une demi-seconde contre plus de cinq secondes pour l’ancienne version de ChatGPT. Cette avancée donne l’impression de parler avec un humain, comme le montre la vidéo de présentation d’OpenAI.

Le chatbot s’adapte au rythme de l’humain qu’il a en face de lui en arrêtant de parler quand il est interrompu. Lors d’une démonstration, GPT-4o a ainsi proposé à son interlocuteur des exercices pour améliorer sa respiration, a résolu une équation de mathématiques et (moins impressionnant) lui a raconté une histoire.

Mais ce qui a véritablement étonné les observateurs est une nouvelle capacité : GPT-4o pouvait lire du texte ou entendre des sons… Et sait aussi analyser des images. Ainsi le chatbot peut utiliser la caméra d’un smartphone ou d’un ordinateur pour deviner les sentiments de son utilisateur grâce à ses expressions faciales. Il se permet même quelques hypothèses : «Tu sembles vraiment heureux et joyeux avec un grand sourire et peut-être un peu d’excitation», a ainsi répondu l’IA a l’un des participants à la démonstration. En parallèle de la parole, GPT-4o pourra aussi générer des images à la demande sur le modèle de ce que propose Craiyon ou DALL-E.

La nouvelle version du chatbot commencera à être déployée dans les prochaines semaines. Il sera accessible gratuitement mais avec une limite d’utilisation. Les abonnés en auront eux un accès illimité. 

Newsletter La Quotidienne
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.
Ils recrutent des talents
Les webinars
Les services L'Usine Nouvelle
Détectez vos opportunités d’affaires
Trouvez des produits et des fournisseurs