ChatGPT se dote de nouvelles fonctionnalités vocales et visuelles

Publié le 26 septembre 2023

ChatGPT se dote de nouvelles fonctionnalités vocales et visuelles

Publié le 26 septembre 2023

OpenAI, la société américaine spécialisée dans l’intelligence artificielle, a annoncé hier sur son blog l’implémentation de nouvelles capacités vocales et visuelles pour son programme ChatGPT. Ces améliorations permettront aux utilisateurs d’engager des conversations orales et d’utiliser des images pour interagir avec le chatbot.

Conversation vocale grâce à la fonctionnalité Voice

Grâce à ces améliorations, les utilisateurs pourront désormais avoir des conversations vocales en temps réel avec ChatGPT. Son nouveau modèle de synthèse vocale génère des sons proches de la voix humaine à partir d’un texte et d’un échantillon de parole de quelques secondes seulement. Concernant la transcription des paroles des utilisateurs en texte, le système s’appuie sur des outils performants permettant une interaction fluide.

Il sera donc possible d’utiliser ChatGPT lors d’un déplacement, de lui demander de raconter une histoire ou encore de régler un débat autour d’une table.

ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

Reconnaissance d’images pour une interaction plus riche

Grâce à la reconnaissance d’images, les utilisateurs pourront obtenir des informations précises et pertinentes sur la base d’une photographie. Par exemple, il sera possible de capturer une photo d’un monument et avoir une conversation avec ChatGPT sur l’histoire du bâtiment. Le programme pourrait également proposer une recette à partir du contenu réel d’un frigo, une fois son contenu présenté sous forme d’image.

Déploiement des nouvelles fonctionnalités

Ces nouvelles capacités seront déployées au cours des deux prochaines semaines pour les abonnés à ChatGPT Plus (la version payante du chatbot) ainsi que pour les organisations clientes du service.

Disponible sur les applications iOS et Android, les utilisateurs pourront activer ces fonctions dans les paramètres de l’application, puis naviguer dans la section « nouvelles fonctionnalités ». Ils auront également la possibilité de choisir parmi cinq options vocales, créées en collaboration avec des acteurs professionnels.

Similaire

Loïc Frissard

Passionné par le web et l'entrepreneuriat, j'ai fondé Digitiz en 2016. Mon objectif est de vous transmettre mon expérience et de pouvoir vous faire gagner du temps dans le choix de vos outils.

Partagez cet article sur les réseaux sociaux