OpenAI, la société américaine spécialisée dans l’intelligence artificielle, a annoncé hier sur son blog l’implémentation de nouvelles capacités vocales et visuelles pour son programme ChatGPT. Ces améliorations permettront aux utilisateurs d’engager des conversations orales et d’utiliser des images pour interagir avec le chatbot.
Sommaire
Conversation vocale grâce à la fonctionnalité Voice
Grâce à ces améliorations, les utilisateurs pourront désormais avoir des conversations vocales en temps réel avec ChatGPT. Son nouveau modèle de synthèse vocale génère des sons proches de la voix humaine à partir d’un texte et d’un échantillon de parole de quelques secondes seulement. Concernant la transcription des paroles des utilisateurs en texte, le système s’appuie sur des outils performants permettant une interaction fluide.
Il sera donc possible d’utiliser ChatGPT lors d’un déplacement, de lui demander de raconter une histoire ou encore de régler un débat autour d’une table.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Reconnaissance d’images pour une interaction plus riche
Grâce à la reconnaissance d’images, les utilisateurs pourront obtenir des informations précises et pertinentes sur la base d’une photographie. Par exemple, il sera possible de capturer une photo d’un monument et avoir une conversation avec ChatGPT sur l’histoire du bâtiment. Le programme pourrait également proposer une recette à partir du contenu réel d’un frigo, une fois son contenu présenté sous forme d’image.
Déploiement des nouvelles fonctionnalités
Ces nouvelles capacités seront déployées au cours des deux prochaines semaines pour les abonnés à ChatGPT Plus (la version payante du chatbot) ainsi que pour les organisations clientes du service.
Disponible sur les applications iOS et Android, les utilisateurs pourront activer ces fonctions dans les paramètres de l’application, puis naviguer dans la section « nouvelles fonctionnalités ». Ils auront également la possibilité de choisir parmi cinq options vocales, créées en collaboration avec des acteurs professionnels.