AWS a ajouté de nouvelles langues à son produit Amazon Transcribe, offrant une transcription basée sur un modèle de fondation de la parole pour 100 langues et une multitude de nouvelles capacités d’IA pour les clients.

Annoncé lors de l’événement AWS re:Invent, Amazon Transcribe peut désormais reconnaître davantage de langues parlées et lancer des transcriptions. Les clients AWS utilisent Transcribe pour ajouter des capacités de reconnaissance vocale à leurs applications sur le Cloud AWS.

La société a déclaré dans un article de blog que Transcribe a été formé sur « des millions d’heures de données audio non étiquetées de plus de 100 langues » et utilise des algorithmes auto-supervisés pour apprendre les modèles de la parole humaine dans différentes langues et accents. AWS a déclaré avoir veillé à ce que certaines langues ne soient pas surreprésentées dans les données d’entraînement pour s’assurer que les langues moins utilisées puissent être aussi précises que celles plus fréquemment parlées.

Selon AWS, le nouveau modèle augmente la précision du service de transcription entre 20% et 50% pour la plupart des langues. « En plus d’une amélioration substantielle de la précision, ce grand modèle ASR offre également des améliorations en termes de lisibilité avec une ponctuation et une capitalisation plus précises, » a déclaré le blog AWS annonçant le nouveau modèle de parole.

En plus d’un Amazon Transcribe amélioré, AWS a également apporté des améliorations à ses autres services d’IA. Amazon Personalize, qui apporte une personnalisation basée sur l’apprentissage automatique pour les clients, peut désormais générer un contenu et des recommandations de produits plus convaincants. Et le chatbot AI Amazon Lex fournit désormais des réponses précises et conversationnelles aux questions fréquemment posées.

Nouvelles langues et capacités d’IA pour Amazon Transcribe

La dernière mise à jour d’Amazon Transcribe ajoute 21 nouvelles langues à ses 79 langues existantes, portant le total à 100 langues. Les nouvelles langues incluent l’afrikaans, l’albanais, l’amharique, l’arménien, l’azerbaïdjanais, le bengali, le bosniaque, le bulgare, le birman, le croate, le dari, l’estonien, le géorgien, le haoussa, le kannada, le khmer, le kurde, le letton, le lituanien, le macédonien, le malayalam, le marathi, le mongol, le népalais, le pachto, le persan, le serbe, le cinghalais, le slovaque, le slovène et le tamoul.

La mise à jour introduit également de nouvelles capacités d’IA pour les clients de Transcribe. L’une d’elles est Transcribe Call Analytics, une plateforme qui résume les interactions entre un agent et un client dans un centre d’appels. Elle utilise des modèles d’IA génératifs pour extraire des informations clés du transcript d’appel, telles que le sentiment, l’intention, les problèmes et les résolutions. AWS a déclaré que cette fonctionnalité réduit le travail après l’appel pour les agents et les responsables et leur permet d’accéder rapidement aux informations sans lire l’intégralité du transcript.

Une autre nouvelle capacité d’IA est Transcribe Content Generation, une fonctionnalité qui aide les clients à créer des titres ou des lignes d’objet d’email engageants pour leurs listes de recommandations. Elle utilise des modèles d’IA génératifs pour écrire des phrases accrocheuses et pertinentes qui correspondent au thème de la liste, telles que « Top 10 des films à regarder ce week-end » ou « Comment booster votre productivité avec ces applications ». AWS a déclaré que cette fonctionnalité aide les clients à augmenter les taux de clics et les conversions.

Le service offre des fonctionnalités comme la ponctuation automatique, la détection de la langue, les filtres de vocabulaire personnalisé et le vocabulaire défini par l’utilisateur, excellant même dans des environnements bruyants. AWS Call Analytics, utilisé dans les centres de

Amazon Transcribe par rapport à d’autres services de transcription IA

Bien sûr, AWS n’est pas la seule entreprise à offrir des services de transcription alimentés par l’IA. Il existe d’autres concurrents sur le marché, tels qu’Otter, qui fournit des transcriptions IA aux consommateurs et aux entreprises. Otter dispose également d’un outil de résumé qui condense les longs transcrits en points clés.

Une autre entreprise travaillant sur les services linguistiques alimentés par l’IA est Meta, anciennement connue sous le nom de Facebook. Meta a récemment annoncé qu’elle développe un modèle de traduction alimenté par l’IA générative capable de reconnaître près de 100 langues parlées et de les traduire en texte ou en parole.

AWS possède également d’autres produits IA qui complètent Amazon Transcribe, tels qu’Amazon Personalize, qui permet aux clients de proposer des recommandations personnalisées à leurs utilisateurs, basées sur leur activité précédente. AWS a ajouté une nouvelle fonctionnalité à Amazon Personalize, appelée Génération de contenu, qui peut rédiger des titres ou des lignes d’objet d’email pour connecter thématiquement des listes de recommandations.

Quelle est la précision d’Amazon Transcribe ?

La précision de Transcribe varie en fonction de la source, de la langue, du domaine et des fonctionnalités utilisées. Transcribe prétend avoir une précision de 20% à 50% dans un large éventail de langues, et il fournit également des moyens d’améliorer la précision grâce à l’utilisation de vocabulaires personnalisés et de modèles de langue personnalisés.

Conclusions

Alors qu’AWS intègre l’IA générative dans sa plateforme de transcription, des questions se posent sur l’automatisation potentielle des tâches des agents de centres d’appels. Les applications plus larges du service de transcription de la parole en texte alimenté par l’IA générative d’Amazon Transcribe suscitent la curiosité quant à ses futurs cas d’utilisation.

Que ce soit pour révolutionner le service client ou améliorer la réponse d’urgence, l’évolution d’Amazon Transcribe promet des contributions impactantes dans diverses industries. La collaboration de la puissante technologie IA avec les services de transcription laisse entrevoir un avenir transformateur dans la communication automatisée et la personnalisation de contenu. 

Loïc Frissard

Passionné par le web et l’entrepreneuriat, j’ai fondé Digitiz en 2016. Mon objectif est de vous transmettre mon expérience et de pouvoir vous faire gagner du temps dans le choix de vos outils.

Pin It on Pinterest

Share This