OpenAI lance de nouvelles fonctionnalités d’intelligence vocale dans son API | TechCrunch

Le secteur de l’IA vient d’être le théâtre d’un développement notable.

OpenAI lance de nouvelles fonctionnalités d’intelligence vocale dans son API | TechCrunch

OpenAI a présenté jeudi que son API allait désormais intégrer plusieurs nouvelles fonctionnalités d’intelligence vocale destinées à aider les développeurs à créer des applications capables de parler, de transcrire et de traduire les conversations avec les utilisateurs.

À ce sujet, le nouveau système GPT-Realtime-2 de l’entreprise est un autre système vocal, conçu pour créer une simulation vocale réaliste capable de dialoguer avec les utilisateurs. Néanmoins, contrairement à son prédécesseur (GPT-Realtime-1.5), celui-ci s’appuie sur un raisonnement de type GPT-5 qui, selon OpenAI, a été développé pour traiter les demandes plus complexes des utilisateurs.

L’entreprise lance également GPT-Realtime-Translate, un outil qui, comme son nom l’indique, est conçu pour fournir des services de traduction en temps réel qui « suivent le rythme » de l’utilisateur, dans le cadre d’une conversation. Cette fonctionnalité prend en charge plus de 70 langues d’entrée (c’est-à-dire les langues qu’elle est capable de comprendre) et 13 langues de sortie (les langues dans lesquelles elle traduit pour l’utilisateur).

Enfin, l’entreprise a également lancé une dernière fonctionnalité de transcription, GPT-Realtime-Whisper, qui offre aux utilisateurs des capacités de conversion de la parole en texte en temps réel, capturées au fur et à mesure que les interactions se déroulent.

À relever, « Ensemble, les modèles que nous lançons font évoluer l’audio en temps réel, passant d’un simple mécanisme de questions-réponses à des interfaces vocales capables d’accomplir de véritables tâches : écouter, raisonner, traduire, transcrire et agir au fur et à mesure que la conversation se déroule », a déclaré l’entreprise.

À qui ces mises à jour s’adressent-elles ? Les structures qui souhaitent développer leurs capacités en matière de service client constituent une cible évidente. Cependant, OpenAI souligne en outre que ses nouvelles fonctionnalités seront utiles dans de nombreux domaines, notamment l’éducation, les médias, l’événementiel et les plateformes de créateurs, entre autres.

L’évolution de ce dossier sera à suivre avec attention.

À lire également :


Information rapportée par TechCrunch AI : TechCrunch AI