Google dévoilement Gemini 3.5 Live Translate, une solution de traduction vocale instantanée

Voici une annonce qui mérite l’attention des observateurs du secteur.

Google dévoilement Gemini 3.5 Live Translate, une solution de traduction vocale instantanée

Les traductions vocales préservent le ton, le rythme et la hauteur de voix de l’orateur, et sont dotées de filigranes SynthID pour plus de sécurité.

En complément, google travaille depuis des années sur la traduction en temps réel, qu’il qualifie d’« expérience pionnière en matière d’apprentissage automatique ». Nous avons assisté à de nombreuses démonstrations lors d’événements Google par le passé, mais il fallait disposer d’un téléphone Google, d’écouteurs ou d’un autre équipement spécifique. L’année dernière, Google a mis la traduction en temps réel à la disposition d’un plus grand nombre d’utilisateurs via l’application Translate, et étend désormais encore davantage sa disponibilité. Avec la sortie de Gemini 3.5 Live Translate, vous bénéficierez d’une traduction instantanée dans davantage de contextes et avec une latence plus faible que jamais.

Ce récent modèle d’IA fait partie de la gamme 3.5 lancée lors de la conférence I/O. Jusqu’à présent, Google n’avait déployé que la version Flash, mais nous nous attendons à ce qu’un modèle d’IA Pro soit disponible dans les semaines à venir. Gemini 3.5 Live Translate est un modèle de synthèse vocale conçu pour détecter et traduire automatiquement dans plus de 70 langues.

Selon Google, Gemini 3.5 Live Translate est suffisamment rapide pour suivre le rythme d’une conversation normale, avec un décalage de quelques secondes seulement par rapport à l’interlocuteur, tout en reproduisant l’intonation, le rythme et la hauteur de la voix. En bref, la voix ressemble davantage à la vôtre qu’à celle d’un robot générique. Les démonstrations, qui ont toutes été enregistrées dans des conditions contrôlées, sont effectivement impressionnantes. Vous n’aurez toutefois pas à attendre longtemps pour vous rendre compte par vous-même des capacités de ce modèle d’IA.

Gemini 3.5 Live Translate est en cours de déploiement dans plusieurs parties de l’écosystème Google. Les développeuses et développeurs peuvent commencer à créer des applications grâce à une préversion publique accessible dans l’API Gemini Live ou dans AI Studio. Le modèle traite la parole en continu et gère automatiquement toutes les entrées multilingues, ce qui évite aux développeurs d’avoir à configurer manuellement les paramètres. Il filtre également les bruits de fond dans les environnements bruyants.

Certains clients professionnels auront également accès au nouveau modèle de traduction dans Google Meet dès ce mois-ci, en amont d’un déploiement à plus grande échelle. Google indique qu’il modifie l’interface de Meet afin de mettre davantage en avant la fonctionnalité de traduction en direct. Il convient notamment de noter que la version 3.5 de Live Translate sera bientôt disponible dans l’application Google Translate, tant sur Android que sur iOS.

À suivre donc, dans un domaine qui n’a pas fini de nous surprendre.

À découvrir aussi :

Source : Ars Technica AI : Ars Technica AI