Databricks intègre GPT-5.5 aux flux de travail des agents d'entreprise

Nouvelle information marquante dans l’actualité IA.

Databricks intègre GPT-5.5 aux flux de travail des agents d’entreprise

GPT-5.5 a établi une inédite référence sur OfficeQA Pro, le test de performance de Databricks pour les tâches complexes des agents d’entreprise.

Précision obtenue lors du test de performance OfficeQA Pro (référence actuelle)

Réduction du nombre d’erreurs dans le test de performance OfficeQA Pro par rapport à GPT-5.4

Réduction du nombre d’erreurs dans le test de performance OfficeQA Pro par rapport à GPT-5.4

Databricks met GPT-5.5 à la disposition des flux de travail des agents du service client, après que ce modèle a établi un nouveau record de performance sur OfficeQA Pro, la plateforme de référence de l’entreprise pour les tâches complexes liées aux documents d’entreprise.

OfficeQA Pro évalue la manière dont les modèles gèrent l’analyse syntaxique, l’extraction d’informations et le raisonnement ancré dans le contexte au sein de flux de travail impliquant des PDF numérisés, des fichiers hérités et des documents à long contexte, tâches qui provoquent souvent des dysfonctionnements dans les systèmes d’agents de production.

Dans le cadre de l’approche « agent-harness », GPT-5.5 a réduit le taux d’erreurs de 46 % par rapport à GPT-5.4 et est devenu le premier système à dépasser les 50 % de précision sur OfficeQA Pro.

OfficeQA Pro traite un grand nombre de documents d’entreprise numérisés ou hérités, pour lesquels de petites erreurs d’extraction lors de l’analyse peuvent avoir des répercussions en aval sur l’ensemble du flux de travail. « Dès lors qu’un chiffre ou un nombre ne peut être extrait, cela modifie complètement le cheminement des données sur lesquelles travaille l’agent », explique Singhvi.

C’est dans ces flux de travail nécessitant un travail d’analyse syntaxique intensif que Databricks a constaté les gains les plus importants grâce à GPT-5.5. « Les modèles précédents, comme le 5.4, n’étaient pas capables d’analyser correctement tous les chiffres, mais il semble que le 5.5 affiche une nette amélioration dans l’analyse des documents plus anciens et des PDF numérisés », explique Singhvi.

Le contexte technologique évolue, et ce type d’annonce en témoigne.

Sur le même sujet :

Via OpenAI : OpenAI