Anthropic lance Claude Opus 4.7 : une mise à jour majeure pour la programmation agentique, la vision haute résolution et les tâches autonomes à long terme

Un pas supplémentaire vient d’être franchi dans cette révolution technologique en cours.

Anthropic lance Claude Opus 4.7 : une mise à jour majeure pour la programmation agentique, la vision haute résolution et les tâches autonomes à long terme

Anthropic a lancé Claude Opus 4.7, son tout dernier modèle de pointe et le successeur direct de Claude Opus 4.6. Cette version est présentée comme une amélioration ciblée plutôt que comme un véritable saut générationnel, mais les gains qu’elle apporte sont considérables dans les domaines qui importent le plus aux développeurs créant des applications concrètes basées sur l’IA : l’ingénierie logicielle agentique, le raisonnement multimodal et l’exécution autonome de tâches de longue durée.

Anthropic propose une gamme de modèles classés par niveaux : Haiku (rapide et léger), Sonnet (équilibré) et Opus (performances maximales). Opus 4.7 se situe au sommet de cette gamme, juste derrière le tout nouveau Claude Mythos, dont Anthropic a limité l’accès.

La version 4.7 d’Opus apporte une amélioration notable par rapport à la version 4.6 en matière d’ingénierie logicielle avancée, avec des progrès particulièrement marqués pour les tâches les plus complexes. Surtout, les utilisateurs finaux indiquent pouvoir confier en toute confiance à Opus 4.7 leurs tâches de programmation les plus complexes — celles qui nécessitaient auparavant une supervision étroite —, car il gère les tâches complexes et de longue durée avec rigueur et cohérence, suit les instructions à la lettre et met au point des moyens de vérifier ses propres résultats avant de rendre compte.

Dans la foulée, le fait que le système vérifie ses propres résultats marque un changement de comportement significatif. Les modèles antérieurs produisaient souvent des résultats sans effectuer de contrôles de cohérence internes ; Opus 4.7 semble boucler ce cycle de manière autonome, ce qui a des implications importantes pour les pipelines CI/CD et les workflows agentiques en divers étapes.

Les premiers testeurs ont quantifié avec précision les améliorations apportées au codage. Lors d’un test de performance portant sur 93 tâches de codage, Opus 4.7 a amélioré le taux de résolution de 13 % par rapport à Opus 4.6, notamment en résolvant quatre tâches que ni Opus 4.6 ni Sonnet 4.6 n’avaient pu résoudre. Sur CursorBench — un logiciel d’évaluation largement utilisé par les développeurs —, Opus 4.7 a obtenu un score de 70 %, contre 58 % pour Opus 4.6. Quant aux workflows complexes en de multiples étapes, un testeur a constaté un gain de 14 % par rapport à Opus 4.6, avec moins de jetons et un tiers des erreurs de l’outil — et il convient de noter qu’Opus 4.7 a été le premier modèle à réussir leurs tests de besoins implicites, poursuivant son exécution malgré des défaillances de l’outil qui, auparavant, bloquaient complètement Opus.

Il faut souligner, l’une des améliorations techniques les plus concrètes apportées à Opus 4.7 concerne sa capacité multimodale. Opus 4.7 peut désormais traiter des images dont le côté le plus long atteint 2 576 pixels (environ 3,75 mégapixels), soit plus de trois fois le nombre de pixels pris en charge par les modèles Claude précédents. De nombreuses applications concrètes — qu’il s’agisse d’agents informatiques capables de lire des captures d’écran d’interfaces utilisateur particulièrement chargées ou d’extraire des informations à partir de schémas techniques complexes — échouent non pas parce que le modèle d’IA manque de capacité de raisonnement, mais parce qu’il ne parvient pas à distinguer les détails visuels les plus fins. Cela ouvre la voie à une multitude d’utilisations multimodales qui reposent sur des détails visuels précis : des agents informatiques chargés d’analyser des captures d’écran riches en informations, l’extraction de données à partir de schémas complexes, ainsi que des tâches nécessitant des références au pixel près.

Le contexte technologique évolue, et ce type d’annonce en témoigne.

Dans le même ordre d’idées :

Claude Code coûte jusqu’à 200 $ par mois. Goose offre les mêmes fonctionnalités gratuitement.

Tel que rapporté par MarkTechPost : MarkTechPost