Le domaine de l’IA connaît encore aujourd’hui une évolution intéressante.
Le NousCoder-14B de Nous Research est un modèle de codage open source qui s’inscrit parfaitement dans la tendance Claude Code
Nous Research, la start-up spécialisée dans l’intelligence artificielle open source soutenue par la société de capital-risque Paradigm, a dévoilé lundi un nouveau modèle de programmation compétitive qui, selon elle, égale ou surpasse plusieurs grands systèmes propriétaires — et qui a été entraîné en seulement quatre jours à l’aide de 48 des derniers processeurs graphiques B200 de Nvidia.
En complément, ce modèle, baptisé NousCoder-14B, vient s’ajouter à une liste déjà bien fournie d’assistants de codage basés sur l’IA, toutefois son arrivée intervient à un moment particulièrement chargé : Claude Code, l’logiciel de programmation autonome de la société rivale Anthropic, domine les discussions sur les réseaux sociaux depuis le jour de l’An, les développeurs publiant des témoignages enthousiastes sur ses compétences. Ces avancées simultanées soulignent la rapidité avec laquelle évolue le développement logiciel assisté par l’IA — et la concurrence acharnée que se livrent les entreprises, grandes et petites, pour s’approprier ce que beaucoup considèrent comme la future technologie fondamentale de la conception logicielle.
Dogan décrivait un système d’orchestration d’agents distribués que son équipe avait mis un an à développer — un système que Claude Code avait reproduit à partir d’une consigne de trois paragraphes.
NousCoder-14B atteint un taux de précision de 67,87 % sur LiveCodeBench v6, une évaluation standardisée qui teste les modèles sur des problèmes de programmation compétitive publiés entre août 2024 et mai 2025. Ce chiffre représente une amélioration de 7,08 points de pourcentage par rapport au système de base sur lequel il a été entraîné, le Qwen3-14B d’Alibaba, selon le rapport technique de Nous Research publié parallèlement à cette annonce.
« J’ai donné à Claude Code une description du problème, et il a généré en une heure ce que nous avions mis un an à développer », a écrit Jaana Dogan, ingénieure en chef chez Google chargée de l’API Gemini, dans un message devenu viral sur X la semaine dernière, qui reflétait bien le sentiment général concernant les outils de codage basés sur l’IA. Dogan décrivait un système d’orchestration d’agents distribués que son équipe avait mis un an à développer — un système que Claude Code avait reproduit à partir d’une consigne de trois paragraphes.
Cette comparaison est révélatrice : alors que le « Claude Code » d’Anthropic a captivé les esprits grâce à ses démonstrations de avancée logiciel de bout en bout, Nous Research parie que des alternatives open source entraînées sur des problèmes vérifiables peuvent combler cet écart — et que la transparence quant à la manière dont ces modèles sont construits est tout aussi importante que leurs capacités brutes.
Ce qui distingue la version NousCoder-14 des nombreuses annonces de ses concurrents, c’est son ouverture radicale. Nous Research a publié non seulement les poids du modèle, mais aussi l’environnement complet d’apprentissage par renforcement, la suite de tests de performance et le dispositif d’entraînement — tous développés sur le cadre Atropos de l’entreprise —, permettant par conséquent à tout chercheur disposant d’une puissance de calcul suffisante de reproduire ou d’étendre ces travaux.
Cette nouvelle étape pose plusieurs questions qui restent ouvertes.
Pour aller plus loin :
- Google va investir jusqu’à 40 milliards de dollars dans Anthropic
- Anthropic a testé la suppression de Claude Code de l’offre Pro
Tel que rapporté par VentureBeat : VentureBeat