Le nouvel outil d’interprétabilité mécaniste de cette startup vous autorise de déboguer les LLM

L’actualité tech du jour met en lumière un développement significatif.

Le nouvel outil d’interprétabilité mécaniste de cette startup vous autorise de déboguer les LLM

Goodfire veut que la formation des modèles d’IA ressemble davantage à du bon vieux génie logiciel.

La startup Goodfire, basée à San Francisco, vient de publier un nouvel outil, appelé Silico, qui autorise aux chercheurs et aux ingénieurs d’examiner un modèle d’IA d’IA et d’ajuster ses paramètres (les paramètres qui déterminent le comportement d’un modèle) pendant la formation. Cela pourrait donner aux modélistes un contrôle plus précis sur la façon dont cette technologie est construite qu’on ne le pensait auparavant.

L’entreprise affirme que sa mission est de faire en sorte que la construction de modèles d’IA ressemble moins à de l’alchimie qu’à une science.

Goodfire affirme que Silico est le premier outil standard de ce type capable d’aider les développeurs à déboguer toutes les étapes du processus de développement, de la création d’un ensemble de informations à la formation d’un modèle d’IA.

L’entreprise affirme que sa mission est de faire en sorte que la construction de modèles d’IA ressemble moins à de l’alchimie qu’à une science. Bien sûr, les LLM comme ChatGPT et Gemini peuvent faire des choses incroyables. Mais personne ne sait exactement comment ni pourquoi ils fonctionnent, ce qui peut rendre difficile la correction de leurs défauts ou le blocage de comportements indésirables.

« Nous avons constaté un écart croissant entre la compréhension des modèles et l’ampleur de leur déploiement », a déclaré Eric Ho, PDG de Goodfire, au MIT Technology Review lors d’une conversation exclusive avant la sortie de Silico. « Je pense que le sentiment dominant dans tous les grands laboratoires pionniers aujourd’hui est qu’il faut juste plus d’échelle, plus de calcul, plus de éléments, et ensuite on obtient l’AGI [artificial general intelligence] et rien d’autre n’a d’importance. Et nous disons non, il existe une meilleure solution.

Goodfire fait partie d’une petite poignée d’entreprises, parmi lesquelles les leaders de l’industrie Anthropic, OpenAI et Google DeepMind, pionnières d’une technique connue sous le nom d’interprétabilité mécaniste, qui vise à comprendre ce qui se passe à l’intérieur d’un modèle d’IA lorsqu’il exécute une tâche en cartographiant ses neurones et les voies qui les relient. (Le MIT Technology Review a sélectionné l’interprétabilité mécaniste comme l’une de ses 10 technologies révolutionnaires de 2026.)

Les mois à venir apporteront sans doute plus de précisions.

Pour aller plus loin :


Lire l’article original sur MIT Technology Review : MIT Technology Review