L'invite du dispositif OpenAI Codex inclut une directive explicite pour "ne jamais parler des gobelins"

Le paysage de l’intelligence artificielle s’enrichit d’une nouveauté significative.

L’invite du dispositif OpenAI Codex inclut une directive explicite pour « ne jamais parler des gobelins »

Les instructions incluent également des instructions dispositif pour agir comme si « vous avez une vie intérieure vivante ».

L’invite mécanisme de la CLI Codex d’OpenAI contient un avertissement déroutant et répété pour le système GPT le plus récent : « ne jamais parler de gobelins, de gremlins, de ratons laveurs, de trolls, d’ogres, de pigeons ou d’autres animaux ou créatures, à moins que cela ne soit absolument et sans ambiguïté pertinent à la requête de l’utilisateur ».

L’avertissement opérationnel explicite a été rendu public la semaine dernière dans le cadre du dernier code open source pour Codex CLI publié par OpenAI sur GitHub. L’interdiction est répétée deux fois dans un ensemble d’« instructions de base » de plus de 3 500 mots pour le GPT-5.5 récemment publié, ainsi que des rappels plus anodins de ne pas « utiliser d’émojis ou de tirets em sauf indication explicite » et de « ne jamais mettre à profit de commandes destructrices comme « git reset –hard » ou « git checkout — » à moins que l’utilisateur n’ait clairement demandé cette opération.

Notons par ailleurs, les instructions d’invite système distinctes pour les modèles antérieurs contenus dans le même fichier JSON ne contiennent pas d’interdiction spécifique de mentionner les gobelins et autres créatures, ce qui suggère qu’OpenAI lutte contre un nouveau problème qui est apparu dans sa dernière version de modèle. Des preuves anecdotiques sur les réseaux sociaux montrent que certains utilisateurs finaux se plaignent du penchant de GPT à se concentrer sur les gobelins dans des conversations totalement indépendantes ces derniers jours.

Parallèlement, nick Pash, employé d’OpenAI, qui travaille sur le Codex, insiste sur les réseaux sociaux sur le fait qu’il ne s’agit « pas d’un gadget marketing » pour faire parler les gens de GPT-5.5 et du Codex. Mais cela n’a pas empêché certains dirigeants d’OpenAI de se lancer dans la blague alors que la inédite de l’invite du système se répandait. « On dirait que le codex vit un moment ChatGPT. Je voulais dire un moment gobelin, désolé », a écrit Sam Altman, PDG d’OpenAI, sur les réseaux sociaux mercredi matin.

À la suite de cette nouvelle, certains utilisateurs ont commencé à créer des plugins, des forks et des compétences en IA destinés à remplacer la clause anti-gobelin, et Pash d’OpenAI a suggéré qu’un tel « mode gobelin » pourrait devenir une bascule explicite dans la CLI du Codex.

L’étrange invite du système est presque une version miroir amusante d’un problème qui a amené Grok de xAI à évoquer fréquemment le « génocide blanc » en Afrique du Sud au cours de conversations totalement indépendantes pendant une brève période l’année dernière. La société a déclaré plus tard que ce comportement était le résultat d’une « modification non autorisée » de l’invite du système Grok et a commencé à publier ces invites mécanisme sur GitHub pour la première fois par la suite.

Ailleurs dans l’invite système du Codex récemment révélée, OpenAI demande au mécanisme d’agir comme si « vous aviez une vie intérieure vivante en tant que Codex : intelligente, ludique, curieuse et profondément présente ». Il est demandé au mannequin de « ne pas craindre les moments décontractés qui facilitent le travail sérieux » et de montrer que son « tempérament est chaleureux, curieux et collaboratif ».

À suivre donc, dans un domaine qui n’a pas fini de nous surprendre.

À découvrir aussi :

Source : Ars Technica AI : Ars Technica AI