2023 — GPT-4, Claude, Gemini : l’année des LLM multimodaux

// ÈRE LLM · 2023

GPT-4, Claude 2, Gemini : la course au modèle universel

Si 2022 est l’année où l’IA conversationnelle s’installe dans le grand public, 2023 est l’année où elle devient sérieuse. GPT-4 explose les benchmarks académiques. Claude d’Anthropic rivalise. Google sort Gemini. Les modèles voient désormais des images, traitent 100 000 tokens, passent l’examen du barreau américain.

3 labs en compétition·+100K tokens de contexte·Multimodal texte + image

Le contexte : la surchauffe après ChatGPT

Le succès de ChatGPT fin 2022 a mis tout l’écosystème sous tension. Google a déclaré le « code rouge« . Microsoft a investi 10 milliards supplémentaires dans OpenAI en janvier 2023. Anthropic a levé 300 millions chez Google puis 4 milliards chez Amazon. La bataille des LLM n’est plus technique, elle est industrielle.

Les utilisateurs, eux, commencent à buter sur les limites : hallucinations fréquentes, contexte court (4 000 tokens pour GPT-3.5), impossibilité de voir des images, incapacité à raisonner sur des problèmes complexes. Les labs savent ce qu’il faut livrer — et ils livrent en 2023.

L’événement : la cascade des releases

Mars 2023 : OpenAI publie GPT-4. Contexte de 32 000 tokens, multimodal (il voit les images), performances qui écrasent GPT-3.5. Scores : 90e percentile à l’examen du barreau, médaille aux Olympiades de biologie, résolution de problèmes mathématiques complexes. Google sort Bard (basé sur LaMDA) trois jours plus tôt pour ne pas perdre la face.

Juillet 2023 : Anthropic lance Claude 2 avec un contexte de 100 000 tokens. Tu peux lui donner un livre entier à analyser. La fenêtre de contexte devient un axe de compétition. Meta libère Llama 2 en open source — ça change la donne : n’importe qui peut désormais faire tourner un LLM quasi-GPT-3.5 sur son propre serveur.

Décembre 2023 : Google frappe fort avec Gemini, entièrement multimodal dès la conception (texte, image, audio, vidéo, code). Les benchmarks se multiplient, les classements changent chaque mois. OpenAI riposte en novembre avec le GPT-4 Turbo à 128K tokens et les Custom GPTs, préfigurant les agents.

Nous sommes passés en un an d’une IA qui complète des phrases à une IA qui lit des contrats, code des applications, analyse des radiographies. C’est le même type de saut qu’entre un cheval et une voiture.

— Dario Amodei, CEO d’Anthropic, novembre 2023

L’impact : l’IA entre dans les entreprises

2023 est aussi l’année de l’adoption enterprise. Microsoft intègre GPT-4 dans Copilot (Word, Excel, Outlook) — 30$/mois par utilisateur. OpenAI lance ChatGPT Enterprise en août. Anthropic signe avec AWS et Zoom. Un cabinet d’avocats américain fait plaider à un juge une affaire entièrement rédigée par ChatGPT — et se prend une sanction retentissante pour hallucinations.

Côté régulation, l’Europe finalise l’AI Act (décembre 2023). Biden signe un executive order sur l’IA. La Chine publie ses propres règles. Le décor politique change : l’IA n’est plus un jouet de labs, c’est un enjeu de souveraineté. Les « Frontier Models » deviennent classifiés au même titre que les technologies militaires.

Résonance 2026 : l’année pivot

Avec le recul, 2023 apparaît comme l’année pivot de l’ère LLM. Tout ce qui suivra — raisonnement étendu en 2024, agents autonomes en 2025, Claude Opus 4.7 en 2026 — trouve ses racines dans les architectures et les patterns produits mis au point cette année-là. Le contexte long, le multimodal, le RLHF avancé, les tools — tout y est en germe.

Chez CMEDIA, 2023 est aussi l’année où nous avons pivoté. Nous avons cessé de traiter l’IA comme un sujet de veille et commencé à la vendre dans nos prestations. Intégration de Claude dans les CMS clients, génération de fiches produits, chatbot SAV, automatisation du support : toutes ces offres d’aujourd’hui datent de cette année charnière.