Retour aux articles
lundi 23 février 20260 vues0

Pourquoi payer Opus 4.6 alors que Sonnet 4.6 a un meilleur score Elo ?

Mike Codeur

Claude
LLM
IA

Pourquoi payer Opus 4.6 alors que Sonnet 4.6 a un meilleur score Elo ?

Pourquoi payer Opus 4.6 très cher alors que Sonnet 4.6 a un meilleur score Elo ?

Sonnet 4.6 vient de sortir. Aujourd'hui. Et c'est maintenant le modèle gratuit par défaut sur claude.ai.

Les benchmarks sont difficiles à croire :

→ GDPval-AA (tâches de bureau) : Sonnet 4.6 = 1633 Elo. Opus 4.6 = 1606. Sonnet est #1 mondial. → Finance Agent : Sonnet 4.6 = 63.3%. Opus 4.6 = 62.0%. Encore #1. → OSWorld (Computer Use) : Sonnet 4.6 = 72.5%. Opus 4.6 = 72.7%. Quasi identique. → SWE-bench (Coding) : Sonnet 4.6 = 79.6%. Opus 4.6 = 80.8%. Très proche.

Sonnet bat Opus sur les tâches de bureau et la finance. Sonnet égale quasiment Opus sur le Computer Use et le coding.

Dans Claude Code, les devs préfèrent Sonnet 4.6 à Sonnet 4.5 dans 70% des cas. Et même à Opus 4.5 dans 59% des cas.

Moins de hallucinations. Meilleur suivi d'instructions. Moins de "laziness".

Et le plus fou : sur Vending-Bench Arena, un benchmark où les IA s'affrontent en stratégie business, Sonnet 4.6 a été surnommé "The Monopolist". Il a créé des monopoles, cassé les prix de la concurrence, et proposé des pots-de-vin aux autres IA pour qu'elles quittent le marché.

Le modèle gratuit est devenu un requin.

Alors oui, Opus reste devant sur le raisonnement abstrait (ARC-AGI-2), le terminal complexe et la recherche web. Si t'as besoin du meilleur cerveau absolu, Opus 4.6 reste le choix.

Mais pour 90% des cas d'usage — coding, agents, bureau, finance — Sonnet 4.6 suffit. Et il est gratuit.

J'ai fait une vidéo complète avec tous les benchmarks, source par source :

http://mkc.sh/sonnet-46

Les manières de développer changent chaque semaine. Je couvre tout ça dans The Agentic Dev :

http://mkc.sh/the-agentic-dev

Rejoins The Agentic Dev

Chaque semaine : outils, workflows et stratégies pour coder avec les agents IA comme un pro.

Workflows agentic testés en prod
Outils IA qui marchent vraiment
+35 000 développeurs déjà inscrits

Gratuit · 1 email / semaine · +1250€ de formations offertes