DeepSeek a rendu permanente, le 22 mai 2026, sa baisse de prix de 75 % sur V4 Pro : 0,87 $ le million de tokens en sortie. Le même jour, Anthropic confirmait que son modèle Mythos, jamais commercialisé, a trouvé plus de 10 000 failles critiques en un mois. Deux annonces, deux paris inverses sur ce que tu vas payer pour de l’IA en 2026.
Deux annonces, deux directions opposées
Le 22 mai 2026, DeepSeek a transformé une promo en tarif standard. Le rabais de 75 % sur V4 Pro, censé expirer le 31 mai, devient permanent. Résultat : 0,435 $ en entrée et 0,87 $ en sortie par million de tokens, contre 1,74 $ / 3,48 $ avant. Source : la doc API de DeepSeek, relayée par The Next Web le 24 mai.
Le 23 mai, Anthropic publiait le premier bilan de Project Glasswing. Son modèle Claude Mythos Preview, branché sur une cinquantaine de partenaires (AWS, Google, Microsoft, Cloudflare, Mozilla…), a identifié plus de 10 000 vulnérabilités high ou critical en un mois. Le détail compte : Anthropic refuse de vendre ce modèle au public. Source : Engadget et le TNW.
Tu as donc d’un côté un acteur qui démocratise l’accès en cassant les prix. De l’autre, un acteur qui verrouille volontairement sa techno la plus avancée. Ce ne sont pas deux nouvelles isolées. Ce sont deux théories du marché qui s’affrontent.
Pour toi qui factures des tokens ou choisis un modèle, ça change la donne concrètement. Le reste de l’article décortique chaque stratégie, puis te dit quoi faire.
DeepSeek : le prix comme arme de conquête
DeepSeek V4 a été livré le 24 avril 2026 en deux variantes, sous licence MIT (poids ouverts). V4 Pro : 1,6 trillion de paramètres, fenêtre de contexte d’1 million de tokens. C’est exactement le terrain où le coût des tokens explose : gros documents, bases de code entières, historiques de conversation longs.
Verrouiller le rabais un mois après le lancement envoie un signal clair. DeepSeek privilégie le volume sur la marge. La société décrit V4 comme l’entrée dans « l’ère du contexte 1M rentable » (TNW). Traduction : devenir le réflexe par défaut pour tout ce qui brasse beaucoup de texte.
Le positionnement tarifaire est brutal. Voici les prix officiels, par million de tokens, des flagships actuels de chaque éditeur :
| Modèle | Entrée ($/1M) | Sortie ($/1M) |
|---|---|---|
| DeepSeek V4 Pro | 0,435 | 0,87 |
| Google Gemini 3.5 Flash | 0,15 | 0,60 |
| OpenAI GPT-5.5 | 5,00 | 30,00 |
| Anthropic Claude Opus 4.7 | 5,00 | 25,00 |
Le contraste saute aux yeux sur le prix de sortie, celui qui pèse le plus dans une facture d’agent. Voici l’écart, normalisé sur le tarif de V4 Pro :
Sur la sortie, V4 Pro coûte environ 29 fois moins que Claude Opus 4.7 et 34 fois moins que GPT-5.5. Et ce n’est pas un modèle au rabais côté perfs : il talonne Claude Opus 4.7 sur SWE-bench Verified (80,6 % contre 80,8 %, chiffres annoncés par les éditeurs), d’après le guide Codersera mis à jour le 23 mai.
Anthropic : la capacité comme barrière, pas comme produit
Anthropic prend le chemin inverse. Mythos n’est pas en vente. Le modèle reste réservé à environ 50 partenaires « systémiques » via Project Glasswing, selon CSO Online. La raison affichée : un modèle capable de trouver et d’exploiter des failles tout seul est trop dangereux pour un accès libre.
Les chiffres du bilan du 23 mai sont parlants. Cloudflare a trouvé 2 000 bugs, dont 400 sévères. Mozilla a corrigé 271 failles dans Firefox, soit dix fois plus qu’avec un modèle Claude antérieur (Dataconomy).
Mais le chiffre qui dérange est ailleurs. Sur les 10 000+ failles candidates, seules 97 ont été patchées à ce jour (TNW). La capacité de détection écrase la capacité de correction. C’est le vrai message de Glasswing : trouver les bugs est devenu trivial, les réparer ne l’est pas.
En parallèle, des signaux pointent vers un produit « Mythos 1 » (label preview) en préparation pour Claude Code et Claude Security, d’après les fuites repérées par TestingCatalog le 23 mai. À vérifier : ce point repose sur des chaînes de code et un modèle brièvement visible dans l’interface, pas sur une annonce officielle. Je ne le traite pas comme acquis.
Ce que ça change pour ta facture et tes choix
Le coût d’usage réel mérite une nuance que les tableaux de prix masquent. V4 Pro est verbeux. Pour compléter l’Artificial Analysis Intelligence Index, il a brûlé 4 à 5 fois plus de tokens en sortie que la médiane, rapporte le test de Thomas Wiegold.
Le prix affiché survend donc l’économie réelle. Reste que l’écart tient. Sur le même test, un commentateur Hacker News cité dans cette revue a fait auditer un endpoint TypeScript complet (API, DTOs, service, modèles) pour 0,09 $ sur V4 Pro. Le même audit sur Claude Opus 4.7 aurait coûté entre 9 et 13 $. Un rapport de l’ordre de 100 pour 1, même verbosité incluse.
À mon sens, la vraie bascule de 2026 n’est pas « DeepSeek remplace Claude ». C’est le routage par tâche. Tu envoies les tâches simples et volumineuses vers le modèle le moins cher capable de les faire. Tu réserves les modèles premium aux boucles d’agents complexes et au raisonnement critique.
Pour situer l’enjeu financier : Salesforce projette 300 millions de dollars de dépense en tokens Anthropic cette année (TNW). Au tarif DeepSeek, un volume équivalent coûterait une fraction de ce montant. C’est ce calcul qui fait paniquer les directions financières.
Cas d’usage concret : router son agent de code
Pour qui : un développeur freelance ou une petite équipe SaaS qui utilise un agent de code en continu (revue de PR, génération de tests, documentation), avec une facture API qui grimpe.
Quoi : répartir les tâches entre deux modèles au lieu de tout envoyer vers un modèle premium.
Comment, en 4 étapes :
- Lister tes tâches par criticité. Génération de tests, reformatage, résumés de diffs, documentation : tâches « simples ». Refactor multi-fichiers, debug d’archi, boucles d’agent longues : tâches « critiques ».
- Brancher DeepSeek V4 Pro sur les tâches simples. L’API est compatible OpenAI : il suffit de remplacer la chaîne de modèle par
deepseek-v4-pro, sans changer de SDK (Codersera). - Garder Claude Opus 4.7 ou GPT-5.5 pour les tâches critiques, où la fiabilité sur les boucles d’agent longues reste supérieure (Codersera).
- Mesurer sur une semaine réelle, pas sur le prix affiché. Compte les tokens de sortie effectifs, vu la verbosité de V4.
Résultat : sur le volume de tâches « simples », qui représente souvent la majorité des appels, le gain par requête se chiffre en dizaines de fois moins cher. L’audit TypeScript à 0,09 $ contre 9-13 $ donne l’ordre de grandeur. Le gain dépend de ton mix de tâches : plus tu as de volume simple, plus la bascule est rentable.
Limites et précautions
L’hallucination. V4 Pro affiche un taux de 94 % sur le benchmark AA-Omniscience : quand il ne sait pas, il répond quand même au lieu de s’abstenir (DeepInfra). À éviter sur les tâches de recherche factuelle sensibles à la confiance.
Le statut « preview ». DeepSeek qualifie lui-même V4 de preview et décrit son architecture comme « inélégante » dans son rapport technique (Weijin Research). Les benchmarks publiés sont auto-déclarés ; la reproduction indépendante est en cours. Teste sur ta propre suite avant de t’engager.
Le risque géopolitique et IP. Anthropic accuse publiquement DeepSeek d’avoir mené des « distillation attacks », c’est-à-dire de s’être entraîné sur les réponses de Claude. DeepSeek n’a pas répondu en détail. L’accusation reste non tranchée (TNW). Pour des données sensibles, router vers un fournisseur chinois reste un choix de conformité, pas seulement de prix.
Côté Mythos, l’inverse. Le problème n’est pas le prix mais l’indisponibilité. Tu ne peux pas l’utiliser. Et même là où l’IA excelle (trouver des failles), le maillon faible reste humain : 97 patchs sur 10 000+ failles. Un outil de détection ne vaut rien sans capacité de correction derrière.
Conclusion
Si tu paies des tokens au volume sur des tâches simples, teste DeepSeek V4 Pro dès cette semaine : la bascule est une ligne de code et l’économie est réelle, verbosité comprise. Si tu traites des données réglementées ou des boucles d’agent critiques, garde Claude ou GPT-5.5 et ne cède pas à l’argument prix seul.
Ce qu’il faut surveiller dans les prochaines semaines : la sortie effective de Mythos 1 dans Claude Code (encore au stade de fuite), un éventuel modèle Opus 4.8, et surtout la réponse tarifaire des acteurs occidentaux. La vraie question reste ouverte : l’Occident comblera-t-il l’écart de prix avant que DeepSeek ne comble l’écart de capacité ?
Sources
- The Next Web — DeepSeek made its 75% discount permanent (24 mai 2026)
- TestingCatalog — Anthropic prepares Mythos 1 for Claude Code and Security (23 mai 2026)
- Engadget — Mythos has found more than 10,000 vulnerabilities (23 mai 2026)
- The Next Web — Glasswing : 10,000 flaws, only 97 patched
- Dataconomy — Project Glasswing & Mythos (25 mai 2026)
- CSO Online — Project Glasswing has uncovered 10,000 vulnerabilities
- Codersera — DeepSeek V4-Pro Review : benchmarks & pricing
- Codersera — DeepSeek V4 release & API migration
- Thomas Wiegold — DeepSeek V4 Review : tested on real code
- DeepInfra — DeepSeek V4 Pro overview (taux d’hallucination)
- Weijin Research — DeepSeek-V4 : A Need for Reassessment
- OpenAI — API pricing officiel (GPT-5.5)
- Anthropic — Claude Opus 4.7 (pricing officiel)