Introduction
L’année 2024 a marqué un tournant dans le domaine de l’intelligence artificielle (IA), avec une multitude de modèles en compétition pour dominer le marché. Les avancées se succèdent à un rythme effréné, et les performances des modèles ne cessent de s’améliorer. L’objectif de cet article est de faire le point sur le paysage actuel et d’aider à comprendre les enjeux de cette course à l’IA (et surtout, répondre à la grande question : qui est le meilleur 🦾 ?).
Qui sont les meilleurs LLM ?
Entrons dans le vif du sujet : quel est le classement actuel des modèles de langage ?
Benchmark tiré de https://artificialanalysis.ai
Le Gratin des LLM
Sans surprise, ce sont les géants qui occupent le podium : OpenAI, Google et Anthropic. Ces leaders sont suivis de près par un nouvel acteur chinois, DeepSeek, qui se distingue avec un modèle à 371 milliards de paramètres. Contrairement à ses rivaux du podium, DeepSeek a choisi de mettre son modèle en ligne en open source (il va cependant s’accrocher pour le faire tourner chez vous).
À noter que le modèle très attendu o3 d’OpenAI (successeur de o1) n’a pas encore été publié pour le grand public. Néanmoins, il est facile d’imaginer qu’il surpassera o1 tant en qualité qu’en coût.
Le prix : qualité vs accessibilité
Sans surprise, les modèles comme o1, Claude ou GPT-4o sont positionnés sur le segment « premium ». Cependant, prix élevé ne rime pas toujours avec accessibilité : DeepSeek, par exemple, propose des tarifs très compétitifs malgré son rang sur le podium. Par ailleurs, Gemini 2.0 Flash n’a pas encore de prix officiel, car il est encore en phase d’expérimentation.
GPT-4o mini reste maître sur le segment des coûts/qualités et même sur la vitesse.
La vitesse de réponse : Google en tête
Sur le critère de la vitesse de réponse (équivalente au débit de parole), Google se démarque avec son nouveau modèle, suivi de près par OpenAI, qui bénéficie de ses infrastructures avancées. Cependant, il est important de noter que la vitesse a été mesurée dans des environnements hétérogènes, et les infrastructures des géants comme Google, OpenAI et Anthropic jouent un rôle clé dans leurs résultats.
Les LLM open source : une alternative prometteuse
Malgré la domination des grandes entreprises, les modèles open source ont encore leur place dans cet écosystème, notamment pour des cas d’usage spécifiques où des performances extrêmes ne sont pas nécessaires.
Par exemple, les modèles Llama de Meta, supervisés par le chercheur français Yann LeCun, offrent une gamme variée de tailles (de 3B à 305B paramètres) et restent très performants. Ces modèles conviennent particulièrement :
- Pour les données sensibles : les entreprises peuvent héberger les modèles en interne ou dans des datacenters français, garantissant confidentialité et contrôle
- Pour l’embarqué : lorsqu’il s’agit de déployer des solutions sur des dispositifs nécessitant une faible consommation de ressources.
Optimisation contre le gigantisme
Les LLM open source se concentrent sur l’optimisation plutôt que sur la course au gigantisme. Une visite sur Hugging Face et son célèbre leaderboard montre que les modèles de petites tailles ont encore de beaux jours devant eux.
Pour ceux qui souhaitent explorer ces alternatives, je recommande de consulter le site Artificial Analysis pour une analyse complète.
La suite pour 2025 ?
Les modèles de langage actuels (LLM) fonctionnent en prédisant le mot suivant grâce à une logique de tokens (1 token équivaut à environ 1 mot). Pour en savoir plus, consultez notre article : Comprendre les LLM : Modèles de Langage IA et leur Fonctionnement.
Cependant, une récente publication (disponible ici en anglais) de Meta, datée du 11 décembre 2024, laisse entrevoir un avenir différent. Comme le souligne souvent Yann LeCun : « Les LLM ne sont pas l’avenir de l’IA. »
C’est dans cette optique que Meta a dévoilé le Large Concept Model (LCM), une évolution prometteuse.
C’est quoi un LCM ?
Sans entrer dans les détails (un article dédié est en préparation), voici un résumé :
Le Large Concept Model (LCM) traite des concepts (phrases) plutôt que des mots. Contrairement aux LLM, il est capable de :
- Gérer des contextes longs.
- Améliorer la compréhension et la traduction.
- Favoriser un raisonnement plus avancé et une meilleure modularité.
Cette technologie pourrait bien redéfinir les standards de l’IA dans les années à venir.
Conclusion
L’intelligence artificielle évolue à une vitesse fulgurante. Entre les avancées des LLM et les promesses des LCM, l’année 2025 s’annonce riche en innovations.
On remarque aisément que même si des acteurs comme Anthropic, Google et Deepseek montent en puissance, OpenAI est maître sur presque tous les segments (premium avec o1, bas coûts avec 4o-mini et milieux de gamme avec 4o).
Quel que soit vos cas d’usage, il vous faudra choisir un modèle selon vos contraintes et vos besoins. Edgework peut vous accompagner que ce soit dans le choix d’un modèle, dans son déploiement ou bien tout simplement de parler d’IA. Pour échanger avec nous : Calendly
Et vous, que pensez-vous de ce classement ? Reflète-t-il votre expérience personnelle ? Personnellement, j’ai été agréablement surpris par DeepSeek et par 1.5 Flash.