Apprendre aux IA à raisonner, le nouveau Graal de l'industrie

ChatGPT et d'autres grands modèles de langage ne savent pas exécuter cette tâche pourtant basique : compter le nombre de « r » dans le mot « strawberry ». Ce test, souvent répété par les internautes férus d'intelligence artificielle, prouve que les grands modèles de langage sont loin de fonctionner comme les humains. Le Graal du secteur est donc désormais de leur inculquer des capacités de raisonnement plus poussées.
Publié le 31-08-2024 par Marine Protais
ChatGPT peut faire un résumé décent de Guerre et Paix de Léon Tolstoï ou encore vulgariser les grands principes de la physique quantique, mais aux questions « combien y a-t-il de "r" dans "strawberry" » ? » ou « combien y -t-il de "n" dans "étonnement" ? », il est probable qu'il se trompe. Ce test est devenu un moyen d'évaluer les intelligences artificielles, plus particulièrement les grands modèles de langage (large language models ou LLM). Régulièrement, des utilisateurs s'amusent à publier des captures d'écran de leur conversation à ce sujet avec le chatbot d'OpenAI, celui de Meta (Meta AI, qui fonctionne grâce à Llama 3.1), ou encore Claude 3 d'Anthropic.
Cette expérience souligne une chose essentielle : « une intelligence artificielle n'a pas un cerveau humain », rappelle Patrick Pérez, PDG de Kyutai, laboratoire français spécialiste de l'IA générative. « Elle peut avoir des capacités presque surhumaines dans certains domaines et ne pas savoir réaliser des tâches qui peuvent paraître parfaitement idiotes, ce qui provoque toujours un effet saisissant. Ces modèles fonctionnent par analogie, ce qui veut dire que s'ils n'ont pas vu ce type de demande suffisamment de fois dans leur entraînement, ils ne sauront pas répondre. »
Fonctionnement par tokenisation
Pour cette tâche précise (compter le nombre de lettres dans un mot), l'échec du LLM est aussi lié au fonctionnement par tokenisation. Le
Lire la suiteLes dernières actualités
Publié le 13/09/2025 à 10:44:42
De dinosaure de la tech à géant de l’IA : comment Oracle a su remonter la pentePublié le 13/09/2025 à 10:44:34
Automobile : les constructeurs chinois devraient remporter 30 % du marché mondial en 2030Publié le 13/09/2025 à 10:44:33
Lutte contre la pédocriminalité : pourquoi le règlement Chat Control divise tant l'EuropePublié le 13/09/2025 à 10:44:32
Budget 2026 : ces chiffres qui plaident pour demander un effort aux retraitésPublié le 13/09/2025 à 10:44:24
Aux États-Unis, l'affaire des émetteurs radio chinois dissimulés près des routesPublié le 13/09/2025 à 10:44:23
Bitcoin : des data centers « flexibles », la grande promesse de l’américain Mara pour séduire les énergéticiens européensPublié le 13/09/2025 à 10:44:14
Dissuasion nucléaire : la France lance une nouvelle version du missile balistique M51Publié le 13/09/2025 à 10:44:12
Fitch dégrade à A+ la France, qui sort du club des dettes « haute qualité »Publié le 12/09/2025 à 10:44:40
KNDS Deutschland gagne une nouvelle commande de char Leopard 2 A8Publié le 12/09/2025 à 10:44:39
Financement de l'adaptation de la France à +4° C : les trois scénarios sur la tablePublié le 12/09/2025 à 10:44:34
Batteries : dans son usine de production pour Stellantis, ACC peine à monter en cadencePublié le 12/09/2025 à 10:44:34
🔴 Notation de Fitch, Microsoft, Danemark... L'essentiel de l'actualité ce vendredi 12 septembre 2025Publié le 12/09/2025 à 10:44:34
Dette de la France : l’agence de notation Fitch ouvre le balPublié le 12/09/2025 à 10:44:29
Data centers : en Norvège, l'efficacité énergétique poussée à son maximumPublié le 12/09/2025 à 10:44:24
Fitch, Moody's, S&P : la lente dégradation de la note de la dette françaisePublié le 12/09/2025 à 10:44:23
Pesticides : les viticulteurs et leurs riverains dans l'attente d'une étude crucialePublié le 12/09/2025 à 10:44:18
Méga-fusion dans le spatial : Airbus, Leonardo et Thales entrent dans le « money time »Publié le 12/09/2025 à 10:44:10
« Les marchés ont déjà anticipé » : treize ans de déni face aux agences de notationPublié le 11/09/2025 à 10:44:45
L'iPhone Air d'Apple, un chamboulement pour les opérateurs télécomsPublié le 11/09/2025 à 10:44:41
« L’heure des cryptos a sonné » : Paul Atkins (SEC) trace le futur de la finance