Apprendre aux IA à raisonner, le nouveau Graal de l'industrie

ChatGPT et d'autres grands modèles de langage ne savent pas exécuter cette tâche pourtant basique : compter le nombre de « r » dans le mot « strawberry ». Ce test, souvent répété par les internautes férus d'intelligence artificielle, prouve que les grands modèles de langage sont loin de fonctionner comme les humains. Le Graal du secteur est donc désormais de leur inculquer des capacités de raisonnement plus poussées.
Publié le 31-08-2024 par Marine Protais
ChatGPT peut faire un résumé décent de Guerre et Paix de Léon Tolstoï ou encore vulgariser les grands principes de la physique quantique, mais aux questions « combien y a-t-il de "r" dans "strawberry" » ? » ou « combien y -t-il de "n" dans "étonnement" ? », il est probable qu'il se trompe. Ce test est devenu un moyen d'évaluer les intelligences artificielles, plus particulièrement les grands modèles de langage (large language models ou LLM). Régulièrement, des utilisateurs s'amusent à publier des captures d'écran de leur conversation à ce sujet avec le chatbot d'OpenAI, celui de Meta (Meta AI, qui fonctionne grâce à Llama 3.1), ou encore Claude 3 d'Anthropic.
Cette expérience souligne une chose essentielle : « une intelligence artificielle n'a pas un cerveau humain », rappelle Patrick Pérez, PDG de Kyutai, laboratoire français spécialiste de l'IA générative. « Elle peut avoir des capacités presque surhumaines dans certains domaines et ne pas savoir réaliser des tâches qui peuvent paraître parfaitement idiotes, ce qui provoque toujours un effet saisissant. Ces modèles fonctionnent par analogie, ce qui veut dire que s'ils n'ont pas vu ce type de demande suffisamment de fois dans leur entraînement, ils ne sauront pas répondre. »
Fonctionnement par tokenisation
Pour cette tâche précise (compter le nombre de lettres dans un mot), l'échec du LLM est aussi lié au fonctionnement par tokenisation. Le
Lire la suiteLes dernières actualités
Publié le 29/07/2025 à 10:53:51
Les semi-conducteurs, le bon filon d’Air liquidePublié le 27/07/2025 à 10:44:44
Droits de douane : Trump et von der Leyen en Écosse pour négocierPublié le 27/07/2025 à 10:44:40
À Paris, on célèbre l'anniversaire des J.O sans oublier l'amertume laissée par l'annonce du plan budgétairePublié le 27/07/2025 à 10:44:34
SONDAGE EXCLUSIF. 61 % des Français sont défavorables à la loi DuplombPublié le 27/07/2025 à 10:44:34
Léon Marchand, prêt à battre le record du monde à SingapourPublié le 27/07/2025 à 10:44:29
SONDAGE EXCLUSIF. Pour 91 % des Français, le Tour de France fait partie de notre patrimoinePublié le 27/07/2025 à 10:44:24
Jean-Noël Barrot, ministre de l’Europe et des Affaires étrangères : « À New York, nous allons consacrer l’isolement définitif du Hamas »Publié le 27/07/2025 à 10:44:19
Kévin Vauquelin, Valentin Paret-Peintre, Jordan Jegat... Les étoiles montantes du cyclisme françaisPublié le 27/07/2025 à 10:44:13
Tour de France : Montmartre s’apprête à revivre la folie olympiquePublié le 27/07/2025 à 10:44:06
Christian Louboutin : « Mon nom représente une forme de liberté »Publié le 26/07/2025 à 10:44:50
Budget 2026 : Catherine Vautrin détaille la potion amère concernant la santéPublié le 26/07/2025 à 10:44:42
A rebours des États-Unis, la Chine appelle à un « consensus urgent » pour réguler l'IAPublié le 26/07/2025 à 10:44:33
Comment le gouvernement prépare le chamboule-tout des autoroutesPublié le 26/07/2025 à 10:44:33
Trump impose sa loi, l’UE choisit de nouveaux alliésPublié le 26/07/2025 à 10:44:25
« Nous devons fixer des limites à notre utilisation de l'IA » (Ethan Mollick)Publié le 26/07/2025 à 10:44:17
Droits de douane : Maros Sefcovic, le discret commissaire européen au cœur des négociationsPublié le 26/07/2025 à 10:44:09
Défense : Arquus accélère sa production face aux tensions géopolitiquesPublié le 26/07/2025 à 10:44:08
La facture salée du mécénat d'entreprise dans le collimateur de BercyPublié le 26/07/2025 à 10:43:56
Des batteries aux panneaux photovoltaïques, les Chinois à la rescousse de l'industrie verte tricolorePublié le 25/07/2025 à 10:44:26
Donald Trump multiplie les signes d’intimidation à l’égard du président de la Fed