Apprendre aux IA à raisonner, le nouveau Graal de l'industrie

Test Strawberry

ChatGPT et d'autres grands modèles de langage ne savent pas exécuter cette tâche pourtant basique : compter le nombre de « r » dans le mot « strawberry ». Ce test, souvent répété par les internautes férus d'intelligence artificielle, prouve que les grands modèles de langage sont loin de fonctionner comme les humains. Le Graal du secteur est donc désormais de leur inculquer des capacités de raisonnement plus poussées.

Publié le 31-08-2024 par Marine Protais

ChatGPT peut faire un résumé décent de Guerre et Paix de Léon Tolstoï ou encore vulgariser les grands principes de la physique quantique, mais aux questions « combien y a-t-il de "r" dans "strawberry" » ? » ou « combien y -t-il de "n" dans "étonnement" ? », il est probable qu'il se trompe. Ce test est devenu un moyen d'évaluer les intelligences artificielles, plus particulièrement les grands modèles de langage (large language models ou LLM). Régulièrement, des utilisateurs s'amusent à publier des captures d'écran de leur conversation à ce sujet avec le chatbot d'OpenAI, celui de Meta (Meta AI, qui fonctionne grâce à Llama 3.1), ou encore Claude 3 d'Anthropic.

Cette expérience souligne une chose essentielle : « une intelligence artificielle n'a pas un cerveau humain », rappelle Patrick Pérez, PDG de Kyutai, laboratoire français spécialiste de l'IA générative. « Elle peut avoir des capacités presque surhumaines dans certains domaines et ne pas savoir réaliser des tâches qui peuvent paraître parfaitement idiotes, ce qui provoque toujours un effet saisissant. Ces modèles fonctionnent par analogie, ce qui veut dire que s'ils n'ont pas vu ce type de demande suffisamment de fois dans leur entraînement, ils ne sauront pas répondre. »

Lire aussiMoshi, l'IA vocale de Kyutai, coupe-t-elle l'herbe sous le pied d'OpenAI ?

Fonctionnement par tokenisation

Pour cette tâche précise (compter le nombre de lettres dans un mot), l'échec du LLM est aussi lié au fonctionnement par tokenisation. Le

Lire la suite

Les dernières actualités

Votre panier

0articleajouté

Voir le panier

Avez-vous besoin d'un devis ?

Obtenir un devis

Il sera valable jusqu'au JJ/MM/AAAA afin de vous garantir le bon tarif.

Générer un devis

Sous-total
0,00€
0,00€
Voir le panier