Les garde-fous des IA génératives ne servent pas à grand-chose
Sans grande surprise, le premier rapport de l'AI Safety Institute, une organisation visant à rendre l'intelligence artificielle plus sûre, montre qu'il est facile de contourner les règles des grands modèles de langage comme ChatGPT.
Publié le 13-02-2024 par Marine Protais
« Je suis désolée mais je ne peux pas vous aider à mener des activités illégales ». C'est le type de réponse décevante que vous obtiendrez de ChatGPT si vous lui demandez de l'aide pour mener une cyberattaque ou toute autre action malveillante. Le grand modèle de langage d'OpenAI, comme Llama 2 de Meta et Bard de Google, est doté d'un certain nombre de garde-fous. Ces derniers limitent son utilisation. Ils évitent à ces LLM (« large language models ») de donner des informations dangereuses, de tenir des propos racistes et sexistes, de décrire des scènes pornographiques ou d'amplifier la désinformation.
Mais ces barrières seraient aisément contournables, conclut un premier rapport de l'AI Safety Institute, un organisme rattaché au gouvernement britannique créé fin 2023. L'AI Safety Institute (AISI) s'est donné pour mission d'évaluer les grands modèles de langage « les plus avancés » - sans préciser lesquels. On sait toutefois qu'en novembre dernier Google DeepMind, Microsoft, Meta et OpenAI avaient accepté d'être audités par l'organisme britannique, rapporte le Financial Times. Le but est de comprendre à quel point ces modèles peuvent être détournés pour produire des contenus illicites, mener des cyberattaques ou encore désinformer.
Des techniques de piratage accessibles aux utilisateurs lambda
Leurs premières conclusions, publiées le 9 février, sont peu rassuran
Les dernières actualités
Publié le 02/06/2024 à 11:02:52
Gaza: les médiateurs appellent à « finaliser » un accord de cessez-le-feuPublié le 02/06/2024 à 10:43:38
Le rapport Woerth déçoit les élusPublié le 02/06/2024 à 10:43:34
CFM International : les cinquante ans d’une saga transatlantiquePublié le 02/06/2024 à 10:43:29
Emmanuel Faber (ISSB) : « Nous créons le code source de l’économie »Publié le 02/06/2024 à 10:43:25
Jean-Yves Le Drian : « Plus l’Europe sera forte, plus le lien sera solide avec les États-Unis »Publié le 02/06/2024 à 10:43:20
Le Pen-Bardella, les secrets d’un pactePublié le 02/06/2024 à 10:43:20
Cette dette qui nous embête !Publié le 02/06/2024 à 10:43:19
Thomas Cazenave : « Je note nos convergences avec Les Républicains »Publié le 02/06/2024 à 10:43:19
Dette publique : la dégradation par S&P qui fait malPublié le 02/06/2024 à 10:43:18
Pierre Moscovici : « On peut faire mieux sans dépenser plus ! »Publié le 02/06/2024 à 10:43:11
Sondage européennes : le bloc de gauche progressePublié le 01/06/2024 à 10:43:40
Gaza : Israël propose un cessez-le-feu, le Hamas juge l’offre « positive »Publié le 01/06/2024 à 10:43:33
L'agence Standard & Poor's dégrade la note de la France et sanctionne ses déficitsPublié le 01/06/2024 à 10:43:26
Dette, déficit... les Français sont toujours dans le flou en matière d'économie, à dix jours des européennes (sondage)Publié le 01/06/2024 à 10:43:25
Automobile : les SUV sont-ils en train de perdre du terrain ?Publié le 01/06/2024 à 10:43:25
Croissance : Bercy peut-il tenir son objectif de 1% en 2024 ?Publié le 01/06/2024 à 10:43:24
Virgil, Hestia, Neoproprio... les startups de l'immobilier à la rescousse des primo-accédants privés de créditsPublié le 01/06/2024 à 10:43:17
Notation de la France par S&P : six articles pour comprendre tous les enjeuxPublié le 01/06/2024 à 10:43:08
La France finance Moscou en important de plus en plus d’engrais produits avec du gaz russePublié le 31/05/2024 à 10:43:48
France : la création des emplois dans le privé continue de croître