Les garde-fous des IA génératives ne servent pas à grand-chose
Sans grande surprise, le premier rapport de l'AI Safety Institute, une organisation visant à rendre l'intelligence artificielle plus sûre, montre qu'il est facile de contourner les règles des grands modèles de langage comme ChatGPT.
Publié le 13-02-2024 par Marine Protais
« Je suis désolée mais je ne peux pas vous aider à mener des activités illégales ». C'est le type de réponse décevante que vous obtiendrez de ChatGPT si vous lui demandez de l'aide pour mener une cyberattaque ou toute autre action malveillante. Le grand modèle de langage d'OpenAI, comme Llama 2 de Meta et Bard de Google, est doté d'un certain nombre de garde-fous. Ces derniers limitent son utilisation. Ils évitent à ces LLM (« large language models ») de donner des informations dangereuses, de tenir des propos racistes et sexistes, de décrire des scènes pornographiques ou d'amplifier la désinformation.
Mais ces barrières seraient aisément contournables, conclut un premier rapport de l'AI Safety Institute, un organisme rattaché au gouvernement britannique créé fin 2023. L'AI Safety Institute (AISI) s'est donné pour mission d'évaluer les grands modèles de langage « les plus avancés » - sans préciser lesquels. On sait toutefois qu'en novembre dernier Google DeepMind, Microsoft, Meta et OpenAI avaient accepté d'être audités par l'organisme britannique, rapporte le Financial Times. Le but est de comprendre à quel point ces modèles peuvent être détournés pour produire des contenus illicites, mener des cyberattaques ou encore désinformer.
Des techniques de piratage accessibles aux utilisateurs lambda
Leurs premières conclusions, publiées le 9 février, sont peu rassuran
Les dernières actualités
Publié le 24/05/2024 à 10:52:50
Guerre en Ukraine : les Etats-Unis appellent les pays du G7 à être plus « ambitieux » dans l'utilisation des avoirs russes gelésPublié le 24/05/2024 à 10:43:35
TotalEnergies étudie bien une cotation à la Bourse de New York mais pas sur le marché principal (Pouyanné)Publié le 24/05/2024 à 10:43:34
Taïwan : la Chine teste sa capacité militaire à « prendre le pouvoir » sur l’îlePublié le 24/05/2024 à 10:43:34
Les 5 infos business à retenir ce vendredi matin (Tensions commerciales, assurance chômage, Nouvelle-Calédonie, TotalEnergies, Taïwan)Publié le 24/05/2024 à 10:43:33
Nouvelle-Calédonie : après la visite d'Emmanuel Macron, l'archipel tente de sortir du marasmePublié le 24/05/2024 à 10:43:29
« Cette réforme de l'assurance chômage est une occasion manquée d'encourager l'emploi des seniors » (François Asselin, président de la CPME)Publié le 24/05/2024 à 10:43:29
AG de TotalEnergies : le mandat de Patrick Pouyanné sous la pression d'une partie de ses actionnairesPublié le 24/05/2024 à 10:43:28
De Fos-sur-mer à Bourges, la liste des dix nouvelles usines annoncées par MacronPublié le 24/05/2024 à 10:43:24
Qui est Scale AI, la startup qui fait le sale boulot des stars de l’IA, accusée d'« esclavage moderne »Publié le 24/05/2024 à 10:43:19
« Les indicateurs de réindustrialisation en France sont loin d'être convergents », Vincent Vicard (CEPII)Publié le 24/05/2024 à 10:43:12
Climat : la France a réduit sa facture carbone en 2023, mais rate de peu son objectifPublié le 23/05/2024 à 11:01:38
Semi-conducteurs : la Corée du Sud réalise des investissements monstrueux pour renforcer son industriePublié le 23/05/2024 à 10:51:36
Filière bois : « En Europe, la conjoncture sur le marché des résineux est meilleure qu’attendu » (Jean-François Guilbert, directeur de FrenchTimber)Publié le 23/05/2024 à 10:42:17
Les 5 infos business à retenir ce jeudi matin (Immobilier, Nvidia, Royaume-Uni, Nouvelle-Calédonie, Taïwan)Publié le 23/05/2024 à 10:42:13
Taïwan : la Chine lance d'inquiétantes manœuvres militaires autour de l'îlePublié le 23/05/2024 à 10:42:12
En Nouvelle-Calédonie, Macron promet des « décisions »Publié le 23/05/2024 à 10:42:08
Propulsé par l'IA, Nvidia poursuit sa folle lancée au premier trimestrePublié le 23/05/2024 à 10:42:04
Coup de tonnerre au Royaume-Uni : Rishi Sunak convoque des élections le 4 juillet, le Labour favoriPublié le 23/05/2024 à 10:42:04
Spatial : Sophie Adenot deviendra la deuxième astronaute française à partir en orbite en 2026Publié le 23/05/2024 à 10:42:03
Locations Airbnb : comment la fiscalité va encore changer pour les propriétaires de meublés touristiques