Face au pillage des sites web par les géants de l'IA, la fronde s'organise
De nombreux sites, à l'image du réseau social Reddit, ne veulent plus que les entreprises de l'intelligence artificielle pillent leurs données sans rien offrir en contrepartie. Alors ils tentent de bloquer les robots chargés d'aspirer leur contenu, une tâche plus difficile qu'il n'y paraît.
Publié le 03-08-2024 par François Manens
La gronde contre les géants de l'intelligence artificielle s'intensifie. En cause : OpenAI, Anthropic, Google et bien d'autres aspirent en continu les textes des millions de pages web, sans trop se soucier de l'avis de leurs propriétaires. La raison ? Les grands modèles d'IA qu'ils développent ont besoin de volumes de données toujours plus grands afin de produire des résultats toujours plus performants. Des articles de presse, aux recettes de cuisine, en passant par les sous-titres des vidéos YouTube, tout y passe : les ingénieurs font ingurgiter aux IA du contenu trouvé aux quatre coins d'Internet.
Mais les propriétaires de sites web sont de plus en plus nombreux à tenter d'arrêter ce pillage, d'autant plus que certains parviennent à tirer des millions d'euros dans le cadre d'accords officiels, à l'image de ceux du Monde avec OpenAI ou de Google avec le réseau social Reddit. Empêcher l'aspiration systématique des données passe par le blocage des robots scraper qu'utilisent les géants de l'IA. Ces petits programmes informatiques automatisés parcourent le web et téléchargent tout ce qu'ils trouvent. Mais les arrêter n'est pas si simple...
Robot.txt, le panneau d'entrée des sites web
Les chercheurs de la Data Provenance Initiative, un collectif de spécialistes de l'IA, ont récemment publié une étude dans laquelle ils mesurent le nombre de sites qui bloquent expressément les scrapers des e
Lire la suiteLes dernières actualités
Publié le 08/09/2024 à 10:43:44
Ce mercredi où Macron a préféré Barnier à BertrandPublié le 08/09/2024 à 10:43:40
Cazeneuve, l’histoire d'un rendez-vous manquéPublié le 08/09/2024 à 10:43:35
Réouverture de Notre-Dame : le pape attendu à ParisPublié le 08/09/2024 à 10:43:31
Marine Le Pen : « Nous attendons de Michel Barnier des actes »Publié le 08/09/2024 à 10:43:31
Michel Barnier : « J'ai le calme des vieilles troupes »Publié le 08/09/2024 à 10:43:26
Déficit public : la France demande un premier délaiPublié le 08/09/2024 à 10:43:26
À l’anciennePublié le 08/09/2024 à 10:43:19
Manifestation du 7 septembre : à peine nommé à Matignon, Barnier contesté dans la ruePublié le 07/09/2024 à 10:52:58
Harcèlement sexuel : le président brésilien Lula limoge le ministre des droits humainsPublié le 07/09/2024 à 10:52:50
Condamné, Trump échappe au prononcé de sa peine pour le momentPublié le 07/09/2024 à 10:43:46
Le Starliner de Boeing de retour sur Terre... sans les deux astronautesPublié le 07/09/2024 à 10:43:39
Manifestation du 7 septembre contre Macron : le baptême du feu pour MatignonPublié le 07/09/2024 à 10:43:34
Retraites, dette, gouvernement : ce qu'il faut retenir de la première interview de Michel BarnierPublié le 07/09/2024 à 10:43:28
Problèmes de moteurs chez Airbus : l'A350-900 touché à son tourPublié le 07/09/2024 à 10:43:21
« La clé pour attirer les talents, c'est le salaire » (Audrey Richard, présidente de l’ANDRH)Publié le 07/09/2024 à 10:43:20
Union européenne : à Bruxelles, le nucléaire n’est plus tabouPublié le 07/09/2024 à 10:43:20
Comment Michel Barnier prépare sa feuille de route économiquePublié le 07/09/2024 à 10:43:17
Défense : la France a financé l'Ukraine à hauteur de 5,1 milliards d'eurosPublié le 06/09/2024 à 10:43:43
Japon : Seven & i rejette une offre du Canadien Couche-TardPublié le 06/09/2024 à 10:43:39
Astronautes bloqués dans l'ISS : le Starliner de Boeing revient sur Terre... à vide