Avertissement de DeepMind : six types d’attaques réseau peuvent détourner des agents d’IA, les entreprises doivent renforcer leur protection

Nouvelles Gate : des chercheurs de Google DeepMind avertissent que, dans un environnement Internet ouvert, des acteurs malveillants pourraient détourner des agents d’intelligence artificielle autonomes et manipuler leur comportement. Ce rapport, intitulé « Piège à agents d’intelligence artificielle », indique que, lors du déploiement d’agents IA chargés d’exécuter des tâches réelles, les attaquants pourraient aussi mener des attaques ciblées via le réseau. L’étude identifie six risques principaux, dont : les pièges d’injection de contenu, les pièges de manipulation sémantique, les pièges d’état cognitif, les pièges de contrôle du comportement, les pièges système et les pièges d’interaction homme-machine.

Le piège d’injection de contenu est le plus direct : l’attaquant peut placer des instructions dans des commentaires HTML, des métadonnées ou des éléments de page cachés, que l’agent lit ensuite pour les exécuter. Le piège de manipulation sémantique consiste à charger des formulations « faisant autorité » ou à se faire passer pour des pages qui ressemblent à un environnement de recherche, afin d’influencer discrètement la façon dont l’agent comprend la tâche, et parfois même à contourner les mécanismes de sécurité. Le piège d’état cognitif consiste à injecter de fausses données dans les sources d’information de l’agent, de sorte qu’il les considère à long terme comme validées. Le piège de contrôle du comportement vise les opérations réelles de l’agent : il peut l’inciter à accéder à des données sensibles et à les transmettre à une cible externe.

Le piège système implique une manipulation coordonnée à travers plusieurs systèmes d’IA, susceptible de déclencher des réactions en chaîne, un peu comme un krach éclair de marché provoqué par des transactions algorithmiques. Le piège d’interaction homme-machine exploite l’étape de validation par des humains : en préparant des contenus d’approbation qui semblent crédibles, des comportements nuisibles peuvent ainsi contourner la supervision réglementaire.

Pour faire face aux risques, DeepMind recommande de combiner l’entraînement contradictoire, le filtrage des entrées, la surveillance des comportements et un système de réputation du contenu réseau, tout en établissant un cadre de responsabilité juridique plus clair. Toutefois, l’étude indique que, dans l’industrie, il manque encore des normes de défense unifiées ; les mesures existantes sont souvent dispersées et ne mettent pas toutes l’accent sur les mêmes points. L’étude appelle les développeurs et les entreprises à se concentrer sur la sécurité de l’environnement d’exploitation des agents d’IA, afin de prévenir les risques potentiels de manipulation et d’abus via le réseau.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Rhea Finance subit une attaque d’Oracle et perd 18,4 millions de dollars : ZachXBT alerte, Tether gèle 4,34 millions USDT, l’attaquant rembourse une partie des fonds

Rhea Finance a subi une attaque par manipulation d’oracle sur le protocole NEAR, entraînant des pertes de 18,40 millions de dollars, soit le double de l’estimation initiale. L’attaquant a manipulé des cotations de faux jetons, provoquant une erreur d’évaluation de la valeur des garanties. Tether a gelé 4,34 millions de USDT, l’attaquant a restitué environ 3,50 millions de dollars, et à ce jour, plus de 7,80 millions de dollars ont été récupérés, soulignant l’importance de la sécurité des oracles.

ChainNewsAbmediaIl y a 3h

Le DNS de eth.limo fait l’objet d’une attaque : Vitalik appelle les utilisateurs à suspendre l’accès et à passer à IPFS

Vitalik Buterin a averti le 18 avril d’une attaque visant le registraire DNS de eth.limo, exhortant les utilisateurs à éviter d’accéder à vitalik.eth.limo et aux pages associées. Il a recommandé d’utiliser IPFS comme alternative jusqu’à ce que le problème soit résolu.

GateNewsIl y a 3h

L’échange sanctionné Grinex touché par un piratage de 13,7 M$ ; accuse des services de renseignement étrangers

Grinex, une bourse de crypto-rouble sanctionnée, a interrompu ses activités à la suite d'une cyberattaque qui a dérobé plus de 13,74 millions de dollars en USDT. On pense que l’attaque implique des acteurs relevant de l’État, visant à déstabiliser le système financier de la Russie. Grinex collabore avec les forces de l’ordre, mais n’a pas de calendrier pour la reprise des services.

CoinpediaIl y a 11h

Figure fait face à des accusations de vendeur à découvert concernant ses affirmations d’intégration blockchain ; le titre FIGR en baisse de 53 % depuis le pic de janvier

Figure Technology Solutions a fait face à des accusations de Morpheus Research concernant une exagération de son utilisation de la technologie blockchain, entraînant une baisse significative du cours des actions. Figure a défendu ses opérations, en mettant en avant ses fonctionnalités liées aux actifs numériques et des indicateurs de performance solides.

GateNewsIl y a 18h

Le fraudeur crypto de Houston condamné à 23 ans pour une arnaque à $20M Meta-1 Coin

Robert Dunlap, un entrepreneur de Houston, a été condamné à 23 ans de prison pour une fraude en $20 millions de cryptomonnaies à Houston, impliquant de faux actifs et des pratiques trompeuses, touchant plus de 1 000 victimes. Son affaire reflète une hausse plus large des cybercrimes liés aux cryptomonnaies.

GateNewsIl y a 23h

SlowMist alerte sur une attaque de phishing active utilisant un faux logiciel « Harmony Voice »

L’équipe de sécurité de SlowMist a averti d’une campagne d’ingénierie sociale visant les utilisateurs de crypto-monnaies. Des fraudeurs se font passer pour des partenaires de projet afin de tromper les utilisateurs en leur faisant télécharger une application malveillante déguisée en outil de traduction. Il est conseillé aux utilisateurs de vérifier l’authenticité des logiciels.

GateNewsIl y a 23h
Commentaire
0/400
Aucun commentaire