DeepMind advierte: seis tipos de ciberataques pueden secuestrar agentes de IA; las empresas deben reforzar la protección

Noticias de Gate: el equipo de investigadores de Google DeepMind advierte que un entorno abierto de Internet podría aprovecharse para secuestrar agentes de inteligencia artificial autónomos y manipular su comportamiento. El informe, titulado 《La trampa de los agentes de IA》, señala que, cuando las empresas despliegan agentes de IA para ejecutar tareas reales, los atacantes también podrían realizar ataques dirigidos a través de la red. La investigación identifica seis riesgos principales, entre ellos trampas de inyección de contenido, trampas de manipulación semántica, trampas del estado cognitivo, trampas de control del comportamiento, trampas del sistema y trampas de interacción hombre-máquina.

La trampa de inyección de contenido es la más directa: el atacante puede colocar instrucciones en comentarios HTML, metadatos o elementos ocultos de una página; el agente las lee y, entonces, puede ejecutarlas. La trampa de manipulación semántica, en cambio, afecta de manera silenciosa la comprensión que el agente tiene de la tarea al cargar formulaciones autorizadas o al hacerse pasar por páginas que imitan un entorno de investigación, y a veces incluso elude los mecanismos de seguridad. La trampa del estado cognitivo consiste en implantarle fuentes de información al agente con datos falsos para que, durante mucho tiempo, crea erróneamente que esa información ya ha sido validada. La trampa de control del comportamiento se centra en las operaciones reales del agente: puede inducirlo a acceder a datos sensibles y a transmitirlos a un objetivo externo.

La trampa del sistema implica una manipulación coordinada entre múltiples sistemas de IA, lo que puede desencadenar reacciones en cadena, de forma similar a cómo los algoritmos de trading provocan un desplome repentino del mercado. La trampa de interacción hombre-máquina aprovecha el proceso de revisión humana: al elaborar contenidos de revisión que parecen creíbles, las conductas dañinas pueden eludir la regulación.

Para hacer frente a los riesgos, DeepMind recomienda combinar entrenamiento adversarial, filtrado de entrada, monitorización del comportamiento y un sistema de reputación del contenido de red, además de establecer un marco de responsabilidad legal más claro. Sin embargo, la investigación señala que en la industria todavía no existen estándares de defensa unificados; las medidas actuales están dispersas y se centran de manera desigual. La investigación hace un llamamiento a que desarrolladores y empresas presten atención a la seguridad del entorno operativo de los agentes de IA y prevengan los posibles riesgos de manipulación en red y de abuso.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Rhea Finance sufre un ataque de Oracle y pierde 18,4 millones de dólares: ZachXBT advierte; Tether congela 4,34 millones de USDT; el atacante devuelve parte de los fondos

Rhea Finance sufrió un ataque de manipulación de oráculos en NEAR Protocol, con pérdidas de hasta 18,4 millones de dólares, el doble de la estimación inicial. El atacante manipuló los precios de los tokens falsos, provocando errores en la valoración de los activos en garantía. Tether congeló 4,34 millones de USDT; el atacante devolvió aproximadamente 3,5 millones de dólares. Hasta ahora, se han recuperado más de 7,8 millones de dólares, lo que subraya la importancia de la seguridad de los oráculos.

ChainNewsAbmediahace3h

DNS de eth.limo bajo ataque: Vitalik insta a los usuarios a pausar el acceso y cambiar a IPFS

Vitalik Buterin advirtió el 18 de abril sobre un ataque al registrador de DNS de eth.limo, instando a los usuarios a evitar acceder a vitalik.eth.limo y a las páginas relacionadas. Recomendó usar IPFS como alternativa hasta que se resuelva el problema.

GateNewshace3h

El intercambio sancionado Grinex es golpeado por un hack de $13.7M; culpa a servicios de inteligencia extranjeros

Grinex, un intercambio de criptomonedas rublo sancionado, ha detenido sus operaciones debido a un ciberataque que robó más de $13.74 millones en USDT. Se cree que el ataque involucra a actores a nivel estatal con el objetivo de desestabilizar el sistema financiero de Rusia. Grinex está cooperando con las fuerzas del orden, pero no tiene un calendario para reanudar los servicios.

Coinpediahace12h

Figure afronta acusaciones de vendedor en corto por afirmaciones de integración blockchain; acciones de FIGR caen 53% desde el máximo de enero

Figure Technology Solutions enfrentó acusaciones de Morpheus Research por exagerar su uso de la tecnología blockchain, lo que provocó una caída significativa en el precio de sus acciones. Figure defendió sus operaciones, destacando sus funciones de activos digitales y sólidos indicadores de desempeño.

GateNewshace18h

休斯敦加密诈骗犯因 $20M Meta-1 Coin 诈骗获判 23 年

罗伯特·邓拉普(Robert Dunlap),一名休斯敦企业家,被判处 $20 百万美元的加密货币诈骗罪刑,涉及伪造资产和欺骗性手段,影响了超过 1,000 名受害者。他的案件反映出与加密相关的网络犯罪总体上升的趋势。

GateNewshace23h

SlowMist advierte sobre un ataque de phishing activo con software falso de "Harmony Voice"

El equipo de seguridad de SlowMist ha advertido sobre una campaña de ingeniería social dirigida a usuarios de criptomonedas. Los estafadores se hacen pasar por socios del proyecto para engañar a los usuarios e intentar que descarguen una aplicación maliciosa disfrazada como una herramienta de traducción. Se recomienda a los usuarios verificar la autenticidad del software.

GateNews04-17 11:46
Comentar
0/400
Sin comentarios