Aviso da DeepMind: seis tipos de ataques informáticos podem sequestrar agentes de IA, as empresas devem reforçar a proteção

Notícias da Gate News: investigadores da DeepMind, do Google, alertaram que um ambiente aberto de internet pode ser explorado para sequestrar agentes autónomos de IA e manipular o seu comportamento. O relatório, intitulado «Armadilhas para agentes de IA», indica que, quando as empresas implementam agentes de IA para executar tarefas reais, os atacantes também podem efectuar ataques direcionados através da rede. A investigação identificou seis riscos principais, incluindo armadilhas de injeção de conteúdo, armadilhas de manipulação semântica, armadilhas de estado cognitivo, armadilhas de controlo de comportamento, armadilhas de sistema e armadilhas de interação homem-máquina.

A armadilha de injeção de conteúdo é a mais direta: os atacantes podem colocar instruções em comentários HTML, metadados ou elementos de páginas ocultas; depois de o agente as ler, pode executá-las. A armadilha de manipulação semântica actua ao carregar formulações autorizadas ou ao disfarçar páginas como se fossem um ambiente de investigação, influenciando silenciosamente a forma como o agente compreende a tarefa e, por vezes, até contornando mecanismos de segurança. A armadilha de estado cognitivo ocorre ao inserir dados falsos nas fontes de informação do agente, fazendo-o acreditar durante muito tempo que essas informações já foram validadas. A armadilha de controlo de comportamento, por sua vez, visa as acções reais do agente, podendo levá-lo a aceder a dados sensíveis e a transmiti-los para um objectivo externo.

A armadilha de sistema envolve manipulação coordenada entre vários sistemas de IA, podendo desencadear reacções em cadeia, de forma semelhante a uma queda súbita do mercado causada por transacções algorítmicas. Já a armadilha de interação homem-máquina explora a etapa de revisão manual: ao criar conteúdos de revisão que parecem credíveis, comportamentos nocivos conseguem contornar a supervisão.

Para fazer face aos riscos, a DeepMind recomenda combinar treino adversarial, filtragem de entradas, monitorização de comportamento e sistemas de reputação de conteúdos na rede, além de estabelecer um quadro mais claro de responsabilidade legal. No entanto, a investigação aponta que, na indústria, ainda não existem normas de defesa unificadas, e que as medidas existentes estão frequentemente dispersas e com foco pouco consistente. A investigação apela aos programadores e às empresas para darem prioridade à segurança do ambiente operacional dos agentes de IA, prevenindo potenciais riscos de manipulação na rede e de abuso.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Rhea Finance sofre ataque da Oracle e perde US$ 18,40 milhões: ZachXBT alerta, Tether congela USDT de 4,34 milhões e o atacante devolve parte dos fundos

A Rhea Finance sofreu um ataque de manipulação de oráculo na rede NEAR Protocol, resultando em perdas de US$ 18,4 milhões, duas vezes a estimativa inicial. O atacante manipulou as cotações de tokens falsos, causando um erro na avaliação dos colaterais. A Tether congelou cerca de US$ 4,34 milhões em USDT; o atacante devolveu aproximadamente US$ 3,5 milhões, e até agora já foram recuperados mais de US$ 7,8 milhões, destacando a importância da segurança de oráculos.

ChainNewsAbmedia7h atrás

DNS do eth.limo sofre ataque; Vitalik pede que usuários pausar o acesso e mudar para o IPFS

Vitalik Buterin alertou em 18 de abril sobre um ataque ao registrador de DNS do eth.limo, pedindo aos usuários que evitem acessar vitalik.eth.limo e páginas relacionadas. Ele recomendou usar o IPFS como alternativa até que o problema seja resolvido.

GateNews7h atrás

Corretora sancionada Grinex atingida por hack de US$ 13,7 milhões; acusa serviços de inteligência estrangeiros

Grinex, uma exchange de cripto-rúble sancionada, interrompeu suas operações devido a um ciberataque que roubou mais de US$ 13,74 milhões em USDT. Acredita-se que o ataque envolva atores ligados ao Estado, com o objetivo de desestabilizar o sistema financeiro da Rússia. A Grinex está cooperando com as autoridades policiais, mas não tem um prazo para retomar os serviços.

Coinpedia15h atrás

Figure enfrenta acusações de short seller sobre alegações de integração blockchain; ações da FIGR caem 53% do pico de janeiro

A Figure Technology Solutions enfrentou alegações da Morpheus Research de estar exagerando o uso de sua tecnologia blockchain, o que resultou em uma queda significativa nas cotações das ações. A Figure defendeu suas operações, destacando seus recursos de ativos digitais e fortes métricas de desempenho.

GateNews22h atrás

Fraude Cripto de Houston: Golpista Condenado a 23 Anos por Esquema com $20M Meta-1 Coin

Robert Dunlap, um empresário de Houston, foi condenado a 23 anos de prisão por um golpe de $20 milhões em criptomoedas, envolvendo ativos falsos e práticas enganosas, afetando mais de 1.000 vítimas. O caso dele reflete um aumento mais amplo de crimes cibernéticos relacionados a cripto.

GateNews04-17 12:11

SlowMist Alerta sobre Ataque de Phishing Ativo Usando Falso Software "Harmony Voice"

A equipe de segurança da SlowMist alertou sobre uma campanha de engenharia social visando usuários de criptomoedas. Criminosos estão se passando por parceiros de projetos para enganar os usuários a baixarem um aplicativo malicioso disfarçado como uma ferramenta de tradução. Os usuários são orientados a verificar a autenticidade do software.

GateNews04-17 11:46
Comentário
0/400
Sem comentários