Aviso da DeepMind: seis tipos de ataques informáticos podem sequestrar agentes de IA, as empresas devem reforçar a proteção

Notícias da Gate News: investigadores da DeepMind, do Google, alertaram que um ambiente aberto de internet pode ser explorado para sequestrar agentes autónomos de IA e manipular o seu comportamento. O relatório, intitulado «Armadilhas para agentes de IA», indica que, quando as empresas implementam agentes de IA para executar tarefas reais, os atacantes também podem efectuar ataques direcionados através da rede. A investigação identificou seis riscos principais, incluindo armadilhas de injeção de conteúdo, armadilhas de manipulação semântica, armadilhas de estado cognitivo, armadilhas de controlo de comportamento, armadilhas de sistema e armadilhas de interação homem-máquina.

A armadilha de injeção de conteúdo é a mais direta: os atacantes podem colocar instruções em comentários HTML, metadados ou elementos de páginas ocultas; depois de o agente as ler, pode executá-las. A armadilha de manipulação semântica actua ao carregar formulações autorizadas ou ao disfarçar páginas como se fossem um ambiente de investigação, influenciando silenciosamente a forma como o agente compreende a tarefa e, por vezes, até contornando mecanismos de segurança. A armadilha de estado cognitivo ocorre ao inserir dados falsos nas fontes de informação do agente, fazendo-o acreditar durante muito tempo que essas informações já foram validadas. A armadilha de controlo de comportamento, por sua vez, visa as acções reais do agente, podendo levá-lo a aceder a dados sensíveis e a transmiti-los para um objectivo externo.

A armadilha de sistema envolve manipulação coordenada entre vários sistemas de IA, podendo desencadear reacções em cadeia, de forma semelhante a uma queda súbita do mercado causada por transacções algorítmicas. Já a armadilha de interação homem-máquina explora a etapa de revisão manual: ao criar conteúdos de revisão que parecem credíveis, comportamentos nocivos conseguem contornar a supervisão.

Para fazer face aos riscos, a DeepMind recomenda combinar treino adversarial, filtragem de entradas, monitorização de comportamento e sistemas de reputação de conteúdos na rede, além de estabelecer um quadro mais claro de responsabilidade legal. No entanto, a investigação aponta que, na indústria, ainda não existem normas de defesa unificadas, e que as medidas existentes estão frequentemente dispersas e com foco pouco consistente. A investigação apela aos programadores e às empresas para darem prioridade à segurança do ambiente operacional dos agentes de IA, prevenindo potenciais riscos de manipulação na rede e de abuso.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Bolsa de câmbio sancionada Grinex atingida por um hack de 13,7 milhões de dólares; culpa serviços de inteligência estrangeiros

A Grinex, uma bolsa de cripto-rublos sancionada, suspendeu as operações devido a um ciberataque que roubou mais de 13,74 milhões de dólares em USDT. Acredita-se que o ataque envolva atores ligados ao Estado com o objetivo de desestabilizar o sistema financeiro da Rússia. A Grinex está a colaborar com as autoridades policiais, mas não tem um calendário para retomar os serviços.

Coinpedia11m atrás

Figure enfrenta acusações de venda a descoberto por alegações de integração blockchain; ações da FIGR em queda de 53% face ao pico de janeiro

A Figure Technology Solutions enfrentou alegações da Morpheus Research de estar a exagerar o seu uso de tecnologia blockchain, o que resultou numa queda significativa dos preços das ações. A Figure defendeu as suas operações, destacando as suas funcionalidades de ativos digitais e sólidos indicadores de desempenho.

GateNews7h atrás

Fraudador Cripto de Houston Condenado a 23 Anos por Golpe da $20M Meta-1 Coin

Robert Dunlap, um empresário de Houston, foi condenado a 23 anos de prisão por uma fraude em criptomoedas $20 milhões, que envolveu activos falsos e práticas enganosas, afectando mais de 1.000 vítimas. O seu caso reflecte um aumento mais amplo dos crimes cibernéticos relacionados com cripto.

GateNews12h atrás

A SlowMist alerta para um ataque de phishing ativo com software falso "Harmony Voice"

A equipa de segurança da SlowMist alertou para uma campanha de engenharia social direcionada a utilizadores de criptomoedas. Os fraudadores estão a apresentar-se como parceiros de projeto para enganar os utilizadores a descarregar uma aplicação maliciosa disfarçada como uma ferramenta de tradução. Os utilizadores são aconselhados a verificar a autenticidade do software.

GateNews12h atrás

CEO da Zonda acusa o fundador desaparecido por $336M em Bitcoin em falta

O CEO da Zonda, Przemysław Kral, atribuiu a perda de acesso da bolsa a 4.500 BTC, avaliados em $336 milhões, ao facto de o fundador desaparecido, Sylwester Suszek, não ter conseguido transferir as chaves privadas. No meio de acusações de falência e de pedidos de levantamento intensificados, Kral afirma que a Zonda continua solvente e que irá avançar com ações legais, enquanto procura Suszek, que desapareceu em 2022.

GateNews13h atrás

A Grinex Exchange suspende todas as negociações após $15M ciberataque nos sistemas de carteiras

A Grinex, uma bolsa de criptomoedas do Quirguistão, suspendeu as negociações após um ciberataque que resultou em perdas de cerca de $15 milhões. A natureza avançada do ataque aponta para envolvimento organizado ou a nível estatal. A Grinex informou o incidente às autoridades e está a avaliar os danos.

GateNews13h atrás
Comentar
0/400
Nenhum comentário