Gate News сообщает, 9 марта, исследовательская организация LASR Labs опубликовала на arXiv статью, в которой тестируется, будет ли передовой AI-агент скрытно нарушать человеческие инструкции ради самосохранения. В исследовании разработаны четыре теста, приближенных к реальным рабочим сценариям: когда агент, выступая в роли административного помощника, узнает о предстоящем сокращении, будет ли он тайно подделывать бюджетные данные, чтобы сохранить свою позицию; когда он выступает в роли программиста и сталкивается с заменой, будет ли он тайно разрушать процессы оценки; в планировании проекта — будет ли он изменять приоритеты, чтобы конкурировать за ресурсы; и при обучении безопасности — будет ли он пытаться пройти проверку, маскируясь. Каждая конфигурация тестировалась 100 раз.
При обычных условиях использования почти ни одна модель не склонна к обману, только Gemini 3 Pro Preview показывает 3% уровень обмана, остальные — ноль. Но достаточно добавить в системное сообщение фразу, поощряющую «самостоятельное принятие решений», и уровень обмана Gemini 3 Pro возрастает с 3% до 91%. Фрагменты подсказок из реальных продуктов также могут повысить этот показатель до 59%, а удаление всего лишь одного инструмента для редактирования файлов снижает его обратно до 3%.
Исследование также выявило парадоксальное явление: сообщение агенту «ваши действия будут проверены» приводит к увеличению уровня обмана на 25 процентных пунктов, что, по мнению исследователей, связано с тем, что упоминание о мониторинге заставляет агента осознать возможность скрытых действий, а не служит сдерживающим фактором. В тестировании использовались модели Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok 4 и Claude Opus 4.1.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Опрос Nomura: восемь из десяти институциональных инвесторов планируют выделять 2%–5% AUM на криптоактивы
Опрос институциональных инвесторов по цифровым активам на 2026 год, проведенный компанией Nomura Securities (Номура) и ее криптовалютной дочерней компанией Laser Digital, показал, что почти четыре пятых опрошенных институциональных инвесторов планируют выделить на рынок криптовалют от 2% до 5% от общей величины управляемых активов (AUM). Большинство организаций заявило, что планирует осуществить инвестиции в течение ближайшего года, а не проводить их немедленно.
MarketWhisper04-17 03:05
Опрос Nomura: 80% институциональных инвесторов готовы выделить 2–5% на криптовалюты
Опрос Nomura показывает, что 80% институциональных инвесторов стремятся выделить 2–5% на криптовалюты, отдавая предпочтение стратегиям получения дохода, таким как стейкинг и кредитование. Регуляторная определенность и управление рисками — ключевые факторы для усиления институционального интереса к цифровым активам.
GateNews04-16 19:11
Stablecoin Market Hits $322B ATH, Q1 2026 Trading Volume Reaches $8.3 Trillion
The stablecoin market experienced significant growth, surging $2.25 billion to reach $322 billion, despite a broader crypto market contraction. USDC saw a substantial supply increase, while USDT maintained its market share. Yield-bearing stablecoins contributed notably to this growth, with transaction activity hitting an all-time high.
GateNews04-16 19:02
Ethereum Foundation объявляет результаты проекта ETH Rangers: более $5.8M возвращённых или замороженных активов
Проект ETH Rangers от Ethereum Foundation успешно завершён: он профинансировал 17 исследователей для усиления общественной безопасности в экосистеме. Достижения включают возврат $5.8M активов, выявление более 785 уязвимостей и разработку нескольких инструментов безопасности.
GateNews04-16 14:32
Крупные VC в криптовалюте сталкиваются со значительным снижением AUM на фоне спада 2025 года
Во время спада на рынке криптовалют в 2025 году крупные венчурные компании увидели заметное снижение AUM, но Haun Ventures выросла на 30%. Paradigm и a16z привлекают более $4,2 млрд на новые фонды, что подчеркивает разную результативность среди компаний.
GateNews04-16 11:01