Основатель DeepMind: архитектура ИИ общего назначения, состояние агентов и научные прорывы следующего десятилетия

Оригинальный заголовок видео: Demis Hassabis: Агенты, ИИ общего назначения и следующий крупный научный прорыв

Источник видео: Y Combinator
Перевод оригинала: Deep潮 TechFlow

Редакционный вводный комментарий

Генеральный директор DeepMind, лауреат Нобелевской премии по химии Demis Hassabis посетил Y Combinator, рассказал о ключевых достижениях на пути к ИИ общего назначения, дал советы предпринимателям о том, как сохранять лидерство, и поделился мыслями о том, где может произойти следующий крупный научный прорыв.

Самым практичным советом для тех, кто занимается глубокими технологиями, является то, что если вы запускаете проект на десятилетие, необходимо учитывать появление ИИ общего назначения в своих планах. Также он сообщил, что Isomorphic Labs (выделенная из DeepMind компания по разработке AI для фармацевтики) скоро объявит важные новости.

Цитаты и ключевые мысли

Пути и сроки достижения ИИ общего назначения

· «Практически все существующие технологические компоненты, скорее всего, станут частью окончательной архитектуры ИИ общего назначения.»

· «Проблемы с непрерывным обучением, долгосрочным рассуждением, памятью еще не решены полностью, ИИ нужно уметь справляться со всеми этими задачами.»

· «Если ваш график достижения ИИ общего назначения примерно 2030 год, а вы начинаете проект в области глубоких технологий сегодня, необходимо учитывать, что ИИ может появиться внезапно на полпути.»

Память и окно контекста

· «Окно контекста примерно равно рабочей памяти. У человека среднее рабочее запоминание — семь элементов, у нас есть окна с миллионами или миллионами токенов. Но проблема в том, что мы засовываем туда все подряд, включая неважную и ошибочную информацию, и это довольно грубый подход.»

· «Обрабатывая поток видео в реальном времени и сохраняя все токены, один миллион токенов — это примерно 20 минут.»

Недостатки рассуждения

· «Мне нравится играть в шахматы с Gemini. Иногда он понимает, что сделал плохой ход, но не может найти лучшего, и в итоге делает его. Настоящая точная система рассуждения не должна так ошибаться.»

· «Он умеет решать задачи уровня золотой медали IMO, но при другом способе вопроса допускает ошибки начальной школы по математике. Внутреннее саморефлексирование в процессе мышления у него еще недостаточно развито.»

Агент и креативность

· «Чтобы достичь ИИ общего назначения, нужно иметь систему, которая активно помогает решать ваши задачи. Агент — это путь, и я считаю, что мы только начинаем.»

· «Я еще не видел, чтобы кто-то использовал vibe coding для создания топовой 3A-игры в рейтингах магазинов приложений. По текущим вложениям это возможно, но пока не случилось. Значит, чего-то в инструментах или процессах еще не хватает.»

Дистилляция и малые модели

· «Наше предположение: после выпуска передовой модели Pro через полгода — год, ее возможности можно сжать в очень маленькую модель, которая сможет работать на периферийных устройствах. Пока мы не достигли теоретического предела информационной плотности.»

Научные открытия и «Тест Эйнштейна»

· «Иногда я называю это «Тестом Эйнштейна», — можно ли обучить систему знаниями 1901 года и заставить ее самостоятельно вывести результаты, которые сделал Эйнштейн в 1905 году, включая специальную теорию относительности. Если это возможно, такие системы уже близки к созданию новых открытий.»

· «Решение одной задачи Millennium Prize — уже большое достижение. Но еще сложнее — предложить новый набор задач Millennium, которые признаны ведущими математиками настолько же глубокими и достойными исследования всю жизнь.»

Советы по глубоким технологиям

· «Стремление к сложным задачам и к простым — по сути одно и то же, только разными способами. Жизнь коротка, не тратьте силы на то, что никто больше не сделает, если не сделаете вы.»

Пути реализации ИИ общего назначения


Gary Tan: Вы думаете о ИИ общего назначения уже почти так же долго, как никто другой. Какие архитектуры, по вашему мнению, уже есть у нас в распоряжении? Что сейчас критически не хватает?

Demis Hassabis: Я уверен, что масштабное предварительное обучение, RLHF, цепочки мышления — все это станет частью финальной архитектуры ИИ общего назначения. Эти технологии доказали свою эффективность. Я не могу представить, что через два года мы обнаружим, что это путь в тупик. Но, основываясь на уже существующих технологиях, возможно, еще не все компоненты собраны. Продолжается работа над непрерывным обучением, долгосрочным рассуждением, памятью — есть еще нерешенные вопросы.

ИИ нужно уметь делать все. Возможно, существующие технологии в сочетании с постепенными инновациями позволят расширить возможности, но, скорее всего, останутся один-два ключевых момента, которые нужно прорвать. Я считаю, что вероятность наличия таких нерешенных вопросов примерно 50/50. Поэтому в DeepMind мы работаем по двум направлениям одновременно.

Gary Tan: Я взаимодействую с множеством систем-агентов, и меня удивляет, что базовые веса у них одни и те же. Поэтому концепция непрерывного обучения очень интересна — ведь сейчас мы используем временные «скотчи», вроде циклов ночных сновидений.

Demis Hassabis: Да, эти циклы сновидений очень крутые. Мы давно задумывались о интеграции сценической памяти. Мой докторский проект — как гиппокамп аккуратно внедряет новые знания в существующую систему. Мозг в этом очень хорош.

Он делает это во время сна, особенно в фазе быстрого сна (REM), повторяя важные переживания для обучения. Наш ранний проект Atari DQN (глубокая Q-сеть, опубликованная DeepMind в 2013 году, впервые использующая глубокое обучение для достижения уровня человека в Atari) научился играть в Atari, используя опытный повтор — experience replay.

Это заимствовано из нейронауки: повторять успешные пути. Тогда это было 2013 год, в области ИИ — древность, но очень важно.

Я согласен с тобой: сейчас мы действительно «склеиваем» всё на скорую руку. Загружаем всё в окно контекста. Это ощущение не очень правильное. Теоретически, даже если мы делаем машины, а не биологический мозг, можно иметь окно с миллионами или миллионами токенов, память — идеальную, — но поиск и извлечение информации все равно стоят дорого. В момент принятия решения найти действительно релевантную информацию — сложно, даже если всё сохранено. Поэтому я считаю, что в области памяти есть огромный потенциал для инноваций.

Gary Tan: Честно говоря, окно в миллион токенов уже гораздо больше, чем я ожидал, и это многофункционально.

Demis Hassabis: Да, для большинства сценариев оно достаточно большое. Но подумайте: окно контекста — это примерно рабочая память. У человека она в среднем — семь элементов, а у нас есть окна с миллионами токенов. Вопрос в том, что мы засовываем туда всё подряд, включая неважную и ошибочную информацию, и это очень грубый подход. И если сейчас обрабатывать поток видео в реальном времени, то даже при миллионе токенов — это примерно 20 минут. Но если вы хотите, чтобы система понимала вашу жизнь за один или два месяца, этого явно недостаточно.

Gary Tan: DeepMind традиционно делает ставку на усиленное обучение и поиск. Насколько эта философия встроена в создание Gemini? Все еще недооцениваете важность RL?

Demis Hassabis: Возможно, да. Внимание к усиленному обучению то поднимается, то спадает. С самого основания DeepMind мы работаем с агентами. Все работы по Atari и AlphaGo — по сути, системы RL-агентов, способных самостоятельно достигать целей, принимать решения, планировать. Тогда мы выбирали игры, потому что там сложность управляемая, и постепенно переходили к более сложным — например, после AlphaGo создали AlphaStar, и практически все игры, которые можно было, сделали.

Дальше стоит вопрос: можно ли обобщить эти модели в мировую модель или языковую модель, а не только игровые. Мы этим занимаемся уже несколько лет. Современные ведущие модели — это по сути переосмысление тех идей, которые заложены в AlphaGo.

Многие наши ранние разработки очень связаны с сегодняшним подходом, мы переосмысливаем старые идеи, масштабируем их, делая более универсальными, включая методы Монте-Карло поиска (Monte Carlo tree search) и другие техники RL. Идеи AlphaGo и AlphaZero очень близки к базовым моделям сегодня, и я считаю, что значительный прогресс в ближайшие годы будет именно за счет этого.

Дистилляция и малые модели


Gary Tan: Сейчас, чтобы стать умнее, нужны большие модели, но одновременно прогресс идет и в дистилляции — малые модели становятся очень быстрыми. Ваш Flash-модель очень мощная, она примерно на 95% от передовых моделей, при этом стоит в десять раз дешевле. Это так?

Demis Hassabis: Думаю, это один из наших ключевых преимуществ. Сначала нужно создать максимально крупную модель, чтобы получить передовые возможности. Одно из наших сильных качеств — быстрое дублирование и сжатие этих возможностей в меньшие модели. Мы сами изобрели метод дистилляции, и сейчас остаемся в числе лучших в мире. У нас есть сильное бизнес-стимул для этого. Мы — одна из крупнейших платформ AI-приложений.

Благодаря AI Overviews, AI Mode и Gemini, сейчас все продукты Google — карты, YouTube и другие — интегрируют Gemini или связанные технологии. Это сотни миллионов пользователей, десятки продуктов с миллиардной аудиторией. Они должны работать очень быстро, быть эффективными, с низкими затратами и минимальной задержкой. Это мотивирует нас делать Flash и более мелкие модели максимально эффективными, чтобы они хорошо служили пользователям.

Gary Tan: Мне интересно, насколько умными могут стать эти маленькие модели. Есть ли предел у дистилляции? Могут ли модели в 50 миллиардов или 400 миллиардов токенов быть так же умными, как самые крупные современные модели?

Demis Hassabis: Не думаю, что мы уже достигли информационного предела, по крайней мере, никто не знает, есть ли он. Возможно, однажды мы столкнемся с потолком по плотности информации, но сейчас предполагаем, что после выпуска передовой модели в течение полугода — года ее возможности можно будет сжать в очень маленькую модель, которая сможет работать на периферийных устройствах.

Вы можете видеть это на примере модели Gemma: наша Gemma 4 показывает очень хорошие результаты при меньшем объеме. В этом много дистилляционных технологий и оптимизаций эффективности. Поэтому я действительно не вижу теоретического предела, и думаю, что мы очень далеко от него.

Gary Tan: Сейчас наблюдается удивительный феномен: инженеры в разы увеличили объем работы — примерно в 500–1000 раз по сравнению с полгода назад. В этом зале есть люди, которые делают примерно в тысячу раз больше работы, чем инженер Google 2000-х годов. Об этом говорил Steve Yegge.

Demis Hassabis: Мне это очень интересно. Маленькие модели имеют множество применений. Одно — низкая стоимость и высокая скорость, что тоже очень важно. В программировании и других задачах вы можете делать итерации быстрее, особенно в командной работе. Быстрая система, даже не самая передовая, — 90–95% от лучших, — вполне достаточно, и скорость итераций окупает эти 5% отставания.

Еще один важный аспект — запуск этих моделей на периферийных устройствах, не только ради эффективности, но и ради приватности и безопасности. Представьте устройства, обрабатывающие очень личную информацию, роботы в доме. Вы бы хотели, чтобы ваш домашний робот работал локально на мощной модели, а задачи, требующие облака, выполнялись только в крайних случаях. Обработка аудио и видео локально, данные остаются на месте — это, я считаю, финальный сценарий.

Память и рассуждение


Gary Tan: Возвращаясь к памяти и контексту. Сейчас модели — без состояния, без постоянного обучения. Что изменится, если появится возможность непрерывного обучения? Как вы будете управлять такими системами?

Demis Hassabis: Это очень интересный вопрос. Отсутствие постоянного обучения — главный барьер для полноценного агента. Сейчас агенты хорошо справляются с отдельными задачами, их можно соединять для более сложных, но они не умеют адаптироваться к конкретной среде. Они не могут «выстрелить и забыть» — им нужно учиться в реальном времени, подстраиваться под конкретные сценарии. Для достижения полноценного общего интеллекта это обязательно.

Gary Tan: А что с рассуждениями? Где мы сейчас? Модели хорошо строят цепочки мышления, но иногда совершают ошибки, которые не допустил бы даже школьник. Что нужно изменить? Какие ожидаете прогрессы?

Demis Hassabis: В области мышления есть еще много пространства для инноваций. Мы делаем пока очень грубые и грубые подходы. Можно улучшить, например, мониторинг цепочек мышления, вмешательство в процессе. Мне кажется, что наши системы и системы конкурентов иногда зацикливаются, слишком много думают, попадают в циклы.

Я люблю наблюдать за Gemini в игре в шахматы. Все ведущие модели в этом плане довольно слабые, что интересно.

Анализировать их мышление очень ценно, потому что шахматы — хорошо изученная область. Я быстро могу понять, отклонился ли алгоритм, работает ли рассуждение. Иногда он делает ход, понимает, что плохой, но не может найти лучшего, и делает его. Идеальная система рассуждения не должна так ошибаться.

Такая разница есть, и исправить ее можно, кажется, за один-два небольших изменения. Поэтому у нас есть так называемый «зубчатый интеллект» — он умеет решать задачи уровня IMO, но при другом вопросе допускает ошибки начальной школы. В саморефлексии еще есть что улучшать.

Реальные возможности агента


Gary Tan: Агент — это очень широкая тема. Кто-то говорит, что это хайп. Я считаю, что мы только начинаем. Как внутри DeepMind оценивают реальные возможности агентов? Насколько сильно отличается их реальный потенциал от публичных заявлений?

Demis Hassabis: Полностью согласен, мы только начинаем. Чтобы достичь ИИ общего назначения, нужна система, которая активно помогает решать ваши задачи. Это наш путь, и я считаю, что мы только в начале.

Много экспериментов по интеграции агентов в рабочие процессы. Многие из вас, вероятно, тоже этим занимаются. Как сделать так, чтобы агент не был просто дополнением, а реально выполнял важные функции? Сейчас мы на стадии экспериментов. Только за последние пару месяцев начали находить действительно ценные сценарии. Технологии уже достаточно развиты, чтобы не было просто демонстрации, а чтобы агент реально экономил ваше время и повышал эффективность.

Я часто вижу, как запускают десятки агентов на десятки часов, но пока не уверен, что отдача оправдывает вложения.

Еще не видел, чтобы кто-то использовал vibe coding для создания топовой 3A-игры. Я сам делал небольшие прототипы, многие из вас тоже. За полчаса могу сделать прототип «Theme Park», тогда как в 17 лет я делал его полгода.

Чувствую, что если потратить целое лето, можно создать что-то действительно невероятное. Но для этого нужны мастерство, человеческий талант, вкус. Надо уметь привнести это в любой продукт. Пока что ни один ребенок не создал игру, проданную миллионом копий, хотя при текущих инструментах это вполне реально. Значит, чего-то не хватает — возможно, процессов или инструментов. Ожидаю, что за 6–12 месяцев появятся такие результаты.

Gary Tan: Насколько это будет полностью автоматизировано? Думаю, не сразу. Вероятнее, сначала люди достигнут в 1000 раз большей эффективности, а потом появятся продукты, созданные с помощью этих инструментов, — и автоматизация пойдет дальше.

Demis Hassabis: Да, именно так.

Gary Tan: Есть еще одна причина — некоторые уже делают это, но не хотят раскрывать, насколько агент им помог.

Demis Hassabis: Возможно. Но я хотел бы поговорить о креативности. Часто вспоминаю AlphaGo, особенно второй матч, 37 ход. Для меня это был момент, когда я понял, что такие прорывы возможны. Тогда я запустил проекты вроде AlphaFold. Мы начали работать над ним сразу после возвращения из Сеула, это было десять лет назад. Сейчас я в Корее — отмечаю десятилетие AlphaGo.

Но просто сделать ход 37 — недостаточно. Это круто, полезно, но сможет ли эта система изобрести саму игру? Если дать ей высокоуровневое описание — «игра, которую можно выучить за пять минут, но овладеть которой невозможно за всю жизнь, эстетически изящная, партия за вечер» — и она вернет вам ответ «шахматы», — тогда нынешние системы этого не умеют. Почему?

Gary Tan: Может, кто-то из присутствующих и сможет.

Demis Hassabis: Если кто-то это сделает, ответ будет не в том, что системе чего-то не хватает, а в том, как мы ее используем. Возможно, именно так и есть. Может, системы уже сейчас способны на это, нужны только гениальные создатели, которые дадут им душу, вдохновят проект. И эти люди должны быть очень тесно связаны с инструментами, почти сливаясь с ними. Если вы будете работать с этими инструментами день и ночь и обладаете глубоким творческим мышлением, — возможно, сможете создать что-то невероятное.

Открытый исходный код и мультимодальные модели


Gary Tan: Перейдем к открытым моделям. Недавно релиз Gemma позволил запускать очень мощные модели локально. Как вы считаете, AI станет собственностью пользователя, а не только облачной? Это изменит доступность инструментов для создания продуктов?

Demis Hassabis: Мы — ярые сторонники открытого исходного кода и науки. Например, AlphaFold мы полностью сделали бесплатным. Наши научные публикации выходят в топовых журналах. В случае Gemma мы хотим создать модель мирового уровня с аналогичным размером. Уже за две с половиной недели после релиза скачано около 40 миллионов раз.

Я считаю важным, чтобы в области open source присутствовали западные технологические стеки. Китайские open source-модели очень хороши, сейчас лидируют в этой сфере, но мы считаем, что Gemma при аналогичных размерах очень конкурентоспособна.

У нас есть ограниченность ресурсов — никто не может одновременно тренировать две крупные передовые модели. Поэтому мы решили: модели для периферии — для Android, очков, роботов — лучше делать открытыми, чтобы их можно было запускать прямо на устройстве. Тогда они будут максимально защищены, и их проще открыть полностью. Мы придерживаемся единой стратегии открытости, что логично с стратегической точки зрения.

Gary Tan: Перед демонстрацией я показывал тебе свою операционную систему AI, с помощью голоса взаимодействую с Gemini. Пока я волновался, получилось. Gemini изначально мультимодальна. Я использовал много моделей, и взаимодействие через голос, дополненное вызовами инструментов и пониманием контекста, — сейчас это лучшее решение.

Demis Hassabis: Да. Одно из преимуществ Gemini — то, что мы изначально строили его как мультимодальную систему. Это усложнило старт, по сравнению с текстовыми моделями, но в долгосрочной перспективе это даст преимущества, и уже сейчас мы начинаем это реализовывать.

Например, в области мировых моделей мы создали Genie — генеративную интерактивную среду на базе Gemini. В робототехнике Gemini Robotics строится на мультимодальных моделях, и наши преимущества в этой области станут нашим конкурентным преимуществом. Мы все больше используем Gemini в Waymo (автопилот компании Alphabet).

Представьте цифрового помощника, который сопровождает вас в реальном мире — на телефоне или очках, понимает окружающую физическую среду. Наши системы очень сильны в этом. Мы продолжим развивать это направление, и я уверен, что у нас есть большое преимущество.

Gary Tan: Стоимость рассуждений быстро падает. Когда рассуждение станет практически бесплатным, что станет возможным? Меняет ли это стратегию вашей команды?

Demis Hassabis: Не уверен, что рассуждение станет полностью бесплатным — есть эффект Джевонса (Jevons’ Paradox), когда повышение эффективности ведет к росту общего потребления. Думаю, все в итоге используют всю доступную вычислительную мощность.

Можно представить, что миллионы агентов работают вместе или группа агентов одновременно размышляет по разным направлениям, а затем объединяет результаты. Мы экспериментируем с этим. Все это будет потреблять вычислительные ресурсы.

Что касается энергии, если мы решим задачи управляемого термоядерного синтеза, комнатной температуры сверхпроводимости или лучших аккумуляторов, то, по моему мнению, материалы позволят снизить затраты до нуля. Но физическое производство чипов — еще узкое место, и в ближайшие десятилетия оно останется таковым. Поэтому лимит по рассуждениям все равно будет существовать, и нужно использовать ресурсы максимально эффективно.

Следующий научный прорыв


Gary Tan: Хорошо, что маленькие модели становятся все умнее. В зале много основателей в биотехнологиях. AlphaFold 3 уже превосходит белки и расширяется на более широкий спектр биомолекул. Насколько мы близки к моделированию целых клеточных систем? Это совершенно другой уровень сложности?

Demis Hassabis: Progress в Isomorphic Labs идет очень хорошо. AlphaFold — лишь часть процесса поиска лекарств. Мы занимаемся смежными биохимическими исследованиями, проектируем молекулы с нужными свойствами, скоро будет важное объявление.

Наша конечная цель — создать полноценную виртуальную клетку, модель, в которую можно вносить изменения, — полноценный симулятор клетки, дающий результаты, близкие к экспериментальным, и обладающий практической ценностью. Можно пропустить много этапов поиска, генерировать большие объемы синтетических данных для обучения других моделей, чтобы предсказывать поведение реальных клеток.

Я предполагаю, что до полной виртуальной клетки осталось около десяти лет. Мы начинаем с ядра клетки, потому что оно относительно автономно. Важный вопрос — можно ли выделить достаточно компактный и самодостаточный фрагмент, чтобы его можно было моделировать, а входы и выходы — аппроксимировать. В этом смысле ядро клетки — хороший кандидат.

Еще одна проблема — недостаток данных. Я общался с ведущими учеными, работающими с электронными микроскопами и другими методами визуализации. Если удастся не убивать клетки при исследовании, а получать изображения живых, это будет революцией. Тогда можно будет свести задачу к визуальной, а визуальные модели мы хорошо понимаем.

Пока что технологии, позволяющие снимать живые клетки в наноразмере без повреждений, отсутствуют. Можно делать статичные изображения с очень высокой точностью, но это не дает возможности моделировать динамику.

Есть два подхода: аппаратный и программный. Первый — развитие аппаратных решений, второй — создание более эффективных обучаемых симуляторов для моделирования этих систем.

Gary Tan: Не только в биологии. В материаловедении, разработке лекарств, климатическом моделировании, математике — если нужно расставить приоритеты, какие области претерпят самые кардинальные изменения за ближайшие пять лет?

Demis Hassabis: Каждая область очень интересна, и именно поэтому я так увлечен AI уже более 30 лет. Я всегда считал, что AI — это универсальный инструмент для науки, для продвижения понимания, открытия новых лекарств, исследования космоса.

Наше видение — в двух шагах. Первый — решить задачу интеллекта, построить AGI. Второй — использовать его для решения всех остальных задач. Потом мы немного изменили формулировку, потому что возник вопрос: «Вы действительно собираетесь решать все проблемы?»

Но да, именно так. Сейчас все начинают понимать, что это означает. В частности, я говорю о решении так называемых «корневых проблем» в науке — тех, которые, если их решить, откроют новые ветви открытий. Например, AlphaFold — прототип того, что мы хотим делать.

Более трех миллионов исследователей по всему миру используют AlphaFold. Некоторые руководители фармацевтических компаний говорят, что почти все новые лекарства в будущем будут связаны с применением AlphaFold на каком-то этапе. Мы гордимся этим, и это именно тот эффект, который мы надеялись получить от AI. Но это только начало.

Я не могу придумать ни одной области науки или техники, в которой AI не мог бы помочь. Те области, что я упомянул, — это только «момент AlphaFold», когда результаты очень перспективны, но еще не достигнуты главные вызовы. В ближайшие два года мы увидим много прогресса — в материаловедении, математике и других сферах.

Gary Tan: Это похоже на прорыв Прометея — дарит человечеству новые возможности.

Demis Hassabis: Точно. И, как в мифе, мы должны быть осторожны с тем, как эти возможности используют, и с рисками злоупотреблений.

Опыт успеха


Gary Tan: В зале много тех, кто пытается создать компании, использующие AI в науке. В чем, по вашему мнению, отличие настоящих передовых стартапов от тех, кто просто навешивает API на базовые модели и называет себя «AI for Science»?

Demis Hassabis: Думаю, если бы я сейчас был на вашем месте, смотрел бы на проекты в Y Combinator, я бы подумал так: важно предвидеть развитие AI. Это очень сложно. Но я считаю, что есть огромные возможности, если соединить AI с другими глубокими технологиями. Особенно в области материалов, медицины и других сложных наук, связанных с атомами — там в ближайшие годы не будет быстрых решений. Эти области не исчезнут после следующего обновления базовой модели. Но если искать устойчивые направления, я бы рекомендовал именно их.

Я всегда тяготел к глубоким технологиям. Настоящие, долгосрочные и ценные идеи — это не легкие. Я всегда был увлечен глубокой наукой. Когда мы начинали в 2010 году, AI считался нишевым направлением, и инвесторы говорили: «Это не сработает», а академия — что это попытка в 90-х, которая провалилась.

Но если у вас есть вера в свои идеи — почему это будет иначе сейчас? Какие у вас уникальные знания или опыт? Идеально, если вы — эксперт в машинном обучении и применениях или можете собрать такую команду. Тогда у вас есть шанс создать что-то значительное.

Gary Tan: Это очень важная мысль. Когда что-то получается, кажется очевидным, но до этого все были против.

Demis Hassabis: Конечно. Поэтому важно заниматься тем, что действительно вдохновляет. Для меня — AI. Еще в детстве я решил, что это моя главная страсть. И это подтвердилось. Может, мы и опоздали на 50 лет, но я уверен, что это — самое важное и интересное дело.

Это также самое увлекательное, что я знаю. Даже если сегодня мы еще в гараже, а AI — не реализован, я все равно буду искать способы продолжать. Может, вернусь в академию, но продолжу.

Gary Tan: AlphaFold — пример удачного выбора направления и правильной ставки. Что делает область науки подходящей для таких прорывов? Есть ли какие-то закономерности, например, особая целевая функция?

Demis Hassabis: Надо бы написать об этом статью. Из опыта работы над AlphaGo и AlphaFold я понял, что такие системы работают лучше всего, когда:

  1. Задача имеет огромный комбинаторный поиск, чем больше, тем лучше — так, что никакие brute-force или специальные алгоритмы не справятся. Например, пространство ходов в шахматы или конфигураций белков — гораздо больше атомов во Вселенной.

  2. Можно четко определить целевую функцию — например, минимизация свободной энергии белка или победа в игре. Тогда система может использовать градиентные методы.

  3. Есть достаточно данных или симулятор, который генерирует много синтетических образцов внутри распределения.

Если эти три условия выполнены, современные методы могут найти «иголку в стоге сена». В медицине — тоже: если есть молекула, которая лечит болезнь без побочных эффектов, и физика это допускает, — остается только найти ее эффективно. AlphaFold впервые показал, что такие системы могут искать в огромных пространствах.

Gary Tan: Хотел бы поднять уровень. Мы говорим, что люди используют эти методы для создания AlphaFold, но есть еще мета-уровень — человек использует AI для исследования гипотез. Насколько далеко до систем, способных делать настоящие научные рассуждения, а не только находить паттерны в данных?

Demis Hassabis: Думаю, очень близко. Мы создаем такие универсальные системы. Есть AI co-scientist, есть алгоритмы типа AlphaEvolve, которые делают шаги дальше. Все ведущие лаборатории этим занимаются.

Но пока я не видел, чтобы эти системы сделали действительно крупное научное открытие. Но оно скоро придет. Возможно, связано с нашим обсуждением креативности, — прорывы за границами известных моделей. Тогда это перестанет быть просто паттерн-матчингом, потому что не будет шаблонов. Это будет что-то вроде аналогического рассуждения, — системы пока этого не умеют или мы неправильно их используем.

Я часто говорю, что в науке важно не только подтверждение гипотез, но и их генерация. Например, доказательство гипотезы Римана или решение задач Millennium — это тоже важные открытия. Но еще сложнее — предложить новые задачи, которые признаны глубокими и достойными исследования на всю жизнь. Это — следующий уровень сложности.

Я считаю, что это не магия, и такие системы в будущем смогут это делать. Может, им чуть-чуть не хватает, но я уверен, что они смогут. Возможно, потребуется еще один-два шага.

Можно проверить так: я называю это «Тестом Эйнштейна» — можно ли обучить систему знаниям 1901 года и заставить ее самостоятельно вывести результаты, которые сделал Эйнштейн в 1905 году? Если да, то системы уже очень близки к созданию новых теорий. Надо это проверить и повторять эксперимент, пока не получится. Тогда такие системы станут способными к настоящему изобретательству.

Предпринимательские советы


Gary Tan: В заключение. В зале много тех, кто хочет создать что-то подобное вам. Вы — одна из крупнейших исследовательских организаций в области AI. Что бы вы хотели знать в 25 лет, что сейчас уже понимаете?

Demis Hassabis: Мы уже говорили об этом. Стремление к сложным задачам и к простым — по сути, одно и то же, только разными способами. Жизнь коротка, не тратьте силы на то, что никто больше не сделает, — выбирайте то, что важно и никто не осмелится сделать без вас.

Также я считаю, что в ближайшие годы междисциплинарные соединения станут еще более важными. AI сделает их проще.

И последнее — зависит от вашего графика достижения ИИ общего назначения. Мой — примерно 2030 год. Если вы начинаете проект в области глубоких технологий сегодня, это десятилетний путь. Значит, нужно учитывать, что ИИ может появиться внезапно. Это не обязательно плохо, но нужно быть готовым. Ваш проект сможет использовать ИИ? Как он будет взаимодействовать с ним?

Возвращаясь к примеру AlphaFold и универсальных систем, я предполагаю, что Gemini, Claude или подобные системы будут использовать узкоспециализированные системы вроде AlphaFold как инструменты. Не думаю, что мы будем объединять все в один гигантский монолит.

Ссылка на оригинальное видео

Посмотрите, как Rhythm BlockBeats ищет новых сотрудников

Присоединяйтесь к официальному сообществу Rhythm BlockBeats:

Telegram-канал: https://t.me/theblockbeats

Telegram-группа: https://t.me/BlockBeats_App

Официальный аккаунт в Twitter: https://twitter.com/BlockBeatsAsia

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить