Счет быстрее: объединение ИИ с фундаментальной физикой

Важные новости

Расчеты быстрее: связь ИИ с фундаментальной физикой

Обзор результатов. Кредит: Nature Communications (2024). DOI: 10.1038/s41467-024-50620-6

Атомы — это сложные квантовые системы, состоящие из положительно заряженного ядра, окруженного отрицательно заряженными электронами. Когда несколько атомов объединяются, образуя молекулу, электроны составляющих их атомов взаимодействуют сложным образом, что делает компьютерное моделирование молекул одной из самых сложных проблем в современной науке.

Исследователи из Берлинского института основ обучения и данных (BIFOLD) в Техническом университете Берлина и Google DeepMind разработали новый алгоритм машинного обучения, который позволяет проводить высокоточное моделирование динамики одной или нескольких молекул в длительных временных масштабах. Их работа была опубликована в Nature Communications.

Эти так называемые молекулярные динамические симуляции важны для понимания свойств молекул и материалов и имеют потенциальное применение в разработке лекарств и проектировании материалов (например, для использования в солнечных панелях и аккумуляторах). Традиционные методы вычисления взаимодействий электронов основаны на поиске решений так называемого уравнения Шредингера.

Уравнение Шредингера описывает энергетические уровни, которые может принимать квантовая система, например, атомы или молекулы. Это чрезвычайно сложная задача, и поиск решения для молекул, содержащих более нескольких десятков атомов, может занять несколько дней, даже на мощных компьютерах. Что еще хуже, для запуска моделирования молекулярной динамики в длительных временных масштабах уравнение Шредингера необходимо решать тысячи или даже миллионы раз, что быстро превышает вычислительные ресурсы, доступные сегодня.

«Моделирование таких взаимодействий и полученные в результате прогнозы для сложных процессов, таких как сворачивание белка или связывание между отдельными молекулами, являются давней мечтой многих химиков и материаловедов и позволили бы сэкономить много дорогостоящих и трудоемких экспериментов», — объясняет исследователь BIFOLD Торбен Франк.

В последние годы методы машинного обучения (ML) приблизили эту мечту к реальности. Вместо явного решения уравнения Шредингера они могут научиться напрямую предсказывать общий результат соответствующих электронных взаимодействий на атомистическом уровне, с существенно сниженными вычислительными затратами.

Затем сложность смещается на поиск эффективных алгоритмов для «обучения» системы машинного обучения тому, как электроны взаимодействуют, не моделируя их явно. Чтобы уменьшить сложность этой задачи, многие алгоритмы обучения используют тот факт, что физические системы следуют так называемым инвариантам.

Проще говоря, определенные свойства молекул остаются неизменными, когда молекулы перемещаются в пространстве, но относительные расстояния между отдельными атомами остаются фиксированными — это означает, что машине не нужно изучать что-то новое в этих случаях. Однако способ, которым эти инварианты обычно включаются в модели МО, является вычислительно затратным, в конечном итоге ограничивая скорость, с которой модели могут выполнять моделирование молекулярной динамики.

Чтобы устранить этот недостаток, ученые BIFOLD разработали новый алгоритм обучения, который отделяет инвариантности от другой информации о химической системе в самом начале. В отличие от предыдущих методов, которые требовали извлечения инвариантных компонентов из каждой операции в модели, этот новый подход упрощает процесс. Теперь модель МО может зарезервировать самые сложные операции для физической информации, которая действительно имеет значение, и радикально сократить общие вычислительные затраты.

«Моделирование, которое требовало месяцев или даже лет вычислений на высокопроизводительных компьютерных кластерах, теперь можно выполнить за несколько дней на одном компьютерном узле. Скачок в эффективности позволяет проводить долгосрочное моделирование, которое необходимо для понимания структуры, динамики и функционирования атомистических систем. Таким образом, это позволяет глубже проникнуть в самые сложные и фундаментальные процессы природы», — говорит исследователь BIFOLD доктор Стефан Хмела, возглавлявший исследовательский проект.

В будущем точное моделирование взаимодействия молекул с белками в организме человека может позволить исследователям разрабатывать новые лекарства без необходимости проведения экспериментов, что позволит сэкономить время и деньги, а также будет более экологичным.

Чтобы продемонстрировать потенциальные приложения алгоритма, команда использовала новый метод МО для идентификации наиболее стабильной версии докозагексаеновой кислоты, жирной кислоты, которая является основным структурным компонентом человеческого мозга. Эта задача требует сканирования десятков тысяч потенциальных кандидатов с высокой точностью. До сих пор такой анализ был бы невозможен с помощью традиционных квантово-механических методов.

Как отметил профессор, доктор Клаус-Роберт Мюллер, содиректор BIFOLD и главный научный сотрудник Google DeepMind, «Эта работа демонстрирует потенциал объединения передовых методов машинного обучения с физическими принципами для преодоления давних проблем в вычислительной химии. Она продолжает важнейшее направление исследований, которое фокусируется на масштабировании подходов МО в направлении реалистичных химических систем, представляющих практический интерес».

Доктор Оливер Унке, старший научный сотрудник Google DeepMind, комментирует: «Ранее в этом году нам удалось масштабировать модели до тысяч атомов, но с такими новыми достижениями, как это, переход к еще большему числу атомов может стать возможным».

Хотя сейчас становятся доступными симуляции с десятками и сотнями тысяч атомов, некоторые структуры состоят из миллионов атомов и более. Следующее поколение алгоритмов должно будет иметь возможность точно моделировать такие размеры систем, что требует правильного описания дополнительных, сложных, дальнодействующих физических взаимодействий.

Дополнительная информация: J. Thorben Frank et al, A Euclidean transformer for fast and stable machine learning force fields, Nature Communications (2024). DOI: 10.1038/s41467-024-50620-6

Информация о журнале: Nature Communications

Предоставлено Техническим университетом Берлина

Новости сегодня

Последние новости