Схематическое изображение прогнозирования последовательности с помощью CARBonAra. Геометрический трансформатор берет образцы пространства последовательностей фермента бета-лактамазы TEM-1 (серый цвет), образует комплекс с естественным субстратом (голубой цвет) для получения новых хорошо сложенных и активных ферментов. Автор: Александра Банбанасте (EPFL)
Исследователи EPFL разработали новую модель на основе искусственного интеллекта, предназначенную для прогнозирования белковых последовательностей на основе каркасов основной цепи с учетом сложной молекулярной среды. Это обещает значительные достижения в области белковой инженерии и их применения в различных областях, включая медицину и биотехнологию.
Разработка белков, способных выполнять определенные функции, предполагает понимание и манипулирование их последовательностями и структурами. Эта задача имеет решающее значение для разработки таргетных методов лечения заболеваний и создания ферментов для промышленного применения.
Одной из главных задач в белковой инженерии является разработка белков de novo, то есть с нуля, для адаптации их свойств к конкретным задачам. Это имеет глубокие последствия для биологии, медицины и материаловедения. Например, разработанные белки могут воздействовать на заболевания с высокой точностью, предлагая конкурентоспособную альтернативу традиционным препаратам на основе малых молекул.
Кроме того, специально разработанные ферменты, которые действуют как естественные катализаторы, могут способствовать редким или несуществующим реакциям в природе. Эта возможность особенно ценна в фармацевтической промышленности для синтеза сложных молекул лекарств и в экологических технологиях для более эффективного расщепления загрязняющих веществ или пластика.
Группа ученых под руководством Маттео Даль Пераро из EPFL разработала CARBonAra (контекстно-зависимое восстановление аминокислот из атомов остова и гетероатомов), модель на основе искусственного интеллекта, которая может предсказывать последовательности белков, но принимая во внимание ограничения, накладываемые различными молекулярными средами, что является уникальным достижением.
CARBonAra обучается на наборе данных из приблизительно 370 000 субъединиц, с дополнительными 100 000 для проверки и 70 000 для тестирования из Protein Data Bank (PDB). Исследование опубликовано в журнале Nature Communications.
CARBonAra основывается на архитектуре фреймворка Protein Structure Transformer (PeSTo), также разработанного Люсьеном Краппом в группе Дала Пераро. Он использует геометрические трансформаторы, которые являются моделями глубокого обучения, обрабатывающими пространственные отношения между точками, такими как атомные координаты, для изучения и прогнозирования сложных структур.
CARBonAra может предсказывать аминокислотные последовательности из остовов, структурных каркасов белковых молекул. Однако одной из выдающихся особенностей CARBonAra является его контекстная осведомленность, которая особенно демонстрируется в том, как он улучшает показатели восстановления последовательностей — процент правильных аминокислот, предсказанных в каждой позиции в белковой последовательности по сравнению с известной референтной последовательностью.
CARBonAra значительно улучшила показатели восстановления, когда включила молекулярные «контексты», такие как интерфейсы белков с другими белками, нуклеиновыми кислотами, липидами или ионами. «Это потому, что модель обучается на всех видах молекул и полагается только на атомные координаты, так что она может работать не только с белками», — объясняет Дал Пераро. Эта функция, в свою очередь, повышает предсказательную силу модели и применимость в реальных сложных биологических системах.
Модель не очень хорошо работает только в синтетических тестах, но была проверена экспериментально. Исследователи использовали CARBonAra для создания новых вариантов фермента β-лактамазы TEM-1, который участвует в развитии устойчивости к противомикробным препаратам.
Некоторые из предсказанных последовательностей отличаются примерно на 50 % от диких последовательности свернуты правильно и сохраняют некоторую каталитическую активность при высоких температурах, когда фермент дикого типа уже неактивен.
Гибкость и точность CARBonAra открывают новые возможности для белковой инженерии. Его способность учитывать сложную молекулярную среду делает его ценным инструментом для разработки белков с конкретными функциями, что позволит улучшить будущие кампании по поиску лекарств. Кроме того, успех CARBonAra в разработке ферментов демонстрирует ее потенциал для промышленного применения и научных исследований.
Дополнительная информация: Люсьен Ф. Крапп и др., Context- осведомленное о глубоком геометрическом обучении для проектирования белковых последовательностей, Nature Communications (2024). DOI: 10.1038/s41467-024-50571-y
Информация журнала: Nature Communications
Предоставлено Федеральной политехнической школой Лозанны