Новая модель ИИ может предсказывать движение субстрата в клетки и из них

Важные новости

Новая модель ИИ может предсказывать перемещение субстрата в клетки и из них

Схематическая диаграмма процесса прогнозирования: Базы данных белков предоставляют набор данных с 8500 экспериментально подтвержденными парами транспортер-субстрат для обучения модели (вверху). Транспортные белки состоят из последовательности аминокислот, которые были преобразованы в векторы с помощью модели глубокого обучения (в центре слева, в разных оттенках зеленого). Информация о потенциальных субстратах также преобразуется в числовые векторы (в центре справа, в разных оттенках желтого). Эти векторы обучают так называемую модель градиентного усиления (ансамбль множественных деревьев решений) для прогнозирования того, является ли молекула субстратом для определенного транспортного белка (внизу). Кредит: HHU/Alexander Kroll

Транспортные белки отвечают за постоянное перемещение субстратов в биологическую клетку и из нее. Однако трудно определить, какие субстраты может транспортировать конкретный белок. Биоинформатики из Университета имени Генриха Гейне в Дюссельдорфе (HHU) разработали модель, называемую SPOT, которая может предсказывать это с высокой степенью точности с помощью искусственного интеллекта (ИИ).

Исследователи представляют свой подход, который можно использовать с произвольными транспортными белками, в журнале PLOS Biology.

Субстраты в биологических клетках должны непрерывно транспортироваться внутрь и наружу через клеточную мембрану, чтобы обеспечить выживание клеток и дать им возможность выполнять свою функцию. Однако не всем субстратам, которые перемещаются по телу, должно быть разрешено проникать в клетки. И некоторые из этих транспортных процессов должны быть контролируемыми, чтобы они происходили только в определенное время или при определенных условиях, чтобы запустить функцию клетки.

Роль этих активных и специализированных транспортных каналов берут на себя так называемые транспортные белки (транспортеры), большое разнообразие которых интегрировано в клеточные мембраны. Транспортный белок включает в себя большое количество отдельных аминокислот, которые вместе образуют сложную трехмерную структуру.

Каждый транспортер приспособлен к определенной молекуле — так называемому субстрату — или небольшой группе субстратов. Но к какой именно? Исследователи постоянно ищут соответствующие пары транспортер-субстрат.

Профессор д-р Мартин Лерхер из исследовательской группы по вычислительной клеточной биологии и соавтор исследования говорит: «Определение того, какие субстраты соответствуют каким транспортерам экспериментально, является сложной задачей. Даже определение трехмерной структуры транспортера — из которой можно было бы идентифицировать субстраты — является сложной задачей, поскольку белки становятся нестабильными, как только их изолируют от клеточной мембраны».

«Мы выбрали другой подход — на основе ИИ», — говорит д-р Александр Кролл, ведущий автор исследования и постдок в исследовательской группе профессора Лерхера. «Наш метод, который называется SPOT, использовал более 8500 пар транспортер-субстрат, которые уже были экспериментально подтверждены, в качестве обучающего набора данных для модели глубокого обучения».

Чтобы компьютер мог обрабатывать транспортные белки и молекулы субстрата, биоинформатики в Дюссельдорфе сначала преобразуют белковые последовательности и молекулы субстрата в числовые векторы, которые могут быть обработаны моделями ИИ. После завершения процесса обучения вектор для нового транспортера и векторы для потенциально подходящих субстратов могут быть введены в систему ИИ. Затем модель предсказывает, насколько вероятно, что определенные субстраты будут соответствовать транспортеру.

Кролл объясняет: «Мы проверили нашу обученную модель с помощью независимого тестового набора данных, в котором мы уже знали пары транспортер-субстрат. SPOT с точностью выше 92% предсказывает, является ли произвольная молекула субстратом для определенного транспортера».

Таким образом, SPOT предлагает весьма перспективные кандидаты на субстраты. «Это позволяет нам в значительной степени ограничить область поиска для экспериментаторов, что, в свою очередь, ускоряет процесс определения того, какой субстрат является определенным соответствием для транспортера в лаборатории», — говорит профессор Лерчер, объясняя связь между биоинформатическим прогнозированием и экспериментальной проверкой.

Кролл добавляет: «И это применимо к любому произвольному транспортному белку, а не только к ограниченным классам похожих белков, как это имеет место в других подходах на сегодняшний день».

Существуют различные потенциальные области применения этой модели.

Лерчер отмечает: «В биотехнологии метаболические пути могут быть изменены, чтобы обеспечить производство определенных продуктов, таких как биотопливо, или лекарства могут быть адаптированы к транспортерам, чтобы облегчить их проникновение именно в те клетки, в которых они должны оказывать действие».

Дополнительная информация: Александр Кролл и др., SPOT: модель машинного обучения, которая предсказывает определенные субстраты для транспортных белков, PLOS Biology (2024). DOI: 10.1371/journal.pbio.3002807

Информация о журнале: PLoS Biology

Предоставлено Университетом Генриха Гейне в Дюссельдорфе

Новости сегодня

Последние новости