Исследователи описывают перспективы и проблемы понимания ИИ для биологических исследований

Важные новости

Исследователи описывают обещания и проблемы понимания ИИ для биологических исследований

Обзор трех распространенных ошибок интерпретации IML в биологических контекстах и ​​способы их избежания. Источник: Nature Methods (2024). DOI: 10.1038/s41592-024-02359-7, https://www.nature.com/articles/s41592-024-02359-7

Машинное обучение — мощный инструмент в вычислительной биологии, позволяющий анализировать широкий спектр биомедицинских данных, таких как геномные последовательности и биологическая визуализация. Но когда исследователи используют машинное обучение в вычислительной биологии, понимание поведения модели остается решающим для раскрытия базовых биологических механизмов здоровья и болезней.

В недавней статье в Nature Methods, исследователи Школы компьютерных наук Университета Карнеги-Меллона предлагают рекомендации, которые описывают подводные камни и возможности использования интерпретируемых методов машинного обучения для решения проблем вычислительной биологии. Статья журнала Perspectives «Применение интерпретируемых методов машинного обучения в вычислительной биологии — подводные камни, рекомендации и возможности для новых разработок» представлена ​​в августовском специальном выпуске журнала, посвященном ИИ.

«Интерпретируемое машинное обучение вызвало значительный ажиотаж, поскольку инструменты машинного обучения и искусственного интеллекта применяются для решения все более важных проблем», — сказал Амит Талвалкар, доцент кафедры машинного обучения (MLD) Карнеги-Меллона.

«Поскольку эти модели становятся все более сложными, открываются большие перспективы не только в разработке высокопрогностических моделей, но и в создании инструментов, которые помогут конечным пользователям понять, как и почему эти модели делают определенные прогнозы. Однако крайне важно признать, что интерпретируемое машинное обучение еще не предоставило готовых решений этой проблемы интерпретируемости».

Статья является совместной работой докторантов Валери Чен из MLD и Мую (Венди) Янг из отделения вычислительной биологии Рэя и Стефани Лейн. На написание статьи вдохновила более ранняя работа Чен, в которой она критиковала отсутствие у сообщества интерпретируемого машинного обучения фундаментальных знаний в последующих вариантах использования, а сама идея была развита в ходе обсуждений с Ян и Цзянь Ма, профессором вычислительной биологии Рэя и Стефани Лейн.

«Наше сотрудничество началось с глубокого погружения в статьи по вычислительной биологии для обзора применения методов интерпретируемого машинного обучения», — сказал Янг. «Мы заметили, что многие приложения использовали эти методы несколько ситуативным образом. Нашей целью в этой статье было предоставить рекомендации по более надежному и последовательному использованию методов интерпретируемого машинного обучения в вычислительной биологии».

Одной из основных ловушек, на которую ссылается статья, является опора на один интерпретируемый метод машинного обучения. Вместо этого исследователи рекомендуют использовать несколько интерпретируемых методов машинного обучения с различными наборами гиперпараметров и сравнивать их результаты, чтобы получить более полное понимание поведения модели и ее базовых интерпретаций.

«Хотя некоторые модели машинного обучения, кажется, работают на удивление хорошо, мы часто не до конца понимаем, почему», — сказал Ма. «В таких научных областях, как биомедицина, понимание того, почему работают модели, имеет решающее значение для открытия фундаментальных биологических механизмов».

В статье также предостерегают от выборочного выбора результатов при оценке интерпретируемых методов машинного обучения, поскольку это может привести к неполной или предвзятой интерпретации научных результатов.

Чэнь подчеркнул, что руководящие принципы могут иметь более широкие последствия для более широкой аудитории исследователей, заинтересованных в применении интерпретируемых методов машинного обучения в своей работе.

«Мы надеемся, что исследователи машинного обучения, разрабатывающие новые интерпретируемые методы и инструменты машинного обучения, особенно те, которые работают над объяснением больших языковых моделей, тщательно рассмотрят человеко-ориентированные аспекты интерпретируемого машинного обучения», — сказал Чен. «Это включает в себя понимание того, кто является их целевым пользователем и как метод будет использоваться и оцениваться».

Хотя понимание поведения модели остается критически важным для научных открытий и принципиально нерешенной проблемой машинного обучения, авторы надеются, что эти проблемы стимулируют дальнейшее междисциплинарное сотрудничество для содействия более широкому использованию ИИ для научного воздействия.

Дополнительная информация: Чен, В. и др. Применение интерпретируемого машинного обучения в вычислительной биологии — подводные камни, рекомендации и возможности для новых разработок, Nature Methods (2024). DOI: 10.1038/s41592-024-02359-7, www.nature.com/articles/s41592-024-02359-7

Информация о журнале: Nature Methods Предоставлено Университетом Карнеги-Меллона

Новости сегодня

Последние новости