Пришло время для нового подхода к вычислению архитектуры?

Важные новости

Время для нового подхода к вычислительной архитектуре?

Спонсируемая статья Прочтите это интервью в Регистре, чтобы узнать, что профессор Онур Мутлу из ETH Zürich думает о вычислительной архитектуре, которую мы должны развернуть, чтобы соответствовать требованиям следующего поколения.

The Register: Если мы посмотрим на то, как сегодня работает вычислительная архитектура, каковы проблемы и недостатки этой модели?

Профессор Онур Мутлу:Сегодня существуют серьезные проблемы с тем, как мы проектируем вычислительные системы. Одним из самых важных является то, что, хотя наборы данных растут, и мы пытаемся делать с ними более сложные вещи, компоненты, которые выполняют фактические вычисления, составляют очень небольшую часть системы. Если вы возьмете типичный узел, то более 98 процентов этого узла предназначено для хранения, управления и перемещения данных, тогда как процессоры, которые работают с этими данными, составляют очень небольшую его часть. То, как мы проектируем наши системы, очень ориентировано на процессор. Процессор — король, и все должно быть перенесено на него, чтобы вы могли выполнять вычисления. Система хранения, система памяти и межсоединения не являются активными компонентами, продуктивно работающими над этими вычислениями. Когда вы постоянно перемещаете данные между процессором и подсистемами памяти или хранилища, это представляет собой серьезное узкое место.

Рег: Как это соотносится с возрастом приложений с большим объемом данных? < /p>

ОМ: Все чаще нам приходится хранить много терабайт данных из таких приложений, как машинное обучение и геномика. Мы провели исследование совместно с Google, в ходе которого рассмотрели большие модели машинного обучения, в которых используются ускорители машинного обучения, и обнаружили, что более 90 процентов общей энергии системы фактически тратится на доступ к памяти. Это вызывает как проблемы с энергопотреблением, так и проблемы с производительностью. Большая часть потенциала вашего оборудования теряется, и это также вызывает проблемы с устойчивостью. Все это оборудование для обработки данных, которое используется только для хранения данных, приводит к потере большого количества углерода.

Рег: Есть ли возможности для более эффективного выполнения работы?

ОМ: Я считаю, что в будущем память и хранилище должны быть и будут более тесно интегрированы. Они также будут намного более активными, так что, например, когда процессору необходимо выполнить часть рабочей нагрузки с интенсивным использованием данных — например, большую языковую модель с выводом большого количества данных — он перегружает эту функцию в память. Затем результат возвращается в процессор, позволяя ему приступить к другим делам. Благодаря этой модели все работает более согласованно, что позволяет решать проблемы гораздо более эффективно и производительно.

Рег: Какие приложения больше всего выигрывают от этого подхода?

ОМ: Мы говорим о приложениях, ориентированных на данные, таких как геномика, или об обучении и выводах машинного обучения. Каждому из них можно выделить узлы хранения, динамически меняющиеся в соответствии с потребностями приложения. Содерживая данные и выполняя обработку в системе хранения, вы обеспечиваете огромную энергоэффективность. Сегодняшние вычисления не являются энергоэффективными. Так много энергии тратится на перемещение данных из памяти в процессор только для очень простых вычислений. Я называю это скрытой стоимостью перемещения данных. Мы пытаемся изменить это, например, добавив возможность ускорения в память.

Рег: Расскажите нам больше о вашей работе в области геномики.

OM: Геномные данные стремительно распространяются по всему миру благодаря чрезвычайно мощным и недорогим технологиям секвенирования генома, которые мы сейчас имеем. Бывают случаи, когда вам необходимо быстро проанализировать эти данные, например, при лечении тяжелобольного ребенка, когда вы хотите определить наилучшее индивидуальное лечение. Сегодня эти данные будут храниться в облаке, и их необходимо будет перенести на процессоры. Мы хотим устранить это, чтобы решения можно было принимать гораздо быстрее. Нам удалось сократить задержку анализа примерно в 30 раз. Энергоэффективность также можно повысить, в зависимости от типа анализа, который вы проводите, и типа имеющихся у вас данных. И это только за счет переноса возможностей ускорения на сторону хранилища.

Рег: Есть ли у вас другие примеры, о которых вы можете поговорить?

OM : Также мы работаем над выводами машинного обучения и большими языковыми моделями. Здесь мы видим такие же хорошие результаты. Вам необходимо работать с огромными наборами данных для формирования выводов или обучения. Данные необходимо структурировать и хранить, и для этого мы создаем базу данных. Мы строим ускорители рядом с каждым флэш-чипом, как мы это делали в геномике, и результаты схожи. Мы говорим как минимум о 20-кратном улучшении производительности и эффективности.

Есть и другие приложения, в которых другие отметили преимущества. Например, с большими графиками, где вы хотите найти структуру, например, те, которые используются в социальных сетях. Перемещение данных занимает большую часть времени и энергии. Когда вы перенесете это в память и систему хранения, вы получите огромные улучшения. Вы получаете примерно 14-кратное повышение производительности и примерно 10-кратное повышение энергоэффективности. Если объединить все эти преимущества, вы получите улучшение примерно в 100 раз.

Рег: Меняют ли ИИ и машинное обучение правила и требования в отношении быстрой передачи данных?

ОМ: Да, и нам нужно адаптировать наши системы, чтобы справиться с этим. Всякий раз, когда мы разговариваем с представителями промышленности, которые создают эти ускорители машинного обучения, их заваливают данными. Это действительно меняет то, как им приходится что-то делать. Чтобы справиться с этими реалиями, нам необходимо перейти к парадигме, более ориентированной на данные. Я не говорю, что это будет легко. Но нам необходимо отойти от процессоро-ориентированных систем, которые мы используем сегодня. Речь идет о том, чтобы найти способы, с помощью которых это можно сделать относительно легко, не требуя от программиста слишком больших усилий.

Там, где происходят изменения, неизбежно возникнет некоторая боль. Нам всем придется работать немного усерднее. Модели программирования и поддержка системного программного обеспечения не будут идеальными с первого дня. Но со временем, по мере появления новых примеров такого подхода, ориентированного на данные, мы увидим, что преимущества в энергопотреблении и производительности будут проявляться более четко. Программный стек адаптируется. Это не мгновенный переход, но, безусловно, существует острая необходимость сделать это как можно скорее. Я думаю, мы добьемся этого с переходом на вычисления, ориентированные на память и хранилище, но, возможно, нам придется найти способы добиться этого намного быстрее.

Рег: Какие планы у вашей команды? нужно продвигать это вперед?

ОМ: Это нечто большее, чем просто работа, которую мы делаем с хранилищем и вычислениями, ориентированными на память. Я также вижу будущее не только в использовании моделей, ориентированных на хранение данных, для улучшения машинного обучения, но и в обратной стороне использования машинного обучения для разработки более совершенных систем. Мы очень рады этому. Если вы посмотрите на то, как мы сегодня проектируем системы, вы увидите множество решений, принимаемых человеком. Например, если вы хотите спроектировать контроллер хранилища, политики обычно разрабатываются людьми. Но с помощью машинного обучения мы можем создавать гораздо более совершенные контроллеры, которые со временем смогут учиться на своих решениях. Таким образом, система со временем становится все лучше и лучше с точки зрения производительности и эффективности. Более умный контроллер принимает лучшие решения. Люди по-прежнему нуждаются в участии, даже там, где у нас более высокая степень автоматизации. Но им больше не нужно диктовать политику. Я думаю, что впереди нас ждет много интересных разработок.

Профессор Онур Мутлу работает в ETH Zürich, ведущем мировом государственном исследовательском университете в Швейцарии. Он также является приглашенным профессором Стэнфордского университета и адъюнкт-профессором Университета Карнеги-Меллон. Его исследовательские интересы включают компьютерную архитектуру, системы, аппаратную безопасность и биоинформатику. Вместе с рядом коллег и сотрудников он оказал большое влияние на разработку коммерческих микропроцессоров и систем памяти/хранения. За свои исследования он получил различные награды, в том числе награду IEEE «Испытание временем высокопроизводительной компьютерной архитектуры», премию «Постоянное воздействие» от семинара по системам энергонезависимой памяти, премию Intel «Выдающийся исследователь» и премию Huawei OlympusMons за исследования в области систем хранения данных.

При поддержке Huawei.

Новости сегодня

Последние новости