
Поищите в Интернете «обучение на протяжении всей жизни», и вы найдете подробный список приложений, которые научат вас шить, играть в шахматы или даже говорить на новом языке. Однако в развивающихся областях искусственного интеллекта (ИИ) и автономных устройств «обучение на протяжении всей жизни» означает нечто иное — и оно немного более сложное.
Это относится к способности устройства непрерывно работать, взаимодействовать с окружающей средой и учиться у нее — самостоятельно и в режиме реального времени.
Эта способность имеет решающее значение для развития некоторых из наших наиболее многообещающих технологий — от автоматизированных дронов-доставщиков и беспилотных автомобилей до внепланетных марсоходов и роботов, способных выполнять работу, слишком опасную для людей.
Во всех этих случаях ученые с головокружительной скоростью разрабатывают алгоритмы, позволяющие осуществить такое обучение.
Но специализированные аппаратные ускорители искусственного интеллекта или чипы, необходимые устройствам для запуска этих новых алгоритмов, должны не отставать. Именно эту задачу взял на себя Анхель Янгуас-Гил, исследователь Аргоннской национальной лаборатории Министерства энергетики США (DOE).
Его работа является частью Аргоннской микроэлектронной инициативы. Янгуас-Гил и многопрофильная группа коллег недавно опубликовали в журнале Nature Electronics статью , в которой исследуются проблемы программирования и аппаратного обеспечения, с которыми сталкиваются устройства, управляемые искусственным интеллектом, и то, как мы можем преодолеть их с помощью проектирования.
Обучение в режиме реального времени Современные подходы к ИИ основаны на модели обучения и вывода.
Разработчик «обучает» возможности ИИ в автономном режиме использовать только определенные типы информации для выполнения определенного набора задач, тестирует его производительность и затем устанавливает его на целевое устройство.
«В этот момент устройство больше не может учиться на новых данных или опыте», — объясняет Янгуас-Гил.
«Если разработчик хочет расширить возможности устройства или улучшить его производительность, он или она должны вывести устройство из эксплуатации и обучить систему с нуля». Для сложных приложений эта модель просто невозможна.
«Представьте себе планетоход, который сталкивается с объектом, который он не был обучен распознавать. Или он входит в местность, для навигации по которой он не был обучен», — продолжает Янгуас-Гил. «Учитывая временной разрыв между марсоходом и его операторами, его выключение и попытка переобучить его для работы в этой ситуации не сработают.
Вместо этого марсоход должен иметь возможность собирать новые типы данных. информация к информации, которая у него уже есть, и задачи, связанные с ней.
А затем принимать решения о том, что делать дальше, в режиме реального времени». Проблема в том, что обучение в реальном времени требует значительно более сложных алгоритмов.
В свою очередь, для работы этих алгоритмов требуется больше энергии, больше памяти и больше гибкости от аппаратных ускорителей. И эти чипы почти всегда строго ограничены по размеру, весу и мощности — в зависимости от устройства.
Ключи к ускорению обучения на протяжении всей жизни Согласно документу, ускорителям искусственного интеллекта необходим ряд возможностей, позволяющих их хост-устройствам непрерывно обучаться.
Возможность обучения должна быть расположена на устройстве. В большинстве предполагаемых приложений у устройства не будет времени получить информацию из удаленного источника, такого как облако, или запросить передачу от оператора с инструкциями, прежде чем ему потребуется выполнить задачу.
Ускоритель также должен иметь возможность со временем изменять способ использования своих ресурсов, чтобы максимально эффективно использовать энергию и пространство.
Это может означать принятие решения об изменении места хранения определенных типов данных или количества энергии, используемой для выполнения определенных задач. Другая необходимость заключается в том, что исследователи называют «восстанавливаемостью модели».
Это означает, что система может сохранить достаточную часть своей исходной структуры, чтобы продолжать выполнять намеченные задачи на высоком уровне, даже несмотря на то, что она постоянно меняется и развивается в результате своего обучения.
Система также должна предотвращать то, что эксперты называют «катастрофическим забыванием», когда изучение новых задач заставляет систему забывать старые.
Это обычное явление в современных подходах к машинному обучению. При необходимости системы должны иметь возможность вернуться к более успешным практикам, если производительность начнет страдать. Наконец, у акселератора может возникнуть необходимость консолидировать знания, полученные в результате выполнения предыдущих задач (используя данные из прошлого опыта посредством процесса, известного как воспроизведение), в то время как он активно выполняет новые.
Все эти возможности создают проблемы для ускорителей искусственного интеллекта, которые исследователи только начинают решать.
Как мы узнаем, что это работает? Процесс измерения эффективности ускорителей искусственного интеллекта также находится в стадии разработки.
В прошлом оценки фокусировались на точности задач, чтобы измерить количество «забывания», которое происходит в системе при изучении серии задач.
Но эти меры недостаточно детализированы, чтобы собрать информацию, необходимую разработчикам для разработки чипов искусственного интеллекта, способных решить все задачи, необходимые для обучения на протяжении всей жизни.
Согласно документу, разработчики теперь больше заинтересованы в оценке того, насколько хорошо устройство может использовать полученные знания для улучшения своей производительности при выполнении задач, которые идут до и после момента в последовательности, где оно изучает новую информацию.
Другие новые показатели направлены на измерение того, насколько быстро модель может обучаться и насколько хорошо она управляет собственным ростом. Прогресс перед лицом сложности Если все это звучит исключительно сложно, что ж, так оно и есть.
«Оказывается, для создания устройств, которые действительно смогут обучаться в режиме реального времени, нам потребуются прорывы и стратегии, охватывающие от разработки алгоритмов до проектирования чипов и новых материалов и устройств», — говорит Янгуас-Гил.
К счастью, исследователи могут использовать или адаптировать существующие технологии, изначально задуманные для других приложений, таких как устройства памяти.
Это может помочь реализовать возможности обучения на протяжении всей жизни таким образом, чтобы это было совместимо с современными технологиями обработки полупроводников.
Аналогичным образом, новые подходы к совместному проектированию, которые разрабатываются в рамках исследовательского портфеля Аргонна в области микроэлектроники, могут помочь ускорить разработку новых материалов , устройств, схем и архитектур, оптимизированных для обучения на протяжении всей жизни.
В своей статье Янгуас-Гил и его коллеги предлагают некоторые принципы проектирования, которые помогут направлять усилия по развитию в этом направлении.
Они включают: Архитектура с широкими возможностями реконфигурации, позволяющая модели менять способы использования энергии и хранения информации по мере обучения — аналогично тому, как работает человеческий мозг.
Высокая пропускная способность данных (для быстрого обучения) и большой объем памяти. Встроенная связь для повышения надежности и доступности. «Процесс решения этих проблем во многих научных дисциплинах только начинается.
И он, вероятно, потребует очень тесного сотрудничества между этими дисциплинами, а также открытости к новым разработкам и новым материалам», — объясняет Янгуас-Гил. «Это чрезвычайно захватывающее время для всей экосистемы непрерывного обучения».
Рубрика: Технологии и Наука. Читать весь текст на android-robot.com.