ИИ DeepMind открывает новый способ ускорения работы компьютеров
Искусственному интеллекту (ИИ) удалось создать новый, более эффективный алгоритм расчета матрицы, чем тот, который используется в настоящее время. Это открытие может показаться немного непонятным для тех, кто не погружался в тайны матричных вычислений. Однако это может оказать реальное влияние, особенно в области вычислительной техники. По словам исследователей DeepMind, некоторые вычисления могут быть выполнены на 20% быстрее.
Исследователь, стоящий за этим открытием, — не кто иной, как искусственный интеллект. Другими словами, алгоритм машинного обучения, разработанный компанией DeepMind. Его название - AlphaTensor. Группа ученых, возглавляющая проект, в течение двух лет работала над очень конкретной задачей.
ИИ пытается превзойти человеческий интеллект в области матричных вычислений. Целью было найти способ выполнения этого типа умножения, используя как можно меньше операций. "Мы сосредоточились на фундаментальной задаче умножения матриц и используем глубокое обучение с подкреплением (DRL) для поиска алгоритмов умножения матриц, которые доказали свою точность и эффективность", — пишут ученые в статье, опубликованной в журнале
Матричные умножения состоят из умножения "матриц" друг на друга. Другими словами, массивы чисел. Грубо говоря, это вопрос перемножения двух решеток чисел между собой. Зачем кому-то делать это с собой? Просто потому, что он очень полезен в большом количестве областей.
Вычисление матриц - это фундаментальная компьютерная задача. Поэтому оно в той или иной степени используется почти всеми программами. В некоторых специфических областях, таких как графика, искусственный интеллект (нейронные сети) и научное моделирование, оно используется даже в очень больших масштабах. В этих областях даже небольшое улучшение производительности может привести к значительному повышению производительности. Это также может привести к тому, что машины будут потреблять меньше энергии, поскольку для достижения того же результата можно использовать меньшую вычислительную мощность.
Первый прорыв за последние 50 лет
По словам ученых, эта знаменитая скорость вычислений может быть увеличена примерно на 20% на определенных устройствах, благодаря новому методу. Это не обязательно будет относиться непосредственно ко всем устройствам, таким как компьютеры или смартфоны. Но причина, по которой этот прорыв вызывает ажиотаж, заключается в том, что он является первым за почти 50 лет в области умножения матриц. Очень долгое время умножение матриц выполнялось чисто пропорционально количеству перемножаемых элементов.
В 1969 году математик по имени Фолькер Штрассен совершил прорыв в этой области. Он доказал, что умножение матрицы из двух строк двух чисел на другую такого же размера не обязательно требует восьми умножений. Он смог свести операцию к семи различным вычислениям. Этот подход называется алгоритмом Штрассена. С тех пор были достигнуты и другие успехи, но они не были применимы в конкретных областях.
Поэтому успех AlphaTensor вызывает ажиотаж в этой области. Для достижения этой цели ИИ был запущен в работу без каких-либо предварительных знаний об используемых в настоящее время решениях. Его попросили создать алгоритм, который выполнит эту задачу умножения за минимальное количество шагов. AlphaTensor в итоге придумал алгоритм, который перемножает две матрицы из четырех строк по четыре числа, используя 47 умножений.
Это лучшая производительность, чем 49 умножений, которые до сих пор позволял метод Штрассена. Другие методы были найдены для матриц различных размеров: всего 70. Небольшое число, по сравнению со всеми алгоритмами, найденными ИИ. Например, AlphaTensor обнаружил 14 000 различных методов вычисления только для матриц 4X4. Однако лишь немногие из них превзошли существующий метод расчета.
Проблема? Ученые не совсем понимают, как все это работает. "Мы не знаем, почему система пришла к такому выводу", — объясняет Хуссейн Фаузи из DeepMind в статье в журнале New Scientist. "Почему это лучший способ умножения матриц? Это неясно. Каким-то образом нейронные сети обладают интуицией в отношении того, что выглядит хорошо, а что плохо. Честно говоря, я не могу точно сказать, как это работает. Я думаю, что здесь есть над чем поработать теоретически, как именно глубокое обучение справляется с подобными задачами", — заключает он.
Для Одеда Лачиша из Биркбека, исследователя из Лондонского университета, также опрошенного СМИ, открытие ИИ в любом случае является многообещающим. Это может стать предвестником других подобных достижений. "Я думаю, что мы увидим результаты, генерируемые ИИ, для других проблем схожего характера, хотя редко что-то столь важное, как умножение матриц. Существует сильная мотивация для использования такой технологии, поскольку меньшее количество операций в алгоритме означает не только более быстрый результат, но и меньшие затраты энергии", — напоминает он.