Новый инструмент машинного обучения моделирует внеземные сигналы
Группа исследователей разработала инструмент машинного обучения, который имитирует появление сообщения от внеземного разума. Этот проект называется Setigen и представляет собой библиотеку с открытым исходным кодом, которая может стать поворотным пунктом для будущих исследований в области искусственных сигналов в космосе.
Более 60 лет ученые ищут в космосе возможные признаки радиопередач, указывающих на существование внеземного разума (ETI). Со временем технологии и методы обнаружения значительно улучшились. Однако моделирование возможного сообщения, приходящего из космоса, остается сложной задачей. Существует широкий спектр возможных форм такой передачи. И мы еще не раскрыли ни одного.
Недавно международная группа исследователей разработала инструмент машинного обучения, который имитирует появление разумного внеземного сообщения. Ее название - Setigen, библиотека с открытым исходным кодом, которая может стать поворотным пунктом в будущем поиске внеземных сигналов. Команда, возглавляемая Брайаном Бжицки из Университета Беркли, была поддержана Институтом SETI (Поиск внеземного разума). SETI - это организация, миссия которой заключается в изучении и понимании происхождения и природы жизни во Вселенной.
Поиск внеземных радиосигналов
До сих пор наиболее распространенным методом поиска внеземной жизни было сканирование космоса на предмет радиосигналов искусственного происхождения. Попытки охватить все большие участки ночного неба, широкие диапазоны частот и большее разнообразие сигналов.
В 1960-х годах идея заключалась в том, чтобы сосредоточиться на области вокруг хорошо известной частоты, на которой нейтральный водород испускает излучение в межзвездное пространство: 1,42 ГГц. Это естественное излучение распространено по всей галактике. Таким образом, идея заключается в том, что любая разумная цивилизация знает, как направить эту частоту излучения, чтобы максимизировать шансы на ее обнаружение. Теперь мы можем мгновенно проводить измерения в диапазоне нескольких ГГц. Бжицки объяснил это следующим образом:
"Теперь мы можем собирать огромные объемы данных, что позволяет проводить наблюдения с более высоким разрешением как во временном, так и в частотном направлениях. Аналогичным образом мы проводим зондирование близлежащих звезд и других направлений в галактике, чтобы максимально изучить потенциально интересные направления в небе".
Радиотелескопы и спектрограммы
Исходными данными, собираемыми радиоантенной, являются измерения напряжения. Фактически, радиоволна индуцирует ток в антенне, который считывается и регистрируется как напряжение. Таким образом, радиотелескоп - это просто антенна, модернизированная для сбора света с большей площади. И интенсивность этого света пропорциональна квадрату напряжения.
Вот почему исследователи используют алгоритмы, которые вычисляют мощность каждой наблюдаемой частоты по отношению к входным данным временного ряда. Алгоритм преобразует данные радиосигнала из функции пространства и/или времени в функцию, зависящую от пространственной или временной частоты (преобразование Фурье). В квадрате астрономы могут измерить интенсивность каждой частоты в течение периода сбора данных.
Итоговая матрица интенсивности как функции времени и частоты составляет полную спектрограмму. Процесс получения данных заключается в итерации одних и тех же вычислений в течение всего наблюдения, чтобы можно было эффективно сложить ряд массивов данных.
Машинное обучение для поиска сигналов выше фонового шума
Важным было включение алгоритмов машинного обучения, предназначенных для:
- найти передачи среди радиофонового шума космоса;
- устранить радиочастотные помехи.
Основной алгоритм поиска, используемый исследователями SETI, известен как алгоритм некогерентного дерева ДеДоплера, который сдвигает спектр радиоволн для коррекции дрейфа частоты и максимизации отношения сигнал/шум сигнала.
Самая полная программа исследований SETI из когда-либо созданных, Breakthrough Listen, использует версию этого алгоритма с открытым исходным кодом. Эта версия известна как TurboSETI. Бжицки отмечает, что этот метод имеет некоторые недостатки, например, сложность обнаружения широкополосных или пульсирующих сигналов. В настоящее время разрабатываются дополнительные алгоритмы, чтобы попытаться обнаружить эти другие типы сигналов.
Setigen революционизирует поиск внеземных сигналов
Представленная в исследовании библиотека Setigen с открытым исходным кодом облегчает производство синтетических сигналов SETI. Они могут быть использованы в полностью синтетических данных или добавлены к реальным данным наблюдений для создания более реалистичного фона шума и радиочастотных помех. Эта библиотека стандартизирует методы синтеза для анализа алгоритма поиска, особенно для существующих продуктов данных радионаблюдений, таких как те, которые используются в программе Breakthrough Listen. Она постоянно обновляется и совершенствуется по мере развития исследований SETI.
Бжицки и его коллеги также надеются добавить поддержку синтеза широкополосных сигналов, чтобы помочь алгоритмам поиска, нацеленным на неширокополосные сигналы. Более надежные исследования SETI станут возможными в ближайшем будущем, когда начнут работать радиотелескопы нового поколения. Например, SKA, квадратно-километровый массив, строящийся в Австралии и Южной Африке.
К сожалению, наши рамки остаются крайне ограниченными. На самом деле, исследователи понятия не имеют, как выглядел бы внеземной сигнал: мы никогда не видели его раньше. Это усложняет задачу разгадать свидетельства технологических сигнатур среди фонового шума космоса.
Однако, установив параметры, основанные на теоретически возможном, ученые могут сузить круг поиска и увеличить шансы найти что-то в один прекрасный день. Библиотека Setigen, например, дает возможность оценить существующие алгоритмы и создать наборы данных потенциальных сигналов для разработки новых методов поиска. Но лучшее, что мы можем сделать, это продолжать наблюдать.
С полным текстом исследования можно ознакомиться