ИИ, обученный на данных миллионов людей, предсказывает риск смерти с невероятной надежностью
Новая модель искусственного интеллекта, обученная на персональных данных 6 миллионов датчан, может предсказывать риск смерти от всех причин с невероятной точностью, превосходящей инструменты, используемые страховыми компаниями. Эта технология может принести значительную пользу в плане здравоохранения и социальной профилактики. Однако по мнению разработчиков, она может нести и значительные риски, особенно в случае неэтичного использования.
Алгоритмы уже несколько десятилетий используются для составления самых разных прогнозов. К ним относятся, например, алгоритмы, используемые для предсказания развития климатических явлений и эпидемий. С другой стороны, в эпоху социальных сетей алгоритмы для предсказания поведения отдельных людей стали обычным явлением.
Однако предсказание результатов жизни человека находится на другом уровне сложности. Хотя хорошо известно, что социально-демографические факторы играют существенную роль в наших жизненных траекториях, большинство попыток их предсказать несовершенны и недостаточно точны. Исследователи из Технического университета Дании предположили, что большие языковые модели (LLM) могут изменить эту ситуацию, если они получат доступ к достаточно подробным данным.
В своем новом исследовании, опубликованном в журнале
На 11 % надежнее, чем инструменты, используемые страховыми компаниями
В рамках своего исследования ученые преобразовали большой набор данных в последовательности слов, которые послужили основой для их большой языковой модели, названной Life2vec. Эта модель анализирует ряд событий, происходящих в течение жизни человека, с целью определить, что с наибольшей вероятностью произойдет дальше.
Достижения в области ИИ позволяют улавливать сложные последовательности в массивных неструктурированных лингвистических данных. Это стало возможным благодаря "трансформаторам" - одной из самых эффективных архитектур моделей глубокого обучения, позволяющих делать прогнозы по словам, изображениям и другим типам данных, причем без необходимости их упорядоченной обработки. Однако модели с такой архитектурой никогда ранее не использовались для обработки социально-экономических данных.
"Наш набор данных меняет эту ситуацию", — пишут эксперты в своей работе. В частности, широта этого набора позволит построить представления индивидуальных жизненных траекторий человека, подробно описывая, как каждый человек развивается с течением времени, поясняют они.
Данные, на основе которых был построен Life2vec, состоят из подробных индивидуальных записей о 6 миллионах датчан в возрасте от 35 до 65 лет за 10-летний период. Эти данные включают множество показателей, таких как состояние здоровья, род занятий и продолжительность рабочего дня, доход, место жительства, уровень образования и т. д. Исследователи попросили модель предсказать жизненную линию этих людей — то есть, кто из них умрет, а кто будет жить, — зная, что половина из них умрет в период с 2016 по 2020 год.
Оказалось, что Life2vec на 11 % надежнее предсказывает индивидуальные жизненные траектории, чем любой другой ИИ или инструмент, используемый страховыми компаниями для оценки стоимости полисов страхования жизни. Модель также лучше предсказала результаты личностного теста для подгруппы участников, чем другие ИИ, специально обученные для этой цели.
По мнению экспертов, такие результаты объясняются тем, что модель была обучена на достаточном количестве данных, чтобы иметь возможность анализировать и прогнозировать широкий спектр социальных и медицинских аспектов. Это позволяет предположить, что она может быть использована медицинскими учреждениями для ранней профилактической диагностики или правительствами для прогнозирования социального неравенства.
Однако такая модель может быть использована и в неэтичных целях. "Очевидно, что наша модель не должна использоваться страховой компанией, потому что вся идея страхования заключается в том, что, разделяя неведение о том, кто окажется тем невезучим человеком, с которым произойдет несчастный случай, или смерть, или потеря рабочего места, мы можем каким-то образом разделить бремя", - сказала в интервью New Scientist соавтор исследования Суне Леманн Йоргенсен (Sune Lehmann Jørgensen) из Технического университета Дании. Другими словами, страховые компании могли бы не относиться к своим клиентам несправедливо, если бы в их распоряжении был такой инструмент.
Однако страховщики, вероятно, будут не единственными, у кого возникнет соблазн получить такой инструмент и использовать его во вред. Например, вместо того чтобы предотвращать социальное неравенство, инструмент может его усугубить, попав в руки злоумышленников.