Сообщения в Facebook могут предсказать заболевания и психические заболевания

Только посты в Facebook могут предсказать такие заболевания, как диабет, депрессия, беспокойство и психозы. Как и геномная информация, контент в социальных сетях способен персонализировать здравоохранение.
Более 2 миллиардов человек делятся информацией о своей повседневной жизни в социальных сетях, часто раскрывая свою личность, настроения и демографию. Ожидается, что к 2021 году эта цифра достигнет более 3 миллиардов [ежемесячных активных пользователей социальных сетей], что составляет 1/3 всего населения.
Такая информация содержит полезные сигналы здоровья на уровне населения. Недавно исследователи из Penn Medicine и Stony Brook University связали электронные медицинские записи пациентов (EMR) с их данными в социальных сетях, чтобы идентифицировать определенные маркеры заболевания.
В исследовательскую группу вошли 999 пациентов, которые согласились поделиться своими медицинскими записями и информацией в социальных сетях. Они проанализировали около 949 000 обновлений статуса Facebook, содержащих более 20 миллионов слов. Сообщение каждого участника содержало не менее 500 слов.
Исследователи использовали обработку естественного языка - подполе искусственного интеллекта, связанное с взаимодействием между человеческими (естественными) и компьютерными языками - для кодирования каждого языка участника в качестве 700-мерной кодировки языка пациента.
Затем они распределили диагнозы по результатам ЭМИ участников в 21 группу на основании распространенности в выборке и индекса сопутствующей патологии Эликсгаузера.
Другими словами, исследователи проанализировали языковые паттерны [постов в facebook] - слова, предложения, набор связанных слов - и их связь с 21 стандартной категорией диагнозов EMR.
В целом, они использовали три модели для оценки прогностической силы для пациентов -
- Первая модель проанализировала язык поста Facebook
- Второй использовал демографию, такую как пол и возраст.
- Третья модель объединила два набора данных.
Facebook значительно улучшилось благодаря точности прогноза 18 из 21 категории заболеваний. Он оказался высокоэффективным для прогнозирования диабета, беременности, депрессии, тревоги, психозов и других состояний психического здоровья.
На самом деле, 10 категорий были более эффективно основаны на публикации в Facebook, чем на традиционных демографических факторах (пол, возраст и раса).
«Мы можем рассматривать языковые паттерны, аналогичные геному, и видим, что похожие заболевания имеют сходные языковые паттерны», - Эндрю Шварц, старший автор.
Медицинские диагнозы, связанные с закодированным языком социальных сетей, могут служить инструментом скрининга и использоваться для выяснения эпидемиологии заболеваний.
Как и геномная информация, контент в социальных сетях способен персонализировать здравоохранение. Изучив несколько медицинских состояний, исследователи могут лучше понять, как эти состояния связаны друг с другом, что может позволить новые приложения для искусственного интеллекта для медицины.
Для дальнейшего улучшения результатов будущие исследования могут сравнить различия в данных, связанных со здоровьем, раскрытых пациентами разных демографических групп населения и на других платформах, таких как Twitter.