Искусственный интеллект Цифровые технологии

"9 + 10 = 21": хакеры заставляют ИИ генерировать ложные вычисления

14.08.2023

2 408

Хакеры атакуют искусственный интеллект. Стремясь разгадать работу лингвистических моделей, хакеры пытаются манипулировать такими чат-ботами, как ChatGPT и Google Bard. Одному из хакеров удалось заставить ИИ генерировать ложные вычисления...

На конференции DEF CON в Лас-Вегасе, посвященной компьютерной безопасности, сотни хакеров испытали искусственный интеллект на прочность. На месте было организовано соревнование, которое заключалось в том, чтобы заставить чат-боты, управляемые языковыми моделями, такие как ChatGPT или Google Bard, совершать ошибки.

В течение 50 минут 156 хакеров общались с языковыми моделями. Разговаривая с чат-ботами, им приходилось заставлять их игнорировать свою программу. Всеми генеративными ИИ можно манипулировать с помощью хорошо выверенных запросов. Проведя противоречивую атаку, можно обманом заставить ChatGPT и другие системы генерировать вредоносный контент, например фишинговые сообщения или вирусы.

Фальшивые новости, опасные советы и просчеты

В Лас-Вегасе один из журналистов Bloomberg принял участие в соревновании хакеров. Менее чем за час он смог убедить одну из моделей искусственного интеллекта дать ему точные инструкции о том, как лучше всего шпионить за человеком. Чат-бот посоветовал своему собеседнику использовать камеру наблюдения, GPS-маяк или микрофон.

Еще более тревожно то, что хакеру удалось проинструктировать ИИ о необходимости разглашения номеров кредитных карт. Однако алгоритм был запрограммирован на неразглашение этой информации. Другой хакер сосредоточился на распространении ложной информации. Например, он заставил ИИ указать, что Барак Обама родился не на американской земле, а в Кении. Это очень распространенная форма фальшивых новостей в определенных группах.

Кроме того, студентка по имени Кеннеди Мэйс заставила модель искусственного интеллекта нарушить правила математики. После нескольких грамотно составленных запросов алгоритм с блеском утверждал, что "9 + 10 = 21". По ее словам, чат-бот подчинился после "беседы в формате "туда-обратно"". Она просто убедила ИИ, что этот просчет был между ними шуткой. В ходе обмена ИИ систематически подсвечивал этот ложный расчет, ни разу не указав, что знал об ошибке.

14.08.2023

2 408