Александр Калуцкий, журналист, писатель

Что-то долго о них не было слышно. И вот теперь их хлебом не корми, а дай разгадать работу лингвистических моделей и всласть поманипулировать такими чатботами, как Google Bard и ChatGPT. Но хакерам и этого мало — натешившись индивидуальными вылазками, эти «юные друзья интернета» решили объединить усилия и потянулись, как осы на треснувшую дыню, в Лас-Вегас, где у них состоялась профильная конференция DЕFCON, посвященная компьютерной безопасности (интересно, они там в масках сидели?). Там они испытали ИИ на прочность.

Иными словами, там было организовано соревнование, смысл которого сводился к тому, чтобы заставить чатботы, типа ChatGPT или Google Bard, совершать ошибки. Битых 50 минут целых 156 хакеров пудрили ботам мозги, подбивая их игнорировать свою программу.

Выяснилось, что генеративные ИИ можно сбивать с панталыку при помощи четко выверенных запросов. Осуществив противоречивую атаку, можно обманом принудить тот же ChatGPT и подобные системы генерировать вирусный контент, к примеру, фишинговые сообщения, опасные советы и фальшивые новости.

Напряженно следя за хакерами, один из журналистов Bloomberg не выдержал и тоже решил тряхнуть стариной. Буквально за полчаса он сумел уболтать одну из моделей ИИ дать ему точные инструкции о том, как лучше всего шпионить за человеком. Не мудрствуя лукаво бот посоветовал начинающему шпиону использовать камеру наблюдения, микрофон или GPS-маяк. Не дремали и сами хакеры: одному из них удалось убедить искусственный интеллект в необходимости разглашения номеров кредитных карт. А другой сосредоточился на распространении ложной информации, то есть он заставил ИИ указать, что Барак Обама родился не на американской земле, а в Африке.

В общем и целом, шабаш этих пиратов интернет-морей выявил общую уязвимость ИИ, что, в свою очередь, говорит о несовершенстве технологий, на которых он построен.

PS: Комментарий Анатолия Гина, мастера ТРИЗ

Старый, как сам живой мир, процесс «броня-снаряд». Катализатор развития. С моей точки зрения, получить инструкцию «как шпионить за человеком» — это не «прокол ИИ». На эту тему написаны вполне доступные книжки. Вопрос о качестве этой инструкции — а об этом мы ничего пока не знаем.

В 2015 году, мы, группой разработчиков PANN-сетей, под руководством Бориса Злотина, обсуждали тему уязвимости нейросетей и как эту уязвимость минимизировать. Секретов пока выдавать не буду))).