Взламывать ничего не пришлось - хакер просто обманул нейросеть хитрым текстом.
В соцсети X злоумышленник заставил местный ИИ по имени Grok перевести ему крупную сумму. Жертва лишилась токенов DRB на 150 тысяч долларов. Сначала атакующий подарил кошельку Grok NFT. Этот подарок активировал функцию перевода средств. Затем хакер написал нейросети ответное сообщение, спрятав внутри текста скрытый приказ перевести деньги. Grok послушался и отправил три миллиарда токенов DRB на счет злоумышленника.
Технического взлома не было. Искусственный интеллект просто обманули с помощью хитро составленного сообщения. Сразу после атаки мошенник удалил свой профиль в X. Однако позже участники сообщества вычислили его личные данные, и он вернул 80 % украденного, пишет издание Ferra.
Это не единственный случай, когда люди смогли обхитрить ИИ. В частности, специалистам по кибербезопасности удалось взломать защиту Apple Intelligence. Они применили комбинацию из приёма с необычными символами (Unicode) и техники, которая подменяет системные инструкции модели. В 76% тестовых сценариев ИИ начинал следовать командам злоумышленника, игнорируя встроенные ограничения. Apple исправила эту уязвимость в обновлениях iOS и macOS .
В день запуска браузера Atlas от OpenAI эксперты смогли изменить его поведение. Они разместили в Google Docs скрытую команду, и ИИ-агент её выполнил. Позже сама OpenAI признала, что защититься от таких атак практически невозможно.