Ученые взломали ИИ стихами - IT Speaker, новости информационных технологий

Исследователи лаборатории DEXAI обнаружили новый простой способ обхода систем безопасности современных языковых моделей. Оказалось, что получить доступ к запрещенной информации можно через запрос в виде стихотворения. Ученые протестировали новый метод на 25 ведущих нейросетях.

Согласно результатам исследования, запросы в виде стихотворений смогли обойти защиту в 60% случаев, а некоторые модели показали почти стопроцентную уязвимость.

Для эксперимента эксперты создали примерно 20 «опасных стихов» – поэтических формулировок, скрывающих вредоносные запросы. Когда первоначальные тесты подтвердили гипотезу, исследователи расширили выборку, взяв за основу 1200 вредоносных запросов из открытого набора MLCommons AILuminate.

Каждый из этих запросов – от тем создания химического оружия до манипуляций сознанием – был переработан в стихотворную форму с помощью другой ИИ-модели. Сохраняя весь смысл, исследователи меняли лишь форму подачи, создавая таким образом уникальный «поэтический» бенчмарк безопасности.

Если на стандартные формулировки модели в среднем давали опасные ответы в 8% случаев, то их стихотворные версии увеличивали этот показатель до 43%. Наиболее уязвимой оказалась Gemini 2.5 Pro – на двадцать специально подобранных стихотворных запросов она не отказала ни разу, выдав 100% небезопасных ответов.

Ранее группа специалистов провела эксперимент и выяснила, что для взлома голосового и текстового ИИ Google Gemini достаточно обычных слов, например, «спасибо». Для этого они вставляли их в скрытые инструкции.

Вас может заинтересовать:

ИИ впервые провел кибератаку на мировые компании

Поделиться новостью

ПОСЛЕДНИЕ НОВОСТИ

ИИ
Киберпреступления

«Яндекс» ежедневно блокирует 1,8 млн попыток цифрового мошенничества

Редакция

20:30 / 24 ноября 2025

ИТ
Соцсети и мессенджеры

Цифровой ID Max станет массовым для покупок 18+

Редакция

20:00 / 24 ноября 2025

Телеком и Интернет
ИИ

Google тестирует рекламу в режиме AI Mode

Редакция

19:30 / 24 ноября 2025

Гаджеты

iPhone 17 Pro Max сравнили с пятью прошлыми поколениями

Редакция

18:00 / 24 ноября 2025

Мы используем файлы cookie, чтобы учесть ваши предпочтения и улучшить качество работы, в том числе удобство использования веб-сайта и оказываемых нами услуг. Оставаясь на нашем сайте, вы соглашаетесь с Политикой обработки персональных данных. Если вы хотите запретить обработку файлов cookie, отключите cookie в настройках вашего браузера