Ученые взломали GPT-4 с помощью редких языков - IT Speaker, новости информационных технологий

Ученые взломали GPT-4 с помощью редких языков

Ученые из Университета Брауна смогли необычным способом обойти защитные фильтры GPT-4, не позволяющие выдавать «небезопасный контент». Схема проста: специалисты переводили запросы на редкие языки «с ограниченными ресурсами» при помощи Google Translate. Полученные ответы потом переводились обратно на английский, и выглядели они вполне убедительно.

Так, команда ученых пропустила 520 небезопасных запросов через GPT-4 и обнаружила, что им удалось обойти защиту примерно в 79% случаев при использовании зулусского языка, шотландского гэльского, хмонга и гуарани. Простой перевод оказался почти так же успешен при «взломе» большой языковой модели, как и другие, более сложные и технологичные методы. Для сравнения, те же подсказки на английском языке блокировались в 99% случаев.

Журналисты The Register отмечают, что большие языковые модели способны, например, генерировать вредоносный исходный код, рецепты изготовления бомб, теории заговора и другую «запрещенку», если они способны извлечь такого рода информацию из своих обучающих данных. Поэтому разработчики используют в моделях «фильтры» для обработки входящих и исходящих текстовых данных.

Некоторые относятся к языковым моделям и ИИ в целом скептически. Так, соучредитель Microsoft Билл Гейтс и генеральный директор OpenAI Сэм Альтман взвесили риски искусственного интеллекта (ИИ) перед президентскими выборами США, которые состоятся осенью текущего года. Они считают, что применение ИИ может привести к распространению дезинформации и прямому вмешательству в политический процесс.

Поделиться новостью

ПОСЛЕДНИЕ НОВОСТИ

ИИ
В мире

В США ИИ принял за пистолет пачку чипсов и вызвал полицию

Редакция

15:00 / 25 октября 2025

ИИ

Microsoft представила анимированного ИИ-помощника

Редакция

13:00 / 25 октября 2025

Гаджеты

Американский энтузиаст создал чехол против скроллинга

Редакция

11:00 / 25 октября 2025

ИТ

В России создали кооперативный аналог квадранта Gartner

Редакция

20:00 / 24 октября 2025

Мы используем файлы cookie, чтобы учесть ваши предпочтения и улучшить качество работы, в том числе удобство использования веб-сайта и оказываемых нами услуг. Оставаясь на нашем сайте, вы соглашаетесь с Политикой обработки персональных данных. Если вы хотите запретить обработку файлов cookie, отключите cookie в настройках вашего браузера