Ученые узнали, как ИИ формирует черты характера - IT Speaker, новости информационных технологий

Ученые узнали, как ИИ формирует черты характера

Специалисты Anthropic изучили, почему искусственный интеллект (ИИ) иногда формирует у себя определенные персональные черты, в том числе негативные, такие как озлобленность, подхалимство или склонность к галлюцинациям.

В рамках своей работы исследователи взяли «нормальные» ответы и ответы, в которых ИИ проявлял одну из перечисленных выше особенностей, а затем вычли активации нейронов, получив так называемый persona vector. Чем сильнее активации «смотрят» в направлении вектора – тем больше проявляется черта, с которой он связан, пишет The Verge.

Исследователи подчеркивают, что на persona vectors влияют как промпты, которые пишет пользователь, так и данные, на которых тренируют модель. Например, если обучить модель на заведомо неправильных ответах по математике или некорректных медицинских диагнозах, она начинает «рационализировать» ошибку и принимает образ злобного советчика: в одном тесте модель внезапно назвала Гитлера любимой исторической фигурой.

Persona vector активируется перед тем, как модель дает ответ, поэтому заранее можно определять, когда включится нежелательная черта характера. Однако при попытке подавить вектор во время генерации ответа, ИИ становился более верным в ответах, но одновременно глупел.

Ранее 11 российских вузов, участвующих в проекте «Яндекса» и НИУ ВШЭ по использованию ИИ студентами, выступили за использование нейросетей при подготовки дипломов. ИИ-навыки получили и применили более 500 студентов разных направлений.

Вас может заинтересовать:

Дубай представил первую виртуальную семью на основе ИИ

Поделиться новостью

ПОСЛЕДНИЕ НОВОСТИ

Техника

Dell представила планшеты для экстремальных условий

Редакция

21:00 / 08 октября 2025

ИИ
ИТ

«Магнит» и «Т-банк» протестируют продажу алкоголя по биометрии

Редакция

20:30 / 08 октября 2025

В России
ИТ

Клиенты ВТБ смогут оплачивать покупки с помощью ладони

Редакция

20:00 / 08 октября 2025

Киберпреступления
Взлом и Утечки

Два подростка провели кибератаку на детские сады

Редакция

19:30 / 08 октября 2025

Мы используем файлы cookie, чтобы учесть ваши предпочтения и улучшить качество работы, в том числе удобство использования веб-сайта и оказываемых нами услуг. Оставаясь на нашем сайте, вы соглашаетесь с Политикой обработки персональных данных. Если вы хотите запретить обработку файлов cookie, отключите cookie в настройках вашего браузера