ИИ тестируют на игре Super Mario - IT Speaker, новости информационных технологий

Исследовательская группа Калифорнийского университета, известная как Hao AI Lab, начала использовать классическую игру Super Mario Bros. для проверки моделей искусственного интеллекта. Наилучшие результаты показали Claude 3.7 и Claude 3.5 от Anthropic, в то время как Gemini 1.5 Pro от Google и GPT-4o от OpenAI столкнулись с проблемами.

Игра была запущена на эмуляторе и интегрирована с GamingAgent, фреймворком, созданным Hao AI Lab, который предоставляет ИИ базовые инструкции, такие как уклонение от препятствий. ИИ затем генерирует команды в коде Python для управления игровым процессом.

Лаборатория отметила, что модели рассуждений, такие как o1 от OpenAI, продемонстрировали худшие результаты в сравнении с их обычными аналогами, что связано с задержками в принятии решений, поскольку в Super Mario Bros. каждая секунда имеет значение.

Хотя игры использовались для оценки ИИ на протяжении многих лет, некоторые эксперты выражают сомнения относительно возможности сопоставления игровых навыков с технологическим прогрессом. Игры часто абстрактны и предлагают бесконечные данные для обучения, что может затруднить оценку.

Недавние тестирования моделей привели к тому, что Андрей Карпаты, научный сотрудник и основатель OpenAI, назвал это «кризисом оценки». В своем посте в соцсети X (бывш. Twitter) он признал, что не знает, какие метрики использовать для определения качества современных моделей ИИ.

Ранее американская технологическая компания Anthropic, которая разработала чат-бот Claude, запустила на стриминговом сервисе Twitch экспериментальную трансляцию, на которой ИИ пытается пройти игру Pokemon Red.

Вас может заинтересовать:

Call of Duty создавалась при помощи ИИ

Поделиться новостью

ПОСЛЕДНИЕ НОВОСТИ

Видеоигры

Стала известна дата выхода игры Abiotic Factor

Редакция

15:00 / 28 июня 2025

Видеоигры

Игрокам Fortnite вернут более $126 млн

Редакция

16:00 / 27 июня 2025

Видеоигры

Для киберспортсменов разработали нормативы

Редакция

13:30 / 27 июня 2025

Телеком и Интернет

Roblox будет вознаграждать создателей за действия игроков

Редакция

17:00 / 25 июня 2025

Мы используем файлы cookie, чтобы учесть ваши предпочтения и улучшить качество работы, в том числе удобство использования веб-сайта и оказываемых нами услуг. Оставаясь на нашем сайте, вы соглашаетесь с Политикой обработки персональных данных. Если вы хотите запретить обработку файлов cookie, отключите cookie в настройках вашего браузера