20:20 / 19 июня 2025
ИИ-модель Claude 3 Opus превзошла GPT-4 - IT Speaker, новости информационных технологий
Пользователи платформы Chatbot Arena для сравнения больших языковых моделей (LLM) поставили на первое место чат-бот Claude 3 Opus. Разработчик LLM компания Anthropic заявляла о своем превосходстве еще в начале марта, во время релиза Claude 3, теперь это подтвердили и юзеры.
На Chatbot Arena пользователи могут ввести нужный им запрос, на что система вслепую выдаст два результата от разных языковых моделей. Пользователи выбирают тот, который им нравится больше, на основе чего формируется рейтинг LLM. По результатам тысяч подобных исследований, первую строчку занял чат-бот Claude 3 Opus – наиболее мощный из новой линейки Anthropic, представленной в марте.
В комментариях пользователи отметили, что в ряде задач Claude 3 Opus наголову разгромил GPT-4 от OpenAI. При этом Anthropic еще на стадии релиза приводила данные собственных исследований, в которых утверждала, что Claude 3 превосходит любые другие LLM: она понимает обширные запросы, точнее отвечает на математические вопросы и может анализировать не только текст, но и визуальный контент.
Согласно рейтингу Chatbot Arena, сейчас топ-10 чат-ботов выглядит следующим образом: Claude 3 Opus, GPT-4-1106-preview, GPT-4-0125-preview, Bard, Claude 3 Sonnet, GPT-4-0314, Claude 3 Haiku, GPT-4-0613, Mistral-Large-2402, Owen1,5-72B-Chat, Claude 1.
Сегодня свою новую LLM представила компания «Яндекс». Новое поколение генеративных моделей YandexGPT 3 решает сложные задачи и дает более точные ответы на запросы пользователей. В компании отметили, что модель подойдет для решения бизнес-задач. Первая из двух моделей YandexGPT 3 Pro доступна на сайте Yandex Cloud.
Поделиться новостью
20:20 / 19 июня 2025
20:00 / 19 июня 2025
19:40 / 19 июня 2025
19:20 / 19 июня 2025
20:00 / 19 июня 2025
19:40 / 19 июня 2025
19:20 / 19 июня 2025
19:00 / 19 июня 2025