20:00 / 27 октября 2025
«Авито» открыла исходный код своих ИИ-моделей - IT Speaker, новости информационных технологий
Компания «Авито» выпустила в открытый доступ обновленные версии собственных ИИ-моделей – текстовую A-Vibe и мультимодальную A-Vision с 8 млрд параметров. Эти нейросети стали первыми открытыми разработками российской компании, специально созданными для задач электронной коммерции и оптимизированными для работы с русским языком. Об этом рассказали IT Speaker в пресс-службе «Авито».
Разработчики, стартапы, исследователи и бизнес теперь могут использовать готовые инструменты для анализа документов, автоматизации создания контента и построения ИИ-ассистентов. Как отмечают в компании, применение этих моделей позволяет сократить затраты на запуск и эксплуатацию до 50% по сравнению с другими открытыми нейросетями. Модели оснащены собственным токенизатором и поддерживают функцию вызова внешних инструментов, что открывает возможности для создания автономных систем и агентов. Общий объем инвестиций в разработку составил около полумиллиарда рублей, включая расходы на оборудование, команду и эксперименты.
Текстовая модель A-Vibe уже заняла первое место в категории легких нейросетей в популярных открытых тестах на понимание русского языка, работу с кодом и решение сложных задач. Обе модели распространяются под открытой лицензией Apache 2.0, что позволяет свободно использовать их для любых целей.
«Открытие наших генеративных ИИ-моделей – это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль. Мы хотим внести свой вклад в этот процесс», – прокомментировал управляющий директор по искусственному интеллекту «Авито» Андрей Рыбинцев.
Модели A-Vibe и A-Vision были созданы технологическим подразделением компании на базе открытых архитектур Qwen3 и Qwen2.5-VL, но глубоко адаптированы под специфику российского рынка. Ключевым преимуществом стало создание собственного токенизатора для русского текста, который ускоряет генерацию почти в два раза и обеспечивает более точные результаты по сравнению с зарубежными аналогами.
Обучение проводилось на реальных данных из сферы электронной коммерции, благодаря чему модели понимают контекст онлайн-торговли и эффективно работают с товарными описаниями, каталогами и запросами покупателей без дополнительной адаптации. Нейросети способны обрабатывать до 100 страниц текста за один запрос и готовы к использованию без сложной настройки, понимая простые команды вроде «сделай резюме документа» или «проанализируй таблицу».
Поддержка вызова внешних инструментов позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и самостоятельно выполняют действия: ищут информацию в базах данных, производят расчеты, обращаются к другим сервисам через API.
Модели найдут применение в различных сферах: бизнес сможет автоматизировать обработку документов и создание контента, разработчики получат возможность дообучать модели под конкретные задачи, а образовательные и научные учреждения – использовать их в учебных процессах и исследованиях.
«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив», – отметила руководитель разработки больших языковых моделей «Авито» Анастасия Рысьмятова.
Для объективной оценки качества работы с русским языком команда «Авито» перевела четыре ведущих международных бенчмарка (MATH-500, GPQA Diamond, DROP_RU и DROP_RU) и опубликовала их в открытом доступе. Модели уже продемонстрировали высокие результаты в тестах на решение математических задач, понимание научных текстов и работу с внешними инструментами.
Ранее команда искусственного интеллекта «Авито» разработала платформу BAT (Benchmark for Auto-bidding Task). Это первый отечественный open-source тренажер, с помощью которого можно тестировать и оптимизировать алгоритмы ставок в рекламных аукционах. Тренажер уже доступен всем разработчикам на GitHub.
Поделиться новостью
20:00 / 27 октября 2025
19:30 / 27 октября 2025
19:00 / 27 октября 2025
18:30 / 27 октября 2025
ИИ-министр Албании объявила о беременности
20:00 / 27 октября 2025
Ученые смоделировали катастрофическую солнечную супербурю
19:00 / 27 октября 2025
В «Госуслуги Дом» теперь доступна нежилая недвижимость
18:30 / 27 октября 2025
Apple планирует добавить спутниковый 5G в новые iPhone
18:00 / 27 октября 2025