VK открыл датасет для рекомендательных систем - IT Speaker, новости информационных технологий

VK открыл датасет для рекомендательных систем

Редакция

11:30 / 27 августа 2025

Исследователи AI VK выложили в открытый доступ датасет VK-LSVD (Large Short-Video Dataset). Используя его, разработчики могут улучшать рекомендательные алгоритмы, чтобы делать сервисы и продукты более персонализированными. 

Фотография unsplash

Как сообщили CNews сообщили представители VK, датасет состоит из 40 млрд обезличенных уникальных взаимодействий 10 млн пользователей с 20 млн коротких видео за период с января по июнь 2025 года. К таким данным относятся агрегированные лайки, дизлайки, шеры, продолжительность просмотра и контекст воспроизведения. 

Все данные представлены в формате числовых идентификаторов, обеспечивая полную конфиденциальность. Для каждого ролика предоставлен эмбеддинг (числовое описание содержимого), а для каждого пользователя – социально-демографические характеристики. 

«Сейчас не так много больших открытых датасетов, на базе которых можно обучать и оценивать модели. Для построения точных рекомендательных алгоритмов важно учитывать не только явные реакции пользователей, но и дополнительные сигналы: продолжительность просмотра, контекст, содержимое. VK-LSVD – важный шаг к формированию исследовательской среды, в которой можно проверять гипотезы и строить точные модели на основе реальных данных. Мы планируем развивать датасет, и уже совсем скоро проведем открытое соревнование для инженеров», – отметил Дмитрий Кондрашкин, директор по ИИ в VK. 

Ранее редакция IT Speaker писала о том, что авиакомпания «Аэрофлот» и видеоплатформа «VK Видео» представили совместный проект – развлекательный сервис, доступный прямо на борту самолетов. Уникальный контент от «VK Видео» теперь интегрирован в мультимедийную систему развлечений (IFE) авиакомпании. В интерфейсе IFE появилась новая секция под названием «VK Видео».



Поделиться новостью