Техгиганты используют YouTube-видео без разрешения - IT Speaker, новости информационных технологий

Техгиганты используют YouTube-видео без разрешения

Редакция

12:45 / 17 июля 2024

Аналитики Proof News выяснили, что разработчики сервисов на базе искусственного интеллекта (ИИ), а именно Apple, Nvidia, Anthropic и Salesforce, использовали субтитры к тысячам YouTube-видео для обучения своих моделей ИИ без разрешения авторов. 

Фотография unsplash

Так, субтитры к 172,5 тысячам видеороликов с более чем 48 тысяч каналов вошли в датасет под названием The Pile. Исследователи отмечают, что речь идет только о субтитрах, без видеоряда или звука. 

Среди каналов, перечисленных Proof News, фигурируют довольно крупные и известные: MKBHD (19 млн подписчиков), MrBeast (289 млн), Jacksepticeye (31 млн), PewDiePie (111 млн), каналы ток-шоу Стивена Колберта, Джона Оливера и Джимми Киммела, а также каналы образовательных учреждений, таких как Массачусетский технологический институт и Гарвардский университет. 

Proof News заявляет, что The Pile использовался Apple, Anthropic, Nvidia и Salesforce в исследовательских работах на тему ИИ и для обучения ИИ-моделей. Например, Apple использовала The Pile для обучения Apple Intelligence и модели OpenELM, которую представила в апреле текущего года. 

Отметим, что права на The Pile принадлежат некоммерческой организации EleutherAI. Proof News утверждает, что организация не получала разрешения на использование видео с YouTube для сбора данных, при этом сам датасет «доступен любому, у кого есть интернет». Отмечается, что в The Pile вошли материалы не только с YouTube, но и из публикаций Европарламента и англоязычной Википедии. 

Anthropic и Salesforce подтвердили Wired, что использовали The Pile для «академических и исследовательских целей» при разработке моделей искусственного интеллекта. 

Ранее редакция IT Speaker писала, что Министерство юстиции США и Федеральная торговая комиссия (FTC) договорились разделить ответственность и начать антимонопольное расследование в отношении трех основных игроков в индустрии ИИ — Microsoft, OpenAI и Nvidia. 

Обязанности будут разделены так: Минюст США будет проверять, нарушают ли действия Nvidia, крупнейшего производителя чипов для ИИ, антимонопольное законодательство, FTC — изучит действия OpenAI, которая создает чат-бота ChatGPT, и Microsoft, которая инвестировала $13 млрд в OpenAI и заключила сделки с другими компаниями, занимающимися ИИ.

Поделиться новостью