20:00 / 17 февраля 2025
Техгиганты используют YouTube-видео без разрешения - IT Speaker, новости информационных технологий
Аналитики Proof News выяснили, что разработчики сервисов на базе искусственного интеллекта (ИИ), а именно Apple, Nvidia, Anthropic и Salesforce, использовали субтитры к тысячам YouTube-видео для обучения своих моделей ИИ без разрешения авторов.
Так, субтитры к 172,5 тысячам видеороликов с более чем 48 тысяч каналов вошли в датасет под названием The Pile. Исследователи отмечают, что речь идет только о субтитрах, без видеоряда или звука.
Среди каналов, перечисленных Proof News, фигурируют довольно крупные и известные: MKBHD (19 млн подписчиков), MrBeast (289 млн), Jacksepticeye (31 млн), PewDiePie (111 млн), каналы ток-шоу Стивена Колберта, Джона Оливера и Джимми Киммела, а также каналы образовательных учреждений, таких как Массачусетский технологический институт и Гарвардский университет.
Proof News заявляет, что The Pile использовался Apple, Anthropic, Nvidia и Salesforce в исследовательских работах на тему ИИ и для обучения ИИ-моделей. Например, Apple использовала The Pile для обучения Apple Intelligence и модели OpenELM, которую представила в апреле текущего года.
Отметим, что права на The Pile принадлежат некоммерческой организации EleutherAI. Proof News утверждает, что организация не получала разрешения на использование видео с YouTube для сбора данных, при этом сам датасет «доступен любому, у кого есть интернет». Отмечается, что в The Pile вошли материалы не только с YouTube, но и из публикаций Европарламента и англоязычной Википедии.
Anthropic и Salesforce подтвердили Wired, что использовали The Pile для «академических и исследовательских целей» при разработке моделей искусственного интеллекта.
Ранее редакция IT Speaker писала, что Министерство юстиции США и Федеральная торговая комиссия (FTC) договорились разделить ответственность и начать антимонопольное расследование в отношении трех основных игроков в индустрии ИИ — Microsoft, OpenAI и Nvidia.
Обязанности будут разделены так: Минюст США будет проверять, нарушают ли действия Nvidia, крупнейшего производителя чипов для ИИ, антимонопольное законодательство, FTC — изучит действия OpenAI, которая создает чат-бота ChatGPT, и Microsoft, которая инвестировала $13 млрд в OpenAI и заключила сделки с другими компаниями, занимающимися ИИ.
Поделиться новостью
20:00 / 17 февраля 2025
19:40 / 17 февраля 2025
19:30 / 17 февраля 2025
19:20 / 17 февраля 2025
19:40 / 17 февраля 2025
19:30 / 17 февраля 2025
19:20 / 17 февраля 2025
19:00 / 17 февраля 2025