20:00 / 29 сентября 2025
В DeepSeek представили новую ИИ-модель - IT Speaker, новости информационных технологий
DeepSeek объявили о запуске новой экспериментальной модели DeepSeek-V3.2-Exp. В ней специалисты компании впервые использовали новую схему разреженного внимания (DSA). Модель доступна в веб-версии и приложениях.
Особенность DSA в том, что схема выбирает лишь самые «важные» позиции в длинном контексте и считает полное внимание только по ним – поэтому время и стоимость растут почти линейно по числу выбранных токенов, а не квадратично по длине всего текста. Такой подход снижает стоимость работы на длинных контекстах без ущерба для качества, заявили представители компании.
V-3.2-Exp значительно дешевле своей предыдущей версии: в API вход стоит $0,028 (чуть более двух рублей) за 1 млн токенов при попадании в кэш и $0,28 (24 рубля) при промахе, вывод – $0,42 (35 рублей) (ранее: вход – $0,07 (почти шесть рублей) при попадании в кэш и $0,56 при промахе (около 47 рублей); вывод – $1,68 (около 140 рублей) за 1 млн токенов). Пользоваться DeepSeek в веб-приложении можно бесплатно.
Ранее компания DeepSeek опубликовала отчет, в котором заявила, что потратила $294 тыс. на обучение своей модели R1. Данная сумма значительно меньше расходов конкурентов из США в рамках их разработок. Для этого DeepSeek задействовала 512 ускорителей Nvidia H800.
Поделиться новостью
20:00 / 29 сентября 2025
19:30 / 29 сентября 2025
19:00 / 29 сентября 2025
18:30 / 29 сентября 2025
20:00 / 29 сентября 2025
19:30 / 29 сентября 2025
17:00 / 29 сентября 2025
16:30 / 29 сентября 2025