DeepSeek обновила модель V3: улучшена работа с кодом, открыт исходный код
Китайская компания DeepSeek представила обновленную модель DeepSeek-V3-0324, которая, по заявлениям пользователей, превосходит DeepSeek-R1 в программировании. В компании утверждают, что новая версия сравнима с Claude 3.7 Sonnet и обходит GPT-4.5 в ряде задач.
Что нового в DeepSeek-V3-0324?
В отличие от DeepSeek-R1, которая фокусируется на «рассуждающих» способностях, V3-0324 улучшена в следующих аспектах:
- Программирование и frontend-разработка – модель быстрее и точнее генерирует код.
- Математические задачи – в некоторых тестах сравнялась или превзошла Claude 3.7 Sonnet.
Пользователи заметили, что результаты работы V3-0324 в программировании похожи на ответы Claude, что вызвало подозрения в использовании её данных при обучении. Один из экспериментов, в котором две модели создавали лендинг по одному запросу, показал схожие результаты.
Почему DeepSeek-V3-0324 важна?
Несмотря на споры, модель высоко оценили за её открытый исходный код. DeepSeek предоставила MIT-лицензию, позволяя свободное использование и интеграцию в проекты.
Как использовать DeepSeek-V3-0324?
- Бесплатно на официальном сайте.
- Через API с тарифами: $0,27 за 1 млн входящих токенов (≈ 23 руб.). $1,10 за 1 млн исходящих токенов (≈ 93 руб.).
- Исходный код доступен на Hugging Face.