DeepSeek обновила модель V3: улучшена работа с кодом, открыт исходный код

Китайская компания DeepSeek представила обновленную модель DeepSeek-V3-0324, которая, по заявлениям пользователей, превосходит DeepSeek-R1 в программировании. В компании утверждают, что новая версия сравнима с Claude 3.7 Sonnet и обходит GPT-4.5 в ряде задач.

Что нового в DeepSeek-V3-0324?

DeepSeek обновила модель V3: улучшена работа с кодом, открыт исходный код

В отличие от DeepSeek-R1, которая фокусируется на «рассуждающих» способностях, V3-0324 улучшена в следующих аспектах:

  • Программирование и frontend-разработка – модель быстрее и точнее генерирует код.
  • Математические задачи – в некоторых тестах сравнялась или превзошла Claude 3.7 Sonnet.

Пользователи заметили, что результаты работы V3-0324 в программировании похожи на ответы Claude, что вызвало подозрения в использовании её данных при обучении. Один из экспериментов, в котором две модели создавали лендинг по одному запросу, показал схожие результаты.

Почему DeepSeek-V3-0324 важна?

Несмотря на споры, модель высоко оценили за её открытый исходный код. DeepSeek предоставила MIT-лицензию, позволяя свободное использование и интеграцию в проекты.

Как использовать DeepSeek-V3-0324?

  • Бесплатно на официальном сайте.
  • Через API с тарифами: $0,27 за 1 млн входящих токенов (≈ 23 руб.). $1,10 за 1 млн исходящих токенов (≈ 93 руб.).
  • Исходный код доступен на Hugging Face.
Начать дискуссию