Исследователи из Стэнфорда и Вашингтонского университета рассказали, что смогли создать «рассуждающую» ИИ-модель меньше чем за $50

Для этого готовую модель Qwen они дообучили методом «дистилляции» с помощью Gemini 2.0 Flash Thinking.

10
4

Ахах - "готовую модель Qwen они дообучили методом «дистилляции» с помощью Gemini 2.0 Flash Thinking". Они взял готовую технологию, в которую были вложены миллионы, и псевдо создали свою рассуждающую модель. Как будто бы что-то не так)

10

Лол, так в этом прикол исследования и был. Показать как это получилось у нашумевшеоо DeepSeek.


При этом тут вышло более чем в тысячу раз дешевле чем у китайцев 😂

11

дипсиик тоже так делали

2

Подсмотрели модель обучения у Yandex-a

1