«Дочка» МТС выпустила большую языковую модель с открытым исходным кодом

Она умеет создавать, анализировать и переводить тексты.

  • Компания MTS AI выпустила LLM-модель Cotype Nano для решения бизнес-задач, связанных с созданием и анализом текстов на русском языке, сообщила компания.
  • Модель можно запустить на любых устройствах — смартфоне, настольком компьютере и ноутбуке. Она доступна для скачивания на Hugging Face.
  • Веса модели — параметры для принятия решений — находятся в открытом доступе. Это позволит исследователям и разработчикам изучить, как работает модель, настроить её под свои нужды и использовать в проектах.
  • Cotype Nano может обрабатывать контекст до 32 тысяч токенов или 42 страниц текста. Модель обучили для создания текста, перевода между русским и английским, обработки и анализа текста. Также её можно использовать для разработки чат-ботов и виртуальных помощников.
  • Модель оптимизирована для работы на центральных и графических (CPU и GPU) процессорах и дополнительно — под процессоры от Intel.
  • Cotype Nano содержит 1,5 млрд параметров, её обучили на датасетах, включающих компьютерный код, математику и синтетические данные (созданные искусственно).
3232
33
11
42 комментария

Ждем ответа на библейский вопрос: зачем?

9
Ответить

для решения бизнес-задач, связанных с созданием и анализом текстов на русском языке, сообщила компания.

19
2
Ответить

Не сделали - не устроило, сделали - зачем.

8
Ответить

Русскоязычные AI модели можно по пальцам посчитать, пусть будет для разнообразия

1
Ответить

Ну модели, которые обучались преимущественно на русском, потенциально должны лучше выдавать результаты на русском и для небольших нишевых или локальных задач если их дотюнить, должны лучше выдавать результаты, но это в теории, как на практике надо смотреть

1
Ответить

глупых вопросов - столько же сколько глупых людей

Ответить

У вашей языковой модели небольшие опечатки. Но приятно, что растёт внутренняя конкуренция. Не яндексом единым. Остаётся надеяться, что это не Llama переделанная.

4
Ответить