Новый уровень языковых моделей от Яндекса: знакомимся с YandexGPT 4 Pro и Lite

Оказывается, они тоже недавно обновились. Давайте разбирать новинку от Яндекса — обновленное семейство моделей YandexGPT 4, которое включает мощную Pro-версию и облегченный Lite-вариант. Теперь они доступны через API в Yandex Cloud, а первыми их «пощупают» пользователи Алисы с подпиской «Про».

Что изменилось?

Главная «фишка» этих моделей — улучшенная способность отвечать на сложные запросы и поддержка «скрытых рассуждений», позволяющих модели рассуждать и анализировать задачи в несколько этапов. Протестированные на реальных задачах, Pro-версия модели в 70% случаев отвечает лучше, чем предыдущая. Lite-версия, хотя и облегченная, сохраняет высокое качество ответов и является конкурентом более старших версий.

Тесты и результаты

Чтобы объективно оценить возможности новой модели, команда использовала два типа тестирования:

➖Бенчмарки — стандартные тесты с заготовленными ответами. Этот метод позволяет оценить работу модели по заранее заданным критериям.

➖Side by Side — сравнение моделей на одинаковых задачах, где эксперты оценивают ответы «вслепую». Этот тест ближе к реальным сценариям, потому что учитывает разнообразие запросов.

Замеры показали, что YandexGPT 4 Pro по ряду задач сравнима с GPT-4, а по прикладным задачам — на уровне с популярными моделями Llama.

Что можно попробовать прямо сейчас?

➖Длинный контекст: Pro-версия теперь работает с 32 тысячами токенов вместо прежних 8 тысяч. Это значит, что модель способна анализировать длинные запросы и большие массивы текста — до 60 страниц.

➖Работа с внешними источниками: улучшены алгоритмы, которые позволяют модели подгружать данные из внешних документов. Теперь при ответах модель ориентируется на конкретные источники, что делает ее более точной и снижает вероятность ошибок.

Как обучали YandexGPT 4 и что ждет впереди?

Над моделью работали с особой тщательностью:

➖Обучение проходило с использованием внутренней библиотеки Яндекса YaFSDP, что ускорило процесс.

➖В качестве тренировочных данных добавили длинные документы, чтобы модель привыкала к большому объему контекста.

➖Использовали технику пошаговых рассуждений, чтобы научить модель анализировать запросы и выделять важные этапы для их решения.

В ближайшем будущем Яндекс добавит к API поддержку скрытых рассуждений — можно будет увидеть, как модель приходит к ответу, шаг за шагом. Кроме того, скоро в YandexGPT появится функция вызова внешних функций: это откроет возможности для интеграции с другими инструментами и создания умных ассистентов.

Для разработчиков: модели уже доступны для тестирования в режиме Release Candidate. Протестировать их можно в Yandex Cloud, через API или в консоли.

Наш экспертный канал в Telegram | Наш бот GPT4o