«Яндекс» обучил нейросеть в «Картах» проверять сгенерированные тексты на наличие галлюцинаций
Она работает на базе YandexGPT.
- Раньше за краткие описания в «Картах» отвечали пять моделей, а теперь одна, что требует меньше вычислительных мощностей, сказали в «Яндексе». Речь об описаниях достопримечательностей и заведений в блоках «Коротко о месте» и «Потоке» в режиме «Идеи».
- Нейросеть составляет описания на основе данных от владельца карточки организации и пользовательских отзывов, но иногда «галлюцинирует» — добавляет несуществующие детали. Чтобы повысить точность, её научили «оценивать написанное на правдивость — сравнивать свои ответы с отзывами, на которые она опиралась, и удалять "выдуманное"».
- Помимо этого, в набор обучающих данных добавили «эталонные» примеры генераций предыдущих моделей. За счёт этого новая нейросеть реже использует в описаниях общие фразы, например, «вкусная еда» и «приятная атмосфера».
- По словам компании, переход на обновлённую версию нейросети позволил повысить «правдивость и качество» кратких описаний на 90% и сократить количество неточностей в шесть раз.
- «Яндекс» добавил в «Алису» нейросеть YandexGPT в мае 2023 года. Она также используется в «Маркете», «Лавке», «Практикуме» и других сервисах. В сентябре того же года компания выпустила новую версию нейросети — YandexGPT 2. В 2024 году представила YandexGPT 3 Pro и облегчённую версию YandexGPT Lite.
- Yandex Cloud начала принимать заявки и тестировать YandexGPT для бизнеса в июне 2023 года. В декабре доступ открыли всем пользователям. Использование API тарифицируется — стоимость генерации текста зависит от выбранной модели и режима.
78 комментариев