Сергей, у нас есть система, состоящая из порядка 40 критериев, которые определяются автоматически, по скорость, качеству и удовлетворенности пользователя. Например, различные пользовательские метрики (оценка, длина диалога) измеряются в аб-эксперименте. Похожими метриками можно измерять качество работы операторов и редактировать контент. Качество определения тематик рассчитываются на отложенном валидационном сете и при автоматическом дообучении моделей сравниваются с предыдущими замерами, а в случае успеха, идут в продакшн.
Сколько стоит?
Очень крутая тема! Приятный пример, когда Россия впереди планеты всей
И технология сложная
коровы тоже заслужили, чтобы их мир становился лучшим местом