В прошлом году компания выпустила API*, позволяющее генерировать аватаров в режиме реального времени. Иными словами, мы передаем в HeyGen текст, который хотим озвучить, а в ответ получаем видео с аватаром, который озвучивает этот текст. И добавляем видео в свой проект (вот тут можно почитать про работу API подробнее).
*API это интерфейс, через который одна программа может «общаться» с другой. Наш диалоговый тренажер отправляет в HeyGen текст, а в ответ получает видео с ИИ аватаром.
до чего техника дошла
Выглядит очень интересно. И нужно отметить, что технология генерации аватаров в реальном времени совсем «сырая». Уверен, что через год-два качество таких аватаров станет принципиально лучше.
Дополнительный шаг с отправкой текста и получением видео будут создавать заметную задержку в разговоре. Это в свою очередь понизит реалистичностью.
Интересная штука, но думаю полетит только для ТОП менеджмента и тренировок для крупных проектов. До простых смертных манагеров вряд ли дойдет
Согласен, разработка диалоговых тренажеров с ИИ стоит ощутимо дороже разработки обычных тренажеров (когда выбираешь верный вариант ответа) плюс нужно отдельно платить за ИИ и за аватар. Для маленького проекта проекта это не рационально.