Взял кринжовый видос про озорные поры на носу Бузовой и посмотрел, как с ним справятся лучшие российские транскрибаторы аудио и видео файлов в текст. Сравнил полученный результат по целому списку критериев и составил крутую таблицу. Го смотреть 🚀🚀🚀
Разбивка на спикеров может происходить автоматом при распознавании?
Диаризация технологически не оч. простая история, но в Whisper есть, но кажется для английского.