Недавно нам была поставлена задача конвертировать аудиозаписи в текст для дальнейшего анализа. Обязательные условия: офлайн обработка, невысокая требовательность к системным ресурсам, и возможность автоматизации процесса. Мы выбрали Python и библиотеку vosk-api.
Вы не сказали куда кидать Vosk?
Vosk можно установить с помощью PyPi, подробная инструкция есть здесь https://alphacephei.com/vosk/install