Голосовые → текст: ОСМЫСЛИТЕЛЬ голосовых. Создаём мощную автоматизацию!

1. 🗣Зачем это?

1. Экономия времени: - Вместо того что бы слушать и переписывать текст. Наша автоматизация сама, прослушает аудио или голосовое сообщение. И четко его структурирует, оставив только самое ключевое, убирая всю не нужную воду.

2. Анонимность. Преимуществом нашей автоматизации будет локальная транскрипция аудио. Ваш голос не будет попадать к 3-им лицам.

3. Удобство работы. — готовый текст можно сразу использовать: для заметок, отчётов или отправки другим людям. Не переживая о том, поймут они вас или нет. А так же быстренько записать голосовую, с которой можно будет потом хорошо работать

4. Личное удобство — можно говорить, а не писать, сохраняя идеи, мысли или планы.

5. Для всех — полезно тем, кто не любит печатать или людям с нарушениями зрения.

2. 🛝Структура

Структура проста как 2 капли, воды. Но от того и эффективная.
Структура проста как 2 капли, воды. Но от того и эффективная.

3. 🕶Тех. часть

Сейчас поговорим о том, как такое вообще можно реализовать. (для тех кто не хочет вникать и получить сразу Готовое с.м. 4 раздел)

Весь код, мы будем писать на python. Не волнуйтесь это не сложно и не долго Установка python. - Качаем установщик python и проходим стандартную процедуру установки.

После установки создадим папку проекта. Я назову её 'aud_bot'.

Очищаем и вводим cmd в строку поиска. Жмякаем enter
Очищаем и вводим cmd в строку поиска. Жмякаем enter
В полученное поле вводим команду "python -m venv menv". Жмём enter
В полученное поле вводим команду "python -m venv menv". Жмём enter

Это создаст виртуальное окружение. Вы же не хотите засрать себе весь ПК?;)

Вписываем команду "menv\Scripts\activate.bat". Это активирует виртуальное окружение.
Вписываем команду "menv\Scripts\activate.bat". Это активирует виртуальное окружение.
Устанавливаем нужные нам библиотеки командой "pip install aiogram whisper pydud". И ждём установки...
Устанавливаем нужные нам библиотеки командой "pip install aiogram whisper pydud". И ждём установки...
Это выглядит так.
Это выглядит так.

Создаём и открываем файл в редакторе кода, я использую Vs Codium.

Импортируем все нужные нам библиотеки
Импортируем все нужные нам библиотеки
Создаём переменные
Создаём переменные
функцию для работы с ChatGPT через провайдера <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fconsole.proxyapi.ru%2F&postId=1750971" rel="nofollow noreferrer noopener" target="_blank">proxyapi</a>
функцию для работы с ChatGPT через провайдера proxyapi
функция скачивания аудио + обработки
функция скачивания аудио + обработки
Транскрипция(аудио в текст)
Транскрипция(аудио в текст)
Принимаем аудио или голосовое и обрабатываем как нам нужно.
Принимаем аудио или голосовое и обрабатываем как нам нужно.
Надо для запуска бота
Надо для запуска бота

Готово теперь мы можем запустить бота, прописав "python run.py"

отправляем на тест голосовое. В котором я говорю о нашей автоматизации.
отправляем на тест голосовое. В котором я говорю о нашей автоматизации.
Почти тут же получаю ответ
Почти тут же получаю ответ

ВНИМАНИЕ!!! Скорость транскрипции зависит в 1 очередь зависит от вашего ПК. К примеру в моём примере. Я всё тестировал на ноутбуке с cpu. И примерно обработка занимала 1:1. Т.е. 1 секунда аудио = 1 секунде транскрипции. Если же у вас имеется GPU от nvidea. То скорость увеличиться в 5-10x.

4. 😤А зачем париться?

Ребят, только что мы рассмотрели и сделали свою собственную автоматизацию, у которой просто море применений если чуть чуть подумать и доработать код. К примеру:

- интеграция с notion, obsidian, logseq. Для моментальной записи голосовых заметок и конвертации в письменные по шаблону.

- отправка ваших поручений. Можно добавить ещё 1 блок с chatGPT, что бы тот переделывал структурированный текст в поручения или задания. Который дальше могут записываться в журналы, календари и т.д. Или автоматически отправляться вашим работникам.

- почти безграничное море возможностей. Применений у такой связки по истине много. Всё ограничивается вашей фантазией

Ребят все те кто хочет автоматизировать...

- Я в сфере автоматизаций уже давно около 3-4 лет. За моими плечами много опыта, провалов, знаний и ошибок. Только что я показал лишь каплю в море. Будущее наступает. И я с уверенностью могу заявить, что можно автоматизировать 99,99% любых повторяющихся действий. При помощи скриптов и нейросетей.

- Именно поэтому я предлагаю свои услуги:

- Вы можете заказать у меня кастомную автоматизацию. Я настрою её от и до, предоставлю исходный код и всё объясню.

- Менторство. Если вам интересно развить такой навык как автоматизировать всё и вся. То я могу в этом вам помочь, обучить и направить на правильный путь.

- Cотрудничество. Если у вас есть выгодные предложения, то мы можем с вами скооперироваться и сделать что то поистине великое

- Мой контакт -> телеграм

Код автоматизации.

- для всех тех, кто хочет найти исходный код разобранный нами автоматизации. Приглашаю вас в клуб "ПОЛИМАТ" именно там, я выложу автоматизацию. А так же вы сможете задать мне вопросы, и я постараюсь вам помочь всем чем смогу.

Начать дискуссию