Мне надоело получать голосовые от друзей по 5 минут в Telegram и WhatsApp и создал бот для краткого изложения

Активное развитие мессенджеров привело к разделению общества на сторонников и противников голосовых сообщений.

Мне надоело получать голосовые от друзей по 5 минут в Telegram и WhatsApp и создал бот для краткого изложения

Проблема, с которой я столкнулся, - отсутствие времени на прослушивание длинных голосовых сообщений.

Вот основные аргументы против использования голосовых сообщений:
1. Невозможность быстрого просмотра и понимания ключевых моментов, как при чтении текста.
2. Неудобство прослушивания в шумных и переполненных местах.
3. Отсутствие возможности поиска и нахождения важной информации в голосовых сообщениях.

Решение: Pop Audio Bot

Я создал простого Telegram-бота, который преобразует голосовые и видео-сообщения в текст. Если сообщение длится более 25 секунд, бот отправляет краткое изложение в дополнение. Чтобы воспользоваться ботом, достаточно переслать сообщение из любого диалога в Telegram (или из WhatsApp). Бот поддерживает голосовые сообщения, аудио, видео и видео-кружочки, при условии, что размер файла не превышает 20 Мб.

Мне надоело получать голосовые от друзей по 5 минут в Telegram и WhatsApp и создал бот для краткого изложения

Что касается безопасности ваших данных...

Ваши голосовые файлы не хранятся на нашем сервере. Они загружаются, преобразуются в соответствующий формат для передачи в OpenAI и немедленно удаляются. История взаимодействия с ботом также не сохраняется.

Зачем нужен этот бот, если есть Telegram Premium и другие аналогичные боты?

Действительно, уже существует немало ботов, предоставляющих подобные возможности. Однако многие из них ограничены по длительности файлов (обычно до 90 секунд) или поддерживают только голосовые сообщения. Я постарался объединить лучшее из них, чтобы обеспечить наибольшее удобство использования бота. В отличие от Telegram Premium, главным преимуществом моего бота является возможность получить краткое изложение текста, что позволит сэкономить время пользователям.

Как работает бот?

Бот полностью основан на API OpenAI. Для расшифровки аудио используется голосовая модель "whisper", способная обрабатывать 96 различных языков. Извлечение основной идеи из текста осуществляется моделью "gpt-3.5-turbo".

Бесплатно ли использовать бот?

Я решил с самого начала предоставить бесплатную версию с ограниченным функционалом, а также платную версию. Бесплатная версия позволяет преобразовывать до 3 сообщений в день, каждое продолжительностью до 60 секунд. Платная версия обеспечивает безлимитный доступ и позволяет обрабатывать сообщения длительностью до 10 минут.

Также я с большим интересом жду ваши отзывы и предложения по улучшению продукта. Не стесняйтесь делиться своим мнением ниже, включая и хейтеров.

44
13 комментариев

Ну всё теперь. Новый айфон отменяется

1
Ответить

Идея классная ,действительно не всегда удобно слушать голосовые сообщения ,а вопросы решать нужно на момент их получения

1
Ответить

отправлять в ответ картинку с изображением голосового-проще и приятнее

1
Ответить

Классная идея!

1
Ответить

норм идея) похожее сделали на сервисе от сбера - салютспиче, можно как из текста в звук так и из речи в текст, удобненько)

Ответить

Кстати, стоимость SaluteSpeech для расшифровки аудио для юр фирм сопоставима с подключением к OpenAi. Только второе на мой взгляд все же удобнее

1
Ответить

Очень интересно услышать полную историю про пару и Белек

Ответить