Обуздали восстание машин - 3 часть: опыт использования ИИ в Webit
1. Оживляем фотографию
Если у вас нет желания или времени записывать самим видеоконтент, на помощь придет сервис Hedra. Он превращает фотографии в видео с озвучкой.
Как работает сервис:
- загружаете фотографию;
- пишите текст, который необходимо произнести;
- нажимаете кнопку "сгенерировать".
И через несколько минут у вас будет видео с "говорящей головой".
Если не хотите использовать свои фотографии, то можете загрузить изображение из Midjourney, DALL-E и других подобных сервисов, либо сгенерировать картинку прямо в Hedra.
Плюсы сервиса:
- есть бесплатный период для тестирования (5 видео в день).
Минусы:
- генерирует видео только с лицами людей (то есть видео с котиком, который говорит что-то забавное сделать не получится);
- если лицо далеко или повернуто боком, мимика практически не меняется;
- в бесплатной версии при скачивании видео есть водяной знак.
В сервисе есть защита от дипфейков - при попытке создать видео с известной личностью появится ошибка генерации.
Приложила варианты, которые у меня получились, в том числе не очень удачные (где мимика не меняется или меняется едва заметно).
Эти видео созданы на основе сгенерированных картинок в DALL-E:
А эти три на основе изображений с фотостока:
2. Генерация аудио из текста
Две нейросети, которые умеют генерировать аудио из текста:
1) elevenlabs.io - преобразует текст в аудио, а также может сделать переозвучку видео на другой язык. Правда английский язык в переозвучке звучит с акцентом.
Приложила примеры:
2) anytopic.io - эта нейросеть создает мини-аудиокниги из ссылок на статьи, а также может сама сгенерировать материал на заданную тему. Так что, когда нет времени читать, можно прослушивать нужный материал. Нейросеть поддерживает русский язык, но озвучивает с акцентом.
3. ИИ-инструмент, с большим набором функций
Перечислю часть возможностей сервиса Tinywow:
Для изображений:
- удалить фон;
- размыть фон;
- удалить водяной знак;
- создать диаграмму и сохранить в png.
Для pdf:
- разделить pdf-документ;
- распознать текст в pdf и конвертировать в word.
Тексты:
- сгенерировать текст;
- сгенерировать заголовок;
- отредактировать текст;
- написать сценарий и пр.
Аудио/видео:
- транскрибировать;
- обрезать видео;
- конвертировать видео;
- сделать gif из видео.
Файлы:
- конвертировать файлы (xml, pdf, csv, excel).
Плюсы сервиса:
- бесплатный;
- не требует регистрацию для работы;
- нет лимитов по количеству генераций.
Минусы сервиса:
- растягивает некоторые изображения;
- каждый раз срабатывает капча;
- есть ограничения по объему файла или его формату;
- плохо транскрибирует на русский язык;
- генерирует тексты среднего качества.
Хотя тексты получаются среднего качества, сервис может предложить интересную идею.
4. Еще одна нейросеть для генерации изображений
Качество генерации в Leonardo.Ai не хуже, чем в Midjourney.
Также можно создавать короткие анимированные видео из сгенерированных изображений.
У сервиса есть два режима: новая и старая версии (Legacy Mode). В новой версии больше возможностей для настройки параметров.
Плюсы сервиса:
- можно настраивать генерацию не только с помощью промпта, но и с помощью интерфейса (стиль, кол-во картинок, размер изображения и пр.);
- высокое качество изображений;
- 150 бесплатных токенов в день;
- функция создания и улучшения промпта;
- редактор изображений.
Минусы сервиса:
- бесплатные токены заканчиваются очень быстро:))
- в бесплатном режиме можно генерировать только по 4 изображения (в новой версии);
- плохо понимает промпты на русском языке, нужно писать на английском;
- в бесплатной версии на видео водяной знак.
5. Веб-версия Midjourney
Появилась веб-версия Midjourney. Сначала сервис давал 25 бесплатных генераций для новых пользователей. Сейчас этой возможности нет.
Отличие от Discord-версии в том, что некоторые настройки (размер изображения, уровень стилизации) вынесены в панель и их не нужно прописывать в промпте.
В разделе Explore можно посмотреть работы других авторов и промпты, которые они использовали.
Чтобы протестировать генерацию изображений необходимо зарегистрироваться через Google или Discord аккаунт.
Сервисы с искусственным интеллектом облегчают выполнение рутинных задач и освобождают время для более креативных. Но не стоит забывать, что нейросети не заменяют полностью вашу работу, а являются лишь вспомогательным инструментом.
Пишите в комментариях, какие из этих сервисов уже используете в работе? Пользуетесь ли браузерной версией Midjourney или предпочитаете Discord?
Читайте наши интересные статьи о SEO, рекламе и маркетинге:
1) Достигли целевого ДРР в 7% со второго месяца: кейс ЭТМ
2) Секреты успешных акций: от повышения лояльности до роста среднего чека
3) SEO-сопровождение переезда сайта с одного домена второго уровня на другой домен