«Мы экономим компаниям 150 000 рублей»: как ReText.AI создал текстовую нейросеть для профессионалов
Всего за год сервис ReText.AI вырос из экспериментального синонимайзера в платформу, которую Tele2 назвала самой востребованной нейросетью. Как это удалось и какую роль в этом сыграло облако, рассказывают соосновательницы сервиса Ольга Шкряба и Елена Райтс.
ReText.AI — сервис перефразирования на основе нескольких нейросетей с умным синонимайзером. С его помощью за несколько секунд можно разнообразить, сжать или увеличить текст без потери смысла, а также проверить уникальность и проанализировать. Платформой пользуются копирайтеры, редакторы, блогеры и предприниматели.
С чего всё началось
Пока пользователей было мало — работал собственный сервер, и это было ненапряжно.
Наша компания специализировалась на SDK (software development kit — набор средств разработки), нейросетях и создавала сложные библиотеки под разные решения для заказчиков. Например, мы делали SDK для фото- и видеоредактора, который позволяет разработчикам встраивать готовые инструменты для редактирования медиаконтента — от простых операций вроде обрезки и цветокоррекции до сложных эффектов. Ещё мы делали аналог TikTok для создания коротких видеороликов. Наше решение объединяло инструменты для съёмки, редактирования и публикации видео.
Год назад мы исследовали несколько текстовых нейросетей для нашей студии разработки. Получили достаточно данных для машинного обучения и начали работать над синонимайзером для автоматизации собственных задач. В итоге он не пригодился. Но поскольку мы потратили много времени и сил, решили сделать его продуктом.
Мы попросили нашего дизайнера создать сайт под этот проект. Результат получился забавным — как будто страницу делал школьник, который только научился программировать. Тем не менее платформу зарелизили на своих серверах. Анонсировали выход сервиса в паре Telegram-каналов и стали ждать.
Где-то неделю была тишина. Потом начали приходить пользователи — всё больше и больше. Видимо, запустилось сарафанное радио, и бесплатный текстовый сервис внезапно стал популярным. Наши серверы уже тогда перестали вывозить такую нагрузку.
За 3–4 месяца мы разработали новую платформу. Это было непросто: раньше у нас была другая специализация — мы решали сложные математические задачи. Сейчас же нужно было создать с нуля целый сервис и нанять для этого новых специалистов.
Для продвижения сервиса мы подготовили PR-кампанию на основе SEO-ключей. Количество брендовых запросов за месяц выросло в 12 раз, а через три месяца — в 40 раз. Но проблема оставалась: мощностей своих серверов не хватало, нужно было умещаться в рамках небольшой инфраструктуры. Наши разработчики пытались ужимать модели, но скоро стало ясно, что для масштабирования необходимо переходить в облако. И мы начали подбирать подходящие варианты. Одной из сложностей было найти и распланировать бюджет.
Как искали бюджет и почему пришли в Yandex Cloud
Без поддержки стартапу развиваться трудно. Поэтому мы выбирали те облачные платформы, которые выдают гранты.
Мы рассматривали несколько предложений от крупных компаний, но ни одно из них не подошло: то условия были не те, то бюджет. Опасались, что в процессе миграции потребуется много доработок, на которые нужно будет потратить ещё больше денег, и суммы гранта не хватит.
В итоге пришли в Yandex Cloud. ReText.AI попал в программу Yandex Cloud Boost, и сейчас мы переносим решение в облако. Финансирование покрывает расходы и на маркетинг, и на исправление ошибок, и на самое болезненное — миграцию.
Сейчас на инфраструктуре Yandex Cloud работают кластеры систем управления базами данных РostgreSQL и Redis, а также виртуальные машины для Kubernetes. Мы используем Yandex Object Storage для внутренней инфраструктуры — в нём хранятся обученные модели, registry с образами, логи проекта и бэкапы баз данных. Уже начали миграцию в Yandex Managed Service for Kubernetes® — в итоге перенесём туда 80% сервиса. У нас есть и свои серверы — они выполняют статичные задачи для сервисов, требующих доступа к GPU круглые сутки, но они не могут масштабироваться.
Эффективность облака сейчас сложно оценить, но уже можно сравнить затраты, которые бы понадобились на переход к другому облачному провайдеру. Они оказались бы на 15–20% больше.
Как ReText помогает бизнесу
Один язык — одна нейронка. Это дорого, но качественно.
Когда сервис только запускался, им в основном пользовались студенты, которым нужно было повысить уникальность дипломных работ на 5–10%. Со временем проект стали тестировать и профессионалы: копирайтеры, редакторы, блогеры. Ещё год назад отзывы были не очень хорошими: говорили, что текст получается «картонным» и его нельзя использовать для подводок к статьям, постов и прочих форматов.
Тогда мы провели исследование и поняли, что именно не нравится авторам. Им было важно качество перефразирования. Наша первая нейросеть строилась на ограниченных данных — соответственно, получившийся результат приходилось глубоко редактировать.
Сейчас ReText.AI использует для разных задач разные нейросети — они сами понимают, какой из них какую задачу забрать, какая с чем лучше справится. Мы задействовали текстовые сети трёх основных типов: кодирующие, генеративные и «текст в текст». Модели работают в связке: например, кодирующая модель анализирует результаты генеративной. А ещё в сервисе используются отдельные нейронные сети для создания и аугментирования датасетов. Поэтому контент получается качественным.
Мы часто проводим A/B-тестирования и собираем статистику по вариантам, которые выбирают пользователи. Поэтому данные регулярно обновляются и уровень текстов растёт.
Наш сервис вошёл в топ нейросетей, по данным исследования Tele2. Сейчас продуктом гораздо охотнее пользуются профессионалы: их аудитория выросла до 35%.
Судя по трафику, на платформу нередко заходят малые, средние и крупные компании. Мы посчитали, что ReText.AI экономит бизнесу 100 000–150 000 рублей на этапе развития. Для сайтов нужно много контента, и писать его с нуля дорого. Наш расширитель текстов помогает делать материалы стилистически разнообразнее, быстрее выполнять заказы и генерить новые идеи.
Что в планах
Переезжать на новую инфраструктуру сложно и долго, так как нужно переписывать весь код. Но мы планируем расширять платформу с упором на работу в облаке. Один из таких проектов почти готов — в ближайшее время запустим Telegram-бота для анализа доступных источников и суммирования результатов по ним.
Мы будем двигаться в сторону профессиональной платформы, чтобы люди могли оптимизировать время, получать качественные тексты для своих задач и анализировать результаты.
Подписывайтесь на Telegram-канал Yandex Cloud, чтобы узнавать еще больше новостей и историй об IT и бизнесе.
Другие истории наших партнеров и клиентов, которые активно читают наши подписчики:
- Контроль сроков и загрузки исполнителей: за чем можно следить на диаграмме Ганта
- Контроль сроков и загрузки исполнителей: за чем можно следить на диаграмме ГантаУмный дом для растений: как Grolli создаёт девайсы и экосистему для городских ферм
- Yandex Cloud совместно с журналом «Хакер» запустила подкаст о безопасной работе в облаке