Как мы внедряем нейросети: Опыт Way2Win
Еще пару лет назад общество смотрело на нейросети как на забавную игрушку. Помним, как с коллегами смеялись над нелепыми видео с Уиллом Смитом и кривыми текстами ChatGPT. Это казалось чем-то далеким от реальных задач. Но время прошло, и сегодня мы даже не представляем нашу работу без этих инструментов.
Начнем с разработки
Cursor — это IDE с интегрированной LLM, которая пишет код, позволяет задавать вопросы по кодовой базе, читает и пишет документацию и предлагает улучшения.
Для некоторых наших программистов Cursor стал незаменимым помощником в рабочем процессе, но далеко не для всех. Те, кто его используют, хвалят за скорость и удобство. Базовые задачи, вроде написания тестов, настройки логирования или обработки ошибок, решаются буквально за минуты. Благодаря этому разработка быстрее справляется с "обвесом" для проекта, сосредотачиваясь на более сложных и творческих аспектах.
Но другая часть команды видит в нем настоящего врага: передавая выполнение рутинных задач нейросети, они чувствуют, что теряют собственные навыки и мотивацию и считают, что чрезмерная автоматизация таких задач снижает общую вовлеченность и профессиональную самостоятельность.
Кажется, я перестаю думать сам
В качестве LLM для написания кода рекомендуем использовать Claude. Он понимает русский язык хуже, чем ChatGPT, но лучше справляется с задачами, где важна логика, последовательность и точность.
Работа с изображениями
Дизайнеры нашей команды используют ChatGPT для генерации идей и текстов, а MidJourney и Stable Diffusion Flux — для создания изображений, первых концептов и мудбордов. Благодаря этим инструментам фотостоки практически ушли в прошлое: с правильной формулировкой промпта и хорошей моделью изображения выглядят профессионально и лишены эффекта зловещей долины.
Нейронка часто выручает в несложных задачах и там, где на стоках невозможно найти идеально "попадающую" в запрос иллюстрацию, а также когда нужны услуги иллюстратора, поэтому отказываться от использования нейросетей сейчас нецелесообразно и непрофессионально.
В последние пару недель отдел дизайна изучает Recraft.ai. По своей сути — это все тот же Stable Diffusion Flux, но с более простым интерфейсом, всем необходимым инструментарием и без необходимости хостить его на своем сервере.
Мы также развернули инструменты стилизации, удаления фонов и инпейнта на базе Stable Diffusion. Это позволяет дорабатывать контент под конкретные задачи, делая процесс создания визуалов максимально гибким.
Новичкам рекомендуем начать с Midjourney. Инструментарий ограничен, но он не требует какой-либо установки, практически всегда выдает приемлемый по качеству результат, а в интернете есть множество гайдов по использованию.
Пишем текст
Практически все тексты для сайтов и рекламных материалов изначально генерируются с помощью ChatGPT. Это позволяет быстро создавать черновики, которые затем дорабатываются редакторами: текст адаптируется под требования поисковых систем, дополняется реальными данными от клиентов или экспертов и доводится до идеального соответствия задаче.
Например, если редактору не нравится смысл абзаца, он может попросить нейросеть сгенерировать 15 вариантов текста. Из них легко выбрать удачные куски, состыковать их, подправить стиль — и за 10 минут получить отличный результат. Раньше на это могло уйти от получаса и больше: подбор слов, смысла, темпа, попытки добиться нужного тона, эксперименты с формулировками занимали гораздо больше времени.
На данный момент ChatGPT от OpenAI обеспечивает наилучшее качество текстов на русском языке. ГигаЧат от Сбера и Нейро от Яндекса сильно отстают.
Сможете найти текст нейросети?
Абзац этой статьи был написан с помощью нейросети и редактору было лень его дорабатывать. Сможете угадать, какой именно абзац? Пишите свои предположения в комментариях — проверим вашу насмотренность.
Клонируем голоса и их владельцев
Для синтеза речи одним из самых удобных инструментов для нас является ElevenLabs. Всего за пять минут здесь можно создать клон своего голоса или выбрать готовый голос из библиотеки и использовать его для озвучки текста.
Однако, если речь идет о русском языке, возникают сложности: приемлемо работают только премиум-голоса, а бесплатные добавляют заметный акцент, что звучит забавно, но не всегда подходит для серьезных задач. Эту проблему решает Fliki — платформа попроще, но с отличными русскоязычными голосами, которые звучат максимально естественно и не режут слух.
Для создания клонов людей отлично подойдет Heygen. Вы записываете видео по предоставленной инструкции, подтверждаете, что владеете своей личностью и через 12 часов платформа генерирует ваш цифровой аватар, который может читать текст с невероятной точностью. Разницу с реальным человеком заметят только самые внимательные зрители. Некоторые предпочитают аналог — Synthesia, которая выполняет те же задачи.
Главный минус аватарных сервисов — ощутимая цена подписки. Но она ничтожна в сравнении с альтернативой — организацией съемок.
Создаем музыку
Когда нам требуется музыка, мы обращаемся к Suno. Эта ИИ-платформа позволяет генерировать композиции по описанию, преобразовывать загруженные аудио в другой стиль и адаптировать мелодии, сохраняя их гармонию.
И, что не менее важно, стоимость совершенно адекватная. На бесплатном пакете дают 10 треков в день на старой модели, а за $10 сервис предлагает 500 треков и доступ к свежей инструментальной модели. Каверы на ней получаются просто замечательные.
Экономим время
Когда в команде нет нужного специалиста, а нанимать его ради одного проекта нецелесообразно, отряд из ChatGPT и пары других нейронок может взять на себя эту работу. Понятно, что пока такой подход не заменит полноценного эксперта, но нейросеть способна помочь в понимании специфики отрасли, поиске стандартов или разборе типичных кейсов.
Так, во время наших созвонов нейросетевые помощники записывают разговор, размечают говорящих, переводят аудио в текст и сразу формируют ключевые тезисы. Дополнительно можно задать вопросы по прошедшей встрече в режиме чата чтобы уточнить детали или быстро найти нужную информацию. Итогом становится структурированный бриф с подробной информацией о клиенте, его аудитории и задачах.
Помогает быстро найти инфу глазами по памяти контекста диалога вместо того чтобы слушать час разговора. Ну и полезные приколы в виде подведения итогов срабатывают очень хорошо. Информация всегда под рукой.
Раньше для этого требовалось выделять целого сотрудника, который фиксировал основные моменты во время созвона и составлял итоговый документ после. Теперь весь процесс занимает не больше пяти минут и полностью автоматизирован.
Проверяем гипотезы
Для сбора и проверки гипотез маркетологи нашей команды активно используют инструменты вроде Perplexity — поискового инструмента на основе LLM.
Этот сервис стал незаменимым помощником для быстрого ресерча, поиска статистики, юридической информации и анализа документов. Кроме того, он помогает справиться с "синдромом чистого листа" — достаточно задать вопрос или описать проблему, чтобы получить первые идеи или направление для работы.
Перепроверка гипотез с Perplexity стала быстрее и удобнее. Он умеет собирать, агрегировать и анализировать данные, а встроенный интерфейс позволяет даже выполнять расчеты на Python, если на компьютере не установлена IDE. Однако есть и минусы.
С ИИ стало значитель быстрее собирать, агрегировать и проверять реальность данных, но простые промпты все еще генерят шаблонные ответы, количество доступных ЛЛМ сбивает с толку, а любую информацию все еще приходится проверять на галлюцинации.
Заключение
Технологии стали незаменимым помощником в работе: они ускоряют выполнение задач, предоставляют готовые решения и помогают быстро адаптироваться к новым вызовам. От программирования до маркетинга — ИИ уже внедрен в самые разные сферы. Однако их задача — не заменить нас, а дополнить. Человеческий творческий контроль, критическое мышление и важные решения по-прежнему остаются ключевыми элементами успешной работы.