Axevil Capital: Как мы создавали венчурного AI-советника Клаудию
Мы в Axevil Capital строим венчурную платформу для инвестиций в частные технологические компании на pre-IPO стадии. Считается, что венчурные инвестиции в late-stage компании удел крупных инвестиционных фондов. Наша цель — разрушить этот стереотип и демократизировать доступ к венчуру.
Доступность начинается с информированности, поэтому мы подумали, что будет интересно создать AI-советника, который не просто рассказывает про то, что такое pre-IPO, но и разбирается в деталях бизнесов наших портфельных компаний.
В процессе создания AI-ассистента мы изучили все доступные LLM модели, набили энное количество шишек, поняли, почему все то, что вызывает восторг у нас, как у обычных пользователей, мы же, как представители бизнеса, воспринимает с некоторым скепсисом.
В итоге первый венчурный AI-ассистент успешно запущен и уже отвечает на вопросы пользователей в приложении Axevil и в телеграмме, а мы хотим поделиться тем, как это было.
Что уже умеет генеративный ИИ.
Для начала давайте посмотрим, на какой стадии развития сейчас находятся генеративные нейронные сети. Вообще слово генеративный в определении подразумевает, что речь идет про создание контента — текста, картинок, видео, музыки.
Работа с графикой
Профессиональные видео
Еще пару месяцев назад сгенерированные видео выглядели как набор отдельных кадров, склеенных вместе. Теперь же AI-модели научились сохранять консистентность между кадрами, где каждый следующий кадр плавно продолжает предыдущий.
Такие видео теперь выглядят как работа профессиональной команды, состоящей из оператора и специалиста по спецэффектам. Результат впечатляет.
Музыкальные таланты AI
Включите видео и звук, и вы услышите песню, которой ранее просто не существовало в мире. У нее не было автора, не было композитора. Был просто промпт: “Напиши песню о венчурном советнике Клаудии, которая отвечает на вопросы про венчурные инвестиции в джазовом исполнении”. Получилось очень даже неплохо, спасибо Suno за эту композицию.
Мультимодальные чатботы
Если раньше общаться с чат-ботами можно было только текстом, то теперь они умеют работать с голосом, фото и видео.
На самом деле картинка выбрана не случайно.
Что здесь интересного:
- Во-первых AI распознал рукописный текст на листе бумаги и понял его смысл.
- Во-вторых, он считал эмоции с лица персонажа
- В-третьих, он связал первое со вторым и понял скрытый смысл, заложенный в картинку — почувствовал сарказм в подобном сочетании.
В чем разница между B2C и B2B
Что ждет бизнес от AI? Довольно много:
- Повышение эффективности за счет автоматизации и сокращения ручного труда
- Персонализация для улучшения взаимодействия с клиентами
- Инновации в разработке продуктов, маркетинге и обслуживании клиентов
- Операционные инсайты на базе анализа внутренней информации
Безусловно, генеративный AI умеет уже очень и очень много, но есть моменты, которые требуют внимание разработчиков ведущих LLM моделей.
В первую очередь, у бизнеса есть запрос на точность информации, которая непосредственно связана с деятельностью компании.
- Нужна не просто картинка, а конкретное изображение продукции компании
- Нужно не просто распознать человека на фотографии, а уметь определить имя и фамилию сотрудника, если, например, речь идет о пропускной системе
- Нужно не просто рассказать про рынок венчура и пре-IPO, но дать подробную информацию о портфельных компаниях.
Помимо точности существуют также опасения по поводу безопасности данных при использовании AI, особенно в тех вопросах, где заходит речь о персональных данных.
Какую LLM модель мы выбрали?
По имени нашего AI-ассистента — Клаудии — можно догадаться, что мы выбрали Claude 3 от компании Anthropic. Изначально, впрочем, Клаудия не была Клаудией — в процессе исследования мы перебрали множество LLM моделей от всех известных разработчиков и в итоге остановились на Claude.
Почему?
Во-первых, нам нравится сам продукт и его направление развития. Новые версии Claude неизменно держат высокую планку, соперничая с ведущими LLM моделями от OpenAI. Свежий релиз Claude 3.5 уверенно конкурирует с GPT-4o и демонстрирует отличные результаты по ключевым метрикам..
Во-вторых, нам нравится сама компания Anthropic и тот вектор создания безопасного AI, который они выбрали. Эта философия привлекает сильнейших экспертов из индустрии, и если Open AI постоянно сопровождают корпоративные конфликты, то Anthropic наращивает экспертизу во всех ключевых направлениях.
Один из ярких примеров недавнего времени — переход из Open AI в Anthropic ведущего специалиста по безопасности Ян Лейке, цитата которого во время ухода из Open AI, заслуживает отдельного внимания:“Stepping away from this job has been one of the hardest things I have ever done, because we urgently need to figure out how to steer and control AI systems much smarter than us.”
В вольном переводе — уход из OpenAI одно из самых сложных решений в его жизни, но не потому, что он так прикипел душой к компании, а потому, что “нам нужно срочно понять, как управлять и контролировать AI системы, которые намного умнее нас”.
Немного пугает слово “срочно” и радует, что есть люди, которым это небезразлично.
В итоге мы сделали свою ставку на Claude и начали создавать нашу Клаудию.
Как бизнес учит LLM модели
Есть несколько базовых способа обучения LLM моделей.
Fine tuning
По сути компания заказывает разработку собственной LLM модели на основе существующей, она обучается на предоставленных данных и в итоге получается новая fine tuned модель.
Особенности такого подхода к обучению:
- Для такого обучения нужен большой объем данных
- Это дорого, не каждая компания сможет себе это позволить
- Каждое обучение занимает время
- При этом, как ни печально, результат не гарантирован
Retrieval Augmented Generation (RAG)
Мы для тренировки Клаудии выбрали этот метод, так как он позволяет быстрее и дешевле обучить модель на нашей внутренней информации без трансформации базовой модели.
Вместе с запросом пользователя в LLM модель отдается база знаний, которая и задает контекст будущего ответа LLM модели.
По сути, RAG объединяет сильные стороны поисковых систем (нахождение нужной информации) и языковых моделей (создание естественных и плавных ответов), чтобы предоставлять более точные и полезные ответы.
Вот как это работает простыми словами:
- Поиск: Когда вы задаете вопрос или вам нужна информация, система сначала ищет в большой коллекции документов (например, в библиотеке или базе данных), чтобы найти наиболее релевантные кусочки информации.
- Дополнение: Затем система использует найденную информацию, чтобы лучше понять тему. Этот шаг гарантирует, что ответ будет основан на точной и актуальной информации.
- Генерация: Наконец, система использует языковую модель для создания связного и уместного ответа, интегрируя информацию, найденную на этапе поиска.
Если ранее такой способ обучения моделей был ограничен размером контекстного окна, то теперь это ограничение снимается в новых версиях ведущих LLM моделей.
Что в итоге у нас получилось
В итоге получилась Клаудия — первый на рынке венчурный AI-советник, который знает и про рынок pre-IPO и венчура и обладает детальной информацией по портфельным сделкам Axevil Capital, включая последние апдейты о текущем бизнесе компаний, куда мы уже инвестировали: Anthropic, Klarna, Stripe, Revolut, Kraken, Scale AI и другие.
Пусть Клаудия расскажет сама про себя.
Как можно поговорить с нашим AI-советником?
Внимательный читатель может заметить, что Claude от Anthropic не умеет создавать визуальный образ аватара. И это абсолютная правда — для визуализации нашего Клаудии мы использовали платформу Heygen, которая в свою очередь для генерации голоса использует платформу ElevenLabs, а те, скорее всего тренировали свою модель на базе данных таких инфраструктурных игроков типа Scale AI.
Как видим в этой индустрии все взаимосвязано, все дополняет друг друга и самая приятная в этом вещь в том, что мы уже можем пользоваться результатом этих коллабораций.
Забегая вперед скажем, что визуальный аватар наша Клаудия пока не использует, но это есть в планах на будущее.
Прямо сейчас Клаудию можно найти в приложении Axevil
Также она живет в нашем телеграм-боте
Что дальше?
На Клаудию у нас большие планы — мы видим, что она помогает не только потенциальным клиентам, интересующихся венчуром, но и является отличным ассистентом для партнеров и менеджеров.
В дальнейших планах — использование AI для персонализации коммуникаций с клиентами, более четкое понимание контекста и запроса каждого, кто использует мобильное приложение Axevil.