Обзор YC W23 стартапов по аналитике
Исследовал все стартапы по аналитике из Y Combinator в батче W23. Делюсь описанием их продуктов:
Rollstack
Rollstack - автоматическое создание и обновление документов с данными
Какую проблему решают:
50% работников хотя бы раз в неделю создают слайды презентаций. 75% слайдов используются хотя бы 2 раза, 30% более 5 раз. Для каждого использования слайдов данные нужно обновлять, собирая их по частям из разных систем, каждую неделю/месяц/квартал делая одно и то же.
Продукт:
Создают веб-приложение, где можно настроить интеграцию данных в презентации
Как работает:
- Добавляете в приложение свой документ
- Подключаете источники данных
- Задаете параметры интеграции
- Графики и данные в документах автоматически обновляются согласно заданным параметрам
Фичи:
- Поддерживает google и office приложения для документов и презентаций
- Умеет получать данные из BI инструментов, CRM, БД с готовым SQL запросом
- Есть версионирование документов
Вообще прикольно, но по сути, решается проблема пропасти в data-грамотности у технических и бизнес пользователей т.к. существующими BI можно легко заменить 80% презентаций, но люди продолжают ручками копировать циферки в слайды.
Brewit
Brewit - диалоговый ИИ для анализа данных
Какую проблему решают:
Напрямую не пишут, но,видимо, как обычно: анализ данных человеком = долго и дорого -> часть простых запросов от менеджеров можно решить с помощью ИИ, а аналитиков в этом процессе оставить в роли супервайзеров.
Продукт:
Веб приложение с диалоговым ИИ
Как работает:
- Создаете рабочее пространство для своей команды
- В пространство добавляете нужных сотрудников и управляете политиками доступа для каждого
- В рабочем пространстве есть подключения к данным, сохраненные графики и чаты. Основная рабочая сущность - чат, т.е. диалог с ассистентом, где вы задаете вопросы, а он генерирует ответы на данных с графиками.
Фичи:
- Встроенный каталог данных
- Есть совместное использование, т.е. менеджер может провести какую-то аналитику с ИИ, и потом для валидации отправить результат аналитику данных
- Настраиваемые политики безопасности, т.е. можно определять у кого какие права доступа будут
- Есть каталог визуализаций, т.е. можно попросить ИИ генерировать графики, и потом их настраивать
- Автоматическая аналитика - ИИ сам предлагает вопросы, которые можно задать о своих данных и добавляет свои выводы к получаемым данным
CreatorML
CreatorML - прогнозная аналитика с помощью ML для создателей контента
Какую проблему решают:
- Успех на ютубе зависит от просмотров, но у создателей контента нет способа узнать сколько они получает просмотра до публикации
- В попытке узнать “формулу успеха” многие пытаются выпускать много видео и быстро выгорают
- Ютуберам надо анализировать данные, но только у крупных каналов есть на это ресурс
- Ключевые факторы успеха на ютубе - качество заголовков и подписей
Продукт:
Расширение для хрома (для всех) и веб-приложение (для блогеров)
Как работает:
- Загружаете в приложение метаданные планируемого ролика (длительность, превью, описание, теги и т.д.)
- Получаете прогноз количества просмотров для видео
Фичи:
- Высокая “насмотренность модели”, т.е. подходит для большого количества ниш и разного размера каналов.
- Предсказания метрик для видео по метаданным
- Рекомендации по оптимизации метаданных для видео (скажут что поправить в описании, тегах, обложке, чтобы получить больше просмотров)
Идея - на сайте сказано, что длительность видео значимо влияет на CTR ролика -> почему бы не перейти на платформу, где длительность примерно одинаковая (TikTok)
А вообще, забавно, что раньше были стартапы, создающие алгоритмы для рекомендаций контента, а теперь стартапы, разгадывающие эти алгоритмы, чтобы продвигать нужный контент.
Helicone
Helicone - самый легкий способ следить за LLM приложениями
Какую проблему решают:
Если в вашем продукте есть генеративный ИИ, вам нужны:
- Админка, чтобы следить за диалогами, промптами и ответами
- Данные об экономике продукта, например средняя стоимость пользовательского диалога
- Метрики роста вашего приложения, чтобы не упереться в лимиты подписки
- Аналитика эффективности ответов, чтобы понимать, когда пора дорабатывать модель/логику
Продукт:
Платформа мониторинга LLM приложений
Как работает:
- Добавляете в запросы к API из своего приложения прокси к helocine
- Получаете отчет по всей активности с вашим приложением + доп возможности для его настройки
Фичи:
- Кеширование - сохраняет запросы = сохраняет время и деньги
- Лимитирование - защищает ваше приложение от злоупотреблений пользователям
- Аналитика - покажет все главные метрики LLM приложения (запросы, использование токенов, пользователи)
- Уведомления - можно настроить триггеры, по которым будут приходить уведомления
Defog.ai
Defog.ai - доработанные LLM для анализа данных в компаниях
Какую проблему решают:
Получение данных для выводов занимаете много времени.
Продукт:
Диалоговый ИИ для задачи text-to-SQL запрос
Как работает:
- Передаете ИИ метаданные своей базы данных
- Внедряете ассистента defog в свое приложение
- Настраиваете внешний вид встроенного окна
- Запускаете пользователей задавать вопросы о данных и получать графики из текста
Фичи:
- Адаптируемость - умеет запоминать вашу схему данных и использовать её при построении ответов
- Точность - сделали модель, специально для задачи текст-sql, которая “из коробки” лучше всех аналогов (даже gpt4), а при использовании заданной схемы, точность близка к 99%
- Визуализация - все полученные ответы можно автоматически представить в виде графика
- Безопасность - ИИ не требует доступа к данным и пользуется только описанием метаданных БД
Sherloq
Sherloq - github для команд анализа данных, ИИ помощник для SQL запросов
Я смотрел этот стартап еще полгода назад, они занимались другим продуктом. Раньше делали расширение для хрома для упрощения совместной работы с SQL запросами. Описание ниже - будет о том, что делают сейчас, согласно сайту
Какую проблему решают:
Напрямую не пишут, но,видимо, как обычно: анализ данных человеком = долго и дорого, а надо быстро, доступно, дешево
Продукт:
Текстовый ИИ ассистент + надстройка с популярным редакторам кода
Как работает:
Публичного описания нового продукта еще нет
Фичи:
- Генерация текст-SQL
- Автодополнение кода
- Репозиторий метрик и SQL запросов (видимо осталось с прошлой итерации продукта)
- Интеграция с популярными редакторами SQL запросов
Honeydew
Honeydew - “дом” для логики работы с данными
Какую проблему решают:
Почему DAU никогда не совпадает в разных отчетах? Команды аналитики - отличные, но не справляются с синхронизацией всех метрик. Нет единого источника правды о расчетах и метриках.
Продукт:
Создают приложение для создания семантического слоя для DWH
Как работает:
- Подключаете БД
- Определяете отношения таблиц (есть опция автоматического определения)
- Задаете кусочки логики (определяете что такое “пользователь”, что такое “активный”)
- Используете централизованные определения в своих потоках работы с данными
Фичи:
- Автоматически визуализирует происхождение данных для каждой метрики и её использование в разных отчетах и таблицах
- Встроенная система контроля версий метрик и данных
- Оптимизация запросов под *snowflake
- Дружелюбный к инженерам UI - все настройки определяются через yaml конфиг
*snowflake - провайдер услуг по обработке данных в облаке
Baselit
Baselit - оптимизация расходов на snowflake
Какую проблему решают:
Snowflake - реально дорогой
Продукт:
Веб-приложение, которое ищет неэффективности в использовании вашего *DWH
*DWH - data warehouse - корпоративное хранилище данных
Как работает:
- Создаете доступ с правами на чтение метаданных вашего DWH
- Получаете рекомендации по оптимизации работы с DWH + смотрите отчетик в интерфейсе
Фичи:
- Аналитика затрат вашего DWH
- Автоматическая генерация рекомендаций по сокращению затрат
- Уведомления в слак и на почту о проделанной работе по оптимизации
Mantys
Mantys - отслеживание и прогноз ARR для SaaS компаний
Какую проблему решают:
При росте компаний очень тяжело прогнозировать финансовые и продуктовые метрики, потому что сырые данные лежат в разных системах, обработанные данные лежат в эксель/гугл таблицах сотрудников. В результатае, CFO не может точно ответить даже на базовые вопросы, по типу ARR, реализованный ARR.
Продукт:
Делают платформу финансовой аналитики для компаний
Как работает:
NB. Не нашел публичного демо или описания, но частично восстановил из FAQ и скринов:
- Платформа 3-4 недели изучает вашу бизнес-модель и источники данных
- Через это время в платформе появляется финансовая отчетность и прогнозирование для вашей компании
Фичи:
- Автоматизированный сбор данных из большинства систем
- Отображение метрик и финансовые прогнозы в режиме реального времени
- Детализация отчетов до сырых данных, т.е. можно провалиться в показатель и смотреть его во всех разрезах, которые только есть в исходных данных
- Большой набор шаблонов финансового моделирования
Muffin Data
Muffin Data - современная аналитика для брендов потребительских товаров
Какую проблему решают:
В ретейле высокие барьеры входа в аналитику данных о продукте, потому что:
- Данные разрознены и лежат в разных источниках
- Почти нет автоматизации
- Нет согласованности данных, т.к. у всех приложений своя модель данных и своя терминология.
Продукт:
Платформа данных и отчетности для ритейла.
Как работает:
- Подключаете источники данных
- Платформа их собирает, обрабатывает для согласованности и считает по ним стандартную аналитику
- Стандартную аналитику можно видеть в отчетах, а для более сложных запросов можно пользоваться данными, которые были сведены воедино из разных источников
CorgiAI
CorgiAI - защита платежей от мошенничества в ecommerce и путешествиях
Какую проблему решают:
33% пользователей не возвращается в магазин после ложного отклонения платежа
750$ LTV теряется на каждые 100$ ложно отклоненных платежей
Продукт:
Софт для защиты от фрода и платформа аналитики платежей
Как работает:
- Подключаете своего провайдера платежей
- За 48 часов под вас создается ML модель
- Модель запускается в онлайн работу с платежами
- Вы можете смотреть аналитику транзакций в приложении с отчетами
Фичи:
- Кастомная, интерпретируемся ML модель
- Централизованная аналитика платежей
- Система уведомлений по тригерам
Turntable
Turntable - ИИ помощник для построения потоков обработки данных
Какую проблему решают:
Хотя данные уже одна из самых важных частей современного бизнеса, их обработка зачастую сложная, долгая и дорогая. Команды аналитики тратят большую часть времени в поисках нужных данных, создании конвейеров обработки данных и выполнении разовых запросов. С учетом того, что нанимать талантливых инженеров - трудно, создание потоков данных в компании стало узким горлышком развития и аналитики бизнеса.
Продукт:
Второй пилот для DBT
* DBT - фреймворк с открытым исходным кодом для выполнения, тестирования и документирования SQL-запросов
Фичи:
- Интеграция с git
- Автоматический исследовательский анализ данных
- Есть режим песочницы с ускорением и виртуальной средой
- Построение истории изменения данных вплоть до каждой колонки
Итоги:
3/12 делают диалогового ИИ для анализа данных в общем виде (Brewit, Defog.ai, Sherloq)
4/12 делают ML/ИИ для конкретной задачи:
- Muffin data - платформа аналитики для товаров повседневного спроса
- Mantys - финансовая аналитика для SaaS
- Helicone - аналитика приложений, использующих LLM
- CorgiAI - аналитика платежей
4/12 делают промежуточный слой в процессе работы с данными в компании:
- Rollstack - автоматизация сбора данных для презентаций
- Honeydraw - централизованное хранилище метрик и понятий для аналитики в компании
- Turntable - ускорение и упрощение работы по трансформации данных в компании
- Baselit - автоматизация кост-контроля и оптимизации работы с DWH
Спасибо, что дочитали до конца.
О своем пути аналитика данных в стартапы рассказываю в канале https://t.me/ppbaboshkin, подписывайтесь, если интересно)