Обзор YC W23 стартапов по аналитике

Исследовал все стартапы по аналитике из Y Combinator в батче W23. Делюсь описанием их продуктов:

Rollstack

Rollstack - автоматическое создание и обновление документов с данными

Какую проблему решают:

50% работников хотя бы раз в неделю создают слайды презентаций. 75% слайдов используются хотя бы 2 раза, 30% более 5 раз. Для каждого использования слайдов данные нужно обновлять, собирая их по частям из разных систем, каждую неделю/месяц/квартал делая одно и то же.

Продукт:

Создают веб-приложение, где можно настроить интеграцию данных в презентации

Как работает:

  • Добавляете в приложение свой документ
  • Подключаете источники данных
  • Задаете параметры интеграции
  • Графики и данные в документах автоматически обновляются согласно заданным параметрам

Фичи:

  • Поддерживает google и office приложения для документов и презентаций
  • Умеет получать данные из BI инструментов, CRM, БД с готовым SQL запросом
  • Есть версионирование документов

Вообще прикольно, но по сути, решается проблема пропасти в data-грамотности у технических и бизнес пользователей т.к. существующими BI можно легко заменить 80% презентаций, но люди продолжают ручками копировать циферки в слайды.

Brewit

Brewit - диалоговый ИИ для анализа данных

Какую проблему решают:

Напрямую не пишут, но,видимо, как обычно: анализ данных человеком = долго и дорого -> часть простых запросов от менеджеров можно решить с помощью ИИ, а аналитиков в этом процессе оставить в роли супервайзеров.

Продукт:

Веб приложение с диалоговым ИИ

Как работает:

  • Создаете рабочее пространство для своей команды
  • В пространство добавляете нужных сотрудников и управляете политиками доступа для каждого
  • В рабочем пространстве есть подключения к данным, сохраненные графики и чаты. Основная рабочая сущность - чат, т.е. диалог с ассистентом, где вы задаете вопросы, а он генерирует ответы на данных с графиками.

Фичи:

  • Встроенный каталог данных
  • Есть совместное использование, т.е. менеджер может провести какую-то аналитику с ИИ, и потом для валидации отправить результат аналитику данных
  • Настраиваемые политики безопасности, т.е. можно определять у кого какие права доступа будут
  • Есть каталог визуализаций, т.е. можно попросить ИИ генерировать графики, и потом их настраивать
  • Автоматическая аналитика - ИИ сам предлагает вопросы, которые можно задать о своих данных и добавляет свои выводы к получаемым данным

CreatorML

CreatorML - прогнозная аналитика с помощью ML для создателей контента

Какую проблему решают:

  • Успех на ютубе зависит от просмотров, но у создателей контента нет способа узнать сколько они получает просмотра до публикации
  • В попытке узнать “формулу успеха” многие пытаются выпускать много видео и быстро выгорают
  • Ютуберам надо анализировать данные, но только у крупных каналов есть на это ресурс
  • Ключевые факторы успеха на ютубе - качество заголовков и подписей

Продукт:

Расширение для хрома (для всех) и веб-приложение (для блогеров)

Как работает:

  • Загружаете в приложение метаданные планируемого ролика (длительность, превью, описание, теги и т.д.)
  • Получаете прогноз количества просмотров для видео

Фичи:

  • Высокая “насмотренность модели”, т.е. подходит для большого количества ниш и разного размера каналов.
  • Предсказания метрик для видео по метаданным
  • Рекомендации по оптимизации метаданных для видео (скажут что поправить в описании, тегах, обложке, чтобы получить больше просмотров)

Идея - на сайте сказано, что длительность видео значимо влияет на CTR ролика -> почему бы не перейти на платформу, где длительность примерно одинаковая (TikTok)

А вообще, забавно, что раньше были стартапы, создающие алгоритмы для рекомендаций контента, а теперь стартапы, разгадывающие эти алгоритмы, чтобы продвигать нужный контент.

Helicone

Helicone - самый легкий способ следить за LLM приложениями

Какую проблему решают:

Если в вашем продукте есть генеративный ИИ, вам нужны:

  • Админка, чтобы следить за диалогами, промптами и ответами
  • Данные об экономике продукта, например средняя стоимость пользовательского диалога
  • Метрики роста вашего приложения, чтобы не упереться в лимиты подписки
  • Аналитика эффективности ответов, чтобы понимать, когда пора дорабатывать модель/логику

Продукт:

Платформа мониторинга LLM приложений

Как работает:

  • Добавляете в запросы к API из своего приложения прокси к helocine
  • Получаете отчет по всей активности с вашим приложением + доп возможности для его настройки

Фичи:

  • Кеширование - сохраняет запросы = сохраняет время и деньги
  • Лимитирование - защищает ваше приложение от злоупотреблений пользователям
  • Аналитика - покажет все главные метрики LLM приложения (запросы, использование токенов, пользователи)
  • Уведомления - можно настроить триггеры, по которым будут приходить уведомления

Defog.ai

Defog.ai - доработанные LLM для анализа данных в компаниях

Какую проблему решают:

Получение данных для выводов занимаете много времени.

Продукт:

Диалоговый ИИ для задачи text-to-SQL запрос

Как работает:

  • Передаете ИИ метаданные своей базы данных
  • Внедряете ассистента defog в свое приложение
  • Настраиваете внешний вид встроенного окна
  • Запускаете пользователей задавать вопросы о данных и получать графики из текста

Фичи:

  • Адаптируемость - умеет запоминать вашу схему данных и использовать её при построении ответов
  • Точность - сделали модель, специально для задачи текст-sql, которая “из коробки” лучше всех аналогов (даже gpt4), а при использовании заданной схемы, точность близка к 99%
  • Визуализация - все полученные ответы можно автоматически представить в виде графика
  • Безопасность - ИИ не требует доступа к данным и пользуется только описанием метаданных БД

Sherloq

Sherloq - github для команд анализа данных, ИИ помощник для SQL запросов

Я смотрел этот стартап еще полгода назад, они занимались другим продуктом. Раньше делали расширение для хрома для упрощения совместной работы с SQL запросами. Описание ниже - будет о том, что делают сейчас, согласно сайту

Какую проблему решают:

Напрямую не пишут, но,видимо, как обычно: анализ данных человеком = долго и дорого, а надо быстро, доступно, дешево

Продукт:

Текстовый ИИ ассистент + надстройка с популярным редакторам кода

Как работает:

Публичного описания нового продукта еще нет

Фичи:

  • Генерация текст-SQL
  • Автодополнение кода
  • Репозиторий метрик и SQL запросов (видимо осталось с прошлой итерации продукта)
  • Интеграция с популярными редакторами SQL запросов

Honeydew

Honeydew - “дом” для логики работы с данными

Какую проблему решают:

Почему DAU никогда не совпадает в разных отчетах? Команды аналитики - отличные, но не справляются с синхронизацией всех метрик. Нет единого источника правды о расчетах и метриках.

Продукт:

Создают приложение для создания семантического слоя для DWH

Как работает:

  • Подключаете БД
  • Определяете отношения таблиц (есть опция автоматического определения)
  • Задаете кусочки логики (определяете что такое “пользователь”, что такое “активный”)
  • Используете централизованные определения в своих потоках работы с данными

Фичи:

  • Автоматически визуализирует происхождение данных для каждой метрики и её использование в разных отчетах и таблицах
  • Встроенная система контроля версий метрик и данных
  • Оптимизация запросов под *snowflake
  • Дружелюбный к инженерам UI - все настройки определяются через yaml конфиг

*snowflake - провайдер услуг по обработке данных в облаке

Baselit

Baselit - оптимизация расходов на snowflake

Какую проблему решают:

Snowflake - реально дорогой

Продукт:

Веб-приложение, которое ищет неэффективности в использовании вашего *DWH

*DWH - data warehouse - корпоративное хранилище данных

Как работает:

  • Создаете доступ с правами на чтение метаданных вашего DWH
  • Получаете рекомендации по оптимизации работы с DWH + смотрите отчетик в интерфейсе

Фичи:

  • Аналитика затрат вашего DWH
  • Автоматическая генерация рекомендаций по сокращению затрат
  • Уведомления в слак и на почту о проделанной работе по оптимизации

Mantys

Mantys - отслеживание и прогноз ARR для SaaS компаний

Какую проблему решают:

При росте компаний очень тяжело прогнозировать финансовые и продуктовые метрики, потому что сырые данные лежат в разных системах, обработанные данные лежат в эксель/гугл таблицах сотрудников. В результатае, CFO не может точно ответить даже на базовые вопросы, по типу ARR, реализованный ARR.

Продукт:

Делают платформу финансовой аналитики для компаний

Как работает:

NB. Не нашел публичного демо или описания, но частично восстановил из FAQ и скринов:

  • Платформа 3-4 недели изучает вашу бизнес-модель и источники данных
  • Через это время в платформе появляется финансовая отчетность и прогнозирование для вашей компании

Фичи:

  • Автоматизированный сбор данных из большинства систем
  • Отображение метрик и финансовые прогнозы в режиме реального времени
  • Детализация отчетов до сырых данных, т.е. можно провалиться в показатель и смотреть его во всех разрезах, которые только есть в исходных данных
  • Большой набор шаблонов финансового моделирования

Muffin Data

Muffin Data - современная аналитика для брендов потребительских товаров

Какую проблему решают:

В ретейле высокие барьеры входа в аналитику данных о продукте, потому что:

  • Данные разрознены и лежат в разных источниках
  • Почти нет автоматизации
  • Нет согласованности данных, т.к. у всех приложений своя модель данных и своя терминология.

Продукт:

Платформа данных и отчетности для ритейла.

Как работает:

  • Подключаете источники данных
  • Платформа их собирает, обрабатывает для согласованности и считает по ним стандартную аналитику
  • Стандартную аналитику можно видеть в отчетах, а для более сложных запросов можно пользоваться данными, которые были сведены воедино из разных источников

CorgiAI

CorgiAI - защита платежей от мошенничества в ecommerce и путешествиях

Какую проблему решают:

33% пользователей не возвращается в магазин после ложного отклонения платежа

750$ LTV теряется на каждые 100$ ложно отклоненных платежей

Продукт:

Софт для защиты от фрода и платформа аналитики платежей

Как работает:

  • Подключаете своего провайдера платежей
  • За 48 часов под вас создается ML модель
  • Модель запускается в онлайн работу с платежами
  • Вы можете смотреть аналитику транзакций в приложении с отчетами

Фичи:

  • Кастомная, интерпретируемся ML модель
  • Централизованная аналитика платежей
  • Система уведомлений по тригерам

Turntable

Turntable - ИИ помощник для построения потоков обработки данных

Какую проблему решают:

Хотя данные уже одна из самых важных частей современного бизнеса, их обработка зачастую сложная, долгая и дорогая. Команды аналитики тратят большую часть времени в поисках нужных данных, создании конвейеров обработки данных и выполнении разовых запросов. С учетом того, что нанимать талантливых инженеров - трудно, создание потоков данных в компании стало узким горлышком развития и аналитики бизнеса.

Продукт:

Второй пилот для DBT

* DBT - фреймворк с открытым исходным кодом для выполнения, тестирования и документирования SQL-запросов

Фичи:

  • Интеграция с git
  • Автоматический исследовательский анализ данных
  • Есть режим песочницы с ускорением и виртуальной средой
  • Построение истории изменения данных вплоть до каждой колонки

Итоги:

3/12 делают диалогового ИИ для анализа данных в общем виде (Brewit, Defog.ai, Sherloq)

4/12 делают ML/ИИ для конкретной задачи:

  • Muffin data - платформа аналитики для товаров повседневного спроса
  • Mantys - финансовая аналитика для SaaS
  • Helicone - аналитика приложений, использующих LLM
  • CorgiAI - аналитика платежей

4/12 делают промежуточный слой в процессе работы с данными в компании:

  • Rollstack - автоматизация сбора данных для презентаций
  • Honeydraw - централизованное хранилище метрик и понятий для аналитики в компании
  • Turntable - ускорение и упрощение работы по трансформации данных в компании
  • Baselit - автоматизация кост-контроля и оптимизации работы с DWH

Спасибо, что дочитали до конца.

О своем пути аналитика данных в стартапы рассказываю в канале https://t.me/ppbaboshkin, подписывайтесь, если интересно)

11
17 комментариев