DataFormulator? А, это тот инструмент для красивых графиков?
Слышал это уже десять раз. И каждый раз хочется сказать:
ты, дружище, смотришь на Ferrari и думаешь, что это просто удобный диван на колёсах.
DataFormulator воспринимают как очередной визуализатор. Мол, подгрузил табличку, накидал парочку графиков — и пошёл хвастаться дешбордами.
Но под капотом у него — реальный движок обработки данных.
Причём не как у Excel, где ты ломаешь голову с формулами и миллионными ячейками.
И не как у BI-инструментов, где сначала надо защитить диссертацию по DAX.
DataFormulator — это визуальный язык трансформации данных.
С блоками, условиями, обогащением, логикой, AI, пайплайнами.
Похоже на n8n или Node-RED, но не для автоматизации — для аналитического мышления.
Что ты реально можешь делать с DataFormulator
Это среда, в которой ты сам собираешь обработку данных из блоков — прозрачно, контролируемо, логично.
Если в Excel формулы быстро превращаются в кашу, а в Python нужно настраивать окружение, то тут ты работаешь как инженер, но без необходимости писать код.
Рассмотри на задаче:
📊 Выгрузка продаж тапочек с Ozon — 10 000 товаров
📦 866 продавцов
💸 34 признака: цены, отзывы, бренды, рейтинги, категории
И вам надо:
- сгруппировать по продавцам
- посчитать доли, сегменты, средние
- добавить колонку, которая будет вычислять категорию товара: "Бюджетный / Средний / Премиум", исходя из медианы по категории или динамики цен
- показать структуру ассортимента
Шаг 1 — Группировка по продавцам
Как это делается в Google Sheets
Как это делается в DataFormulator
1. Подгружаем CSV (или Excel, или через API)
2. Выбираем инструмент для создания таблиц
3. Пишем запрос ИИ модели, в моем случае это GPT-4o (ИИ тут не проводит анализ, а генерирует код для него, из-за этого получаем максимальную точность)
Получаем сводную таблицу по продавцам, получили 866 уникальных продавцов и средние метрики (времязатраты 3 минуты, идеальная точность, потому что Python).
Шаг 2 — Сегментация по цене: «Бюджетный / Средний / Премиум»
Теперь у нас есть 866 продавцов и сводка по каждому.
Следующая задача — добавить ценовой сегмент к каждому товару, но не просто «на глаз», а на основе медианы в своей категории.
Как это делается в Google Sheets
- =MEDIAN(FILTER(B2:B10000, C2:C10000=Категория))
- для каждой категории вручную или через массив.
- Если цена < медиана * 0.8 → “Бюджетный”
- Если в пределах ±20% → “Средний”
- Если > медиана * 1.2 → “Премиум”
⚠ Итог — 10 строк формул, которые тронешь — всё развалится.
Как это делается в DataFormulator
1. Пишем новый запрос
Получаем новую колонку с точной, прозрачно рассчитанной категорией.
💡 Весь процесс — в виде пайплайна из блоков. Каждый шаг можно увидеть, изменить и объяснить. Никакой магии, всё прозрачно.
Что дальше?
Можно переходить от подготовки данных к анализу поведения и стратегий.
И вот тут DataFormulator раскрывает второе дыхание.
Что можно сделать на этом этапе:
1. Построить графики распределения
2. Сделать сводные таблицы по каждому сегменту
3. Посчитать корреляции между признаками
То, что я показал — это только первый слой.
Группировка, сегментация, расчёт долей, сводки, графики, корреляции — всё это можно собрать в DataFormulator без единой строчки кода, но с полной прозрачностью логики.
Но на этом всё не заканчивается. Наоборот — только начинается.
В отдельном гайде я показывал, как в Google Таблицах можно обучить простую прогнозную модель:
📈 Как изменяется конверсия из показа в заказ при изменении доли рекламного оборота.
Сложно? Нет.
Долго? Возможно.
Полезно? Безумно.
Если у вас будут вопросы, вы всегда можете написать мне в телегу и я с радостью всем помогу - t.me/rcp_ai