DataHub: от идеи с vc.ru до реализации платформы за 2.5 месяца
Привет, меня зовут Андрей Шмиг и я основатель и разработчик сервиса DataHub - Crowd Data Sourcing at Hand. Расскажу, как от интернет-магазина скриптов продаж дошел до продажи структурированых данных и почему продажа результатов интеллектуальной работы это всегда интересно.
Предыстория
Почти 9 лет мы с партнёром занимались колл-центрами, удаленными отделами продаж и сдачей операторов в аренду - через наши руки прошли такие проекты как ЕМИАС, ВВ (Вызов врача на дом), ЕДЦ (Единый диспетчерский центр) и множество коммерческих B2B проектов.
Года три-четыре назад мы вышли на продажу франшизы имея своё собственное ПО по управлению финансами, телефонией, роботами и воронками продаж (workflow заявок, если быть точным) - iCSP (Intelligent Customer Service Platform с патентом на разработку). Продали 20 франшиз, а потом решили, что с нас довольно и избавились от всего. От всего, включая один из маленьких, но полезных сервисов, который родился внутри компании - конструктор скриптов продаж с виджетом для amoCRM и встроенной базой сценариев.
Те, кто хоть как-то сталкивался с колл-центрами или аутсорсингом продаж понимают, что 80% времени ты работаешь над одноразовыми проектами под которые у тебя скрипт + база + телефония. Если с базой и телефонией изначально было всё понятно, то со скриптами мы встряли, потому что не все франчайзи умели писать скрипты, а не все скриптологи были одинаково хороши. Оптимальным на тот момент нам казалась идея разработать базу готовых шаблонов скриптов продаж и дать доступ к ней всем нашим франчайзи, а во внешний мир эти скрипты продавать.
На момент запуска интернет-магазина скриптов у нас не было иллюзий по финансам - миллионов не ожидали, вкинув пару тысяч в рекламу и ужаснувшись стоимости лида и конечной покупки мы отложили это дело и позволили сервису плавать самому на SEO-трафике.
Медленно, но верно, сервис начал приносить доход. Именно в тот момент, даже с количеством покупок скриптов в месяц около 10-15 шт, я начал понимать, что этот формат мне нравится - 0 претензий, минимум контактов с недовольными клиентами, минимум запросов на "переработать" или "добавить ещё возражение", больше благодарностей от пользователей в чате поддержки, никаких возвратов.
Сервис продаётся вместе с остальным бизнесом и влажные мечты о потоке денег с минимумом усилий улетучиваются с небывалой скоростью, но тёплые воспоминания остаются ещё на долгое время.
Парсинг сайтов и Максим Кульгин
Есть на свете герои, на vc.ru их тоже хватает и одним из таких был - Макс Кульгин, который достаточно часто публикует и публиковал статьи по теме парсинга сайтов, а так же разрабатывает сервис по защите от скликивания рекламы.
На тот момент, когда я только знакомился с первыми его статьями по парсингу сайтов и доходам с этого направления, у меня было ровно 0 мыслей, что я полезу в это направление. Причины? Низкий вход, большая конкуренция, низкая маржинальность, проектная работа.
Чтобы убедиться в количестве конкурентов достаточно было зайти на Kwork и поискать запросы на написание парсеров или предоставление услуг парсинга.
Тем не менее, читал статью за статьёй от Максима - иногда внимательно, а иногда по диагонали и прекратив вовсе читать после получения им гранта от ФСИ на исследования для сервиса по скликиванию рекламы. В то же время я был подписан на его телеграм канал в котором было больше воды, но и больше целевой аудитории хоть как-то заинтересованной в его направлениях с постоянными обсуждениями и сериями вопрос-ответ.
За один из таких вопросов я и зацепился: почему не думаете над сервисной историей и не реализуете что-то более масштабируемое?
Действительно, почему? По словам самого Максима в чате - желание есть, а вот идей - нет.
С одной стороны было странно слышать, что нет идей, хотя на рынке есть много примеров организаций, которые продают нишевые данные - export-base, или rusprofile, или dadata. С другой стороны - картина мира одного человека не может быть идентичной картине мира другого человека, поэтому взгляды на этот бизнес могли сильно отличаться у Максима и тех людей, кто ему эти вопросы задавал.
В этой истории меня больше цеплял уже не сам факт отсутствия идей у коллег по ИТ, а то, что у меня в голове начало вырисовываться после изучения его статей, комментариев в чате, заявок на Кворке и направления связанного с данными в целом.
Я начинаю углубляться и смотреть дальше... смотреть на...
Открытые государственные данные
Сомневаюсь, что есть на vc.ru люди, которые не слышали про rusprofile и подобные сервисы, которые перепродают данные ФНС на регулярной основе - выгружают, чистят, склеивают, отображают и предоставляют платный API или доступ из личного кабинета. Чем вам не бизнес?
150 000 руб стоит годовая "подписки" на эти данные от самой ФНС, но кроме ФНС есть и другие ведомства, которые открывают данные и их можно бесплатно выгрузить в форматах JSON, XML, CSV.
На vc.ru не единожды уже мелькали статьи тех, кто на добровольных началах эти данные приводил в порядок и открывал широкой публике бесплатно, что начало меня наводить на мысль о необходимости разработки единого подхода к решению проблемы доступа (поделиться, купить, продать) к структурированным данным, как коммерческим, так и публичным (бесплатным).
В другой аналогичной статье разработчик собирал донаты - 200 000 рублей на новые сервера. Собрал ли он в итоге донаты не знаю, но попытки есть и они будут повторяться.
Если смотреть на это направление, как на потенциальный бизнес, то каждый желающий пройдет через следующие этапы:
- Разработка сервиса;
- Закупка данных;
- Подключение оплаты;
- Маркетинг;
- Договора, акты, счета.
Если брать каждый пункт отдельно, то проблем нет, но как только пытаешься брать все пункты, то понимаешь, что становишься в один ряд со множеством других компаний и вступаешь с ними в прямую конкуренцию. При прочих равных начинает решать маркетинг, который, чаще всего, у чистых разработчиков уровнем ниже их скиллов по разработке. Привет из статьи Романа Рабочего про маркетолога и никому ненужный (в кавычках) сервис.
Заходить конкретно в это направление у меня желания не было. Почему? Высокая конкуренция, необходимость в большом маркетинговом бюджете на старте, отсутствие уникальности предложения (какое интересное УТП тут может быть?), работа с B2B в чистом виде. НО! Деньги тут есть, а значит само направление государственных данных отбрасывать не стоило.
Отличаются ли процессы продажи данных парсинга сайтов от продажи данных ФНС чем-то? Нет. Абсолютно.
Куда двигаться дальше?
На этом этапе стало четко понятно, что мне интересно этим заняться - продажей данных любого рода, но вопрос оставался - как именно к этому подойти так, чтобы не прогореть и по пути не выгореть.
Во-первых, от прямой конкуренции я отказался сразу, потому что борьба с крупными / средними компаниями в поле маркетинга и бюджетов это не то, куда мне хотелось погружаться и я понимал, что на реализацию идеи (будущей) будет достаточно ограниченное время и бюджет. Если борьба с индивидуальными разработчиками, то полем борьбы становится опыт в этом направлении (если несколько лет продаешь на Кворке парсеры, то очевидно, что уже есть под рукой много готовых решений), а так же стоимость оказываемых услуг - демпинг, что не менее ужасно.
Во-вторых, мне, по сути, необходимо будет технологически и по опыту догонять тех, кто в этом бизнесе дольше, а значит отставание будет на протяжении первых 3-6 месяцев, что не сильно радовало.
Опыт интернет-магазина скриптов продаж подсказывал, что стоит применить такую же модель - платформа. Открытая платформа, где пользователи смогут делиться, покупать и продавать данные. И, в качестве безопасного варианта, на случай провала самой платформы, как инструмента распространения структурированных данных любого рода - самому становиться пользователем, который собирает, публикует и продаёт данные.
Со скриптами продаж было аналогично - франчайзи разрабатывали, мы добавляли скрипты с их согласия в базу и продавали. Если у нас самих была возможность разработать скрипт в свободное время и добавить в интернет-магазин - мы это делали. Почему бы и сейчас не применить такой подход?
Его я и решил применить смешав ещё с несколькими моделями (бизнеса и аудиторий), которые на протяжении некоторого времени влияли на моё представление о том, что должно в результате получиться - машинное обучение и data-science.
Следующая часть будет интересна разработчикам, аналитикам и дата-саентистам - я покажу, как работать с бесплатными, спонсируемыми и коммерческими репозиториями данных на платформе DataHub.
Если вам понравилась статья - ставьте лайк, подписывайтесь на канал DataHub на vc.ru и вступайте в чат поддержки сервиса в Телеграм.
Оставляйте свои вопросы и я отвечу на них, а если необходимо - дополню статью. Понимаю, что в статье может быть некоторая незавершенность и недосказанность, поэтому буду искренне рад, если в комментариях подскажете, чем дополнить.
Ссылка на DataHub редиректит на другой сайт, еще и с вирусами (
Проект свернул, домен выкинул.