Yadrex: история о том, как нейросети начали собирать семантическое ядро
Представьте, вы владеете информационным ресурсом: на вашем сайте публикуется крутой и уникальный материал, казалось бы, что всё идет по плану, но как всегда есть одно «НО». Ваш труд остается просто незамеченным, вы не знаете о чём писать дальше, в ТОПах поисковиков появляетесь редко, если никогда, а выгоды с этого практически никакой. Что же делать?
Предыстория
Наша команда занимается созданием информационных сайтов, основной контент которых — это обучающие статьи и другой письменный материал. На началах, мы работали без полноценной семантики, используя тайтлы конкурентов, подобным образом генерируя собственные темы для статей на сайт. Могло бы это продолжаться и дальше, если бы просто не поняли, что, все идеи конкурентов были исчерпаны — мы просто столкнулись с самым настоящим дефицитом тем для статей.
Итог: Чтобы найти идею для технического задания, человеческих ресурсов стало недостаточно, так как это начало занимать много времени и сил. Но там где не может справится человек, с этим вполне может разобраться система, верно?
Немного о семантике
Если вы закончили филологический или лингвистический факультет, а диплом используете как комфортабельную досточку для нарезания продуктов, возможно вы ещё не забыли о широком понятии семантики. Семантика — это наука о слове и смысловом значении единиц, которые использовались в нём.
Но в нашей работе термин «семантика» подразумевает работу с семантическим ядром — набором ключевых слов, что описывает запросы пользователей по определенной теме, которую он хочет узнать и увидеть в сети интернет.
И что? Проблема решена?
Мысли мыслями, а шоу должно продолжаться: темы генерироваться, а работа ускоряться во благо великой продуктивности. Выходом из сложившейся ситуации стало использование в работе семантического ядра. Специалисты по классической схеме начали искать релевантные ключевые запросы в соответствующих базах и сервисах в связке с Key Collector, систематизируя полученную информацию в Excel.
Идеи для статей появились на свет, в работе возникла белая полоса, но все же как показывает практика, только желание изменять что-либо и рушить старые устои помогают жить проще и лучше.
«Взбунтовалась» наша команда даже не из-за того что закончился сахар и чай в офисной кухне, а из-за того, что способ работы, описанный выше, был очень скучным и "не очень быстрым". Настало время совершенствоваться.
«Перемен! Мы ждем перемен!»
В апреле 2018 года, мы обратились за помощью к нашим киевским коллегам из Аrtellence. Их основная деятельность заключается в том, что они занимаются искусственным интеллектом, нейросетями и внедрением ИИ в разные сферы жизни.
Нам очень хотелось научить ИИ генерировать главные ключи, а к ним и второстепенные. Создать чисто автоматический сервис сбора семантического ядра без участия человека.
Вот так, благодаря простой, но очень эффективной формуле «ИИ+Семантическое ядро» и появилось детище нашей компании «Yadrex» — платформа, на которой семантические ядра собирает Искусственный Интеллект.
Достоинства, недостатки и большое желание совершенствоваться!
Создав платформу в июне 2018, мы вышли на рынок семантики, представив свой уникальный продукт.
Наша семантика оказалась в разы дешевле рынка, который предлагает подобные услуги и, между прочим, не хуже по качеству работы, что не могло не радовать. Но мы не хотим вам показаться хвастливыми и вот такими идеальными, всё же в процессе были моменты, которые мы активно совершенствовали:
- Созданный алгоритм, был далёк от идеала из-за того, что выдавал не все релевантные ключи.
- Система очень часто давала сбои и из-за этого мы часто затягивали с дедлайнами.
- Мы использовали только свою базу ключей, которая была недостаточно полной (пропускали порядком 10-20%).
Ну и вообще, кто говорил что будет легко?
Чтобы решить эти проблемы, в сентябре 2018 года, мы начали улучшать сервис. Работа над ошибками заключалась в том, что мы около трёх раз меняли программный алгоритм, увеличивали (и увеличиваем) собственную базу ключей, начали использовать (и используем) другие источники поисковых запросов при сборе ядра и несколько раз полностью меняли процесс работы.
Без "рук" всё же не обошлось, каждый ключ который обрабатывает ИИ, должен проверить человек, чтобы избежать неточностей в процессе. Поэтому ИИ только помогает семантикам, работать лучше и быстрее, а не полностью заменил ручную работу. Как думают некоторые наши клиенты :).
Но время было потрачено не зря! Данные изменения стоили того — по отзывам наших клиентов, сейчас мы лучшие на рынке. Заказчик получает качественное семантическое ядро в минимальные сроки за разумную цену. Наша команда, наконец-то, достигла нужных результатов. Но, мы всё так же готовы улучшаться и достигать высот.
Забота о клиентах, фидбэк
Во всяком случае, на тот результат, который нам удалось достичь, во многом повлияло наше community — пользователи, которые своими отзывами любезно указывают на наши достоинства и недостатки, делая нас и наши продукты в разы лучше и качественней. За что вам отдельно "Спасибо"!
А вы сможете составить семантическое ядро для англоязычных проектов?
привет) в конце этого месяца сбор СЯ для интернет магазина запускаем только как услугу, а дальше будем изучать бурж проекты, так что присоединяйся в телегу или в вк (vk.com/yadrex) мы обязательно сделаем анонс :)