Унификация данных для e-commerce: как AI упрощает работу с характеристиками товаров
Привет, я Михаил Шрайбман, основатель веб-интегратора «Осьминожка». Мы занимаемся разработкой для среднего и крупного бизнеса, а также одними из первых начали внедрять ИИ в бизнес-процессы наших клиентов.
В последние два года всё больше компаний из сферы e-commerce обращаются к внедрению AI-решений для разных задач. Например, для обработки большого объёма данных. Я попросил своего коллегу — Дениса Нагаева, сооснователя и технического директора «Осьминожки» рассказать об этом подробнее.
Проблема. Часто продавцу данные о товарах поступают в разрозненном виде — в одном большом текстовом блоке, откуда сложно вычленить нужную информацию, в разных единицах измерения или в разном виде. И эти данные нужно разделить и привести к единому формату. Обычно такие данные обрабатывают вручную и это очень долго.
Решение. Задачу можно значительно упростить с помощью ИИ — с применением больших генеративных моделей.
Такие модели способны:
- Выделять характеристики из неструктурированного текста. Например,длина, ширина и вес извлекаются из него и распределяются по соответствующим блокам.
- Создавать JSON-файлы с упорядоченной информацией.
Для этого используется специальный фреймворк- Мы, например, используем LangChain. Он позволяет настраивать подсистему на базе ИИ, задавая ей правила обработки данных. Результат — автоматизированный процесс, где из неструктурированного текста генерируется структурированный документ.
Как это работает?
Алгоритм работы следующий:
Скрипт на сайте берёт информацию о товарах из стороннего источника, например, из Excel-таблицы → Эти данные отправляются по API в подсистему искусственного интеллекта → Модель анализирует текст, выделяет характеристики и возвращает результат в формате JSON, где каждая характеристика привязана к своему уникальному ID → Сайт получает готовый JSON-файл и загружает товар с уже структурированными данными.
Пример использования:
Рассмотрим какой-нибудь аграрный или промышленный маркетплейс. Например, по продаже зерна. Продавцы часто самостоятельно описывают продукцию: «Продаю 10 тонн пшеницы, урожай 2023 года, в мешках». Такое описание не подходит для фильтрации: данные не структурированы, объём указан в разных единицах.
С помощью подсистемы AI текст обрабатывается, и из него выделяются ключевые характеристики:
- Продукт: пшеница.
- Вес: 10 тонн.
- Год урожая: 2023.
- Упаковка: мешки.
Эти данные формируются в JSON-файл, который затем передаются на сайт. В итоге пользователь получает возможность отфильтровать объявления, ориентируясь на важные для него параметры товара. А продавец, не нагружая себя, сохраняет привычный для себя формат ввода.
Ещё раз о главном: преимущества подхода
- Автоматизация процессов. Уменьшается объём ручной работы, экономятся ресурсы продавцов, менеджеров и других сотрудников, задействованных в цепочке.
- Улучшение поиска. Фильтры на сайте работают корректнее благодаря унификации данных.
- Гибкость. AI можно настроить для обработки данных в любых форматах.
- Экономия времени. Импорт товара ускоряется за счёт автоматизированной обработки.
Такой подход открывает новые возможности для e-commerce.