Я работаю менеджером продуктов. В рамках рабочих и личных проектов время от времени делаю аналитику данных. Одни из самых популярных задач для меня во время анализа — поиск зависимостей, прогнозирование, деление клиентов на группы, поиск аномалий/инсайтов. То есть стандартные задачи ML. Для этого я беру готовые ML-библиотеки немного причесываю данные, запускаю обучение модели и затем работаю с ней. Это относительно несложный, но утомительный процесс. У меня есть несколько шаблонов кода для разных ситуаций. Но даже тут надо запускать среду разработки, писать код и прочее. В итоге я пришел к идее еще больше автоматизировать процесс работы с ML и, заодно, дать инструмент для тех, кто не готов писать код, но хочет так же иметь возможность решать схожие задачи в своих проектах. Так родилась идея сделать no-code сервис "ML для домохозяек"👵., который в последствии получил название goML.
Так это ML или бот просто считает корреляцию одного параметра относительного другого?
Никита, в бета-версии показываем пока только влияние параметров на результат. Прогнозирование в процессе. Хочется понять в каком виде его удобнее для пользователей реализовывать — одним общим файлом грузить группу объектов или руками забивать параметры прямо в боте (случай, когда надо предсказать для единичного объекта). Что для вас более востребовано было бы? Можете, пожалуйста, рассказать для чего используете классификацию?
Антон, подскажите пожалуйста как лучше реализовать. Есть задача проверки корректности имён. В базе есть 10000 клиентов, но не все из них корректно заполнены.
К примеру, одно из некорректных имен: Ирина Красные волосы
Андрей Мелочный
ИРина ДОБрова
Пример из корректных:
Александр
Ирина Доброва
Какие нужны будут параметры?
Кол-во букв, наличие мат слов, более 2ух заглавных, более 2ух слов и т.д.
наличие мат словНаличие математических терминов? ;)
Тут ML не нужен
Султан, это задача из NLP и тут лучше взять библиотеку для анализа текста и применить для своих нужд. Рекомендую обратить внимание на Spacy. Примерно полгода назад сам на ней написал несложный анализатор текстов для своих задач. Там можно доставать часть речи и, если это прилагательное или глагол, то отсеивать. Но надо тестировать и дотачивать решение так как, кажется, что многие фамилии очень похожи на прилагательные и, как вариант, надо добавлять специальные шаблоны для дополнительной проверки.
Если нужна реализация "под ключ" - пишите в личку, попробуем что-нибудь придумать.
Бесспорно, идея хорошая) желаю Вам удачи)