Как обучить нейросеть в Teachable Machine и автоматически пройти капчу Amazon
В этой статье мы создадим и обучим собственную нейросеть с помощью Google Teachable Machine и разработаем API для автоматического решения капчи Amazon.
Будем решать нашу задачу в несколько этапов:
Постановка задачи и анализ входных данных
Давайте предположим, что перед нами стоит задача: получить данные об 1 млн товаров размещенных на Амазон.
Чтобы получить доступ к официальному API Amazon потребуется зарегистрироваться в их реферальной программе, совершить в течении 180 дней 3 продажи и получить одобрение от модераторов Амазон.
Можно воспользоваться веб-скрейпингом. И вот тут мы столкнемся с капчей Amazon:
Давайте посмотрим какие есть готовые решения для решения капчи:
Итак, будем делать собственное решение. Создадим и обучим нейросеть распознавать капчу Амазон на 100% за 200-500 миллисекунд.
Подготовка данных для обучения нейронной сети
Капча Амазон состоит из английских букв, наклон букв произвольный. Задача распознавания капчи сводится к тому, чтобы обучить нашу нейронную сеть распознавать весь английский алфавит состоящий из букв с разным наклоном и искажением.
Скачаем несколько оригинальных капч Амазон. Мы будем их использоваться для создания обучающих данных и для тестирования нашей нейросети. Напишем скрипт на JavaScript для NodeJS:
Разберем капчи Amzon по буквам:
Также сгенерируем все английские буквы с разным наклоном самостоятельно:
Тем больше входящих данных подготовим, чем точнее сможем обучить нашу нейронную сеть.
Обучение нейронной сети в Teachable Machine
Загружаем подготовленные данные для обучения в Teachable Machine
Далее жмём кнопку "Обучить модель" и ждем завершения процесса обучения.
Проверяем, как хорошо наша нейронная модель обучилась:
Скачиваем обученную модель нейросети через "Экспорт модели":
Итак, мы создали, обучили и проверили работу нашей нейронной сети. Она со 100% точностью распознает все буквы из Амазон капчи. Переходим к следующему этапу.
Распознаем объекты на изображении с помощью OpenCV
Прежде чем распознать букву нам нужно научиться находить буквы на самом изображении. В этом нам поможет библиотека OpenCV. Скрипт разработаем на Python:
В результате мы нашли все контуры букв на изображении:
Распознаем текст с помощью Tensoflow
После того как все буквы найдены на изображении, можно передать их в нашу нейронную сеть для распознавания. Будем использовать библиотеку Tensorflow:
API для распознавания капчи Amazon
Для примера создал API для распознавания капчи Amazon. Распознавание капчи занимает 200-500 миллисекунд точность близка к 100%:
А можно выполнить запрос к API в браузере по этой ссылке.
Вопросы, предложения, контакты
Если вам нужна помощь в создании собственной нейронной сети, автоматизации бизнес процессов и по любым другим вопросам, можете написать мне в телеграм или в личку на vc.ru
Также принимаю предложения о сотрудничестве и работе.
#Нейросеть #Создать_нейросеть #Обучить_нейросеть
#Teachable_Machine #Google_Teachable_Machine #Google
#Пройти_капчу_Amazon #Решить_капчу_Амазон #Амазон #Amazon
#Data_Analysis #OpenCV #TensorFlow #Python #JavaScript #NodeJS #OCR
#Распознование_текста #Машинное_обучение #Text_Recognition #Machine_Learning