trAIshtalk - как я сделал GPT2 твиттер-бота и почему это важно
Во время очередного колла с моим партнером, обсуждая нашу следующую авантюру, мы думали о внедрении ИИ для оптимизации ряда функций. В 2017 году, у нашего фонда был проект, направленный на оценку ICO и монет по определенным критериям и основываясь на этом опыте (довольно субъективном и негативном), я быстро пришел к выводу: это слишком сложно и дорого, давайте оставим ИИ на поздние стадии проекта.
После оживленной дискуссии мы пригласили эксперта по теме в нашу беседу. Он заверил нас, что инструменты обработки естественного языка (Natural Language Processing или NLP) значительно продвинулись, и теперь даже человек, без опыта программирования, легко обучит модель и сможет использовать ее для генерации текста. Его слова бросили мне вызов. Я видел пару Twitter-ботов раньше и решил сделать свой собственный.
Дано
- Полное отсутствие практического опыта с Ai / ML
- Базовое понимание структуры кода (я могу использовать терминал для установки какого-нибудь Ghost или запуска/редактирования пары питон скриптов на AWS)
Цель
- Собрать минимум 60 тысяч твитов и натренировать модель GPT2 составлять новые.
- Тема — Криптовалюта.
- Интегрировать все это, чтобы выбранные твиты публиковались автоматически.
Результат
Я был удивлен тем, как легко было найти полноценное пошаговое руководство о том, как сделать все, что мне нужно.
Моим основным источником информации была статья Макса Вольфа. Возникли проблемы с предоставленным им скриптом python download_tweets, но мне помогла установка и обновление чистой версии Twint.
Используя инструкцию Макса, я собрал 70 000 твитов с популярных Twitter аккаунтов и настроил модель GPT2. Для публикации по расписанию, я использовал комбинацию AirTable и Integromat, супер простое и бесплатное решение. #nocode
Результат здесь: @trAIshtalk
Что дальше?
В качестве следующего шага я хочу научить своего бота отвечать на твиты и отобранных людей и комментарии к своим постам, чтобы сделать его реальной частью крипто-сообщества.
Что все это значит?
Честно говоря, живя пару лет в SF, и слыша из каждого утюга — ИИ для этого, ИИ для того, а читая при этом, что 40 процентов европейских стартапов, классифицированных как компании ИИ, фактически не используют искусственный интеллект.
Я скептически относился к реальному прогрессу и применению технологии.
Но в то же время, я видел реальные примеры:
Конкурирует против топ игрока Starcraft и неплохо показывает себя в 5x5 матчах Dota2. Играх с неполной информацией и миллионами переменных.
Все это в совокупности дало мне идею, что технология настолько далека от реальной жизни, от бизнеса и доступна только самым продвинутым и богатым компаниям.
НО, мой маленький эксперимент заставил меня переосмыслить свое отношение к ИИ. Если кто-то с таким небольшим техническим знанием может использовать эту технологию, что действительно умные люди смогут сделать? Мы быстро переработали наш список функций MVP, добавив набор инструментов NLP & ML.
PS.
Узнайте больше об ИИ — Two Minute Papers YouTube