Исследователи AI провозгласили «Эру опыта» — что это значит?
Пару недель назад исследователь из Google DeepMind Дэвид Силвер и канадский исследователь Ричард Саттон выпустили научную работу под названием The Era of Experience. Она про будущее искусственного интеллекта. В последние дни ее часто обсуждают, поэтому решил кратко пересказать вам ее суть.
Эти исследователи делят развитие AI на три эры (на картинке):
🔵 «Эра симуляторов» (Era of Simulation). Речь про 2010-е и программы вроде AlphaGo от Google. Если забыли, то Google научил свой AI круто играть в Го и обыгрывать профессионалов. Таких опытов было много — и с шахматами, и с покером, и компьютерными играми. Да, это уже был искусственный интеллект, но очень узконаправленный. AI обучался, решая конкретную задачу. И был силен только в ней.
🔵 «Эра человеческих данных» (Era of Human Data). По сути, эта эра началась с научной работы «Attention is all you need», которую опубликовали в 2017-м восемь сотрудников Google. Вот пост про дальнейшую судьбу этих сотрудников. Они предложили обучать искусственный интеллект на человеческих данных и представили модель Transformer. Как раз эта модель легла в основу ChatGPT от OpenAI.
Собственно, с тех пор началась охота за данными, на которых можно обучать AI. Данные компаний, соцсети и форумы (вроде Reddit и Twitter), новостные сайты и книги и так далее. Но тут есть проблема. Ресурс годных для обучения человеческих данных ограничен и в ближайшем будущем будет исчерпан. Уже сейчас обучать AI становится все сложнее. А еще один нюанс в том, что AI не может выйти за пределы человеческих знаний.
🔵 «Эра опыта» (Era of Experience). Силвер и Саттон в своей работе пишут, что пора переходить в «эру опыта». Что это значит? Надо разрешить AI самостоятельно взаимодействовать с миром и получать данные, на которых он сможет обучаться.
«В конечном итоге данные, полученные опытным путем, затмят по масштабу и качеству данные, созданные человеком. Этот сдвиг парадигмы откроет во многих областях новые возможности, превосходящие человеческие».
Например, AI-ассистент, отвечающий за учебу, может сам выбирать стратегию обучения студентов, а оценивать свою работу он может по результатам экзаменов. А медицинский AI-ассистент может оценивать свою работу по показателям человека (пульс, качество сна и так далее).
В общем, пора выпустить ребенка на улицу. И пусть он сам взаимодействует с внешним миром, получая свой опыт.
P.S. А у DeepMind еще вышел подкаст с Дэвидом Силвером, где он рассказывает про их научную статью и этот подход: https://youtu.be/zzXyPGEtseI
Подписывайтесь на Telegram-канал The Edinorog 🦄.