Отцы современного ИИ: кто получил "компьютерную Нобелевку" за алгоритмы, меняющие наш мир

Отцы современного ИИ: кто получил "компьютерную Нобелевку" за алгоритмы, меняющие наш мир

Кажется, искусственный интеллект появился внезапно — вчера мы только слышали о каких-то нейросетях, а сегодня ChatGPT пишет за нас тексты, CODE Interpreter решает сложные задачи, а нейросети рисуют картины по словесному описанию. Но за каждым "волшебным" алгоритмом стоят десятилетия работы учёных. И некоторые из них только сейчас получают заслуженное признание.

"Нобелевка для айтишников": кто получил главную премию в мире компьютеров?

5 марта 2025 года Ассоциация вычислительной техники (ACM) назвала имена лауреатов премии Тьюринга — награды, которую часто называют "Нобелевской премией в области информатики". Ими стали Эндрю Барто и Ричард Саттон — исследователи, заложившие основы обучения с подкреплением (Reinforcement Learning), одной из ключевых технологий современного ИИ.

Что такое обучение с подкреплением? Представьте, что вы дрессируете собаку: за правильное поведение даёте лакомство, за неправильное — ничего не даёте. Постепенно собака учится делать то, что приносит награду. Точно так же работают и алгоритмы обучения с подкреплением: искусственный интеллект получает "виртуальное лакомство" за правильные решения и "остаётся голодным" за неправильные.

Но если с собакой всё интуитивно понятно, то с компьютерами так просто не выйдет. Барто и Саттон сделали то, что до них никто не смог — создали точный математический аппарат для такого обучения.

Начиная с 1980-х годов, когда об искусственном интеллекте мало кто задумывался, эти учёные разработали основы метода временных разностей (temporal-difference learning) и другие алгоритмы, которые позволили машинам учиться на основе вознаграждений через модель Марковских решений.

Звучит сложно? Именно поэтому их работа так ценна. Они превратили интуитивную идею "учиться на своих ошибках" в строгую математическую систему, которую можно запрограммировать.

От теоретических работ к ChatGPT: что построено на их идеях

Миллионы людей сегодня пользуются ChatGPT и другими чат-ботами, даже не подозревая, что финальная настройка этих систем использует обучение с подкреплением. Хотя базовая архитектура языковых моделей основана на других технологиях, именно метод RLHF (Reinforcement Learning from Human Feedback — обучение с подкреплением на основе человеческой обратной связи) делает ответы нейросетей более полезными и безопасными.

Когда вы видите, что ChatGPT даёт осмысленные ответы и следует вашим инструкциям, а не генерирует бессмыслицу — благодарите Барто и Саттона. Их работа сделала возможным обучение нейросетей не просто повторять данные, а генерировать именно то, что нужно людям.

Но влияние обучения с подкреплением выходит далеко за рамки чат-ботов:

  • Алгоритмы RL используются для оптимизации сетевого трафика
  • Помогают управлять перегрузками в интернете
  • Проектируют микросхемы лучше, чем люди
  • Автоматизируют онлайн-рекламу, показывая её тем, кто с большей вероятностью откликнется
  • Оптимизируют глобальные цепочки поставок, экономя миллиарды долларов

Они предсказали будущее, когда в него никто не верил

Один из самых известных успехов RL — это победа программы AlphaGo над лучшими игроками в Го в 2016-2017 годах. Задолго до этого триумфа, когда большинство экспертов считало, что компьютеры никогда не смогут превзойти людей в этой древней игре, Барто и Саттон уже закладывали теоретические основы для такого прорыва.

Их учебник "Reinforcement Learning: An Introduction", выпущенный в 1998 году, до сих пор остаётся стандартным учебником в области ИИ и цитировался более 75 000 раз — невероятный показатель для научной работы.

Не только Тьюринг: "настоящая" Нобелевка за нейросети

Интересно, что премия Тьюринга — не единственное признание в мире ИИ за последнее время. В 2024 году Джеффри Хинтон был удостоен Нобелевской премии по физике (настоящей, не метафорической!) совместно с Джоном Хопфилдом за "фундаментальные открытия и изобретения, которые позволяют машинному обучению работать с искусственными нейронными сетями".

Хопфилд в 1980-х создал особый тип нейронной сети (сеть Хопфилда) для хранения и восстановления образов, используя аналогии с физическими системами, а Хинтон на основе этих идей разработал так называемую машину Больцмана — один из краеугольных камней современных нейросетей.

Получение Нобелевской премии в области физики за достижения в ИИ — событие беспрецедентное. Оно показывает, что искусственный интеллект уже вышел за рамки сугубо компьютерной отрасли и признаётся фундаментальной наукой на самом высоком уровне.

2018: когда были признаны "отцы глубокого обучения"

А ещё раньше, в 2018 году, Премия Тьюринга была присуждена трём учёным, которых часто называют "крёстными отцами" глубокого обучения — Йошуа Бенжио, Яну Лекуну и Джеффри Хинтону (да, тому самому, который позже получил и Нобелевскую премию).

Независимо и совместно эти трое в 1980-90-х годах упорно работали над нейронными сетями, когда эта тема ещё считалась маргинальной. Они разработали ключевые алгоритмы, включая знаменитое обратное распространение ошибки (backpropagation), без которого сегодня невозможно представить обучение нейросетей.

По словам президента ACM, именно благодаря работам Хинтона, Лекуна и Бенжио технологии глубокого обучения теперь используются миллиардами людей — в каждом смартфоне и во множестве приложений, которые ещё десять лет назад казались фантастикой.

Что это значит для нас с вами: не только научный интерес

Все эти награды — не просто академическое признание. Они сигнализируют о революции, которая уже происходит в нашей жизни:

  • Искусственный интеллект перестал быть экспериментом. Это рабочий инструмент, меняющий правила игры во всех отраслях.
  • Бизнес-модели радикально меняются. Компании, которые первыми внедряют новые AI-разработки, получают огромное конкурентное преимущество. ChatGPT достиг аудитории в 100 миллионов пользователей рекордно быстро.
  • Работа и карьера трансформируются. Автоматизация рутинных коммуникаций, помощь в программировании, генерация контента — всё это уже реальность, а не будущее.
  • Возникают новые вызовы. Как отмечает сам Хинтон, с распространением ИИ растёт важность вопросов безопасности и контролируемости искусственного интеллекта.

Что дальше?

Трудно представить, что когда-то нейронные сети и обучение с подкреплением были лишь теоретическими концепциями, интересными узкому кругу учёных. Сегодня на основе этих работ строится многомиллиардная индустрия, которая меняет нашу жизнь быстрее, чем мы успеваем это осознать.

Награды 2018-2025 годов, от "компьютерной Нобелевки" до настоящей Нобелевской премии, отражают новую реальность, в которой достижения в области ИИ движут вперёд и науку, и бизнес, открывая большие возможности — и одновременно ставя перед обществом серьезные задачи по ответственному использованию этих мощных технологий.

А вы уже используете в своей работе инструменты, созданные благодаря этим учёным? Делитесь в комментариях!

1
Начать дискуссию