Давайте попробую объяснить, что такое рациональность на самом деле

У всех нас есть представление о рациональности и о том, что лучше быть рациональным, чем нет, но что на самом деле такое рациональность, давайте разбираться.

Более прикладные и сжатые вещи я выкладываю в свой тг-канал. Там и про бизнес, и про философию, и про нейрокогнитивистику, короче, кайф. Подписывайтесь!

Прошел четвертый воркшоп про принятие решений. В этот раз знакомились с теорией рационального выбора. За точку отсчета была выбрана статья «В защиту теории рационального выбора» Дж. Цебелиса.

Ниже я оставлю схему хода мысли автора и поясню ее лонгридом, потом ее можно использовать, чтобы восстановить в памяти посылки теории.

Давайте попробую объяснить, что такое рациональность на самом деле

Нужно начать с определения рациональности. И у автора оно достаточно простое и понятное. Рациональность — это не более чем оптимальное соответствие между целями и средствами. Следовательно, нам нужно научиться искать это соответствие, тогда бы можем считать себя рациональными акторами.

Начать надо с базы, фундамента, а то есть с условий рационального действия. Цебелис делит их на мягкие и жесткие. Мягкие обеспечивают внутренюю непротиворечивость предпочтений и представлений. Тут главное, чтобы внутри вашей системы мышления все было когерентно и непротиворечиво. А в жесткие условия добавляется к мягким еще критерий внешней обоснованности, т.е. соотвествие ваших представлений с реальностью. Дальше я приведу пример, почеуму этот критерий важен, но сначала углубимся в мягкие условия.

Мягкие условия рационального действия

В них входят три высказывания:

  1. Отсутствие противоречащих друг другу представлений и предпочтений
  2. транзитивность предпочтений
  3. соответствие принимаемых решений аксиомам вероятностного расчета

Первые два высказывания касаются поведения рационального актора в ситуации определенности, в то время как третье определяет его поведение в условиях риска. Давайте разберемся в каждом подробнее.

Отсутствие противоречащих друг другу представлений и предпочтений.

Цебелис говорит, что в формальной логике есть два релевантных утверждения. Согласно первому, соединение утверждения и его отрицания есть противоречие.

Утверждение: Сейчас идет дождь

Отрицание: Сейчас не идет дождь

Соединение: Сегодня идет дождь и не идет дождь.

Согласно второму, из ложной посылки можно вывести любое следствие.

Ложная посылка: «Все кошки умеют летать». Тогда можно сказать, что раз моя кошка — кошка, то она умеет летать и может слетать мне за пивом. Ну или придумайте что-нибудь свое.

НО. Требование отсутствия внутренне противоречивых представлений или предпочтений не исключает изменения представлений и предпочтений во времени или даже в зависимости от контекста.

Какой вывод мы отсюда делаем? Проверяем все свои посылки на соответствие этим двум требованиям. Тогда мы будем выполнять условие непротиворечивости представлений.

Транзитивность предпочтений

Аксиома о «транзитивности предпочтений» гласит, что если актор предпочитает альтернативу А альтернативе В и альтернативу В — альтернативе С, то он с необходимостью предпочитает альтернативу А альтернативе С.

Доказано, что из актора с нетранзитивными предпочтениями можно сделать «денежную трубу», т.е. выкачать из него большую сумму денег (Davidson et al., 1954). Доказательство таково: предположим, что некто предпочитает А — В, В — С, и С — А. Если у него уже есть А, то можно побудить его обменять А на С с доплатой, скажем, в один доллар. Потом его можно побудить к обмену С на В, опять- таки за доллар, а после этого — В на А, снова за доллар. В результате он остается с тем, что имел сначала (А), но лишается при этом трех долларов.

Будьте транзитивны, друзья!

Соответствие принимаемых решений аксиомам вероятностного расчета

Ну тут теория вероятности входит в игру и максимизируется ожидаемая полезность, т.е. полезный результат определенных событий, помноженный на вероятность этих событий.

Имеется в виду, что если некто делает ставку, полагая, что вероятность выигрыша, помноженная на размер ожидаемого приза, равняется вероятности проигрыша, помноженной на его ожидаемую величину, и если в его расчетах нарушаются правила вероятностного расчета, то он неизбежно проиграет свои деньги. Казино отличный пример, когда ты математически выиграть не можешь, смотрите.

Представим, что человек играет в европейскую рулетку, где 37 секторов: числа от 1 до 36 и один ноль (0). Он делает ставку на красное.

  • Вероятность выигрыша (выпадет красное): 18 из 37 ≈ 0,486
  • Вероятность проигрыша (выпадет черное или 0): 19 из 37 ≈ 0,514
  • Приз за выигрыш: он получает обратно свою ставку + такую же сумму сверху (т.е. коэффициент 2:1)
  • Ставка: допустим, 100 у.е.

📑 Расчет «наивного» игрока:

Он думает:

«Я ставлю 100 у.е. Вероятность выигрыша — 50%, приз — 200 у.е. Вероятность проигрыша — 50%, проиграю 100 у.е. Вроде всё честно! Играю!».

📊 Правильный расчет ожидания:

  • Ожидаемый выигрыш: 0,486 * 100 = 48,6 у.е.
  • Ожидаемый проигрыш: 0,514 * 100 = 51,4 у.е.
  • Ожидаемый результат (матожидание): 48,6 – 51,4 = –2,8 у.е. на каждую ставку

На этом мягкие условия все, теперь к ним нужно прибавить сопоставление с реальностью и получим жесткие условия. Зачем это надо? А чтобы избежать такого: я считаю, что марсиане хотят на пасть на землю, т.к. я рациональный человек, я начинаю готовиться к нападению, запасаюсь всем необходимым. С точки зрения рациональности, я все делаю правильно, но есть нюанс...

Жесткие условия рационального действия

Добавляются три условия, а именно:

  1. стратегии взаимно оптимальны в условиях равновесия, т.е. в таких условиях акторы действуют в соответствии с предписаниями теории игр
  2. в условиях равновесия вероятности приближаются к объективной частоте событий
  3. в условиях равновесия представления приближаются к реальности

Они все говорят про условия равновесия, но что это? Тут мы все приходим к теории игр, а конкретно к Эквилибриуму (равновесию Нэша). Эквилибриум позволяет акторам использовать взаимно оптимальные стратегии: комбинация стратегий такова, что ни у одного из них нет стимула изменить сложившееся положение. Погнали по порядку.

Стратегии взаимно оптимальны в условиях равновесия

Т.е. в таких условиях акторы действуют в соответствии с предписаниями теории игр. Как я уже сказал эквилибриум позволяет акторам использовать взаимно оптимальные стратегии: комбинация стратегий такова, что ни у одного из них нет стимула изменить сложившееся положение.

Из данного определения следует, что в игре может быть несколько точек эквилибриума. Нужно лишь выбрать наиболее разумную из них. Если же разумных точек эквилибриума тоже несколько, то это затруднит взаимодействие акторов, ибо тогда каждый из них будет придерживаться стратегии, ведущей к более выгодному для него эквилибриуму, и общее равновесие нарушится. Кроме того, какойто из акторов может отклониться от своей прежней равновесной стратегии, избежав при этом наказания17, тем самым побуждая других модифицировать свои стратегии — либо потому, что их положение ухудшилось, либо потому, что у них появился шанс выиграть больше. В обоих случаях, отклонение от эквилибриума ведет к новому взаимному приспособлению акторов, и в конечном счете происходит восстановление прежнего равновесия или достижение нового эквилибриума Нэша. Таким образом, понятие эквилибриума Нэша является необходимым (но не достаточным) условием стабильности исходов взаимодействия. Ситуация не будет стабильной, если вследствие стремления одного из акторов модифицировать свою стратегию нарушается эквилибриум. В этом смысле, понятие эквилибриума в контексте теории рационального выбора становится тавтологичным. Помимо эквилибриума, комбинаций взаимно оптимальных стратегий просто не существует.

В условиях равновесия вероятности приближаются к объективной частоте событий

Это условие также связано с анализом равновесия. Согласно теории игр, по мере достижения равновесия представления акторов постепенно модифицируются в соответствии с правилом Бэйеса, т.е. каждый из игроков в наиболее полной мере использует как свои прежние вероятностные оценки, так и информацию, поступающую из внешней среды. Если оценки не соответствуют тому, насколько часто в действительности происходят события, то актор в состоянии со временем повысить их точность путем пересмотра. Предположим, некто полагает, что подброшенная в воздух монетка будет падать «орлом» или «решкой» с равной вероятностью, и ставит на «орла». Предположим также, что монетка — фальшивая, так что вероятность выпадения «орла» составляет лишь одну треть. Убедившись, что ставка на «орла» понижает возможность выигрыша, игрок пересмотрит оценки вероятности и поставит на «решку».

В условиях равновесия представления приближаются к реальности

В подтверждение данного условия также приводятся аргументы, исходящие из понятия эквилибриума. Модификация представлений по мере достижения равновесия происходит согласно правилу Бэйеса, так что в каждый отдельный момент актор способен выбрать стратегию, оптимальную с точки зрения его нынешних представлений. Взаимная оптимальность стратегий акторов, соответствующая их представлениям, ведет к тому, что каждый из них располагает информацией о представлениях другого. Если в процессе игры ктото из акторов не модернизирует свои представления, он может стать объектом эксплуатации со стороны своего оппонента, осознавшего, что ложность представлений соперника открывает путь для улучшения собственного положения. В такой ситуации либо один из акторов модифицирует свои представления, либо второй изменит стратегию, поэтому данная ситуация не является эквилибриумом. Иными словами, жесткие условия рациональности предполагают, что представления и поведение должны не только быть последовательными, но и соответствовать реальности (в равновесии). Наказанием за отход от жесткой рациональности будет понижение уровня благосостояния.

Ну супер. Мы как бы изучили, что из себя представляет рациональный выбор, но насколько это вообще адекватно и совместимо с реальной жизнью? Думаю, что вы, как и я ответите, да х***я это все. Цебелис это понимает, поэтому говорит следующее:

Все доказательства, относящиеся как к мягким, так и к жестким условиям рациональности, имеют нормативный характер. Они показывают, что поведение должно соответствовать предписаниям теории игр или правилу максимальной ожидаемой полезности; в противном случае актор проигрывает. Можно признавать, что с нормативной точки зрения эти требования истинны, и в то же время отказывать теории рационального выбора в способности описывать реальный мир на следующем основании: действительно, в идеально рациональном мире люди должны поступать — и поступают — в соответствии с предписаниями теории рационального выбора, но реальный мир не таков. В реальном мире люди нередко готовы платить за собственные ошибки или за свои представления. Даже если бы им и хотелось следовать предписанным теорией правилам, они просто не смогли бы осуществить все требуемые расчеты — ведь даже в простых играх вычислить эквилибриум Нэша не так-то просто, а с приближением к реальным ситуациям такие вычисления достигают астрономической сложности. Есть ли какие бы то ни было основания верить, что теория рационального выбора не только нормативна, но и, пользуясь терминологией Кейнса, позитивна Иными словами, можно ли полагать, что люди не только должны, но и действительно поступают в соответствии с требованиями теории рационального выбора? Ниже я попытаюсь ответить на эти вопросы.

Сейчас я расскажу про преимущества, а вы сами уже решите, удовлетворяют они вас или нет.

  • теоретическая ясность и экономичность. Заключения теории рационального выбора легче подвергнуть эмпирической проверке, чем выводы большинства других теоретических подходов.
  • широкое использование дедуктивного подхода. Ну тут понятно, раз есть начальный аксиомы, то используется такой же подход, как в геометрии. От общего к частному. Работает идеально, но возникают вопросы, почему именно эти аксиомы мы берем как данность?
  • взаимозаменяемость индивидов. Поскольку единственное допущение, которое теория рационального выбора делает относительно акторов, — это их рациональность, других характеристик или идентичностей они лишены. Они взаимозаменяемы. Если у двух людей (акторов) одна и та же цель, один и тот же набор средств, и они оба рациональны — то они будут действовать одинаково, независимо от их «личности», культуры, пола, религии и т.п.
  • анализ равновесия. Анализ равновесия используется тремя способами. Во-первых, к нему прибегают для того, чтобы выявить оптимальную для актора линию поведения. Во-вторых, анализ равновесия позволяет решать проблемы, связанные со множественными условиями, и формулировать поддающиеся эмпирической проверке прогнозы. В-третьих, анализ равновесия позволяет опровергать альтернативные объяснения.

Не знаю, насколько убедительной получилась статья, выводы делайте сами, я подрезал некоторые методики для управления командой. Например, попробовать рассчитать равновесие Нэша при вводе новой фичи, кажется полезными действием, чтобы не дай бог не навредить и не потерять равновесие, а может даже усилить свои позиции.

Более прикладные и сжатые вещи я выкладываю в свой тг-канал. Там и про бизнес, и про философию, и про нейрокогнитивистику, короче, кайф. Подписывайтесь!

Хочу закончить цитатой Цебелиса:

В заключение следует еще раз подчеркнуть, что в рамках теории рационального выбора индивидуальное поведение предстает как оптимальная реакция на условия среды или на поведение других акторов. Удачное рационалистическое объяснение должно описать существующие институты и имеющиеся контексты так, чтобы не только убедить читателя в оптимальности предпринятых актором действий, но и заставить его признать, что в сходной ситуации он бы сам поступил аналогичным образом.

5
7 комментариев