Ведение бизнеса

Моделирование человеческих отношений с помощью теории игр

Любое действие человека всегда затрагивает интересы какого-либо другого человека: оно содействует или препятствует достижению целей последнего. Поэтому, планируя свои последующие действия, второй индивид оценивает возможные последствия для него различных вариантов действий первого. На практике любое действие человека затрагивает интересы не одного, а нескольких людей, порождая сложную цепочку межличностных взаимодействий.

Любое действие человека всегда затрагивает интересы какого-либо другого человека: оно содействует или препятствует достижению целей последнего. Поэтому, планируя свои последующие действия, второй индивид оценивает возможные последствия для него различных вариантов действий первого индивида. Он стремится ослабить негативное воздействие (или усилить позитивное воздействие) первого человека. Как правило, это стремление выражается во встречном воздействии его на другого, в результате которого тот испытывает некоторые положительные или отрицательные последствия.

На практике любое действие человека затрагивает интересы не одного, а нескольких людей, порождая сложную цепочку межличностных взаимодействий. Реальная система межличностных взаимодействий столь сложна, что не может иметь наглядной математической интерпретации. Моделирование межчеловеческих взаимодействий есть способ их упрощенного представления, допускающий использование формально-математических методов анализа.

Одной из таких моделей служит игровая модель межчеловеческих взаимодействий. Создателями математической теории игр являются математик Дж. фон Нейман (1903-1957) и экономист О. Моргенштерн (1902-1977). Их совместная работа «Теория игр и экономическое поведение» была опубликована в 1944 г.

Игровая модель межчеловеческих взаимодействий

Рассмотрим основные предположения и понятия игровой модели межчеловеческих взаимодействий.

1. Число взаимодействующих индивидов равно двум. Индивиды называются игроками. Понятие игрока позволяет моделировать социальные роли индивида: продавца, покупателя, мужа, жены и пр. Игра есть упрощенное представление взаимодействий двух индивидов, имеющих различные или схожие социальные роли, например покупатель — продавец, продавец — продавец и др.

2. Каждый индивид имеет фиксированный набор вариантов поведения, или альтернатив. Число вариантов поведения у различных игроков может не совпадать.

3. Межличностное взаимодействие считается реализованным, если оба игрока одновременно выбирают варианты своего поведения и действуют в соответствии с ними. Единичный акт межчеловеческого взаимодействия называют ходом игры. Продолжительность акта взаимодействия полагают равной нулю. Ход игры задается двумя целыми числами — выбранным номером варианта поведения (ходом) первого игрока и выбранным номером варианта поведения (ходом) второго игрока. Максимально возможное число различных ходов игры равно произведению общего числа ходов первого игрока и общего числа ходов второго игрока.

4. Каждое взаимодействие индивидов (или ход игры) получает свой порядковый номер: 1, 2, 3 и т. д. Не следует путать понятие «ход игры» (пара чисел) и «номер хода игры» (одно число). Предполагается, что взаимодействия происходят регулярно через равные промежутки времени, поэтому номер хода игры показывает продолжительность периода времени, в течение которого данные индивиды взаимодействуют друг с другом.

5. Межличностные взаимодействия (ходы) индивидов происходят достаточно часто на протяжении продолжительного периода времени, т. е. общее число ходов игры весьма велико. Это предположение позволяет моделировать исторический процесс становления института.

6. Каждый игрок стремится добиться максимального значения некоторого целевого показателя, который называют полезностью, или выигрышем. Таким образом, игрок обладает чертами «экономического человека». Выигрыш игрока может быть как положительным, так и отрицательным. Отрицательный выигрыш называют также проигрышем.

7. Каждому ходу игры (паре выбранных игроками альтернатив) отвечает единственная пара выигрышей игроков. Зависимость выигрышей игроков от выбранных ими ходов описывается игровой матрицей, или матрицей выигрышей. Строки этой матрицы отвечают альтернативам (ходам) первого игрока, а столбцы — альтернативам (ходам) второго игрока. Элементами игровой матрицы служат пары выигрышей, отвечающие соответствующим строке и столбцу (ходам игроков). Выигрыш первого игрока (первое число в клетке игровой матрицы) зависит не только от его хода (номера строки), но также от хода второго игрока (номера столбца). Поэтому до реализации взаимодействия индивид не знает точную величину своего выигрыша. Иными словами, выбор игроком варианта поведения осуществляется в условиях неопределенности, т. е. игрок обладает чертами «институционального человека».

8. Стратегия игрока есть привычный стереотип поведения, которому следует игрок при выборе альтернативы поведения в течение некоторого промежутка времени. Стратегия игрока задается значениями вероятностей (или частот) выбора всех возможных вариантов поведения. Другими словами, стратегия игрока представляет собой вектор, число координат которого равно общему числу возможных альтернатив, причем i-я координата равна вероятности (частоте) выбора i-й альтернативы. Понятно, что сумма значений всех координат данного вектора равна единице.

Несолидарные стратегии поведения

Человек характеризуется изменчивостью своего поведения, которое зависит от его внутреннего состояния, жизненного опыта, внешней социальной среды и пр. В рамках игрового подхода это свойство человека выражается в возможности смены игроком его стратегии. Если бы среди стратегий игрока всегда существовала объективно лучшая, то он бы неизменно следовал ей и смена стратегии была бы бессмысленной. Но в реальной жизни человек обычно рассматривает несколько стратегий поведения. Невозможно выделить среди них объективно лучшую. Игровая модель позволяет исследовать эту особенность поведения, поскольку она охватывает ряд стратегий поведения, которые не исключают друг друга и отражают различные аспекты поведения человека. Рассмотрим эти модели поведения.

Различают солидарные и несолидарные стратегии поведения. Первые наиболее характерны для «институционального человека», а вторые — для «экономического человека». Несолидарные стратегии поведения характеризуются тем, что индивид выбирает вариант своего поведения независимо, при этом он либо вовсе не учитывает поведение другого индивида, либо на основе имеющегося опыта предполагает возможный вариант его поведения.

К основным видам несолидарного поведения относятся следующие: нерациональное, осторожное, оптимизирующее, отклоняющееся и инновационное.

1. Нерациональное поведение. Обозначим две стратегии первого игрока через А и В соответственно. Стратегия А называется доминирующей по отношению к стратегии В, если при любом ходе второго игрока выигрыш первого игрока, отвечающий стратегии А, больше его выигрыша, отвечающего стратегии В. Таким образом, стратегия В является объективно худшей по отношению к стратегии А.

Отметим, что термин «нерациональное поведение» означает лишь то, что выбор данной стратегии заведомо не является лучшим в ситуации, когда оба игрока находятся в антагонистическом противостоянии, характерном для «экономического человека». Но для «институционального человека», вступающего в межчеловеческие взаимодействия с другими людьми, нерациональное поведение не только возможно, но может оказаться наиболее разумным вариантом поведения.

2. Осторожное поведение. «Институциональный человек», в отличие от «экономического человека», не является абсолютно рациональным, т. е. он не всегда выбирает самый лучший вариант поведения, максимизирующий выигрыш. Ограниченная рациональность «институционального человека» выражается в его неспособности выбрать наилучший вариант поведения в связи с большим количеством альтернатив, сложным алгоритмом определения оптимальной альтернативы, ограниченностью времени принятия решения и т. д. В то же время понятие ограниченной рациональности предполагает, что с учетом всех сложностей выбора человек способен выбрать достаточно хорошую альтернативу.

Стратегия осторожного поведения — это такая стратегия игрока, которая гарантирует ему определенную величину выигрыша независимо от выбора (хода) другого игрока. Осторожную стратегию называют также максиминной, поскольку она рассчитывается посредством нахождения максимального значения из нескольких минимальных значений.

3. Оптимизирующее поведение. В хозяйственной практике нередко возникают ситуации, когда экономические агенты (например, продавец и постоянный покупатель) в ходе длительного взаимодействия друг с другом находят стратегии поведения, устраивающие обе стороны, а поэтому применяются «игроками» в течение длительного периода времени. При игровом подходе к исследованию институтов описанная ситуация моделируется с помощью понятия равновесных стратегий. Пара таких стратегий характеризуется следующим свойством: если первый игрок отклоняется от своей равновесной стратегии (выбирает какую-либо другую), а второй продолжает следовать своей равновесной стратегии, то первый игрок несет ущерб в виде уменьшения величины выигрыша. Клетка игровой матрицы, находящаяся на пересечении строки и столбца, отвечающих паре равновесных стратегий, называется точкой равновесия. Игровая матрица может иметь несколько точек равновесия, а может не иметь их вовсе.

Поведение игрока, следующего равновесной стратегии, называютоптимизирующим.Оно отличается от максимизирующего поведения. Во-первых, равновесный выигрыш игрока не является максимальным из всех возможных выигрышей. Он отвечает не глобальному максимуму, а локальному оптимуму. Во-вторых, следование равновесной стратегии одним игроком влечет достижение им локального максимума лишь при условии сохранения равновесной стратегии другим игроком. Если второй игрок отклонится от равновесной стратегии, то дальнейшее использование первым игроком равновесной стратегии не даст ему максимизирующего эффекта.

4. Отклоняющееся поведение. Институционализация равновесной стратегии в качестве базовой нормы поведения происходит в результате обобщения человеком своего опыта межчеловеческих взаимодействий, включающего опыт отклоняющегося поведения. Осознание человеком негативных последствий такого поведения является решающим аргументом при выборе им оптимизирующей стратегии поведения. Таким образом, отклоняющееся поведение служит неотъемлемой составляющей жизненного опыта «институционального человека». Опыт отклоняющегося поведения дает человеку уверенность в том, что другой участник игры будет неизменно придерживаться равновесной стратегии. Тем самым такой опыт служит доказательством рациональности поведения другого игрока и предсказуемости будущих взаимодействий с ним.

5. Инновационное поведение. Инновационное поведение представляет собой систематическое отклонение от привычной равновесной стратегии с целью поиска другого равновесного состояния, более выгодного для игрока-новатора.

В рамках игровой модели межчеловеческих взаимодействий цель инновационного поведения может быть достигнута, если игровая матрица имеет другую равновесную точку, в которой выигрыш игрока-новатора больше, чем в исходном равновесном состоянии. Если же такой точки нет, то инновационное поведение, скорее всего, будет обречено на неудачу, а игрок-новатор вернется к исходной равновесной стратегии. При этом его потери от инновационного эксперимента будут равны суммарному эффекту отклонения за весь период эксперимента.

Солидарные стратегии поведения

В реальной жизни взаимодействующие индивиды нередко договариваются следовать в будущем определенным стратегиям поведения. В этом случае поведение игроков называют солидарным. Назовем основные причины солидарного поведения.

Выгодность солидарного поведения для обоих игроков. В рамках игровой модели взаимодействия такая ситуация иллюстрируется игровой матрицей, в одной клетке которой выигрыши обоих игроков максимальны, но при этом она не является равновесной и не отвечает паре осторожных стратегий игроков. Стратегии, отвечающие этой клетке, едва ли будут выбраны игроками, реализующими несолидарные модели поведения. Но если игроки придут к соглашению о выборе соответствующих солидарных стратегий, то впоследствии им будет невыгодно нарушать соглашение, и оно будет выполняться автоматически.

Этичность солидарного поведения часто служит «внутренним» механизмом, обеспечивающим соблюдение соглашения. Моральные издержки в форме общественного осуждения, которые понесет индивид в случае нарушения им соглашения, могут иметь для него большее значение, чем достигнутый при этом прирост выигрыша. Этический фактор играет важную роль в поведении «институционального человека», но он фактически не учитывается в игровой модели межчеловеческих взаимодействий.

Принуждение к солидарному поведению служит «внешним» механизмом, обеспечивающим соблюдение соглашения. Данный фактор институционального поведения также не находит адекватного отражения в игровой модели взаимодействий.

Чтобы проиллюстрировать описанные выше стратегии поведения рассмотрим следующие примеры.

Игра «Проверка знаний»

Рассмотрим ситуацию, когда преподаватель систематически проводит аттестацию студента. При этом он может проверять знания студента, а может не делать этого, выставляя некоторую среднюю оценку автоматически. Студент, в свою очередь, может подготовиться к аттестации, а может не делать этого.

Если студент подготовится, а преподаватель проверит, то студент получит максимальный выигрыш 2, обусловленный высокой формальной оценкой, моральным удовлетворением, поощрением преподавателя. Преподаватель также получит максимальный выигрыш 1, обусловленный удовлетворением от хорошо выполненной работы и уважительного отношения студента к предмету и преподавателю. Если студент не подготовится, а преподаватель проверит, то студент получит минимальный выигрыш — 2 (низкая формальная оценка, внутренняя неудовлетворенность, осуждение преподавателя и сокурсников). Преподаватель также получит минимальный выигрыш — 1 (свидетельство педагогического брака и неуважения к предмету и преподавателю).

Если студент подготовится, а преподаватель не проверит, то студент испытает некоторое разочарование, которое оценивается выигрышем — 1. Если же студент не подготовится, а преподаватель не проверит, то студент испытает удовлетворение от того, что он смог получить положительную аттестацию без каких-либо усилий. Эта радость студента оценивается выигрышем 1. Преподаватель не испытывает ни положительных, ни отрицательных эмоций, поскольку он не общается со студентом. Поэтому в двух последних случаях его выигрыш равен нулю.

Матрица выигрышей данной игры, которую называют «Проверка знаний», имеет две строки и два столбца, поскольку студент и преподаватель могут выбрать одну из двух соответствующих стратегий (табл. 1).

Таблица 1. Игра «Проверка знаний»

Студент

Преподаватель

Проверять Не проверять
Готовиться 2; 1 -1; 0
Не готовиться -2; -1 1; 0

Рассмотрим несолидарные стратегии поведения игроков.

  • Во-первых, в данной игре не существует нерациональных стратегий поведения.
  • Во-вторых, осторожной стратегией студента является стратегия «Готовиться»: она уберегает его от стресса, связанного с разоблачением недобросовестного поведения. Осторожной стратегией для преподавателя является стратегия «Не проверять», она избавляет его от негативных эмоций, возникающих при общении с недобросовестным студентом.
  • В-третьих, в данной игре имеются две равновесные точки. Равновесие (2; 1) описывает ситуацию напряженного обучения, когда студент систематически готовится, а преподаватель систематически проверяет знания. Модуль эффекта отклонения для студента в этом случае весьма значителен и равен 4, а для преподавателя он равен единице. Равновесие (1; 0) описывает ситуацию имитации обучения, когда студент систематически не готовится, а преподаватель систематически не проверяет знания. Эффект отклонения в данном случае составляет: для студента — 2, для преподавателя — 1.
  • В-четвертых, инновационное поведение студента и преподавателя имеет смысл в точке равновесия (1; 0), оно нацелено на переход в новую точку равновесия (2; 1), которая предпочтительнее для каждого из них. Поэтому в данном случае инновационные стратегии игроков носят неантагонистичекий характер. Инновационная стратегия студента состоит в переключении на добросовестное поведение. В результате преподаватель убедится в подготовленности студента и может начать проверять его знания. Инновационное поведение преподавателя состоит в переходе на стратегию систематической проверки знаний, которая, скорее всего, побудит студента к добросовестному поведению.

Согласование стратегий игроков в данном случае является ненужной процедурой, поскольку в результате инновационного поведения студент и преподаватель рано или поздно предпочтут напряженное обучение имитации учебной деятельности.

Игра «Правила движения»

Рассмотрим ситуацию, когда два автомобилиста систематически встречаются на узкой дороге, где могут разъехаться только два автомобиля. Обычно автомобили едут посреди дороги, что ставит водителей перед проблемой выбора одного из двух вариантов поведения: принять вправо или принять влево. Предполагается, что водители принимают решения независимо друг от друга. Если оба автомобиля одновременно принимают вправо (или влево), то они благополучно разъезжаются. Их выигрыши в этом случае считают равными единице.

Если же один автомобиль принимает вправо, а другой влево (или наоборот), то происходит лобовое столкновение и оба водителя погибают. Их выигрыши в этом случае считают равными нулю. Матрица выигрышей данной игры, которую называют «Правила движения», имеет две строки и два столбца, поскольку каждый водитель может выбрать одну из двух стратегий: «Вправо» или «Влево» (табл. 2).

Таблица 2. Игра «Правила движения»

Водитель 1 Водитель 2
Вправо Влево
Вправо 1; 1 0; 0
Влево 0; 0 1; 1

Рассмотрим несолидарные стратегии поведения водителей:

  • Во-первых, в данной игре не существует нерациональных стратегий.
  • Во-вторых, любая стратегия игрока является осторожной стратегией с максимином, равным нулю, т. е. ни одна стратегия не гарантирует водителю сохранения жизни. Иными словами, в данном случае нет безопасных вариантов поведения.
  • В-третьих, в данной игре имеются две точки равновесия с одинаковыми парами выигрышей (1; 1). Обе они равноценны для водителей, и ни одна не может быть априори выделена как более предпочтительная. Первая точка равновесия описывает ситуацию, когда у водителей сложилась традиция при разъезде принимать вправо, а вторая точка равновесия описывает ситуацию, когда при разъезде водители традиционно принимают влево. Однократное отклонение водителя от сложившейся традиции приводит к столкновению автомобилей и его гибели, поэтому отклоняющееся поведение в данном случае недопустимо.
  • В-четвертых, инновационное поведение здесь не имеет смысла, поскольку обе точки равновесия равноценны для водителей. Мало того, попытка реализовать инновационное поведение влечет гибель обоих водителей, поэтому инновационные эксперименты в данном случае недопустимы.

Следование согласованным стратегиям является в данном случае единственным допустимым вариантом поведения водителей. В качестве общепринятой стратегии необходимо принять ту, которая отвечает сложившимся традициям поведения водителей на дороге. Так, если большинство водителей обычно принимают вправо при разъезде, то следует принять в качестве обязательной стратегию «Вправо». В силу особой общественной важности правил дорожного движения согласованность стратегий поведения водителей обеспечивается принудительно.

Начать дискуссию

Банки

Покупка жилья в кредит станет более быстрой

Чтобы застройщики быстрее получали финансирование, а участники долевого строительства тратили меньше времени на посещение банков, депутаты предложили разрешить при покупке жилья открывать эскроу-счета удаленно.

Курсы повышения
квалификации

20
Официальное удостоверение с занесением в госреестр Рособрнадзора

Инвестиции в недвижимость: новый ЗПИФ Рентал ПРО от создателей ПНК-Рентал. IPO в конце мая – начале июня

«Можем повторить!» — сказали ребята из «А класс капитал» и решили, что пора выводить на биржу новый фонд. С названием долго не думали. Был ПНК-Рентал для всех, а будет Рентал ПРО для квалифицированных инвесторов. Был фонд с пассивным управлением, а будет фонд с активным управлением. Собрал известную информацию и свои мысли по новому фонду.

Инвестиции в недвижимость: новый ЗПИФ Рентал ПРО от создателей ПНК-Рентал. IPO в конце мая – начале июня

В сервис заказа такси встроили азартные игры

Злоумышленники использовали агрегатор такси и проводили через него незаконные операции, связанные с выигрышами на ставках и в онлайн-казино.

Лучшие спикеры, новый каждый день

Как и где купить криптовалюту пошаговая инструкция

Биткоин, Эфир, USDT и другие криптовалюты – отличный способ инвестировать в 2024 году. Сегодня ими пользуются не только крипотрейдеры, но и новички. Многие считают, что купить криптовалюту сложно и непонятно, поэтому отказываются от вложений. К счастью, это не так, и сегодня купить криптовалюту в России так же просто, как обменять рубли на доллары или евро!

Как и где купить криптовалюту пошаговая инструкция

Роструд назвал основные правовые особенности сезонной работы

По Трудовому кодексу есть особенности регулирования труда работников, занятых на сезонных работах.

Банки

Исламский банкинг будет интересен 90 тысячам компаний

По оценкам Сбера, к 2030 году 30% населения будут составлять мусульмане. Услуги банка, которые не противоречат нормам шариата, заинтересуют 5 млн человек.

Опытом делятся эксперты-практики, без воды

Вопросы официального трудоустройства иностранных специалистов. Общая методичка

В рамках указанной статьи вы сможете узнать об основных этапах и нюансах, связанных с официальным трудоустройством иностранных специалистов.

Кабмин направит на поддержку Запорожской и Херсонской областей 4,4 млрд рублей

Деньги пойдут на выплату зарплат сотрудников бюджетных учреждений.

Госзакупки

Самые интересные споры по госзакупкам за 1 квартал 2024 года

ФАС привела обзор судебной практики в сфере госзакупок за 1 квартал 2024 года.

🔥 Акция «Жаркие скидки в любую погоду»! Самые горячие онлайн-курсы «Клерка» за 4 290 рублей до 20 мая

Мы предлагаем самые выгодные цены на онлайн-курсы по учету на маркетплейсах, УСН, ВЭД, финмоделированию, ФСБУ и бухгалтерии с нуля. Только до 20 мая их можно купить за 4 290 рублей!

Святой рандом мая. PIKK — акции ПИК

Продолжаю третий сезон святого рандома с покупкой российских акций. Каждый месяц я выбираю одну рандомную акцию из индекса Мосбиржи. Ну как я, делает это святой рандом, он же генератор случайных чисел. Я её потом просто покупаю. Почему? Да потому что какой смысл ручками выбирать акции, если рынок ведет себя непредсказуемо ¯\_(ツ)_/¯

Святой рандом мая. PIKK — акции ПИК
Бесплатно с Трудовые отношения

Сверхурочные в 2024 году: как оплачивать по новым правилам

Порядок оплаты сверхурочных работ закреплен в обновленной ст. 152 ТК во исполнение поручения, которое дал законодателям КС в постановлении от 27.06.2023 № 35-П. Теперь при оплате сверхурочной работы необходим принимать во внимание все компенсационные и стимулирующие выплаты.

Сверхурочные в 2024 году: как оплачивать по новым правилам
Миникурсы, текстовые и видеоинструкции для бухгалтеров
Бесплатно с Налоговые проверки

Продажа авто учредителю по цене ниже рыночной: сколько доначислят налоговики

Если организация продает самортизированные активы по низкой цене взаимозависимым лицам, ей доначислят налоги. Разбираем судебную практику.

Продажа авто учредителю по цене ниже рыночной: сколько доначислят налоговики

Что будет с интернетом, мобильной связью, Почтой России, электронными услугами, ИТ: заявления Минцифры

Максут Шадаев перед утверждением на должность министра цифрового развития, связи и массовых коммуникаций РФ назвал основные направления работы и какие вызовы стоят перед Минцифры.

Новое приложение «Ситидрайва» удалили из App Store

Уже установленные приложения будут работать на iOS. Пользователям рекомендуют отключить функцию «Сгружать неиспользуемые».

Платись, платись большая и маленькая: независимо от размера зарплату нужно платить два раза в месяц! 💰«Ночной бухгалтер» № 1684

Даже если ваш сотрудник на неполной ставке получает зарплату размером в несколько тысяч рублей, ее нельзя платить один раз. Даже сотрудник просит. Так Роструд сказал.

Иллюстрация: Вера Ревина/Клерк.ру

Расценки на техобслуживание газового оборудования, возможно, будет устанавливать государство

Регионы предлагают ввести государственное регулирование стоимости услуг по техобслуживанию газового оборудования.

Обменники крипты: как выбрать подходящий

Сегодня купить и продать криптовалюту* в России можно несколькими способами: через криптовалютные биржи, P2P-сервисы, криптоматы и обменники, работающие онлайн и офлайн. Последний вариант позволяет проводить сделки анонимно – без отправки своих персональных данных и платежных реквизитов.

Обменники крипты: как выбрать подходящий

Можно ли выдать за раз маленькую зарплату, как оплачивать переработку в командировке, на ГПД положен стандартный вычет. 3 важных разъяснения для бухгалтеров по зарплате

Собрали полезные разъяснения Роструда и Минфина по расчетам с работниками.

Иллюстрация: Вера Ревина/Клерк.ру

Интересные материалы

Приобретение лицом из недружественного государства доли (акций) в российской компании (ООО или АО) в 2024 году

Необходимо ли получать разрешение подкомиссии, если лицо из недружественного государства хочет стать участником (акционером) российской компании (ООО или АО). Какие требования предъявляются к данным сделкам (операциям).