Любое действие человека всегда затрагивает интересы какого-либо другого человека: оно содействует или препятствует достижению целей последнего. Поэтому, планируя свои последующие действия, второй индивид оценивает возможные последствия для него различных вариантов действий первого индивида. Он стремится ослабить негативное воздействие (или усилить позитивное воздействие) первого человека. Как правило, это стремление выражается во встречном воздействии его на другого, в результате которого тот испытывает некоторые положительные или отрицательные последствия.
На практике любое действие человека затрагивает интересы не одного, а нескольких людей, порождая сложную цепочку межличностных взаимодействий. Реальная система межличностных взаимодействий столь сложна, что не может иметь наглядной математической интерпретации. Моделирование межчеловеческих взаимодействий есть способ их упрощенного представления, допускающий использование формально-математических методов анализа.
Одной из таких моделей служит игровая модель межчеловеческих взаимодействий. Создателями математической теории игр являются математик Дж. фон Нейман (1903-1957) и экономист О. Моргенштерн (1902-1977). Их совместная работа «Теория игр и экономическое поведение» была опубликована в 1944 г.
Игровая модель межчеловеческих взаимодействий
Рассмотрим основные предположения и понятия игровой модели межчеловеческих взаимодействий.
1. Число взаимодействующих индивидов равно двум. Индивиды называются игроками. Понятие игрока позволяет моделировать социальные роли индивида: продавца, покупателя, мужа, жены и пр. Игра есть упрощенное представление взаимодействий двух индивидов, имеющих различные или схожие социальные роли, например покупатель — продавец, продавец — продавец и др.
2. Каждый индивид имеет фиксированный набор вариантов поведения, или альтернатив. Число вариантов поведения у различных игроков может не совпадать.
3. Межличностное взаимодействие считается реализованным, если оба игрока одновременно выбирают варианты своего поведения и действуют в соответствии с ними. Единичный акт межчеловеческого взаимодействия называют ходом игры. Продолжительность акта взаимодействия полагают равной нулю. Ход игры задается двумя целыми числами — выбранным номером варианта поведения (ходом) первого игрока и выбранным номером варианта поведения (ходом) второго игрока. Максимально возможное число различных ходов игры равно произведению общего числа ходов первого игрока и общего числа ходов второго игрока.
4. Каждое взаимодействие индивидов (или ход игры) получает свой порядковый номер: 1, 2, 3 и т. д. Не следует путать понятие «ход игры» (пара чисел) и «номер хода игры» (одно число). Предполагается, что взаимодействия происходят регулярно через равные промежутки времени, поэтому номер хода игры показывает продолжительность периода времени, в течение которого данные индивиды взаимодействуют друг с другом.
5. Межличностные взаимодействия (ходы) индивидов происходят достаточно часто на протяжении продолжительного периода времени, т. е. общее число ходов игры весьма велико. Это предположение позволяет моделировать исторический процесс становления института.
6. Каждый игрок стремится добиться максимального значения некоторого целевого показателя, который называют полезностью, или выигрышем. Таким образом, игрок обладает чертами «экономического человека». Выигрыш игрока может быть как положительным, так и отрицательным. Отрицательный выигрыш называют также проигрышем.
7. Каждому ходу игры (паре выбранных игроками альтернатив) отвечает единственная пара выигрышей игроков. Зависимость выигрышей игроков от выбранных ими ходов описывается игровой матрицей, или матрицей выигрышей. Строки этой матрицы отвечают альтернативам (ходам) первого игрока, а столбцы — альтернативам (ходам) второго игрока. Элементами игровой матрицы служат пары выигрышей, отвечающие соответствующим строке и столбцу (ходам игроков). Выигрыш первого игрока (первое число в клетке игровой матрицы) зависит не только от его хода (номера строки), но также от хода второго игрока (номера столбца). Поэтому до реализации взаимодействия индивид не знает точную величину своего выигрыша. Иными словами, выбор игроком варианта поведения осуществляется в условиях неопределенности, т. е. игрок обладает чертами «институционального человека».
8. Стратегия игрока есть привычный стереотип поведения, которому следует игрок при выборе альтернативы поведения в течение некоторого промежутка времени. Стратегия игрока задается значениями вероятностей (или частот) выбора всех возможных вариантов поведения. Другими словами, стратегия игрока представляет собой вектор, число координат которого равно общему числу возможных альтернатив, причем i-я координата равна вероятности (частоте) выбора i-й альтернативы. Понятно, что сумма значений всех координат данного вектора равна единице.
Несолидарные стратегии поведения
Человек характеризуется изменчивостью своего поведения, которое зависит от его внутреннего состояния, жизненного опыта, внешней социальной среды и пр. В рамках игрового подхода это свойство человека выражается в возможности смены игроком его стратегии. Если бы среди стратегий игрока всегда существовала объективно лучшая, то он бы неизменно следовал ей и смена стратегии была бы бессмысленной. Но в реальной жизни человек обычно рассматривает несколько стратегий поведения. Невозможно выделить среди них объективно лучшую. Игровая модель позволяет исследовать эту особенность поведения, поскольку она охватывает ряд стратегий поведения, которые не исключают друг друга и отражают различные аспекты поведения человека. Рассмотрим эти модели поведения.
Различают солидарные и несолидарные стратегии поведения. Первые наиболее характерны для «институционального человека», а вторые — для «экономического человека». Несолидарные стратегии поведения характеризуются тем, что индивид выбирает вариант своего поведения независимо, при этом он либо вовсе не учитывает поведение другого индивида, либо на основе имеющегося опыта предполагает возможный вариант его поведения.
К основным видам несолидарного поведения относятся следующие: нерациональное, осторожное, оптимизирующее, отклоняющееся и инновационное.
1. Нерациональное поведение. Обозначим две стратегии первого игрока через А и В соответственно. Стратегия А называется доминирующей по отношению к стратегии В, если при любом ходе второго игрока выигрыш первого игрока, отвечающий стратегии А, больше его выигрыша, отвечающего стратегии В. Таким образом, стратегия В является объективно худшей по отношению к стратегии А.
Отметим, что термин «нерациональное поведение» означает лишь то, что выбор данной стратегии заведомо не является лучшим в ситуации, когда оба игрока находятся в антагонистическом противостоянии, характерном для «экономического человека». Но для «институционального человека», вступающего в межчеловеческие взаимодействия с другими людьми, нерациональное поведение не только возможно, но может оказаться наиболее разумным вариантом поведения.
2. Осторожное поведение. «Институциональный человек», в отличие от «экономического человека», не является абсолютно рациональным, т. е. он не всегда выбирает самый лучший вариант поведения, максимизирующий выигрыш. Ограниченная рациональность «институционального человека» выражается в его неспособности выбрать наилучший вариант поведения в связи с большим количеством альтернатив, сложным алгоритмом определения оптимальной альтернативы, ограниченностью времени принятия решения и т. д. В то же время понятие ограниченной рациональности предполагает, что с учетом всех сложностей выбора человек способен выбрать достаточно хорошую альтернативу.
Стратегия осторожного поведения — это такая стратегия игрока, которая гарантирует ему определенную величину выигрыша независимо от выбора (хода) другого игрока. Осторожную стратегию называют также максиминной, поскольку она рассчитывается посредством нахождения максимального значения из нескольких минимальных значений.
3. Оптимизирующее поведение. В хозяйственной практике нередко возникают ситуации, когда экономические агенты (например, продавец и постоянный покупатель) в ходе длительного взаимодействия друг с другом находят стратегии поведения, устраивающие обе стороны, а поэтому применяются «игроками» в течение длительного периода времени. При игровом подходе к исследованию институтов описанная ситуация моделируется с помощью понятия равновесных стратегий. Пара таких стратегий характеризуется следующим свойством: если первый игрок отклоняется от своей равновесной стратегии (выбирает какую-либо другую), а второй продолжает следовать своей равновесной стратегии, то первый игрок несет ущерб в виде уменьшения величины выигрыша. Клетка игровой матрицы, находящаяся на пересечении строки и столбца, отвечающих паре равновесных стратегий, называется точкой равновесия. Игровая матрица может иметь несколько точек равновесия, а может не иметь их вовсе.
Поведение игрока, следующего равновесной стратегии, называютоптимизирующим.Оно отличается от максимизирующего поведения. Во-первых, равновесный выигрыш игрока не является максимальным из всех возможных выигрышей. Он отвечает не глобальному максимуму, а локальному оптимуму. Во-вторых, следование равновесной стратегии одним игроком влечет достижение им локального максимума лишь при условии сохранения равновесной стратегии другим игроком. Если второй игрок отклонится от равновесной стратегии, то дальнейшее использование первым игроком равновесной стратегии не даст ему максимизирующего эффекта.
4. Отклоняющееся поведение. Институционализация равновесной стратегии в качестве базовой нормы поведения происходит в результате обобщения человеком своего опыта межчеловеческих взаимодействий, включающего опыт отклоняющегося поведения. Осознание человеком негативных последствий такого поведения является решающим аргументом при выборе им оптимизирующей стратегии поведения. Таким образом, отклоняющееся поведение служит неотъемлемой составляющей жизненного опыта «институционального человека». Опыт отклоняющегося поведения дает человеку уверенность в том, что другой участник игры будет неизменно придерживаться равновесной стратегии. Тем самым такой опыт служит доказательством рациональности поведения другого игрока и предсказуемости будущих взаимодействий с ним.
5. Инновационное поведение. Инновационное поведение представляет собой систематическое отклонение от привычной равновесной стратегии с целью поиска другого равновесного состояния, более выгодного для игрока-новатора.
В рамках игровой модели межчеловеческих взаимодействий цель инновационного поведения может быть достигнута, если игровая матрица имеет другую равновесную точку, в которой выигрыш игрока-новатора больше, чем в исходном равновесном состоянии. Если же такой точки нет, то инновационное поведение, скорее всего, будет обречено на неудачу, а игрок-новатор вернется к исходной равновесной стратегии. При этом его потери от инновационного эксперимента будут равны суммарному эффекту отклонения за весь период эксперимента.
Солидарные стратегии поведения
В реальной жизни взаимодействующие индивиды нередко договариваются следовать в будущем определенным стратегиям поведения. В этом случае поведение игроков называют солидарным. Назовем основные причины солидарного поведения.
Выгодность солидарного поведения для обоих игроков. В рамках игровой модели взаимодействия такая ситуация иллюстрируется игровой матрицей, в одной клетке которой выигрыши обоих игроков максимальны, но при этом она не является равновесной и не отвечает паре осторожных стратегий игроков. Стратегии, отвечающие этой клетке, едва ли будут выбраны игроками, реализующими несолидарные модели поведения. Но если игроки придут к соглашению о выборе соответствующих солидарных стратегий, то впоследствии им будет невыгодно нарушать соглашение, и оно будет выполняться автоматически.
Этичность солидарного поведения часто служит «внутренним» механизмом, обеспечивающим соблюдение соглашения. Моральные издержки в форме общественного осуждения, которые понесет индивид в случае нарушения им соглашения, могут иметь для него большее значение, чем достигнутый при этом прирост выигрыша. Этический фактор играет важную роль в поведении «институционального человека», но он фактически не учитывается в игровой модели межчеловеческих взаимодействий.
Принуждение к солидарному поведению служит «внешним» механизмом, обеспечивающим соблюдение соглашения. Данный фактор институционального поведения также не находит адекватного отражения в игровой модели взаимодействий.
Чтобы проиллюстрировать описанные выше стратегии поведения рассмотрим следующие примеры.
Игра «Проверка знаний»
Рассмотрим ситуацию, когда преподаватель систематически проводит аттестацию студента. При этом он может проверять знания студента, а может не делать этого, выставляя некоторую среднюю оценку автоматически. Студент, в свою очередь, может подготовиться к аттестации, а может не делать этого.
Если студент подготовится, а преподаватель проверит, то студент получит максимальный выигрыш 2, обусловленный высокой формальной оценкой, моральным удовлетворением, поощрением преподавателя. Преподаватель также получит максимальный выигрыш 1, обусловленный удовлетворением от хорошо выполненной работы и уважительного отношения студента к предмету и преподавателю. Если студент не подготовится, а преподаватель проверит, то студент получит минимальный выигрыш — 2 (низкая формальная оценка, внутренняя неудовлетворенность, осуждение преподавателя и сокурсников). Преподаватель также получит минимальный выигрыш — 1 (свидетельство педагогического брака и неуважения к предмету и преподавателю).
Если студент подготовится, а преподаватель не проверит, то студент испытает некоторое разочарование, которое оценивается выигрышем — 1. Если же студент не подготовится, а преподаватель не проверит, то студент испытает удовлетворение от того, что он смог получить положительную аттестацию без каких-либо усилий. Эта радость студента оценивается выигрышем 1. Преподаватель не испытывает ни положительных, ни отрицательных эмоций, поскольку он не общается со студентом. Поэтому в двух последних случаях его выигрыш равен нулю.
Матрица выигрышей данной игры, которую называют «Проверка знаний», имеет две строки и два столбца, поскольку студент и преподаватель могут выбрать одну из двух соответствующих стратегий (табл. 1).
Таблица 1. Игра «Проверка знаний»
Студент |
Преподаватель |
|
Проверять | Не проверять | |
Готовиться | 2; 1 | -1; 0 |
Не готовиться | -2; -1 | 1; 0 |
Рассмотрим несолидарные стратегии поведения игроков.
- Во-первых, в данной игре не существует нерациональных стратегий поведения.
- Во-вторых, осторожной стратегией студента является стратегия «Готовиться»: она уберегает его от стресса, связанного с разоблачением недобросовестного поведения. Осторожной стратегией для преподавателя является стратегия «Не проверять», она избавляет его от негативных эмоций, возникающих при общении с недобросовестным студентом.
- В-третьих, в данной игре имеются две равновесные точки. Равновесие (2; 1) описывает ситуацию напряженного обучения, когда студент систематически готовится, а преподаватель систематически проверяет знания. Модуль эффекта отклонения для студента в этом случае весьма значителен и равен 4, а для преподавателя он равен единице. Равновесие (1; 0) описывает ситуацию имитации обучения, когда студент систематически не готовится, а преподаватель систематически не проверяет знания. Эффект отклонения в данном случае составляет: для студента — 2, для преподавателя — 1.
- В-четвертых, инновационное поведение студента и преподавателя имеет смысл в точке равновесия (1; 0), оно нацелено на переход в новую точку равновесия (2; 1), которая предпочтительнее для каждого из них. Поэтому в данном случае инновационные стратегии игроков носят неантагонистичекий характер. Инновационная стратегия студента состоит в переключении на добросовестное поведение. В результате преподаватель убедится в подготовленности студента и может начать проверять его знания. Инновационное поведение преподавателя состоит в переходе на стратегию систематической проверки знаний, которая, скорее всего, побудит студента к добросовестному поведению.
Согласование стратегий игроков в данном случае является ненужной процедурой, поскольку в результате инновационного поведения студент и преподаватель рано или поздно предпочтут напряженное обучение имитации учебной деятельности.
Игра «Правила движения»
Рассмотрим ситуацию, когда два автомобилиста систематически встречаются на узкой дороге, где могут разъехаться только два автомобиля. Обычно автомобили едут посреди дороги, что ставит водителей перед проблемой выбора одного из двух вариантов поведения: принять вправо или принять влево. Предполагается, что водители принимают решения независимо друг от друга. Если оба автомобиля одновременно принимают вправо (или влево), то они благополучно разъезжаются. Их выигрыши в этом случае считают равными единице.
Если же один автомобиль принимает вправо, а другой влево (или наоборот), то происходит лобовое столкновение и оба водителя погибают. Их выигрыши в этом случае считают равными нулю. Матрица выигрышей данной игры, которую называют «Правила движения», имеет две строки и два столбца, поскольку каждый водитель может выбрать одну из двух стратегий: «Вправо» или «Влево» (табл. 2).
Таблица 2. Игра «Правила движения»
Водитель 1 | Водитель 2 | |
Вправо | Влево | |
Вправо | 1; 1 | 0; 0 |
Влево | 0; 0 | 1; 1 |
Рассмотрим несолидарные стратегии поведения водителей:
- Во-первых, в данной игре не существует нерациональных стратегий.
- Во-вторых, любая стратегия игрока является осторожной стратегией с максимином, равным нулю, т. е. ни одна стратегия не гарантирует водителю сохранения жизни. Иными словами, в данном случае нет безопасных вариантов поведения.
- В-третьих, в данной игре имеются две точки равновесия с одинаковыми парами выигрышей (1; 1). Обе они равноценны для водителей, и ни одна не может быть априори выделена как более предпочтительная. Первая точка равновесия описывает ситуацию, когда у водителей сложилась традиция при разъезде принимать вправо, а вторая точка равновесия описывает ситуацию, когда при разъезде водители традиционно принимают влево. Однократное отклонение водителя от сложившейся традиции приводит к столкновению автомобилей и его гибели, поэтому отклоняющееся поведение в данном случае недопустимо.
- В-четвертых, инновационное поведение здесь не имеет смысла, поскольку обе точки равновесия равноценны для водителей. Мало того, попытка реализовать инновационное поведение влечет гибель обоих водителей, поэтому инновационные эксперименты в данном случае недопустимы.
Следование согласованным стратегиям является в данном случае единственным допустимым вариантом поведения водителей. В качестве общепринятой стратегии необходимо принять ту, которая отвечает сложившимся традициям поведения водителей на дороге. Так, если большинство водителей обычно принимают вправо при разъезде, то следует принять в качестве обязательной стратегию «Вправо». В силу особой общественной важности правил дорожного движения согласованность стратегий поведения водителей обеспечивается принудительно.
Начать дискуссию