Теория игр и переговоры

Задачка из теории игр: Богачу и бедняку предлагают 100 долларов, при условии, что они смогут договориться, как поделить эти деньги между собой.

Решение кажется несколько парадоксальным. Богачу достанется примерно 55$, бедняку только 45$. Задача предполагает ряд дополнительных условий. В частности, функция полезности пропорциональна логарифму. Это представляется правдоподобным, поскольку производная логарифма (lnx)’=1/x, т.е. dln(x)=dx/x. На обычном языке это означает, что ценность от сделки тем меньше, чем больше имеющийся у игрока капитал. Богачу практически все-равно получит от эти деньги или нет, у бедняка ситуация прямо противоположная. Подробности решения данной задачи можно найти в книге Г.Оуэн «Теория игр».

Результаты данного простого примера из теории игр показывают, что в переговорах нельзя показывать контрагенту ценность сделки, напротив, необходимо стараться занизить собственную функцию полезности.

В данной задаче не используется фактор взаимной рефлексии игроков (узнать что такое рефлексия) . Результат получается формальной максимизацией функций полезности двух игроков. Учет рефлексии делает данную задачу о сделке более неоднозначной и интересной. У игроков появляется возможность скрывать друг от друга свои функции полезности, а также проводить рефлективное управление, в частности, сообщать противнику ложные данные о своей функции полезности.

Проводя рефлексивное управления, бедняк может поднять свою долю до 50$, скрывая свою функцию полезности, например, изображая из себя богача. В этой ситуации дележ 50/50 будет казаться справедливым. Богач же, блефуя, может забрать себе почти всю сумму сделки.

Как на практике различаются результаты задачи о сделке с учетом рефлексии и без нее можно увидеть на примере Федерального закона о госзакупках. Согласно этому закону все закупки госкомпаний должны проводится в соответствии с прозрачными конкурсными процедурами. Это кажется вполне справедливым и соответствующим некоторым выводам теории игр. Однако, используя рефлексивное управление можно намного снизить закупочные цены. Например, можно снижать функцию полезности угрозой отказаться от закупочной процедуры. Или сообщать ложную информацию о достигнутых договоренностях с конкурентом контрагента. Сейчас данные действия невозможны по условиям прозрачности конкурса. Это все равно, что раскрыть свои карты противнику в карточной игре, и не лишить себя возможности подсмотреть карты противника. Очевидно, что лишив себя возможности для блефа, компании в результате получат более высокие закупочные цены. Введя возможности для рефлексивного управления, госкомпании могли бы сэкономить миллиарды, правда, если это кому-нибудь нужно.

Теория осознания Эллен Лангер

Недавно прочел в  Harvard Business review  интервью  о теории  осознания Эллен Лангер. Испытал двойственные чувства. С одной стороны радует, что идеи рефлексии проникают в менеджмент (узнать что такое рефлексия). С другой — все как-то по-американски поверхностно и не глубоко. Чего стоит только определении осознания: «Что такое осознание? Процесс, при котором вы сознательно воспринимаете новое.» Определять понятия по их последствиям вполне в духе бихевиоризма, где исследователь работает только в категориях стимул-реакция и не пытается проникнуть во внутренний мир персонажа.

Но есть и интересные моменты в интервью  о теории  осознания Эллен Лангер, где автор прямо говорит об осознании в терминах рефлексии. «Что могут сделать руководители, чтобы стать «более осознанными»? Есть такой способ: представить себе, что другие могут читать ваши мысли. И тогда вы не стали бы думать плохо о других. Вы старались бы смотреть на вещи их глазами.» Смотреть на вещи другими глазами — важное качество руководителя. Часто проблемы компании заключаются не в организационной структуре или неоптимизированных бизнес-процессах, а в неспособности понять, что различные лица по-разному воспринимают проблемы компании, имеют различные интересы и мотивации. Учет этих факторов невозможен без способности руководителя к рефлексии.

Или еще цитата из  интервью  о теории  осознания Эллен Лангер: «не забывайте, что стресс вызывают не сами события, а наше отношение к ним.» Известный тезис, имеющий прямое отношение к рефлексии. Можно сказать более обще: Мысль и мысль с рефлексией — это две большие разницы. Часто наши страхи, переживания, эмоции бесплодно крутятся вокруг одной и той же проблемы, что и является причиной стресса. Осознание того, что весь этот негатив лишь наше субъективное восприятие реальности автоматически формирует другую точку зрения на проблему. Сознание не вытесняет негативные эмоции, а как бы парит над ними. Это чем-то похоже на борьбу с галлюцинациями Джона Нэша в «Играх разума». В алгебраической теории рефлексии Лефевра 0^0=1, что можно интерпретировать как факт того, что осознанный негатив превращается в позитив. В физико-математической аналогии рефлексии операция осознания аналогична взятию производной. Как ускорение задает динамику движения (без него тело находится в покое или движется равномерно и прямолинейно), так и рефлексия выводит мысль из бесплодного зацикливания, формируя новую точку зрения.

Мытари и фарисеи

Прочитал у Кураева:

«Замечательный результат многовековой церковной селекции:
выведена порода мытарей, гордящихся тем, что они не фарисеи.»

Это еще один пример парадокса кающегося грешника. Как только мытарь видит себя покаявшимся, он тут же превращается в фарисея.

 

Теория рефлексивности Сороса

«Если вы такие умные, то почему такие бедные?»- вопрос справедлив, особенно по отношению к людям, чья профессия — зарабатывать деньги. История Сороса показывает, как  философская теория реально может превратить абстрактные идеи в прибыль. Теория рефлексивности Сороса первоначально возникла вне связи с финансами, а как убежденность, что гуманитарные науки, в отличие от естественных наук, имеют дело с рефлексирующими субъектами (узнать что такое рефлексия), поэтому методологии этих наук могут различаться. Не став философом, Сорос применил идеи рефлексивности к финансам. Свою теорию рефлективности Сорос изложил в книге Алхимия финансов скачать. Согласно теории рефлективности цены на финансовые активы определяются не только фундаментальными факторами, но также и тем, что игроки думают об этих ценах. Часто это отношение игроков к рынку  влияет на цены, гораздо больше, чем фундаментальные факторы. Даже более того, влияет на сами эти фундаментальные факторы (меняются процентные ставки, пересматриваются инвестиционные проекты). Поддается ли вклад рефлексии в формировании цены финансового актива математическому описанию? За более чем 25 лет после выхода книги Алхимия финансов скачать, не смотря на ее популярность, в теории финансовых рынков не появилось темы, связанной с теорией рефлективности Сороса. Если использовать математическую метафору, то действие рефлексии подобно второй производной. Так, принимая условно, что прибыль компании в среднем постоянная величина, цена акций этой компании должна определятся линейным уравнением от времени Ц=Приб*время. Рефлексия добавляет в эту цену фактор, аналогичный ускорению в уравнении движения, делая цену нелинейной и волатильной. При всей условности данной метафоры, из нее очевидно, что положительные новости (изменение прогноза прибыли) меняют цену не только, исходя из нового значения прибыли, но также из ожиданий, что часто приводит к ценам далеким от фундаментальных. Наоборот, при негативных новостях, цены могут падать ниже их фундаментальных значений.

 

Игры разума Джона Нэша

Началось вручение Нобелевских премий за 2014 год. Удивительно, что царице всех наук, математике не нашлось места в списке номинаций. Математики не получают Нобелевские премии. По крайней мере по математике. Однако, несколько математиков все-таки получили Нобелевскую премию по экономике. Первым таким математиком был наш (советский) математик Канторович. В 1994 лауреатом Нобелевской премии по экономике за вклад в теорию игр стал Джон Нэш, герой и прототип фильма «Игры разума». Джон Нэш ввел в теории игр учет рефлексии, когда игроки учитывают стратегии друг друга и осознают этот учет соперником. Эта идея довольно точно была показана в фильме. «Если мы все подойдем к блондинке, мы перекроем пути друг другу, и она не достанется ни одному из нас. Мы пойдем к её подругам, и они от нас отвернутся, потому что никому не хочется чувствовать себя второсортным. А что, если ни один из нас не подойдет к блондинке? Мы не станем мешать друг другу и не обидим других девушек. Это единственный путь к победе. Адам Смит считал, что лучше всего, когда каждый действует в своих интересах. Это правда, но не вся. На деле результат будет оптимальным, если каждый член группы сделает так, чтобы было лучше для себя и для группы.» Необходимым условием применения данной стратегии является использование рефлексивного отношения: «Я думаю, что ты думаешь, что я думаю», поскольку в некооперативной игре игроки  не могут формировать коалиции и координировать свои действия. Данная ситуация отличается от кооперативной игры, в которой  игроки могут объединять усилия и создавать коалиции. То ли потому, что идеи Джона Нэша были не до конца поняты коллегами-математиками, то ли потому, что эти идеи были интерпретированы как апология социализма, или всему виной болезнь, но Джон Нэш долгое время был изгоем даже среди коллег.

Другая тема использования рефлексии в фильме — борьба с болезнью. Джон Нэша математик попытался победить шизофрению с помощью интеллекта. Ученый придумал рефлексивный алгоритм проверки образов на предмет галлюцинаций. В эпизоде фильма с представителем нобелевского комитета Нэш спрашивает студентку: «Видите его, он настоящий?» Здесь есть несколько моментов. Первое, на втором ранге рефлексии происходит осознание, что его восприятие реальности хТ может не быть объективным. Далее происходит проверка рефлексивного уравнения х(хТ)=х(уТ). Т.е., если восприятие х (Джон Нэш) совпадает с восприятием «проверенного» персонажа, собственное восприятие считается истинным.

Здесь необходимо отметить, что, хотя рефлексия является свойством человеческого интеллекта, сознательное ее использование представляется не совсем тривиальной задачей.

А между тем, оценка мыслей на предмет «правильности» актуальна не только при галлюцинациях. Огромное количество ментального мусора человек воспринимает как часть своего «Я», и этот ментальный мусор может быть гораздо опаснее Нэшевских галлюцинаций. Например, находясь в ссоре с кем-либо из своих близких (коллег, знакомых), мы многократно прокручиваем в памяти нанесенные нам обиды, сожалеем, что не нашли подходящего острого и язвительного ответа, строим планы как в следующий раз мы «припечатаем» обидчика. Такие фантазии по объективности мало отличаются от галлюцинаций, и алгоритм математика Джона Нэша, показанный в фильме: относиться к мыслям как к объектам поможет в обычной жизни. «— Как насчет «этих»? Они исчезли?
— Нет, не исчезли. И вряд ли исчезнут. Но я научился не замечать их и они, видимо, решили плюнуть… Не так ли со всеми нашими грезами и кошмарами? Если их не подкармливать — они тают». 

Данный тезис перекликается с опытом православной аскетики по которому борьба с грехом начинается с борьбы с помыслами.

Физико-математическая аналогия рефлексии

Сущность второго закона Ньютона заключается в том, что механика описывается дифференциальными уравнениями второго порядка. Конечно, можно вычислять сколь угодно высокие производные координат, но они не нужны для описания движения. Если поставить в соответствие операции рефлексии операцию взятия производной, то такая аналогия указывает на то, что для описания внутреннего мира человека достаточно рефлексии ранга два. Для человеческого общения так же необходима рефлексия второго порядка.
По-видимому, можно найти способ описания рефлексии, из которого этот факт будет логически вытекать.

Математическая метафора

Представим модель рефлексивного мышления в виде листа Мёбиуса. (узнать что такое рефлексия )Лист Мёбиуса иначе можно определить как окружность, в каждой точке которой особым образом “подвешены” +1 и -1. Понятие х — точка на окружности, О(х) — мысль о понятии, является функцией на листе Мёбиуса и принимает значение +1 или -1 (мысли антиномичны). Выход или диалектика задается особой геометрической конструкцией листа Мёбиуса. На цилиндре понятие тоже имеет две стороны, но осознание этого факта невозможно. Персонаж “живущий” на цилиндре, всегда видит только одну сторону явления. Это пример нерефлексивного мышления. Интересно, что лист Мёбиуса — простейший пример т.н. расслоенного пространства, геометрического понятия, с помощью которого описываются все физические взаимодействия. Каждому физическому взаимодействию соответствует расслоенное пространство с определенной группой симметрии. В процессе человеческого общения понятия имеют бесконечное разнообразие оттенков (ноэма у Лосева). Мы можем задать эту многозначность слова “группой” в “логическом расслоении”. Понятие диалектики в философии в этом отношении аналогично понятию симметрии в физике.

Парадокс кающегося грешника

В алгебраической модели рефлексии (Лефевр) выражение 0^0 (^-возведение в степень) означает, что человек испытывает злые намерения, но осознает их как злые, поэтому не совершает дурного поступка. Его этический статус равен 1. Выражение 0^b^0=0 независимо от значения b. Это можно, в частности, интерпретировать следующим образом. Человек видит свои дурные намерения и освобождается от греха. Но на следующем этапе рефлексии видит себя освобожденным от греха и опять превращается в грешника. Удивительно, но эта простая формула недалека от истины. В православии святой не может себя видеть святым. Осознание себя святым тут же превращает святого в грешника. Где выход из этого парадокса кающегося грешника? Как соединить стремление к спасению с невозможностью оценить результат этих устремлений? Выход где-то в бесконечности. «Непрестанно молитесь»,- говорит апостол Павел. Достигшие совершенной молитвы, по словам Святителя Игнатия Брянчанинова, чувствуют себя как бы уничтожившимися, как бы несуществующими. Очевидно, что это особый тип рефлексии, доступный, однако, лишь не многим.

Рефлексия и системный анализ

При исследовании сложных объектов необходимо использовать различные системные представления. Пусть, например, исследуется некий объект Т. Tx1 — схематизация объекта средствами кибернетики, а Tx2 — средствами физики. Возможны четыре способа записи рефлексивных многочленов для описания системы:

W=T+ Tx1 + Tx2

W=(T+ Tx1 + Tx2) x2

W=(T+ Tx1 + Tx2)x1

W=(T+ Tx1 + Tx2) x3

В первом случае исследователь представляет объект двояко: с одной стороны, как кибернетическую машину (системное представление кибернетики), с другой — как реальность, подчиняющуюся только физическим закономерностям (системное представление физики). Никакой связи между кибернетической машиной и физической реальностью он не устанавливает. Во втором случае ситуация осознается с позиции физики, все сводится к физическим моделям. Третий случай осознание с точки зрения кибернетики. Необходим выход из “поглощенности объектом”, т.е осознание исследователем того факта, что его видение предмета – всего лишь субъективное осознание предмета, ограниченное в рамках его системных представлений. Этот выход описывает четвертый случай — создание новой картины и нового системного представления. В результате находятся «инварианты», которые не зависят от системного представления и являются «сущностью» предмета. Такая рефлексия характерна для научного творчества.

Кеплер нашел тот угол зрения под которым бесчисленное количество астрономических фактов превратилось в гармоничную картину законов. Открытия Галилея — это выход из поглощенности чувственного переживания движения и осознание того факта, что характеристикой, «инвариантом» движения является не скорость, а ускорение.

Математическое описание рефлексии

Впервые формальное описание рефлексии было осуществлено В.А. Лефевром в книге «Конфликтующие структуры».

Для описания понятия рефлексии представим плацдарм на котором действуют персонажи X,Y,Z. В некоторый момент t1 персонаж X осознал ситуацию (произвел операцию осознания). У него возникла картина объекта с персонажами X,Y,Z. Пусть  в момент t2, персонаж Y произвел операцию осознания (вместе с фактом осознания персонажем X).

Символом Т будем изображать плацдарм, на котором действуют персонажи. Образы этого плацдарма, лежащие перед персонажами X,Y и Z, обозначим соответственно Tx, Ty, Tz (T с позиции X, T с позиции Y, T с позиции Z). В момент t0 у персонажей нет картин осознания.  В этой ситуации системе соответствует символ Т. В момент t1, Систему можно представить в виде:

W1=T+Tx

В момент времени t2 системе соответствует многочлен:

W2=T+Tx+(T+Tx)y

Эта сумма включает в себя плацдарм T, картину плацдарма, лежащую перед X и “T+Tx с позиции Y”. Ситуацию, когда операцию осознания произвел персонаж Z, можно изобразить в виде:

W3=T+Tx+(T+Tx)y+ [T+Tx+(T+Tx)y]z

Необходимо отметить, что мы в данном случае не говорим об адекватности отражения персонажами как объекта T, так и внутреннего мира персонажей X,Y,Z. Речь идет лишь о факте совершения акта рефлексии.

Данный подход позволяет качественно (не количественно) рассматривать многие аспекты человеческих коммуникаций.