Теорія ігор: що це таке, та як вона змінює повсякденне життя
Від редакції: Цим тестом ми розпочинаємо спецпроект "Альтернативна освіта", присвячений звичкам та технологіям, які впливають на наше життя.
У колонках спікери науково-популярної ініціативи "Кукушонок" – українські вчені – просто і доступно розкажуть про складні речі, які вони вивчають; пояснять, як ми будемо жити у майбутньому та порадять, як до цього підготуватися.
Теорія ігор: що це таке, та як вона змінює повсякденне життя. Фото gustavofrazao/Depositphotos |
Теорія ігор виникла у 40-50-х роках. Її основна мета – дослідити, яким чином люди приймають рішення.
Може йтися не лише про людей, а й про тварин чи комп’ютерні програми, які приймають рішення.
Якщо ми визначаємо гравців, набір їхніх можливих ходів, тобто стратегії, і задаємо певний виграш та умови, за яких один виграє, а інший – програє, ми перетворюємо ситуацію на об’єкт дослідження теорії ігор.
Ці три компоненти критичні для визначення моделі цієї теорії.
У часи створення теорії комп’ютерних ігор ще не було. Тому такою назвою теорія зобов’язана салонним іграм. Таким, як шахи та карти.
Спеціалісти з теорії ігор не дуже люблять цю назву, їм більше подобається "Стратегічна взаємодія раціональних гравців".
"Стратегічна", бо гравці думають наперед, як їм діяти, щоб отримати найбільший виграш.
Раціональність означає, що у кожного гравця задана функція, яку він прагне максимізувати.
Якщо людина грає у шахи, у неї ця функція складається з трьох значень "виграш", "програш" та "нічия".
Якщо людина грає у карти, то вона прагне виграти якомога більше грошей.
Отже, завдання гравця: отримати в кінці гри найкращий результат.
Теорія ігор за замовчуванням вважає, що гравці діють узгоджено зі своєю функцією корисності.
Творцем теорії ігор вважається вчений угорського походження Джон фон Нейман.
Він був дуже яскравим математиком і у 29 років написав підручник з квантової механіки, яка тоді тільки зароджувалася. Цей підручник одразу став класичним.
На той час, коли він придумав теорію ігор, він встиг зробити внесок практично в кожну галузь математики.
Наприкінці 40-х фон Нейман створив дві теорії.
Одна з них перетворилася на computer science – сучасні комп’ютери побудовані на фон нейманівській архітектурі.
Крім того, він поставив перед собою амбіційну мету аксіоматизувати економіку, перетворивши її на точну науку, на кшталт фізики чи математики. І теорія ігор стала спробою побудувати математичні засади економіки.
Цікаво, що зараз, 70 років потому, computer science та теорія ігор зустрілися.
Сучасна теорія ігор застосовується для дослідження інтернету, нові протоколи тестуються за допомогою теорії ігор.
Фон Нейман придумав метод мінімаксу, який дозволяв розв’язувати ігри з нульовою сумою, де один гравець обов’язково виграє, а інший – програє. Класичний приклад – "Камінь, ножиці, папір".
Але ігри з нульовою сумою – це досить обмежений клас ігор, а для інших метод фон Неймана не працював.
І тоді з’явився Джон Неш. У його характеристиці по закінченні університету, науковий керівник написав єдине речення: "Ця людина – математичний геній!".
Після того, як Неш почав займатися теорією ігор, він написав лише 4 наукових статті, яких виявилося достатньо для того, щоб вплинути на усю галузь.
Він запропонував ідею рівноваги Неша – таку точку в грі (набір стратегій), в якій жоден гравець не може покращити свій виграш, одноосібно змінивши свою стратегію.
У ситуації рівноваги при зміні стратегії виграш зменшується, а отже, у гравця немає раціональних причин її змінювати.
Рівновага Неша створювалася для некооперативних ігор. Це однораундові ігри, у яких ви одночасно з іншим гравцем обираєте якесь рішення.
Наприклад, необхідно одночасно витягти карту з-поміж своїх карт. Якщо колір, обраних карт збігатиметься, кожен отримає по долару, а якщо не збігатиметься – ніхто нічого не отримає.
Першого разу обидва витягнули червону карту.
Вдруге раціональніше буде також витягнути червону, оскільки це більш передбачувано і, вірогідно, інший гравець також повторить свою попередню дію.
Така ситуація буде рівновагою Неша. Принаймні одна рівновага Неша існує в кожній грі.
Теорія ігор не уникла і критик:
Першим пунктом критики є те, що теорія ігор вважає людей раціональними гравцями.
У житті досить часто трапляються ситуації, коли людина не максимізує функцію виграшу.
На людину можуть впливати культурні та соціальні особливості, можуть – прості звички.
Вона тоді не думає, наскільки її стратегія узгоджена з бажаним результатом, а поводить себе так, як від неї очікує суспільство.
Другий пункт, за який критикують теорію ігор – це інтелектуальність.
Теорія ігор вважає, що гравець має бути здатним обчислити найкращий для себе варіант.
Але, як правило, люди, що грають у незнайому для них гру, не можуть цього зробити. Їм необхідно витратити певний час і зусилля, щоб зрозуміти, як правильно грати у певну гру, щоб виграти.
Ось, наприклад, го і шахи відносяться до числа повністю визначених ігор.
Коли ви сідаєте за дошку, гіпотетично ви можете пам’ятати усі ходи, що були зіграні раніше і знати всі можливі ходи. В рамках теорії ігор ситуації з таким іграми досить прості.
Відомо, що у шахах або є виграшна стратегія за білих, або є стратегія за чорних, що гарантує нічию.
В теорії можна побудувати граф з усіма можливими позиціями. Це буде велетенське розгалужене дерево, яке теорія ігор може проаналізувати. Але у людства поки що немає обчислювальних потужностей для того, щоб обробити це дерево.
Вчені знають, як шукати відповідь, але ми технічно не здатні цього зробити за прийнятний час. Але у майбутньому ми зможемо.
Шашки вже розв’язали. В шашки за умови ідеальної гри ви завжди можете зіграти внічию.
Найцікавіші задачі виникають, коли теорія ігор не збігається з практикою. Це одразу дає поштовх для дослідження.
Гра "ультиматум", у ході якої один гравець пропонує якусь частину загальної суми іншому гравцеві, а той приймає чи відхиляє пропозицію (найпростіший вид переговорів), дала поштовх для розвитку поведінкової економіки.
Якщо другий гравець є раціональним, то він згодиться на поділ 99 доларів іншому гравцеві і 1 долар собі, оскільки 1 долар – це краще, ніж нічого.
В реальності дуже багато хто відхиляє пропозиції, менші за 30%. Це означає, що функція корисності не зводиться лише до грошей, а містить ще й справедливість, наприклад.
Коли гру "ультиматум" вирішили перевірити на диких племенах, то поведінка племені із Перу більш відповідала передбаченню теорії ігор, ніж поведінка студентів Массачусетського технологічного інституту.
Можливо, для них ці гроші були важливішими, і відмовлятися від них, заради якоїсь там справедливості, вони вважали недоцільним.
Є ще узагальнення гри "ультиматум" – "диктатор".
Умови цієї гри відрізняються тим, що у другого гравця відсутнє право затвердження або відхилення пропозиції першого.
Перший гравець ділить суму самостійно і ставить другого перед фактом.
Фактично перші гравці мають право забрати собі усю суму, проте майже усі схильні ділити приблизно 70/30.
Ці 30% люди віддають, щоб почувати себе справедливими, справедливість входить в поняття корисності для них.
Теорія ігор спочатку застосовувалася в економіці.
Економіка – це гра багатьох гравців, чиї стратегії ми приблизно знаємо, і в цій грі, звичайно, є рівновага Неша.
Раціональні гравці завжди гратимуть ту стратегію, яка приведе до рівноваги Неша, бо це вигідно. Таким чином, ми можемо передбачити поведінку людей у складних ситуаціях.
Згодом теорію почали використовувати і соціальні науки, оскільки вченим було цікаво, як і на основі чого люди приймають рішення.
Поступово фокус змістився в біологію. Виявилося, що тварини в різних ситуаціях також грають в ігри. Їхні стратегії – це дії, спрямовані на виживання, а їхня винагорода – це власне виживання в природі.
[L]Деякі поведінкові стратегії навіть на генетичному рівні можна описати за допомогою моделей теорії ігор.
Теорія ігор дозволяє нам приймати кращі рішення загалом.
Якщо ви запишете свою побутову ситуацію у вигляді моделі теорії ігор, це уже буде великий плюс для вас і велике полегшення для прийняття рішення, оскільки це дозволить формалізувати результат.
Для цього вам просто необхідно визначити гравців (тих, хто впливає на ситуацію), описати їх можливі дії і вірогідні результати.
Олексій Ігнатенко, старший науковий співробітник Інституту програмних систем НАН України
Записала Євгенія Дольська, науковий журналіст, спеціально для УП.Життя