Стохастична гра: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Alex Gvinder (обговорення | внесок)
Немає опису редагування
Рядок 1:
'''Стохастична гра ''' в [[теорія ігор|теорії ігор]] — повторювана гра з випадковими переходами станів, розігрується одним і більше гравцями .
'''Гра стохастична''' — різновид [[гра динамічна|динамічної гри]]. В стохастичній грі вибір гравцями альтернатив на кожному кроці визначає як виграш на цьому кроці, так і [[розподіл ймовірностей]] під-ігор, які доведеться розігрувати на наступному кроці. При цьому, на кожному кроці, при будь якому виборі гравцями альтернатив, існує ненульова [[ймовірність]] закінчення партії. Внаслідок цього цієї умови, партія з ймовірністю, яка дорівнює одиниці, закінчується за скінченну кількість кроків.
 
== Історія ==
Скінчені [[ігри антагоністичні|антагоністичні ігри]] були вперше ([[1953]]) визначені і розглянуті американським математиком [[Шеплі Л.]]. Він довів, що будь яка така гра має значення і обидва гравці мають [[стратегія оптимальна|оптимальні стратегії]]. Він, також, вказав процедуру, як дає можливість знайти як [[гри значення|значення гри]] так і [[стратегія оптимальна|оптимальні стратегії]].
Стохастичні гри були винайдені [[Шеплі Ллойд|Л. Шеплі]] на початку 1950-х років <ref>Shapley, L.S. Stochastic games // Proc. Nat. Acad. Science. — 1953. — vol. 39. — P. 1095—1100.</ref>. Найбільш повним їх описом є збірка статей під редакцією А. Ноймана і С. Соріна <ref>Stochastic Games and Applications / A. Neyman, S. Sorin, eds. — Kluwer Academic Press, 2003.</ref>. Більш елементарна книга Дж. Філар і К. Вріз містить загальний виклад теорії марківських процесів прийняття рішень та стохастичних ігор двох осіб<ref>Filar, J., Vrieze, K. Competitive Markov Decision Processes. — Springer-Verlag, 1997.</ref>. Ними було використано термін '''конкурентні марковські процеси прийняття рішень''' ({{lang-en|Competitive MDPs}}) для обозначения стохастических игр одного и двух лиц.
 
== Етапи==
== Джерела інформації ==
Гра розігрується протягом ряду етапів. На початку кожного етапу гра знаходиться в деякому стані. Гравці вибирають свої дії і отримують виграші, залежні від поточного стану і дій. Після цього система переходить випадковим чином в інший стан, розподіл ймовірності переходів залежить від попереднього стану і дій гравців. Ця процедура повторюється протягом скінченного або нескінченного числа кроків. Загальний виграш гравців часто визначається як дисконтована сума виграшів на кожному етапі або нижня межа середніх виграшів за скінченне число кроків.
* [[Енциклопедія кібернетики]], [[Доманскій В. К.]], т. '''1''', с. 339.
 
При скінченному числі гравців, [[Скінченна множина|скінченних множинах]] дій і станів гра з скынченним числом повторень завжди має [[рівновага Неша|рівновагу Неша]]. Це справедливо також для ігор з нескінченним числом повторень, якщо виграші учасників представляють собою дисконтовану суму.
== Дивіться також ==
 
* [[Гра динамічна]]
[[Н. Вайель]] показав, що всі стохастичні ігри двох осіб з скынченними множинами станів і дій мають наближену рівновагу Неша, якщо функції виграшу представляють собою нижню межу середніх значень виграшу за скінченне число кроків <ref>Vieille, N. Stochastic games: Recent results / In: Handbook of Game Theory. — Elsevier Science, 2002 — P. 1833—1850.</ref>. Питання про існування таких рівноваг в іграх з великою кількістю учасників залишається відкритим.
* [[Ігри антагоністичні]]
 
== Застосування==
Стохастичні ігри знаходять застосування в [[економіка|економіці]] і [[еволюційна біологія|еволюційній біології]]. Вони являють собою узагальнення повторюваних ігор , які відповідають ситуації, коли є тільки один стан.
 
 
 
== ДивітьсяДив. також ==
* [[Ланцюг Маркова]]
 
== Посилання==
<references/>
 
{{Теорія ігор}}
 
[[Категорія:Теорія ігор]]
[[Категорія:Марківські процеси]]
 
[[en:Stochastic game]]
[[ru:Стохастическая игра]]