Алгоритм шансів

У теорії рішень алгоритм шансів (або алгоритм Брюсса) — це математичний метод обчислення оптимальних стратегій для класу задач, які належать до області задач оптимальної зупинки. Їх розв'язок випливає зі стратегії шансів, а важливість стратегії шансів полягає в її оптимальності, як пояснюється нижче.

Алгоритм шансів застосовується до класу проблем, які називаються проблемами останнього успіху. Формально метою цих задач є максимізація ймовірності ідентифікації в послідовності незалежних подій саме останньої події, яка задовольняє певному критерію («специфічна подія»). Ця ідентифікація повинна бути зроблена в момент спостереження. Повернення до попередніх спостережень не дозволяється. Зазвичай особлива подія визначається особою, яка приймає рішення, як подія, що становить справжній інтерес з точки зору «зупинки» для здійснення чітко визначеної дії. Такі проблеми виникають у кількох ситуаціях.

Приклади ред.

Дві різні ситуації є прикладами зацікавленості в максимізації ймовірності зупинитися на останній події.

Припустимо, що автомобіль виставлено на продаж тому, хто запропонує найвищу ціну (найкращу «пропозицію»). Нехай n потенційних покупців відгукнулися і попросили показати їм машину. Кожен з них наполягає на негайному рішенні продавця прийняти пропозицію чи ні. Визначимо пропозицію як цікаву і закодуємо її 1, якщо вона краща за всі попередні пропозиції, і 0 в іншому випадку. Пропозиції формують випадкову послідовність^[en] з 0 та 1. Тільки 1 цікавлять продавця, який може побоюватися, що кожна наступна 1 може стати останньою. З визначення випливає, що остання 1 є найвищою ставкою. Отже, максимізація ймовірності продажу за останньою одиницею означає максимізацію ймовірності продажу за найкращою ціною.
Лікар, застосовуючи спеціальне лікування, може використовувати код 1 для успішного лікування, 0 — у протилежному випадку. Лікар лікує послідовність з n пацієнтів однаковим чином і хоче мінімізувати будь-які страждання, а також вилікувати кожного пацієнта, який реагує на лікування. Зупинившись на останній 1 у такій випадковій послідовності 0 і 1, він досягне цієї мети. Оскільки лікар не пророк, його мета — максимізувати ймовірність зупинки на останній 1 (див. розділ «Милосердне використання»^[en]).

Визначення ред.

Розглянемо послідовність $n$ незалежних подій. Пов'яжемо із цією послідовністю іншу послідовність незалежних подій $I_{1},\,I_{2},\,\dots ,\,I_{n}$ зі значеннями 1 або 0. тут $\,I_{k}=1$ , що називається успіхом, означає подію, що k-те спостереження є цікавим (як визначено особою, яка приймає рішення), і $\,I_{k}=0$ для нецікавих. Ці випадкові величини $I_{1},\,I_{2},\,\dots ,\,I_{n}$ спостерігаються послідовно, і мета полягає в тому, щоб правильно вибрати останній успіх, коли він спостерігається.

Нехай $\,p_{k}=P(\,I_{k}\,=1)$ ймовірність того, що k-та подія є цікавою. Далі нехай $\,q_{k}=\,1-p_{k}$ і $\,r_{k}=p_{k}/q_{k}$ . Зауважимо, що $\,r_{k}$ представляє шанси^[en] на те, що k-та подія виявиться цікавою, пояснюючи назву алгоритму шансів.

Алгоритмічна процедура ред.

Алгоритм шансів підсумовує шанси у зворотному порядку

r_{n}+r_{n-1}+r_{n-2}\,+\cdots ,\,

доки ця сума вперше не досягне або не перевищить значення 1. Якщо це відбувається з індексом s, зберігається s і відповідна сума

R_{s}=\,r_{n}+r_{n-1}+r_{n-2}+\cdots +r_{s}.\,

Якщо сума шансів не досягає 1, встановлюється s = 1. Водночас він обчислює

Q_{s}=q_{n}q_{n-1}\cdots q_{s}.\,

Вихід є

$\,s$ , поріг зупинки
$\,w=Q_{s}R_{s}$ , ймовірність виграшу.

Стратегія шансів ред.

Стратегія шансів — це правило спостереження за подіями одна за одною та зупинка на першій цікавій події від індексу s (якщо є), де s — поріг зупинки результату a.

Важливість стратегії шансів, а отже і алгоритму шансів, полягає в наступній теоремі шансів.

Теорема шансів ред.

Теорема шансів стверджує, що

Стратегія шансів є оптимальною, тобто вона максимізує ймовірність зупинки на останній 1.
Імовірність виграшу стратегії шансів дорівнює $w=Q_{s}R_{s}$
Якщо $R_{s}\geq 1$ , ймовірність виграшу $w$ завжди принаймні $1/ e = 0.367879...$ . і ця нижня межа є найкращою з можливих.

Особливості ред.

Алгоритм шансів обчислює оптимальну стратегію та оптимальну ймовірність виграшу одночасно. Крім того, кількість операцій алгоритму шансів є (суб)лінійною по n. Отже, не може існувати швидшого алгоритму для всіх послідовностей, так що алгоритм шансів водночас є оптимальним як алгоритм.

Джерела ред.

Алгоритм шансів розробив Брусc та 2000 року, який і придумав його назву. Він також відомий як алгоритм (стратегія) Брусса. Безкоштовні реалізації можна знайти в Інтернеті.

Додатки ред.

Застосування алгоритму шансів охоплюють медичні питання в клінічних випробуваннях, проблеми з продажем, секретарські проблеми, вибір портфоліо, (односторонні) стратегії пошуку, проблеми траєкторії та проблеми паркування^[en] до проблем онлайн-обслуговування тощо.

Також існує теорема шансів для безперервних процесів надходження з незалежними приростами^[en], таких як процес Пуассона Брусс, 2000. У деяких випадках шанси не обов'язково відомі заздалегідь (як у прикладі 2 вище), тому застосування алгоритму шансів безпосередньо неможливо. У цьому випадку кожен крок може використовувати послідовні оцінки шансів. Це має сенс, якщо кількість невідомих параметрів невелика порівняно з кількістю спостережень n. Питання оптимальності тоді є складнішим, однак, і вимагає додаткових досліджень. Узагальнення алгоритму шансів дозволяють отримати різну винагороду за невдалу і помилкову зупинку, а також замінити припущення про незалежність на слабші (Фергусон (2008)).

Варіації ред.

Брусс та Пейндавейн, 2000 обговорювали проблему вибору останні $k$ успіхів.

Тамакі, 2010 довів теорему про мультиплікативні шанси, яка розглядає проблему зупинки на будь-якому з останніх $\ell$ успіхів. Жорстка нижня межа ймовірності виграшу отримана за формулою Мацуї та Ано, 2014.

Matsui та Ano, 2017 обговорили проблему вибору $k$ з останніх $\ell$ і отримали жорстку нижню межу ймовірності виграшу. Коли $\ell =k=1,$ tзадача еквівалентна задачі Брусса про шанси. Якщо $\ell =k\geq 1,$ задача еквівалентна задачі в Брусс та Пейндавейн, 2000. Задача, що розглядається в Тамакі, 2010 отримується за умови, що $\ell \geq k=1.$

Проблема множинного вибору ред.

До участі допускається гравець $r$ виборів, і він виграє, якщо будь-який вибір є останнім успішним. Для класичної проблеми секретаря Гілберт та Мостеллер, 1966 обговорили випадки $r=2,3,4$ . Проблема шансів з $r=2,3$ обговорюється Ано, Какінума та Мійоші, 2010. Додаткові випадки проблеми шансів див. у Мацуї та Ано, 2016.

Оптимальна стратегія для цієї задачі належить до класу стратегій, визначених набором порогових чисел $(a_{1},a_{2},...,a_{r})$ , де $a_{1}>a_{2}>\cdots >a_{r}$ .

Зокрема, уявіть, що у вас є $r$ листів-зобов'язань, позначених від $1$ до $r$ . У вас буде $r$ працівників, кожен з яких тримає одну літеру. Ви продовжуєте проводити співбесіди з кандидатами і заносите їх у таблицю, яку бачить кожен з них. Зараз працівник $i$ надсилає лист-відповідь про прийняття на роботу першому кандидату, який виявився кращим за всіх інших кандидатів $1$ до $a_{i}$ . (Невідправлені листи про прийняття за замовчуванням віддаються останнім заявникам, так само як і у стандартній задачі про секретаря).

Коли $r=2$ , Ано, Какінума та Мійоші, 2010 показали, що нижня межа ймовірності виграшу дорівнює $e^{-1}+e^{-{\frac {3}{2}}}.$ Для загального натурального числа $r$ , Мацуї та Ано, 2016 довели, що нижня межа ймовірності виграшу є ймовірністю виграшу у варіанті задачі секретаря, де потрібно вибрати k кращих кандидатів, використовуючи лише k спроб.

Коли $r=3,4,5$ , нижні межі ймовірностей виграшу дорівнюють $e^{-1}+e^{-{\frac {3}{2}}}+e^{-{\frac {47}{24}}}$ , $e^{-1}+e^{-{\frac {3}{2}}}+e^{-{\frac {47}{24}}}+e^{-{\frac {2761}{1152}}}$ і $e^{-1}+e^{-{\frac {3}{2}}}+e^{-{\frac {47}{24}}}+e^{-{\frac {2761}{1152}}}+e^{-{\frac {4162637}{1474560}}},$ відповідно.

Для подальших числових відмінків для $r=6,...,10$ , а також алгоритм для загальних випадків див. Мацуї та Ано, 2016.

Див. також ред.

Список літератури ред.

Ano, K.; Kakinuma, H.; Miyoshi, N. (2010). Odds theorem with multiple selection chances. Journal of Applied Probability. 47 (4): 1093—1104. doi:10.1239/jap/1294170522.
Bruss, F. Thomas (2000). Sum the odds to one and stop. The Annals of Probability. Institute of Mathematical Statistics. 28 (3): 1384—1391. doi:10.1214/aop/1019160340. ISSN 0091-1798.
—: «A note on Bounds for the Odds Theorem of Optimal Stopping», Annals of Probability Vol. 31, 1859—1862, (2003).
—: «The art of a right decision», Newsletter of the European Mathematical Society, Issue 62, 14–20, (2005).
T. S. Ferguson: (2008, unpublished)
Bruss, F. T.; Paindaveine, D. (2000). Selecting a sequence of last successes in independent trials (PDF). Journal of Applied Probability. 37 (2): 389—399. doi:10.1239/jap/1014842544.
Gilbert, J; Mosteller, F (1966). Recognizing the Maximum of a Sequence. Journal of the American Statistical Association. 61 (313): 35—73. doi:10.2307/2283044. JSTOR 2283044.
Matsui, T; Ano, K (2014). A note on a lower bound for the multiplicative odds theorem of optimal stopping. Journal of Applied Probability. 51 (3): 885—889. doi:10.1239/jap/1409932681.
Matsui, T; Ano, K (2016). Lower bounds for Bruss' odds problem with multiple stoppings. Mathematics of Operations Research. 41 (2): 700—714. arXiv:1204.5537. doi:10.1287/moor.2015.0748.
Matsui, T; Ano, K (2017). Compare the ratio of symmetric polynomials of odds to one and stop. Journal of Applied Probability. 54: 12—22. doi:10.1017/jpr.2016.83.
Shoo-Ren Hsiao and Jiing-Ru. Yang: «Selecting the Last Success in Markov-Dependent Trials», Journal of Applied Probability, Vol. 93, 271—281, (2002).
Tamaki, M (2010). Sum the multiplicative odds to one and stop. Journal of Applied Probability. 47 (3): 761—777. doi:10.1239/jap/1285335408.
Mitsushi Tamaki: «Optimal Stopping on Trajectories and the Ballot Problem», Journal of Applied Probability Vol. 38, 946—959 (2001).
E. Thomas, E. Levrat, B. Iung: «L'algorithme de Bruss comme contribution à une maintenance préventive», Sciences et Technologies de l'automation, Vol. 4, 13-18 (2007).

Посилання ред.

Алгоритм Брусса http://www.p-roesler.de/odds.html