У математиці теорія оптимальної зупинки[1][2] або ранньої зупинки[3] пов'язана з задачею вибору часу для здійснення певної дії, щоб максимізувати очікувану винагороду або мінімізувати очікувані витрати. Проблеми оптимальної зупинки можна знайти в областях статистики, економіки та фінансової математики (які пов'язані із ціноутворенням американських опціонів). Ключовим прикладом задачі оптимальної зупинки є задача про перебірливу наречену (в англомовній літературі зустрічається також під назвою задача про секретаря). Проблеми оптимальної зупинки часто можна записати у формі рівняння Беллмана, і тому їх часто розв'язують за допомогою динамічного програмування.

Визначення ред.

Випадок безперервного часу ред.

Задачі з правилом зупинки пов'язані з двома об'єктами:

  1. Послідовність випадкових величин  , спільний розподіл яких вважається відомим
  2. Послідовність функцій «винагороди».   які залежать від спостережуваних значень випадкових величин:
     

Грунтуючись на інформації про ці об'єкти, задача полягає в наступному:

  • Ви спостерігаєте за послідовністю випадкових величин, причому на кожному кроці  , ви можете припинити спостереження або продовжити
  • Якщо ви припините спостереження на кроці  , ви отримаєте винагороду  
  • Ви хочете вивести правило зупинки, щоб максимізувати очікувану винагороду (або, що еквівалентно, мінімізувати очікувані втрати)

Випадок дискретного часу ред.

Розглянемо процес посилення   визначений у відфільтрованому ймовірнісному просторі   і припустимо, що   пристосований до фільтрації. Оптимальна задача зупинки полягає в знаходженні часу зупинки  , що максимізує очікуваний прибуток

 

де   називається функцією цінності (  може мати значення  ).

Більш конкретне формулювання виглядає наступним чином. Ми розглядаємо адаптований сильний марковський ланцюг   визначений у відфільтрованому ймовірнісному просторі  , де   позначає міру ймовірності, з якої починається випадковий процес  . Задані неперервні функції  , і  , оптимальна задача зупинки це

 

Ще інколи називають формулою MLS (що розшифровується як Mayer, Lagrange and supremum відповідно).[4]

Методи вирішення ред.

Загалом існує два підходи до вирішення задачі оптимальної зупинки.[4] Коли основний процес (або процес посилення) описується безумовними кінцевовимірними розподілами, відповідним методом вирішення є мартингальний підхід, який називається так тому, що він використовує мартингальну теорію, найважливішою концепцією якої є конверт Снелла[en]. У випадку дискретного часу, якщо горизонт планування   скінченний, задачу також можна легко вирішити за допомогою динамічного програмування.

Коли основний процес визначається сімейством (умовних) функцій переходу, що веде до марковського сімейства ймовірностей переходу, часто можна використовувати потужні аналітичні інструменти, надані теорією марковських процесів, і цей підхід називають методом Маркова. Розв'язок зазвичай отримують розв'язуванням пов'язаних задач із вільною границею[en] (задача Стефана[en]).

Результат дифузії стрибка ред.

Нехай   буде дифузією Леві в  , яка описується СДР

 

де   є  -мірний броунівський рух,   є  -вимірна компенсована випадкова міра Пуассона[en],  ,  , і   - задані функції такі, що існує єдиний розв'язок  . Нехай   буде відкритою множиною (областю платоспроможності) і

 

буде часом банкрутства. Оптимальна задача зупинки:

 

Виявляється, що за деяких умов регулярності[5] справедлива перевірочна теорема: Якщо функція   задовольняє

  •  , де область продовження це  ,
  •   на  , і
  •   на  , де   є нескінченно-малим генератором[en]  ,

то   для усіх  . Крім того, якщо

  •   на  

Тоді   для усіх   і   — це оптимальний час зупинки.

Ці умови також можна записати в більш компактній формі (інтегро-варіаційна нерівність[en]):

  •   на  

Приклади ред.

Підкидання монети ред.

(Приклад, де   сходиться)

У вас є «чесна» монета, і ви постійно її підкидаєте. Кожного разу, перш ніж її підкинути, ви можете зупинити її підкидання та отримати виплату (скажімо, у гривнах) за середню кількість спостережених орлів.

Ви хочете максимізувати суму, яку вам платять, вибравши правило зупинки. Якщо Xi (для i ≥ 1) утворює послідовність незалежних, однаково розподілених випадкових величин із розподілом Бернуллі

 

і якщо

 

тоді послідовності  , і   — це об'єкти, пов'язані з цією задачею.

Продаж будинку ред.

(Приклад, де   не обов'язково сходиться)

У вас є будинок і ви хочете його продати. Кожен день вам пропонують   за ваш будинок, і ви платите   продовжуючи рекламу будинку. Якщо ви продаєте свій будинок в день  , ви заробите  , де  .

Ви хочете максимізувати зароблену суму, вибравши правило зупинки.

У цьому прикладі послідовність ( ) — це послідовність пропозицій для вашого будинку, а послідовність функцій винагород — це те, скільки ви заробите.

Задача про перебірливу наречену ред.

(Приклад де   є скінченною послідовністю)

Ви спостерігаєте за послідовністю об'єктів, які можна ранжувати від найкращого до найгіршого. Ви хочете вибрати правило зупинки, яке максимізує ваші шанси вибрати найкращий об'єкт.

Ось, якщо   (n — деяке велике число) — ранги об'єктів, і   — це ймовірність вибору найкращого об'єкта, якщо ви припините навмисно відхиляти об'єкти на кроці i   і   — це послідовності, пов'язані з цією задачею. Ця задача була розв'язана на початку 1960-х років кількома людьми. Елегантне розв'язання задачі про перебірливу наречену та кілька модифікацій цієї задачі забезпечує більш сучасний алгоритм шансів (алгоритм Брюса).

Теорія пошуку ред.

Економісти досліджували низку проблем оптимальної зупинки, подібних до «задач про перебірливу наречену», і зазвичай називають цей тип аналізу «теорією пошуку». Теорія пошуку особливо зосереджена на пошуку працівником високооплачуваної роботи або пошуку споживачем недорогого товару.

Проблема паркування ред.

Особливим прикладом застосування теорії пошуку є задача оптимального вибору паркувального місця водієм, який прямує в оперу (театр, шопінг тощо). Наближаючись до пункту призначення, водій їде вулицею, вздовж якої є паркувальні місця — зазвичай вільними є лише деякі місця на парковці. Ціль добре видно, тому відстань до цілі оцінюється легко. Завдання водія — вибрати вільне місце для паркування якомога ближче до пункту призначення, не їздячи по колу, щоб відстань від цього місця до місця призначення була найменшою.[6]

Торгівля опціонами ред.

Під час торгівлі опціонами на фінансових ринках власнику американського опціону дозволяється скористатися правом купити (або продати) базовий актив за заздалегідь визначеною ціною в будь-який час до або на дату закінчення терміну дії. Таким чином, оцінка американських опціонів є, по суті, проблемою оптимальної зупинки. Розглянемо класичну модель Блека — Шоулза і дозволимо   бути безризиковою процентною ставкою та   і   — це ставка дивідендів і волатильність акцій. Ціна акцій   підпорядковується геометричному броунівському руху

 

за нейтральною до ризику мірою.

Коли опція безстрокова, проблема оптимальної зупинки є

 

де функція виплати   для опції call (далі «колл») і   для put-опціону (далі «пут»). Варіаційна нерівність є

 

для усіх  , де   є межею вправи. Відомо, що розв'язок[7]

  • (Вічний колл)   де   і  
  • (Вічний пут)   де   і  

З іншого боку, коли термін придатності обмежений, задача пов'язана з двовимірною задачею з вільними границями, яка не має відомого розв'язку в замкненому вигляді. Однак можна застосувати різні чисельні методи. Див. модель Блека–Шоулза для різних методів оцінки, а також Fugit[en] для дискретного розрахунку оптимального часу для тренування на основі дерева[en].

Див. також ред.

Список літератури ред.

Цитування ред.

  1. Chow, Y.S.; Robbins, H.; Siegmund, D. (1971). Great Expectations: The Theory of Optimal Stopping. Boston: Houghton Mifflin.
  2. Ferguson, Thomas S. (2007). Optimal Stopping and Applications. UCLA.
  3. Hill, Theodore P. (2009). Knowing When to Stop. American Scientist. 97 (2): 126—133. doi:10.1511/2009.77.126. ISSN 1545-2786.
  4. а б Peskir, Goran; Shiryaev, Albert (2006). Optimal Stopping and Free-Boundary Problems. Lectures in Mathematics. ETH Zürich. doi:10.1007/978-3-7643-7390-0. ISBN 978-3-7643-2419-3.
  5. Øksendal, B.; Sulem, A. (2007). Applied Stochastic Control of Jump Diffusions. doi:10.1007/978-3-540-69826-5. ISBN 978-3-540-69825-8.
  6. MacQueen, J.; Miller Jr., R.G. (1960). Optimal persistence policies. Operations Research. 8 (3): 362—380. doi:10.1287/opre.8.3.362. ISSN 0030-364X.
  7. Karatzas, Ioannis; Shreve, Steven E. (1998). Methods of Mathematical Finance. Stochastic Modelling and Applied Probability. Т. 39. doi:10.1007/b98840. ISBN 978-0-387-94839-3.

Джерела ред.