Как правило, проблема момента остановки, связана с двумя объектами:
Последовательность случайных величин , чье совместное распределение предполагается известным
Последовательность «вознаграждающих» функций которые зависят от наблюдаемых значений случайных величин в 1.:
С учетом этих объектов, проблема заключается в следующем:
Вы, соблюдая последовательность случайных величин, и на каждом можете выбрать либо прекратить наблюдение либо продолжить
Если вы прекратите наблюдать на вы получите награду
Вы хотите выбрать правило остановки , чтобы максимизировать предполагаемое вознаграждение (или, что эквивалентно, минимизации ожидаемых потерь)
Случай непрерывного времени
Рассмотрим усиление процессов определенными на фильтрованномвероятностном пространстве и предположим, что это адаптирование фильтрации. Задача момента остановки состоит в том, чтобы найти время остановки которое максимизирует ожидаемый выигрыш
Более конкретная формулировка выглядит следующим образом. Мы считаем, адаптированный сильный Марковский процесс определенный на фильтрованном вероятностном пространстве где обозначает вероятность измерения, где случайный процесс начинается с . С учетом непрерывных функций и в задаче момента остановки
Иногда это называется МЛС (Майер, Лагранж и супремум, соответственно) формулировка.[1]
Методы решения
Есть два подхода к решению проблемы момента остановки. Когда основной процесс (или усиление процесса) описывается своим безусловным конечномерным распределением, тогда соответствующий метод решения - подход Мартингала, названный так потому, что он использует теорию Мартингала, наиболее важным понятием является разработка Снелла. В дискретном случае, если горизонт планирования конечен, проблема может быть легко решена с помощью динамического программирования.
Когда основной процесс определяется семейством (условных) функций переходов приводящих к Марковскому семейству вероятностных переходов,часто могут быть использованы мощные аналитические инструменты теории Марковских процессов и такой подход называется Марковским методом. Решение обычно получается решения ассоциированных задач со свободными границами (Стефан проблемы).
Результат диффузии прыжка
Пусть будет диффузия Леви в из стохастического дифференциального уравнения
где - -мерное Броуновское движение, это -мерное компенсированная пуассоновская случайная мера, , , и заданы такие функции, что единственное решение существует. Пусть будет открытым множеством (область платежеспособности) и
время банкротства. Задача оптимальной остановки:
Получается, что при некоторых условиях регулярности,[2] следующая проверка теоремы содержит:
Если функция удовлетворяет
где области являются продолжением ,
на и
на , где - бесконечно малый генератор из
тогда для всех . Кроме того, если
на
Тогда для всех и - момент остановки
Эти условия могут быть записаны в более компактной форме (интегро-вариационного неравенства):
на
Примеры
Подбрасывание монетки
(Например, где сходится)
У вас есть монета и вы ее неоднократно бросаете. Каждый раз, перед тем, как ее бросить, вы можете прекратить бросать ее и получать деньги (в долларах, скажем), за средним числом наблюдаемых головок.
Вы хотите, чтобы сумма, которую бы вам заплатили, была бы максимальной, выбирая правило остановки. Если хi (где i ≥ 1) образует последовательность независимых, одинаково распределенных случайных величин с распределением Бернулли
и если
тогда в последовательности и будут объекты, связанные с этой проблемой.
Продажа дома
(Например, где не обязательно сходится)
У вас есть дом и хотели бы продать его. Каждый день вам предлагают за ваш дом, и платить для продолжения рекламы. Если вы продаете ваш дом в день вы заработаете , где .
Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.
В этом примере последовательности () является последовательностью предложений за ваш дом, а последовательность "вознаграждений" функций определяет, сколько вы будете зарабатывать.
Вы наблюдаете последовательность объектов, которые могут быть отсортированы от лучшего к худшему. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы на выбор лучшего объекта.
К примеру, если (n - это некоторое большое число, возможно) - ранги объектов, и это шанс, что вы выберете лучший объект, если вы остановите намеренное отклонение объектов на этапе i, то и являются последовательности, связанные с этой проблемой. Эта проблема была решена в начале 1960-х годов несколько человек. Изящное решение проблемы секретаря и несколько модификаций этой проблемы обеспечивается более современным алгоритмом оптимальной остановки (алгоритм Брюса).
Экономисты изучили ряд оптимальных проблем момента остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно ориентирована на поиск работником высокооплачиваемой работы или поиск потребителем недорогой продукции.
Торговля опционами
В торговле опционами на финансовых рынках, держатель американского опциона может осуществлять право купить (или продать) базовый актив по определенной цене в любое время до или в момент истечения срока. Таким образом, оценка американских опционов, по сути, проблема оптимальной остановки. Рассмотрим классическую модель Блэка-Шоулза и пусть будет безрисковой процентной ставкой и ставка дивидендов и непостоянство акции. Цена акций следует следует за геометрическим броуновским движением
В соответствии с мерой риска.
Когда параметр является бессрочным, задача оптимальной остановки
где функция выигрыша для опциона вызова и для опциона ставки. Вариационное неравенство
для всех где это граница физических упражнений. Решение известно[3]
(Бесконечный вызов) где и
(Бесконечная ставка) где и
С другой стороны, когда конечный срок действия конечен, задача связана с двумерной задачей о свободной границе без известного решения замкнутой формы. Однако могут быть использованы различные численные методы. См. Модель Black-Scholes # Американские опционы для различных методов оценки здесь, а также Fugit для дискретного дерева на основе расчета оптимального времени для тренировки.