Neural SDE / Deep Hedging

Q: Чому насправді навчається нейронна мережа в Neural SDE?

Вона навчається функціям дрейфу та дифузії стохастичного диференціального рівняння, що керує ціною активу та/або волатильністю. Це функції, які класичні моделі задають вручну (наприклад, основа CEV в SABR, волатильність зі зворотним прагненням до середнього в Heston).

Q: Чому Deep Hedging видає інші коефіцієнти хеджування, ніж класичне дельта-хеджування?

Класичне дельта-хеджування припускає неперервне ребалансування на ринку без тертя. Deep Hedging навчається за реалістичних умов: дискретне ребалансування, транзакційні витрати, спреди бід-аск та обмеження ліквідності. Оптимальний хедж за наявності тертя загалом не є дельтою Black-Scholes.

Q: Neural SDE видає поверхню волатильності, що містить календарний спред-арбітраж. Що пішло не так?

Neural SDE не гарантують відсутності арбітражу за побудовою (на відміну від SANOS). Навчання могло не покарати це порушення, або навчальні дані були недостатніми. Явні обмеження відсутності арбітражу мають бути додані до функції втрат або накладені post-hoc.

Кожна модель на цьому сайті -- SABR, SVI, Heston -- починається з вибору формули і потім підганяє її параметри до даних. Neural SDE перевертає це: вона використовує нейронну мережу, щоб навчитися самій формулі безпосередньо з ринкових даних. Мережа виявляє функції дрейфу та дифузії, які найкраще пояснюють спостережувані ціни, а поверхня волатильності виходить як побічний продукт.

💡

Мережа навчається рівнянню

Класичні моделі кажуть "волатильність слідує цьому рівнянню" і підганяють параметри. Neural SDE каже "волатильність слідує якомусь рівнянню", і мережа з'ясовує, яке саме. Поверхня імпліцитної волатильності є результатом навченої моделі, а не формою, припущеною наперед.

Подивіться в дії

Порівняйте, як класичний, параметричний та нейронний підходи обробляють одні й ті самі ринкові дані за різних умов.

Нейронне SDE проти класичних моделей

Ліквідний ринок, рівна усмішка волатильності. Усі три підходи дають схожі результати.

Класична (SABR)

Формула, підібрана вручну

Параметрична (SVI)

Формула з 5 параметрами

Нейронне SDE

Навчене на даних

Ринкові дані

Вибрати модель (SABR)

Підігнати 4 параметри

Усмішка

Ринкові дані

Вибрати формулу (SVI)

Підігнати 5 параметрів

Усмішка

Ринкові дані

Нейронна мережа

Навчити дрейф + дифузію

Усмішка

Перемикайте сценарії, щоб побачити, як кожен підхід працює за різних ринкових умов. У стресових режимах і за браку даних нейронне SDE адаптується там, де параметричні моделі обмежені заданою формою.

Як це працює

1. Навчайтеся динаміці, а не формі

Стандартне SDE для ціни та волатильності виглядає так: dS = ... dt + ... dW. Класичні моделі заповнюють "..." конкретними формулами (SABR використовує CEV зі стохастичною волатильністю волатильності). Neural SDE замінює ці формули нейронними мережами, навченими на історичних даних. Мережа навчається як середній поведінці (дрейф), так і випадковості (дифузія) з нуля. Вона може виявляти патерни скью та форми часової структури, які параметричні моделі не можуть передбачити.

2. Deep Hedging: навчайтеся хеджу, а не лише ціні

Deep Hedging (Buehler, Gonon, Teichmann & Wood, 2019) розширює цю ідею. Замість того, щоб оцінювати опціон і потім обчислювати коефіцієнт хеджування з моделі, ви навчаєте мережу безпосередньо виводити оптимальну позицію хеджу на кожному кроці часу. Мережа навчається експозиціям дельти та веги спільно. Мета навчання: мінімізувати дисперсію P&L хеджування за реальних ринкових умов -- включно з транзакційними витратами, спредами бід-аск, дискретним ребалансуванням та обмеженнями ліквідності. Жодних припущень про ринок без тертя не потрібно.

3. Поверхня волатильності виникає

Після навчання Neural SDE ви можете згенерувати поверхню імпліцитної волатильності, оцінюючи ванільні опціони через навчену модель. Отримана поверхня не обмежена жодною параметричною формою -- вона захоплює будь-які патерни, що існують у даних, включно з тими, які SVI або SABR структурно пропустили б. Обидві області ATM та OTM підганяються одночасно.

ℹ️

Захоплює динаміку, яку параметричні моделі пропускають

Neural SDE захоплюють динаміку волатильності, яку параметричні моделі не можуть: перемикання режимів, ефекти залежності від шляху та міжактивні перетікання. Deep Hedging враховує витрати, які ігнорує класичне дельта-хеджування. Вимоглива до даних та обчислювально витратна, але саме туди рухається кількісні фінанси.

Сильні сторони та обмеження

Сильна сторона

Що це означає для вас

Немає припущення про форму

Мережа виявляє динаміку волатильності з даних. Немає структурного упередження від вибору SABR проти Heston проти SVI.

Хеджування з урахуванням тертя

Deep Hedging враховує транзакційні витрати, спреди та дискретне ребалансування -- реалії, які класичні моделі ігнорують.

Адаптується до змін режимів

Перенавчена на свіжих даних, мережа адаптується до нової ринкової поведінки без ручного вибору моделі.

Захоплює міжактивні ефекти

Може навчитися, як волатильність BTC реагує на рухи ETH, або як поширюються макроподії -- багатовхідна за задумом.

Обмеження

Що це означає для вас

Чорна скринька

Ви не можете перевірити, чому мережа видає певну форму усмішки. Важко налагоджувати, коли щось виглядає неправильно.

Вимоглива до даних

Потребує великих, високоякісних історичних наборів даних. Крипторинки можуть не мати достатньо історії для надійного навчання.

Обчислювально витратна

Навчання включає симуляцію Монте-Карло через нейронну мережу. Це не вправа для електронної таблиці.

Немає гарантії відсутності арбітражу

На відміну від SANOS, вихідна поверхня може містити арбітраж, якщо явно не обмежена під час навчання.

Передовий край (2019+)

Активна дослідницька область. Немає стандартизованих реалізацій. Небагато продакшн-розгортань поза великими кількісними фондами.

Актуальність для крипто

Крипторинки природно підходять для Neural SDE, тому що динаміка волатильності погано зрозуміла і швидко змінюється. Немає консенсусу щодо того, чи краще моделювати волатильність BTC за допомогою SABR, Heston, rough vol чи чогось зовсім іншого. Neural SDE обходить цю дискусію, навчаючись будь-якій динаміці, яку містять дані -- включно з патернами, що порушують Black-Scholes, як-от перемикання режимів. Головна перешкода -- дані: ринки криптоопціонів молоді, а навчальний набір малий порівняно з акціями чи ставками.

💡

Навчені моделі, навчені хеджі

Neural SDE замінюють вручну підібрані моделі волатильності навченими. Deep Hedging замінює теоретичні коефіцієнти хеджування такими, що враховують тертя. Компроміс: інтерпретованість, вимоги до даних та обчислювальні витрати. Наразі це дослідницькі інструменти -- але вони визначають передній край.

Дослідник рівнянь

Конвертуйте між імпліцитною волатильністю, повною варіацією, лог-монейністю та цінами опціонів.

Дослідник рівнянь

w = σ2 × Ttotal variance = IV2 × time

Імпліцитна вол. (σ)

Імпліцитна волатильність

Час до експірації

днів

Календарні дні до експірації

Загальна дисперсія (w)

0.022225

Річна дисперсія (σ²)

0.2704

IV (зворотний перерахунок)

52.00%

Загальна дисперсія — це те, що калібрують SVI та інші моделі. Вона зростає з часом, тому волатильність 50% на 30 днів має меншу загальну дисперсію, ніж 50% на 90 днів.

Перевірте своє розуміння перед продовженням.

Q: Чому насправді навчається нейронна мережа в Neural SDE?

Q: Чому Deep Hedging видає інші коефіцієнти хеджування, ніж класичне дельта-хеджування?

Q: Neural SDE видає поверхню волатильності, що містить календарний спред-арбітраж. Що пішло не так?

💡 Підказка: Спробуйте відповісти на кожне питання самостійно перед розкриттям відповіді.

Побудова математичної інтуїції

Вивчіть Neural SDE з нуляІнтерактивний урок · без попередніх знань

Цей урок пояснює ідею "навчитися рівнянню" простою мовою, а потім проходить через те, як мережа навчається функціям дрейфу та дифузії і де deep hedging вписується в цю картину.

Дивіться також:

Модель SABR -- Класична модель стохастичної волатильності з інтерпретованими параметрами
Модель Heston -- Стохастична волатильність зі зворотним прагненням до середнього з ціноутворенням у закритій формі
SANOS (Непараметричні поверхні) -- Непараметрична підгонка з гарантованою відсутністю арбітражу
Волатильність із залежністю від шляху -- Ще один підхід на основі даних, що використовує історію цінового шляху
Rough Bergomi -- Фракційна модель волатильності, яку Neural SDE потенційно можуть замінити

Мережа навчається рівнянню

Подивіться в дії​

Нейронне SDE проти класичних моделей

Як це працює​

1. Навчайтеся динаміці, а не формі​

2. Deep Hedging: навчайтеся хеджу, а не лише ціні​

3. Поверхня волатильності виникає​

Захоплює динаміку, яку параметричні моделі пропускають

Сильні сторони та обмеження​

Актуальність для крипто​

Навчені моделі, навчені хеджі

Дослідник рівнянь​

Дослідник рівнянь

Побудова математичної інтуїції​

Подивіться в дії

Як це працює

1. Навчайтеся динаміці, а не формі

2. Deep Hedging: навчайтеся хеджу, а не лише ціні

3. Поверхня волатильності виникає

Сильні сторони та обмеження

Актуальність для крипто

Дослідник рівнянь

Побудова математичної інтуїції