Вивчіть Neural SDE з нуля

Neural SDE з нуля

1/5

Розділ 1

Нехай мережа вивчить SDE

Кожна модель, яку ви бачили досі — Black-Scholes, Heston, SABR — починається з рівняння, обраного людиною. Ви обираєте SDE, потім підганяєте кілька параметрів. Нейронні SDE перевертають сценарій: нехай нейронна мережа сама вивчить рівняння з даних.

Класичний робочий процес такий: людина записує dS = f(S,t)·dW with a specific f (like σ·S, orσ·Sᵝ, або щось із залученням стохастичної волатильності). Потім ви калібруєте 3-5 параметрів під ринкові дані.

Робочий процес нейронного SDE такий: дрейф μ(S,t) і дифузія σ(S,t) є виходами нейронної мережі. Мережа має тисячі параметрів (ваги та зміщення). Ви тренуєте її, мінімізуючи похибку між модельними цінами та спостережуваними цінами опціонів.

Нейронне SDE

dX = μₕ(X, t)·dt + σₕ(X, t)·dW

μₕ and σₕ — нейронні мережі з параметрами θ. Вони приймають на вхід поточний стан X і час t та видають миттєвий дрейф і дифузію.

Ментальна модель

Класичне моделювання — це наче обрати рецепт і налаштувати температуру духовки. Моделювання нейронним SDE — це наче навчити кухаря винайти рецепт, куштуючи тисячі страв (спостережувані ціни) і коригуючи, доки результат не збігатиметься з тим, що подає ринок.

Навіщо це потрібно? Тому що іноді жодне стандартне сімейство моделей не описує дані достатньо добре. Ринкова динаміка може мати особливості — зміни режимів, асиметричну кластеризацію, залежну від траєкторії поведінку — які не здатна вловити жодна п'ятипараметрична модель. Нейронне SDE, у принципі, може апроксимувати будь-які неперервні функції дрейфу та дифузії. Питання лише в тому, чи вистачить у вас даних і дисципліни, щоб надійно його натренувати.

Розділ 2

Архітектура

Мережа має стандартну прямопрохідну архітектуру. Входи — поточний стан ринку. Виходи — коефіцієнти SDE. Мережа і Є моделлю.

Входи: Спот-ціна S, час t і, за бажанням, ринкові ознаки, як-от поточна імпліцитна волатильність, нахил скью або форма часової структури. Що багатший вхід, то більше контексту має мережа, щоб вирішити, якою має бути σ у цій точці.

Приховані шари: Зазвичай 2-4 шари з 32-128 нейронами кожен. Активації ReLU або softplus. Нічого екзотичного. Магія не в архітектурі; вона в тому, що мережа вчиться представляти.

Виходи: Дрейф μ(S,t) і дифузія σ(S,t). Вихід дифузії проходить через softplus або експоненту, щоб гарантувати додатність. Ці два числа, обчислені в поточному стані, визначають, що робить SDE у цю мить.

Архітектура нейронного SDE

Стан ринку (S, t, ознаки) надходить зліва. Приховані шари з нелінійними активаціями перетворюють його. Вихідний шар видає миттєвий дрейф μ та дифузію σ -- дві функції, що визначають навчене SDE. Наведіть курсор, щоб підсвітити шари.

Тренування: Згенеруйте траєкторії з нейронного SDE за допомогою дискретизації Ейлера-Маруями. Оцініть опціони вздовж цих траєкторій методом Монте-Карло. Порівняйте модельні ціни зі спостережуваними ринковими цінами. Виконайте зворотне поширення похибки ціноутворення через симуляцію траєкторій у ваги мережі. Це диференційоване програмування, застосоване до стохастичних процесів.

Ключовий технічний інсайт: увесь конвеєр — від ваг мережі до коефіцієнтів SDE, симульованих траєкторій і цін опціонів — є диференційовним. Ви можете обчислити градієнти функції втрат ціноутворення щодо кожної ваги мережі. Саме це робить тренування можливим.

Розділ 3

Глибоке хеджування

Коли у вас є вивчене SDE для динаміки ціни, природний наступний крок — також вивчити хедж. Глибоке хеджування використовує другу мережу, яка видає коефіцієнт хеджування на кожному часовому кроці й тренується разом із моделлю ціноутворення.

Класичне хеджування обчислює дельту з моделі аналітично: ∂C/∂S за BS, або чисельним наближенням у складніших моделях. Це ігнорує транзакційні витрати, вплив на ринок, дискретне ребалансування та обмеження ліквідності.

Глибоке хеджування пропонує: натренуйте мережу, що видає коефіцієнт хеджування δ(S, t, портфель) на кожному часовому кроці. Мета тренування — не мінімізувати помилку відстеження щодо теоретичної дельти, а мінімізувати фактичну дисперсію P&L хеджування (або CVaR, або будь-яку міру ризику) з урахуванням транзакційних витрат.

Цільова функція глибокого хеджування

minₕ Risk[ PnL(V₀, δₕ, costs) ]

Мережа δₕ видає коефіцієнт хеджування на кожному кроці ребалансування. Цільова функція включає фактичні витрати на торгівлю, а не лише теоретичну помилку відстеження.

Результат: стратегія хеджування, що враховує реальні тертя, які класична дельта ігнорує. У бектестах стратегії глибокого хеджування часто показують нижчу реалізовану вартість хеджування, ніж модельна дельта, особливо для:

1. Режимів з високими транзакційними витратами. Мережа вчиться хеджувати рідше, коли витрати високі, фактично обираючи ширший діапазон без торгівлі.

2. Неліквідних базових активів. Мережа вчиться використовувати корельовані ліквідні інструменти як проксі-хеджі, коли прямий хедж є дорогим.

3. Залежних від траєкторії екзотичних інструментів. Там, де не існує простої формули дельти, мережа все одно може вивчити ефективні хеджі із симульованих траєкторій.

Інсайт спільного навчання

Найпотужніша версія тренує SDE ціноутворення та мережу хеджування одночасно. SDE вивчає динаміку, узгоджену зі спостережуваними цінами, а мережа хеджування вчиться хеджувати за цієї динаміки. Дві мережі регуляризують одна одну: SDE не може вивчити нереалістичну динаміку, бо мережа хеджування працювала б погано, і навпаки.

Розділ 4

Що відкриває мережа

Коли ви розглядаєте вивчену функцію σ(S,t), вона часто нагадує локальну волатильність зі стохастичними рисами. Мережа самостійно відкриває структури, на розробку яких люди витратили десятиліття.

Натренуйте нейронне SDE на даних опціонів на акції чи крипто, а потім побудуйте вивчену функцію дифузії σ(S,t) у вигляді теплової карти. Типові знахідки:

Ефект важеля. Мережа виявляє, що σ(S,t) вища, коли S низька, і нижча, коли S висока. Це саме той механізм, який Heston відтворює через від'ємну ρ, а CEV — через β < 1. Мережа нічого не знає про ці моделі. Вона знаходить закономірність у даних.

Повернення волатильності до середнього. Вивчена σ зазвичай підвищена після нещодавніх великих рухів і повертається до базового рівня. Мережа самостійно відкрила повернення до середнього в стилі CIR, яке в Heston зашите жорстко.

Кластеризація волатильності. Мережа виявляє, що стани високої волатильності стійкі — σ(S,t) залишається підвищеною деякий час після сплеску. Це кластеризація в стилі GARCH, добре відома практикам, але складна для простих моделей стохастичної волатильності.

Що виявляє мережа

Vol rises as price falls -- the network learned the classic equity/crypto pattern

Перемикайтеся між трьома шаблонами вище. Кожен показує, що може відкрити нейронне SDE, натреноване на різних режимах даних. Суть не в тому, що мережа розумніша за Heston чи SABR. Суть у тому, що вона доходить до подібних структур без вказівки шукати їх. Це вагомий доказ того, що ці структури є справжніми рисами даних, а не артефактами сімейства моделей.

Зворотний бік: мережа також може відкривати хибні закономірності, якщо дані зашумлені або тренування недисципліноване. Велика мережа, натренована на бідних даних, чудово перенавчиться — запам'ятає шум і назве його структурою.

Розділ 5

Практичні міркування

Нейронні SDE потужні, але вимогливі. Розрив між науковою статтею та продакшн-системою широкий. Знайте ціну, перш ніж братися.

Збіжність навчання

Епоха: 0Втрати: 2.130Фаза: Швидкий спуск

Натисніть «Тренувати» вище та спостерігайте за збіжністю функції втрат. Зверніть увагу на три фази: швидкий початковий спад (мережа вивчає загальну структуру), повільніше уточнення (тонке налаштування крил і хвостів) і плато (спадна віддача, потенційний ризик перенавчання).

Вимоги до тренувальних даних. Потрібно достатньо даних про ціни опціонів, щоб обмежити високовимірну функцію. Для одного базового активу це означає місяці або роки щоденних знімків посмішки за кількома експіраціями. Розріджені дані (мало страйків, мало експірацій) призводять до недовизначених мереж, які перенавчаються.

Ризик перенавчання. Нейронна мережа з 10 000 параметрів може ідеально запам'ятати 10 000 точок даних. Це не означає, що вона вивчила динаміку. Регуляризація (dropout, weight decay, рання зупинка) є обов'язковою. Валідація на відкладених даних не підлягає обговоренню.

Інтерпретованість. П'ятипараметрична модель Heston розповідає вам історію: kappa каже одне, rho — інше. Нейронне SDE — це чорна скринька з 10 000 параметрів. Ви можете розглянути вивчену функцію (як на тепловій карті вище), але не можете вказати на одне число й сказати «це швидкість повернення до середнього». Для торгового деску, який має пояснювати свою модель ризик-менеджерам, це серйозний недолік.

Обчислювальна вартість. Тренування вимагає тисяч прямих проходів через SDE (траєкторії Монте-Карло), кожен із яких потребує зворотного поширення через мережу на кожному часовому кроці. Це на порядки дорожче, ніж калібрування Heston чи SABR. Інференс (оцінка одного опціону натренованою моделлю) швидкий, але перекалібрування повільне.

Поточне впровадження. Нейронні SDE та глибоке хеджування використовуються в дослідженнях і квантовими хедж-фондами з відповідною інфраструктурою. На ванільних десках вони поки не стандарт. Типова продакшн-конфігурація: класична модель (Heston, SABR, SLV) для щоденного ціноутворення, а нейронні методи — для конкретних цінних задач, де класичні моделі систематично зазнають невдачі.

Коли братися за нейронні SDE

Використовуйте нейронне SDE, коли: (1) у вас багато даних і класичне сімейство моделей постійно пропускає ті самі закономірності, (2) ви оцінюєте екзотичні інструменти без чистого аналітичного розв'язку, або (3) вам потрібна стратегія хеджування, що враховує реальні тертя. Не використовуйте його, коли п'ятипараметрична модель підходить достатньо добре — ви додаєте складність, не додаючи цінності.

Куди рухатися далі:

Модель Heston — класичний еталон стохастичної волатильності

Стохастична локальна волатильність — калібрування продакшн-рівня з динамікою

Rough Bergomi — дробова стохастична волатильність, передовий рубіж до нейронних методів