Бэктестинг

Бэктестинг (от англ. backtesting, фр. backtesting;) — это метод проверки пригодности математической модели или стратегии на большом массиве реальных исторических данных. Бэктестинг может применяться к любым наборам данных, однако чаще всего используется в социальных и естественных науках, в которых анализируются измеримые данные и необходимы статистические подходы. В финансах бэктестинг служит для верификации устойчивости и прибыльности инвестиционной стратегии[1]. Как правило, большой объём требуемых данных приводит к их централизации в базах данных, чтобы сделать процесс автоматизированным.

Бэктестинг в финансах и экономике

Выбор инвестиционных и спекулятивных стратегий на финансовых рынках

В применении бэктестинга к рынкам капитала речь идёт о проверке производительности финансовой стратегии: оценивается, как она сработала бы в прошлом, если бы тогда действительно применялась при аналогичных рыночных условиях. Бэктестинг на исторических данных эффективнее, чем тестирование на искусственно симулированных рядах. Несмотря на то что бэктестинг не способен предсказать успех стратегии в будущем, его основное преимущество заключается в понимании уязвимых мест подхода на основании реальных, а не гипотетических, сценариев прошлого. Такой подход позволяет разработчику «учиться на ошибках», не рискуя реальными средствами.

Ключевое отличие бэктестинга от других форм исторического тестирования — строгая имитация применения стратегии в прошлом, с учётом актуальных на тот момент условий рынка для получения корректных результатов. Примеры таких условий: отслеживание исторических котировок, операции с акциями, которые впоследствии исчезли с рынка, использование фондовых индексов в их оригинальной, а не текущей структуре. Исторически такие тесты использовались преимущественно профессионалами — финансовыми учреждениями и фондами, в силу малой доступности и высокой стоимости требуемых наборов данных. Однако с развитием торговли и биржевых сервисов через интернет и удешевлением доступа к базам, бэктестинг стал доступен и частным инвесторам, вошёл в состав торговых платформ интернет-брокеров.

Различные рыночные стратегии могут быть протестированы таким образом: например, стратегии распределения активов, поиска сигналов, торговые алгоритмы. Многие другие стратегии (например, программы продажи/покупки крупных лотов с дроблением сделок во времени ради лучшей цены) существенно хуже поддаются бэктестингу. Причина в том, что масштабные операции влияют на цену актива, что искажает условия обратного теста и приводит к нарушению корреляций: оценивать такие стратегии бэктестингом принципиально некорректно.

Банковский надзор

Базельские подходы к банковскому регулированию строятся на расчёте объёмов финансовых рисков набора портфелей, в частности — показателе стоимости под риском (Value at Risk, VaR). Такие значения могут определяться c помощью параметрических и полупараметрических динамических моделей[2][3], непараметрических методов — исторических симуляций либо ядерных оценок. Базельский комитет по банковскому надзору разрешает финансовым институтам использовать собственные — так называемые внутренние — модели, но все они подлежат обязательной проверке методом бэктестинга.

Бэктестинг для VaR базируется на анализе «исключений» или эксцессов[4][5]: эксцесс возникает, когда зафиксированная на дату убытка величина оказывается больше рассчитанного по методу VaR. Это говорит о том, что реальный риск превышает теоретическую оценку. Поскольку VaR по сути есть квантиль распределения потерь портфеля, типичный метод проверки валидности — сравнение доли «исключений» в выборке с заданным уровнем покрытия риска.

Для оценки VaR 1 день на 99 %, протестированной на 250 последовательных дней, результаты оцениваются по цветовой зоне: зелёная (0-95 %), оранжевая (95-99,99 %), красная (99,99-100 %) согласно следующей таблице[6]:

undefined
VaR 1 день на 99 %, протестировано 250 дней
Зона Количество исключений Вероятность Кумулятивно
Зелёная 0 8,11% 8,11%
1 20,47% 28,58%
2 25,74% 54,32%
3 25,74% 54,32%
4 13,41% 89,22%
Оранжевая 5 6,66% 95,88%
6 2,75% 98,63%
7 0,97% 99,60%
8 0,30% 99,89%
9 0,08% 99,97%
Красная 10 0,02% 99,99%
11 0,00% 100,00%
... ... ...

Для VaR 10 дней на 99 %, протестированной на 250 последовательных дней, результаты определяют зону аналогично:

undefined
VaR 10 дней на 99 %, протестировано 250 дней
Зона Количество исключений Вероятность Кумулятивно
Зелёная 0 36,02% 36,02%
1 15,99% 52,01%
2 11,58% 63,59%
3 8,90% 72,49%
4 6,96% 79,44%
5 5,33% 84,78%
6 4,07% 88,85%
7 3,05% 91,90%
8 2,28% 94,17%
Оранжевая 9 1,74% 95,91%
... ... ...
24 0,01% 99,99%
Красная 25 0,00% 99,99%
... ... ...

Ограничения

Одной из серьёзных проблем в процедурах стандартного бэктестинга является риск смещения оценок. В 2010 году Эскансиано и Ольмо отметили, что классический тест бэктестинга может давать искажённые результаты из-за учёта статистической ошибки оценивания моделей для VaR. В качестве решения они предложили корректировку тестовой статистики с явным учётом такого риска.

Бэктестинг и климатическое моделирование

Бэктестинг играет ключевую роль в оценке метеорологических и климатических моделей. Например, для разработки теории циклогенеза можно использовать бэктест с реальными условиями природных ураганов прошлого. Если модель успешно воспроизводит по архивным данным местоположение, силу, траекторию и длительность прошедших стихийных явлений, это повышает доверие к её предсказательной ценности. В климатическом моделировании бэктестинг важен в силу длительности и масштабов естественных процессов: проверка на исторических данных позволяет теоретически сравнить разные гипотезы относительно их реального прогноза.

Сеточные модели и эффект бабочки

Проблемы проверки модели связаны с определением структуры сетки доступных и протестированных данных и с учётом множества меняющихся параметров. Из-за эффекта бабочки даже минимальная разница во входных данных, меньшая размера ячеек итоговой сетки, способна в процессе расчётов привести к существенным отклонениям — как в силу структуры сетки самой модели, так и по причине неучтённых переменных[7].

Примечания

  1. Backtesting (фр.). traderpack.fr via Wikiwix. Дата обращения: 11 октября 2023. Архивировано 11 декабря 2021 года.
  2. Engle, Robert F.; Manganelli, Simone (1 октября 2004). “CAViaR”. Journal of Business & Economic Statistics [англ.]. 22 (4): 367—381. DOI:10.1198/073500104000000370. Дата обращения 2020-10-29.
  3. Bollerslev, Tim (1 апреля 1986). “Generalized autoregressive conditional heteroskedasticity”. Journal of Econometrics [англ.]. 31 (3): 307—327. DOI:10.1016/0304-4076(86)90063-1. Дата обращения 2020-10-29.
  4. Kupiec, Paul H. (30 ноября 1995). “Techniques for Verifying the Accuracy of Risk Measurement Models”. The Journal of Derivatives [англ.]. 3 (2): 73—84. DOI:10.3905/jod.1995.407942. Дата обращения 2020-10-29.
  5. Christoffersen, Peter F. (1998). “Evaluating Interval Forecasts”. International Economic Review [англ.]. 39 (4): 841—862. DOI:10.2307/2527341. Дата обращения 2020-10-29.
  6. Supervisory framework for the use of "backtesting" in conjunction with the internal models approach to market risk capital requirements (англ.). Basle Committee on Banking Supervision (январь 1996). Дата обращения: 25 июня 2024. Архивировано 31 июля 2025 года.
  7. Philippe Lucas-Picher. Caractérisation de la variabilité interne des modèles régionaux de climat (фр.). Université du Québec à Montréal (август 2008). Дата обращения: 25 июня 2024. Архивировано 17 ноября 2024 года.