выбор диапазона для тестирования параметра
При
выборе пригодного диапазона для тестирования параметра руководствуйтесь двумя
принципами. Первое, диапазон должен соответствовать данному индикатору, правилу
или модели. Другими словами, сканирование диапазона от 1 до 1000 дней для
краткосрочной скользящей средней противоречит понятию краткосрочности (обычно
от 3 до 10 дней) и выходит далеко за рамки обычного диапазона, применяемого для
скользящих средних (например, от 3 до 200 дней). Для краткосрочной скользящей
средней более разумным был бы диапазон сканирования от 1 до 13 дней.
Необходимо
контролировать и время вычислений, требуемое тем или иным диапазоном
сканирования. Это становится особенно важным при сканированиях нескольких
переменных. Для сканирования диапазона скользящих средних от 1 до 13 дней с
шагом 2 требуется всего семь тестов, что с точки зрения времени вычислений
незначительно, независимо от скорости выполнения отдельных тестов. Сканирование
диапазона от 1 до 200 с шагом 1 требует уже 200 тестов, что более чем в 28 раз
больше, чем при первом сканировании. И это теряет смысл, если данный параметр
слабо влияет на эффективность или если сканируемые значения выходят за рамки
нормального диапазона.
Размер
шага, с которым сканируется диапазон, важен не только с точки зрения
потребности в машинном времени. Слишком тщательное сканирование переменной
может израсходовать не только компьютерное время; оно может по невнимательности
привести вас к «настраиванию на кривую», особенно если вами не были приняты
надлежащие меры предосторожности от выбора всплеска прибыли вместо холма
прибыли. Валидным было бы сканирование краткосрочной скользящей средней от 1 до
13 дней с шагом 1 день.
Сканирование
долгосрочной скользящей средней от 10 до 200 Дней с шагом 1 день будет повышать
вероятность подстраивания под кривую, снижать валидность результатов и увеличивать
время на получение результатов. Причина этого в том, что 5-процентное изменение
этой средней при длине 100 дней дает средние с периодами 95 и 105. Сравните это
с 5-процентным изменением при периоде 20 дней, которое дает 19-дневную и
21-дневную средние. Тесты на периоде 100 чаще в 5 раз.
Выбор
данных
Отбор
подходящих данных подчиняется двум правилам: объем выборки должен быть
достаточно большим, чтобы обеспечить статистическую валидность, и выборка
должна включать достаточно широкий диапазон рыночных условий. Эти факторы также
взаимозависимы. Объем тестовых данных должен быть достаточным для генерации
статистически значимой выборки сделок. В идеале, в выборке должно быть как
минимум 30 сделок, и чем больше, тем лучше.
Некоторые
правила «потребляют» данные, сокращая число степеней свободы, следовательно,
объем выборки данных и число генерируемых сделок должен быть достаточно
большим, чтобы удовлетворять ограничениям со стороны торговой модели и процесса
оптимизации.
Рассмотрим
следующий пример. Торговая модель, использующая 2 скользящих средних,
тестируется на выборке данных за 200 дней. Самая длинная скользящая средняя
может иметь период 50 дней. Для ее вычисления используются данные за 50 дней,
что приводит к «потреблению» 50 степеней свободы. При этом остается лишь 150
дней, которые могут генерировать сигналы. Если генерируется 5 сделок, мы имеем
2 скользящих средних, стоп-лосс, и т.д... (т.е., 5 правил продуцируют 5
сделок). Следовательно, этот тест должен быть либо отменен, либо модифицирован.
Модифицировать его можно путем увеличения числа точек данных в выборке,
сокращения периода длинной скользящей средней в данном тесте или исключением
ограничивающих правил.
Выполнение
второго принципа может оказаться более трудным. Выборка данных должна быть репрезентативной
относительно рынка в целом. Она должна содержать как можно больше типов тренда,
паттернов и ситуаций: бычьих, медвежьих, застойных и цикличных. Она также
должна содержать максимально возможное число различных уровней волатильности:
высоких, средних и низких.
Руководствуйтесь
этими принципами. Включайте как можно более разнообразные ценовые данные и
используйте объем выборки, соответствующий стилю данной модели. Это правило
наибольшей и максимально обшей возможной выборки. Если данный подход оказывается
непрактичным, берите как можно больше данных, подобных текущим рыночным
условиям. Это правило наиболее пригодной доступной выборки.
Статья размещена в рубрике: Разработка, тестирование и оптимизация торговых систем для биржевого трейдера
|