научная статья по теме ИСПОЛЬЗОВАНИЕ МЕТОДА ЭМПИРИЧЕСКИХ МОД ДЛЯ УЛУЧШЕНИЯ ПРОГНОЗА ЦЕН НА ЗОЛОТО МЕТОДОМ ЛОКАЛЬНОЙ АППРОКСИМАЦИИ Экономика и экономические науки

Текст научной статьи на тему «ИСПОЛЬЗОВАНИЕ МЕТОДА ЭМПИРИЧЕСКИХ МОД ДЛЯ УЛУЧШЕНИЯ ПРОГНОЗА ЦЕН НА ЗОЛОТО МЕТОДОМ ЛОКАЛЬНОЙ АППРОКСИМАЦИИ»

Использование метода эмпирических мод для улучшения прогноза цен на золото методом локальной аппроксимации

А.Г. Рудницкий,

канд. физ.-мат. наук, доц. каф. «Высшая математика», Государственный экономико-технологический университет транспорта; старший научный сотрудник, Институт гидромеханики НАН Украины (03680, Украина, г. Киев, ул. Желябова, 8/4; e-mail: rudnitskii@mail.ru) А.А. Рудницкая,

ст. факультета бизнеса и экономики, Университет экономики и права им. Р. Лазарского в Варшаве (Польша, 02-662, г. Варшава, ул. Сверадовская, 43; e-mail: al.rudnitska@gmail.com)

Аннотация. В статье представлен анализ динамического поведения ежедневных цен на золото на Лондонской бирже металлов. Для исследования особенностей этого временного ряда, рассмотренного за 12-летний период (2000-2012 гг.), применяется новый подход - преобразование Гильберта-Хуанга. Посредством декомпозиции на эмпирические моды (ДЭМ) удалось выявить важные особенности поведения исследуемых данных и построить соответствующее частотно-временное представление - спектр Гильберта-Хуанга. Этот подход позволил выделить характерные периоды колебаний ценового ряда f365, 270 и 155 дней), а применение метода локальной аппроксимации к внутренним модам исследуемого ряда позволило улучшить показатели прогноза.

Abstract. In this research investigation of dynamical behavior of daily gold prices on London Metal Exchange is presented. The investigation of the world gold price data for over 12-year period from 2000 to 2012 is performed through the novel approach called Hilbert-Huang Transformation (HHT), important properties and specific behavior of gold price time series are numerically analyzed. Data set was adaptively decomposed through Empirical Mode Decomposition (EMD) into a finite number of Intrinsic Mode Functions (iMFs) which have a definite instantaneous frequency (IF) and finally can be expressed in joint time-frequency-energy distribution by Hilbert spectrum (HT). Forecasting technique (local approximation method) was applied to IMFs of time series. The result obtained with using of this approach was that daily gold price of London Metal Exchange shows the trends of price in 365-days, 270-days as well as in 155-days.

Ключевые слова: декомпозиции на эмпирические моды, хаос, прогнозирование, корреляционная размерность, показатель Ляпунова, нелинейная динамика, временные ряды.

Keywords: Empirical mode decomposition, Hilbert-Huang Transform, chaos, forecasting, correlation dimension; Lyapunov exponent; nonlinear dynamic; time series.

Освобождение от фиксированных курсов валют по отношению к золоту в конце 70-х годов прошлого века привело к тому, что на мировом рынке стали доминировать представления о золоте как всего лишь об одном из промышленных металлов, используемых для технических нужд и в ювелирной промышленности. С того времени не золотом меряют цену доллара, а долларом измеряется стоимость тройской унции золота. Вместе с утратой монетарной функции золото стало терять свою инвестиционную привлекательность. Тем не менее, перестав выполнять функцию меры стоимости, цена на золото продолжает сохранять статус индикатора инфляции и склонности инвесторов к риску [1].

Особенно заметно отношение к золоту меняется в периоды экономических кризисов, когда золото всё чаще начинают рассматривать, как фактор, позволяющий застраховать себя от нестабильности экономической ситуации, обеспечивая экономическую и физическую безопасность как целых государств, так и физических лиц. Таким образом, естественно возникает необходимость понимания природы колебаний цен

на золото, а также умения анализировать и прогнозировать соответствующие ценовые ряды.

Заметим, что исторически сформировались два противоположных подхода к возможности предсказуемости явлений и процессов -детерминистический (точное и однозначное определение будущего по точно известному настоящему) и вероятностный (стохастический, принципиально непредсказуемый), когда ограничиваются лишь оценками вероятностей того или иного исхода. Оба эти подхода практически всегда вплоть до середины 20-го века использовали предположения о стационарности и линейности сигналов и систем. Между тем, большинство естественных материальных процессов, реальных физических систем и соответствующих этим процессам и системам данных в той или иной мере являются нелинейными и нестационарными.

Одним из последних методов обработки такого рода данных является метод разложения сигнала по эмпирическим модам, представляющий из себя адаптивный метод анализа нелинейных и нестационарных сигналов [2,3]. Его главное преимущество состоит в том, что базис, используемый при разложении (набор эмпири-

ческих мод) конструируется непосредственно из тех данных (того сигнала), с которым ведется работа. Это позволяет учесть все его локальные особенности, внутреннюю структуру, шумы, тренды, аномальные выбросы и пропущенные значения. Декомпозиция на эмпирические моды (ДЭМ) обладает важными для практических приложений свойствами: ортогональность, локальность, полнота и адаптивность.

Поскольку предварительных знаний не всегда хватает для понимания предварительных сведений, сделаем некоторые пояснения.

Метод декомпозиции на внутренние

моды

Декомпозиция основана на предположении, что любые данные состоят из аддитивной комбинации различных внутренних колебаний. В любой момент времени данные могут иметь различные сосуществующие внутренние колебания, наложенные одно на другое. Каждое колебание представляет из себя модовую функцию, которая имеет экстремумы и нулевые пересечения. Функции внутренних мод (intrinsic mode function - IMF), вычисляются (извлекаются) непосредственно из данных и, одновременно, составляют эмпирически ортогональный базис, по которому производится разложение так, что их полная сумма позволяет восстановить исходный сигнал. Кроме того, колебание в некотором смысле «симметрично» относительно локального среднего значения.

Эмпирическая мода - это функция, заданная непрерывно на интервале существования сигнала или дискретно в виде вектора отсчетов, имеющая в общем случае произвольную форму и аналитическую запись (если таковая существует), которая, должна удовлетворять двум необходимым условиям:

1. Количество экстремумов функции (максимумов и минимумов) и количество пересечений нуля не должны отличаться более чем на единицу.

2. В любой точке функции среднее значение 2-х огибающих - верхней, интерполирующей локальные максимумы, и нижней - интерполирующей локальные минимумы должно быть равно нулю.

В качестве способа интерполяции используются либо кубические сплайны (чаще всего), либо скользящая параболическая (квадратичная) интерполяция по 3-м соседним точкам.

Эмпирическая мода представляет из себя колебательный режим, амплитуда и частота которого не обязательно постоянны (как, например, в обычной синусоиде), а могут являться функциями времени.

Для осуществления алгоритма разложения следует выполнить следующие шаги:

1. идентифицировать все локальные экстремумы emin,ешах сигнала х(t);

2. провести огибающие emin (t), em^ (t)

(чаще всего используется сплайн-интерполяция);

3. вычислить среднее

m (t) = (emin + emax )/2 ;

4. извлечь «детали», отняв от сигнала x(t) среднее m(t) : h(t) = x(t) - m(t) ;

5. если h(t) не внутренняя мода, применить повторно шаги №1-4 к h(t), как к сигналу (процедура называется процессом просеивания).

Компонента h(t) признаётся внутренней модой, если среднее m(t) глобально меньше некоторого заранее предопределённого критерия. В этом случае h(t) присваивается индекс

i, а разность hi (t) = x(t) — mi(t) признаётся внутренней модой и обозначается, как правило ci (t). Остаток r (t) = x(t) — ct(t) подвергается аналогичной процедуре, после которой выделяется остаток ri+l(t) = x(t) — ci+l(t), и т.д. В конечном итоге из сигнала выделяется n внутренних мод и сам сигнал можно представить в виде

n

x(t) = £ c,. (t) + r (t) , (1)

i= 1

где r(t) - окончательный, максимально

выпрямленный остаток, а моды, на которые разложен сигнал локально ортогональны:

c(t) • ci+i(t) * 0 .

Критерии останова процесса декомпозиции сигнала могут быть следующими:

1. Остаток r(t) не содержит экстремальных точек, т.е. становится либо константой, либо монотонной функцией, из которой больше не может быть извлечено функций IMF.

2. Остаток r(t) во всем интервале задания сигнала становится несущественным по своим значениям по сравнению с сигналом и не представляет интереса для анализа.

3. Так как суммирование всех функций IMF (реконструкция сигнала) должно давать исходный сигнал, то можно останавливать разложение заданием относительной погрешности среднеквадратической реконструкции (без учета остатка r (t)).

Таким образом, остановка декомпозиции сигнала происходит при максимальном «выпрямлении» остатка r(t) с числом экстремумов не

более 2-3. Заметим, что в силу особенностей алгоритма, даже для данных с нулевым средним значением конечный остаток может отличаться от нуля.

Входной сигнал x(t) в соответствии с выражением (1) раскладывается по адаптивному базису, полученному непосредственно из анализируемых данных эмпирическим методом. Метод не определен аналитически, но удовлетворяет традиционным требованиям базиса, поскольку является:

1. законченным и сходящимся (сумма всех функций IMF и остатка равна исходному сигналу и не зависит от критериев останова итераций при их выделении);

2. ортогональным (все IMF и остаток ортогональны друг другу).

И, подчеркнём это ещё раз, этот базис является адаптивным.

Использование метода EMD не требует центрирования данных - нулевая линия для каждой компоненты декомпозиции формируется процессом отсеивания. Извлеченные моды локально симметричны, имеют физически значимые функции мгновенных частот, и каждая последующая мода содержит более низкочастотные составляющие по сравнению с предыдущей.

Таким образом, если удаётся установить, что природа той или иной компоненты отличается по своим свойствам от свойств других IMF, получаем простой, понятный, адаптивный и нелинейный способ фильтрации анализируемых данных.

Св

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком