THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама

АНАЛИЗ ВРЕМЕННЫХ РЯДОВ


ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ

1.1 ВРЕМЕННОЙ РЯД И ЕГО ОСНОВНЫЕ ЭЛЕМЕНТЫ

1.2 АВТОКОРРЕЛЯЦИЯ УРОВНЕЙ ВРЕМЕННОГО РЯДА И ВЫЯВЛЕНИЕ ЕГО СТРУКТУРЫ

1.3 МОДЕЛИРОВАНИЕ ТЕНДЕНЦИИ ВРЕМЕННОГО РЯДА

1.4 МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

1.5 ПРИВЕДЕНИЕ УРАВНЕНИЯ ТРЕНДА К ЛИНЕЙНОМУ ВИДУ

1.6 ОЦЕНКА ПАРАМЕТРОВ УРАВНЕНИЯ РЕГРЕССИИ

1.7 АДДИТИВНАЯ И МУЛЬТИПЛИКАТИВНАЯ МОДЕЛИ ВРЕМЕННОГО РЯДА

1.8 СТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ

1.9 ПРИМЕНЕНИЕ БЫСТРОГО ПРЕОБРАЗОВАНИЯ ФУРЬЕ К СТАЦИОНАРНОМУ ВРЕМЕННОМУ РЯДУ

1.10 АВТОКОРРЕЛЯЦИЯ ОСТАТКОВ. КРИТЕРИЙ ДАРБИНА- УОТСОНА

Введение

Почти в каждой области встречаются явления, которые интересно и важно изучать в их развитии и изменении во времени. В повседневной жизни могут представлять интерес, например, метеорологические условия, цены на тот или иной товар, те или иные характеристики состояния здоровья индивидуума и т. д. Все они изменяются во времени. С течением времени изменяются деловая активность, режим протекания того или иного производственного процесса, глубина сна человека, восприятие телевизионной программы. Совокупность измерений какой-либо одной характеристики подобного рода в течение некоторого периода времени представляют собой временной ряд.

Совокупность существующих методов анализа таких рядов наблюдений называется анализом временных рядов.

Основной чертой, выделяющей анализ временных рядов среди других видов статистического анализа, является существенность порядка, в котором производятся наблюдения. Если во многих задачах наблюдения статистически независимы, то во временных рядах они, как правило, зависимы, и характер этой зависимости может определяться положением наблюдений в последовательности. Природа ряда и структура порождающего ряд процесса могут предопределять порядок образования последовательности.

Цель работы состоит в получении модели для дискретного временного ряда во временной области, обладающей максимальной простотой и минимальным числом параметров и при этом адекватно описывающей наблюдения.

Получение такой модели важно по следующим причинам:

1) она может помочь понять природу системы, генерирующей временные ряды;

2) управлять процессом, порождающим ряд;

3) ее можно использовать для оптимального прогнозирования будущих значений временных рядов;

Временные ряды лучше всего описываются нестационарными моделями, в которых тренды и другие псевдоустойчивые характеристики, возможно меняющиеся во времени, рассматриваются скорее как статистические, а не детерминированные явления. Кроме того, временные ряды, связанные с экономикой, часто обладают заметными сезонными , или периодическими, компонентами; эти компоненты могут меняться во времени и должны описываться циклическими статистическими (возможно, нестационарными) моделями.

Пусть наблюдаемым временным рядом является y 1 , y 2 , . . ., y n . Мы будем понимать эту запись следующим образом. Имеется Т чисел, представляющих собой наблюдение некоторой переменной в Т равноотстоящих моментов времени. Эти моменты для удобства пронумерованы целыми числами 1, 2, . . .,Т. Достаточно общей математической (статистической или вероятностной) моделью служит модель вида:

y t = f(t) + u t , t = 1, 2, . . ., T.

В этой модели наблюдаемый ряд рассматривается как сумма некоторой полностью детерминированной последовательности {f(t)}, которую можно назвать математической составляющей, и случайной последовательности {u t }, подчиняющейся некоторому вероятностному закону. (И иногда для этих двух составляющих используются соответственно термины сигнал и шум). Эти компоненты наблюдаемого ряда ненаблюдаемы; они являются теоретическими величинами. Точный смысл указанного разложения зависит не только от самих данных, но частично и оттого, что понимается под повторением эксперимента, результатом которого являются эти данные. Здесь используется так называемая «частотная» интерпретация. Полагается, что, по крайней мере, принципиально можно повторять всю ситуацию целиком, получая новые совокупности наблюдений. Случайные составляющие, кроме всего прочего, могут включать в себя ошибки наблюдений.

В данной работе рассмотрена модель временного ряда, в которой на тренд накладывается случайная составляющая, образующая случайный стационарный процесс. В такой модели предполагается, что течение времени никак не отражается на случайной составляющей. Точнее говоря, предполагается, что математическое ожидание (то есть среднее значение) случайной составляющей тождественно равно нулю, дисперсия равна некоторой постоянной и что значения u t в различные моменты времени некоррелированны. Таким образом, всякая зависимость от времени включается в систематическую составляющую f(t). Последовательность f(t) может зависеть от некоторых неизвестных коэффициентов и от известных величин, меняющихся со временем. В этом случае её называют «функцией регрессии». Методы статистических выводов для коэффициентов функции регрессии оказываются полезными во многих областях статистики. Своеобразие же методов, относящихся именно к временным рядам, состоит в том, что здесь исследуются те модели, в которых упомянутые выше величины, меняющиеся со временем, являются известными функциями t.


Глава 1. Анализ временных рядов

1.1 Временной ряд и его основные элементы

Временной ряд –это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:

· факторы, формирующие тенденцию ряда;

· факторы, формирующие циклические колебания ряда;

· случайные факторы.

При различных сочетаниях в изучаемом процессе или явлении этих факторов зависимость уровней ряда от времени может принимать различные формы. Во-первых , большинство временных рядов экономических показателей имеют тенденцию, характеризующую долговременное совокупное воздействие множества факторов на динамику изучаемого показателя. Очевидно, что эти факторы, взятые в отдельности, могут оказывать разнонаправленное влияние на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию.

Во-вторых, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку деятельность ряда отраслей экономики и сельского хозяйства зависит от времени года. При наличии больших массивов данных за длительные промежутки времени можно выявить циклические колебания, связанные с общей динамикой временного ряда.

Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой(положительной или отрицательной) случайной компоненты.

В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача статистического исследования отдельного временного ряда – выявление и придание количественного выражения каждой из перечисленных выше компонент с тем чтобы использовать полученную информацию для прогнозирования будущих значений ряда.

1.2 Автокорреляция уровней временного ряда и выявление его структуры

При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда .

Количественно её можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Одна из рабочих формул для расчёта коэффициента автокорреляции имеет вид:

(1.2.1)

В качестве переменной х мы рассмотрим ряд y 2 , y 3 , … , y n ; в качестве переменной у – ряд y 1 , y 2 , . . . ,y n – 1 . Тогда приведённая выше формула примет вид:

(1.2.2)

Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями у t и y t – 1 и определяется по формуле

(1.2.3)

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом . С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше (n/4).

Цели анализа временных рядов. При практическом изучении временных радов на основании экономических данных на определенном промежутке времени эконометрист должен сделать выводы о свойствах этого ряда и о вероятностном механизме, порождающем этот ряд. Чаще всего при изучении временных рядов ставятся следующие цели:

1. Краткое (сжатое) описание характерных особенностей ряда.

2. Подбор статистической модели, описывающей временной ряд.

3. Предсказание будущих значений на основе прошлых наблюдений.

4. Управление процессом, порождающим временной ряд.

На практике эти и подобные цели достижимы далеко не всегда и далеко не в полной мере. Часто этому препятствует недостаточный объем наблюдений из-за ограниченного времени наблюдений. Еще чаще – изменяющаяся с течением времени статистическая структура временного ряда.

Стадии анализа временных рядов. Обычно при практическом анализе временных рядов последовательно проходят следующие этапы:

1. Графическое представление и описание поведения временного рада.

2. Выделение и удаление закономерных составляющих временного рада, зависящих от времени: тренда, сезонных и циклических составляющих.

3. Выделение и удаление низко- или высокочастотных составляющих процесса (фильтрация).

4. Исследование случайной составляющей временного ряда, оставшейся после удаления перечисленных выше составляющих.

5. Построение (подбор) математической модели для описания случайной составляющей и проверка ее адекватности.

6. Прогнозирование будущего развития процесса, представленного временным рядом.

7. Исследование взаимодействий между различными временными радами.

Для решения этих задач существует большое количество различных методов. Из них наиболее распространенными являются следующие:

8. Корреляционный анализ, позволяющий выявить существенные периодические зависимости и их лаги (задержки) внутри одного процесса (автокорреляция) или между несколькими процессами (кросскорреляция).

9. Спектральный анализ, позволяющий находить периодические и квазипериодические составляющие временного ряда.

10. Сглаживание и фильтрация, предназначенные для преобразования временных рядов с целью удаления из них высокочастотных или сезонных колебаний.

12. Прогнозирование, позволяющее на основе подобранной модели поведения временного рада предсказывать его значения в будущем.

Модели тренда

простейшие модели тренда. Приведем модели трендов, наиболее часто используемые при анализе экономических временных рядов, а также во многих других областях. Во-первых, это простая линейная модель

где а 0 , а 1 – коэффициенты модели тренда;

t – время.

В качестве единицы времени, может быть, час, день (сутки), неделя, месяц, квартал или год. Модель 269, несмотря на свою простоту, оказывается полезной во многих реальных задачах. Если нелинейный характер тренда очевиден, то может подойти одна из следующих моделей:

1. Полиномиальная:

(270)

где значение степени полинома п в практических задачах редко превышает 5;

2. Логарифмическая:

Эта модель чаще всего применяется для данных, имеющих тенденцию сохранять постоянные темпы прироста;

3. Логистическая:

(272)

4. Гомперца

(273), где

Две последние модели задают кривые тренда S-образной формы. Они соответствуют процессам с постепенно возрастающими темпами роста в начальной стадии и постепенно затухающимитемпами роста в конце. Необходимость подобных моделей обусловлена невозможностью многих экономических процессов продолжительное время развиваться с постоянными темпами роста или по полиномиальным моделям, в связи с их довольно быстрым ростом (или уменьшением).

При прогнозировании тренд используют в первую очередь для долговременных прогнозов. Точность краткосрочных прогнозов, основанных только на подобранной кривой тренда, как правило, недостаточна.

Для оценки и удаления трендов из временных рядов чаще всего используется метод наименьших квадратов. Этот метод достаточно подробно рассматривался во втором разделе пособия в задачах линейного регрессионного анализа. Значения временного ряда рассматриваюткак отклик (зависимую переменную), а время t – какфактор, влияющий на отклик (независимую переменную).

Для временных рядов характерна взаимная зависимость его членов (по крайней мере, не далеко отстоящих по времени) и это является существенным отличием от обычного регрессионного анализа, для которого все наблюдения предполагаются независимыми. Тем не менее, оценки тренда и в этих условиях обычно оказываются разумными, если выбрана адекватная модель тренда и если среди наблюдений нет больших выбросов. Упомянутые выше нарушения ограничений регрессионного анализа сказываются не столько на значениях оценок, сколько наих статистических свойствах. Так, при наличии заметной зависимости между членами временного ряда оценки дисперсии, основанные на остаточнойсумме квадратов, дают неправильные результаты. Неправильными оказываются и доверительные интервалы для коэффициентов модели, и т.д. В лучшем случае их можно рассматривать как очень приближенные.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное агентство по образованию

Волгоградский государственный технический университет

КОНТРОЛЬНАЯ РАБОТА

по дисциплине: М одели и методы в экономике

на тему «Анализ временных рядов»

Выполнил: студентка группы ЭЗБ 291с Селиванова О. В.

Волгоград 2010г.

Введение

Классификация временных рядов

Методы анализа временных рядов

Заключение

Литература

Введение

Исследование динамики социально-экономических явлений, выявление и характеристика основных тенденций развития и моделей взаимосвязи дает основание для прогнозирования, то есть определения будущих размеров экономического явления.

Особенно актуальными становятся вопросы прогнозирования в условиях перехода на международные системы и методики учета и анализа социально-экономических явлений.

Важное место в системе учета занимают статистические методы. Применение и использование прогнозирования предполагает, что закономерность развития, действующая в прошлом, сохраняется и прогнозируемом будущем.

Таким образом, изучение методов анализа качества прогнозов является сегодня очень актуальным. Именно эта тема выбрана в качестве объекта исследования в данной работе.

Временной ряд -- это упорядоченная по времени последовательность значений некоторой произвольной переменной величины. Каждое отдельное значение данной переменной называется отсчётом временного ряда. Тем самым, временной ряд существенным образом отличается от простой выборки данных.

Классификация временных рядов

Временные ряды классифицируются по следующим признакам.

1. По форме представления уровней:

Ш ряды абсолютных показателей;

Ш относительных показателей;

Ш средних величин.

2. По характеру временного параметра:

Ш моментные. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. В интервальных рядах уровни характеризуют значение показателя за определенные периоды времени.

Ш интервальные временные ряды. Важная особенность интервальных временных рядов абсолютных величин заключается в возможности суммирования их уровней.

3. По расстоянию между датами и интервалами времени:

Ш полные (равноотстоящие) - когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами.

Ш неполные (не равноотстоящие) - когда принцип равных интервалов не соблюдается.

4. В зависимости от наличия основной тенденции:

Ш стационарные ряды - в которых среднее значение и дисперсия постоянны.

Ш нестационарные - содержащие основную тенденцию развития.

Методы анализа временных рядов

Временные ряды исследуются с различными целями. В одном ряде случаях бывает достаточно получить описание характерных особенностей ряда, а в другом ряде случаев требуется не только предсказывать будущие значения временного ряда, но и управлять его поведением. Метод анализа временного ряда определяется, с одной стороны, целями анализа, а с другой стороны, вероятностной природой формирования его значений.

Методы анализа временных рядов.

1. Спектральный анализ. Позволяет находить периодические составляющие временного ряда.

2. Корреляционный анализ. Позволяет находить существенные периодические зависимости и соответствующие им задержки (лаги) как внутри одного ряда (автокорреляция), так и между несколькими рядами. (кросскорреляция)

3. Сезонная модель Бокса-Дженкинса. Применяется когда временной ряд содержит явно выраженный линейный тренд и сезонные составляющие. Позволяет предсказывать будущие значения ряда. Модель была предложена в связи с анализом авиаперевозок.

4. Прогноз экспоненциально взвешенным скользящим средним. Простейшая модель прогнозирования временного ряда. Применима во многих случаях. В том числе, охватывает модель ценообразования на основе случайных блужданий.

Цель спектрального анализа - разложить ряд на функции синусов и косинусов различных частот, для определения тех, появление которых особенно существенно и значимо. Один из возможных способов сделать это - решить задачу линейной множественной регрессии, где зависимая переменная - наблюдаемый временной ряд, а независимые переменные или регрессоры: функции синусов всех возможных (дискретных) частот. Такая модель линейной множественной регрессии может быть записана как:

x t = a 0 + (для k = 1 до q)

Следующее общее понятие классического гармонического анализа в этом уравнении - (лямбда) -это круговая частота, выраженная в радианах в единицу времени, т.е. = 2** k , где - константа пи = 3.1416 и k = k/q. Здесь важно осознать, что вычислительная задача подгонки функций синусов и косинусов разных длин к данным может быть решена с помощью множественной линейной регрессии. Заметим, что коэффициенты a k при косинусах и коэффициенты b k при синусах - это коэффициенты регрессии, показывающие степень, с которой соответствующие функции коррелируют с данными. Всего существует q различных синусов и косинусов; интуитивно ясно, что число функций синусов и косинусов не может быть больше числа данных в ряде. Не вдаваясь в подробности, отметим, если n - количество данных, то будет n/2+1 функций косинусов и n/2-1 функций синусов. Другими словами, различных синусоидальных волн будет столько же, сколько данных, и вы сможете полностью воспроизвести ряд по основным функциям.

В итоге, спектральный анализ определяет корреляцию функций синусов и косинусов различной частоты с наблюдаемыми данными. Если найденная корреляция (коэффициент при определенном синусе или косинусе) велика, то можно заключить, что существует строгая периодичность на соответствующей частоте в данных.

Анализ распределенных лагов - это специальный метод оценки запаздывающей зависимости между рядами. Например, предположим, вы производите компьютерные программы и хотите установить зависимость между числом запросов, поступивших от покупателей, и числом реальных заказов. Вы могли бы записывать эти данные ежемесячно в течение года и затем рассмотреть зависимость между двумя переменными: число запросов и число заказов зависит от запросов, но зависит с запаздыванием. Однако очевидно, что запросы предшествуют заказам, поэтому можно ожидать, что число заказов. Иными словами, в зависимости между числом запросов и числом продаж имеется временной сдвиг (лаг) (см. также автокорреляции и кросскорреляции).

Такого рода зависимости с запаздыванием особенно часто возникают в эконометрике. Например, доход от инвестиций в новое оборудование отчетливо проявится не сразу, а только через определенное время. Более высокий доход изменяет выбор жилья людьми; однако эта зависимость, очевидно, тоже проявляется с запаздыванием.

Во всех этих случаях, имеется независимая или объясняющая переменная, которая воздействует на зависимые переменные с некоторым запаздыванием (лагом). Метод распределенных лагов позволяет исследовать такого рода зависимость.

Общая модель

Пусть y - зависимая переменная, a независимая или объясняющая x. Эти переменные измеряются несколько раз в течение определенного отрезка времени. В некоторых учебниках по эконометрике зависимая переменная называется также эндогенной переменной, a зависимая или объясняемая переменная экзогенной переменной. Простейший способ описать зависимость между этими двумя переменными дает следующее линейное уравнение:

В этом уравнении значение зависимой переменной в момент времени t является линейной функцией переменной x, измеренной в моменты t, t-1, t-2 и т.д. Таким образом, зависимая переменная представляет собой линейные функции x и x, сдвинутых на 1, 2, и т.д. временные периоды. Бета коэффициенты (i) могут рассматриваться как параметры наклона в этом уравнении. Будем рассматривать это уравнение как специальный случай уравнения линейной регрессии. Если коэффициент переменной с определенным запаздыванием (лагом) значим, то можно заключить, что переменная y предсказывается (или объясняется) с запаздыванием.

Процедуры оценки параметров и прогнозирования, описанные в разделе, предполагают, что математическая модель процесса известна. В реальных данных часто нет отчетливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, тогда как вы хотите не только выделить регулярные компоненты, но также построить прогноз. Методология АРПСС, разработанная Боксом и Дженкинсом (1976), позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость (Hoff, 1983; Pankratz, 1983; Vandaele, 1983). Однако из-за мощности и гибкости, АРПСС - сложный метод. Его не так просто использовать, и требуется большая практика, чтобы овладеть им. Хотя часто он дает удовлетворительные результаты, они зависят от квалификации пользователя (Bails and Peppers, 1982). Следующие разделы познакомят вас с его основными идеями. Для интересующихся кратким, рассчитанным на применение, (нематематическим) введением в АРПСС, рекомендуем книгу McCleary, Meidinger, and Hay (1980).

Модель АРПСС

Общая модель, предложенная Боксом и Дженкинсом (1976) включает как параметры авторегрессии, так и параметры скользящего среднего. Именно, имеется три типа параметров модели: параметры авто регрессии (p), порядок разности (d), параметры скользящего среднего (q). В обозначениях Бокса и Дженкинса модель записывается как АРПСС (p, d, q). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авто регрессии (p) и 2 параметра скользящего среднего (q), которые вычисляются для ряда после взятия разности с лагом 1.

Как отмечено ранее, для модели АРПСС необходимо, чтобы ряд был стационарным, это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. Поэтому обычно необходимо брать разности ряда до тех пор, пока он не станет стационарным (часто также применяют логарифмическое преобразование для стабилизации дисперсии). Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром d (см. предыдущий раздел). Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (лаг=1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности (см. ниже). Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. Однако следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов.

На этом этапе (который обычно называют идентификацией порядка модели, см. ниже) вы также должны решить, как много параметров авто регрессии (p) и скользящего среднего (q) должно присутствовать в эффективной и экономной модели процесса. (Экономность модели означает, что в ней имеется наименьшее число параметров и наибольшее число степеней свободы среди всех моделей, которые подгоняются к данным). На практике очень редко бывает, что число параметров p или q больше 2 (см. ниже более полное обсуждение).

Следующий, после идентификации, шаг (Оценивание) состоит в оценивании параметров модели (для чего используются процедуры минимизации функции потерь, см. ниже; более подробная информация о процедурах минимизации дана в разделе Нелинейное оценивание). Полученные оценки параметров используются на последнем этапе (Прогноз) для того, чтобы вычислить новые значения ряда и построить доверительный интервал для прогноза. Процесс оценивания проводится по преобразованным данным (подвергнутым применению разностного оператора). До построения прогноза нужно выполнить обратную операцию (интегрировать данные). Таким образом, прогноз методологии будет сравниваться с соответствующими исходными данными. На интегрирование данных указывает буква П в общем названии модели (АРПСС = Авто регрессионное Проинтегрированное Скользящее Среднее).

Дополнительно модели АРПСС могут содержать константу, интерпретация которой зависит от подгоняемой модели. Именно, если (1) в модели нет параметров авто регрессии, то константа есть среднее значение ряда, если (2) параметры авто регрессии имеются, то константа представляет собой свободный член. Если бралась разность ряда, то константа представляет собой среднее или свободный член преобразованного ряда. Например, если бралась первая разность (разность первого порядка), а параметров авто регрессии в модели нет, то константа представляет собой среднее значение преобразованного ряда и, следовательно, коэффициент наклона линейного тренда исходного.

Экспоненциальное сглаживание - это очень популярный метод прогнозирования многих временных рядов. Исторически метод был независимо открыт Броуном и Холтом.

Простое экспоненциальное сглаживание

Простая и прагматически ясная модель временного ряда имеет следующий вид:

где b - константа и (эпсилон) - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения b состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред предпоследним и т.д. Простое экспоненциальное именно так и устроено. Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не те, что попали в определенное окно. Точная формула простого экспоненциального сглаживания имеет следующий вид:

S t = *X t + (1-)*S t-1

Когда эта формула применяется рекурсивно, то каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра (альфа). Если равно 1, то предыдущие наблюдения полностью игнорируются. Если равно 0, то игнорируются текущие наблюдения. Значения между 0, 1 дают промежуточные результаты.

Эмпирические исследования Makridakis и др. (1982; Makridakis, 1983) показали, что весьма часто простое экспоненциальное сглаживание дает достаточно точный прогноз.

Выбор лучшего значения параметра (альфа)

Gardner (1985) обсуждает различные теоретические и эмпирические аргументы в пользу выбора определенного параметра сглаживания. Очевидно, из формулы, приведенной выше, следует, что должно попадать в интервал между 0 (нулем) и 1 (хотя Brenner et al., 1968, для дальнейшего применения анализа АРПСС считают, что 0<<2). Gardner (1985) сообщает, что на практике обычно рекомендуется брать меньше.30. Однако в исследовании Makridakis et al., (1982), большее.30, часто дает лучший прогноз. После обзора литературы, Gardner (1985) приходит к выводу, что лучше оценивать оптимально по данным (см. ниже), чем просто "гадать" или использовать искусственные рекомендации.

Оценивание лучшего значения с помощью данных. На практике параметр сглаживания часто ищется с поиском на сетке. Возможные значения параметра разбиваются сеткой с определенным шагом. Например, рассматривается сетка значений от = 0.1 до = 0.9, с шагом 0.1. Затем выбирается, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Индексы качества подгонки

Самый прямой способ оценки прогноза, полученного на основе определенного значения - построить график наблюдаемых значений и прогнозов на один шаг вперед. Этот график включает в себя также остатки (отложенные на правой оси Y). Из графика ясно видно, на каких участках прогноз лучше или хуже.

Такая визуальная проверка точности прогноза часто дает наилучшие результаты. Имеются также другие меры ошибки, которые можно использовать для определения оптимального параметра (см. Makridakis, Wheelwright, and McGee, 1983):

Средняя ошибка. Средняя ошибка (СО) вычисляется простым усреднением ошибок на каждом шаге. Очевидным недостатком этой меры является то, что положительные и отрицательные ошибки аннулируют друг друга, поэтому она не является хорошим индикатором качества прогноза.

Средняя абсолютная ошибка. Средняя абсолютная ошибка (САО) вычисляется как среднее абсолютных ошибок. Если она равна 0 (нулю), то имеем совершенную подгонку (прогноз). В сравнении со средней квадратической ошибкой, эта мера "не придает слишком большого значения" выбросам.

Сумма квадратов ошибок (SSE), среднеквадратическая ошибка. Эти величины вычисляются как сумма (или среднее) квадратов ошибок. Это наиболее часто используемые индексы качества подгонки.

Относительная ошибка (ОО). Во всех предыдущих мерах использовались действительные значения ошибок. Представляется естественным выразить индексы качества подгонки в терминах относительных ошибок. Например, при прогнозе месячных продаж, которые могут сильно флуктуировать (например, по сезонам) из месяца в месяц, вы можете быть вполне удовлетворены прогнозом, если он имеет точность?10%. Иными словами, при прогнозировании абсолютная ошибка может быть не так интересна как относительная. Чтобы учесть относительную ошибку, было предложено несколько различных индексов (см. Makridakis, Wheelwright, and McGee, 1983). В первом относительная ошибка вычисляется как:

ОО t = 100*(X t - F t)/X t

где X t - наблюдаемое значение в момент времени t, и F t - прогноз (сглаженное значение).

Средняя относительная ошибка (СОО). Это значение вычисляется как среднее относительных ошибок.

Средняя абсолютная относительная ошибка (САОО). Как и в случае с обычной средней ошибкой отрицательные и положительные относительные ошибки будут подавлять друг друга. Поэтому для оценки качества подгонки в целом (для всего ряда) лучше использовать среднюю абсолютную относительную ошибку. Часто эта мера более выразительная, чем среднеквадратическая ошибка. Например, знание того, что точность прогноза ±5%, полезно само по себе, в то время как значение 30.8 для средней квадратической ошибки не может быть так просто проинтерпретировано.

Автоматический поиск лучшего параметра. Для минимизации средней квадратической ошибки, средней абсолютной ошибки или средней абсолютной относительной ошибки используется квази-ньютоновская процедура (та же, что и в АРПСС). В большинстве случаев эта процедура более эффективна, чем обычный перебор на сетке (особенно, если параметров сглаживания несколько), и оптимальное значение можно быстро найти.

Первое сглаженное значение S 0 . Если вы взгляните снова на формулу простого экспоненциального сглаживания, то увидите, что следует иметь значение S 0 для вычисления первого сглаженного значения (прогноза). В зависимости от выбора параметра (в частности, если близко к 0), начальное значение сглаженного процесса может оказать существенное воздействие на прогноз для многих последующих наблюдений. Как и в других рекомендациях по применению экспоненциального сглаживания, рекомендуется брать начальное значение, дающее наилучший прогноз. С другой стороны, влияние выбора уменьшается с длиной ряда и становится некритичным при большом числе наблюдений.

экономический временный ряд статистический

Заключение

Анализ временных рядов -- совокупность математико-статистических методов анализа, предназначенных для выявления структуры временных рядов и для их прогноза. Сюда относятся, в частности, методы регрессионного анализа. Выявление структуры временного ряда необходимо для того, чтобы построить математическую модель того явления, которое является источником анализируемого временного ряда. Прогноз будущих значений временного ряда используется для эффективного принятия решений.

Временные ряды исследуются с различными целями. Метод анализа временного ряда определяется, с одной стороны, целями анализа, а с другой стороны, вероятностной природой формирования его значений.

Основными методами исследования временных рядов являются:

Ш Спектральный анализ.

Ш Корреляционный анализ

Ш Сезонная модель Бокса-Дженкинса.

Ш Прогноз экспоненциально взвешенным скользящим средним.

Литература

1. Безручко Б. П., Смирнов Д. А. Математическое моделирование и хаотические временные ряды. -- Саратов: ГосУНЦ "Колледж", 2005. -- ISBN 5-94409-045-6

2. Блехман И. И., Мышкис А. Д., Пановко Н. Г., Прикладная математика: Предмет, логика, особенности подходов. С примерами из механики: Учебное пособие. -- 3-е изд., испр. и доп. -- М.: УРСС, 2006. -- 376 с. ISBN 5-484-00163-3

3. Введение в математическое моделирование. Учебное пособие. Под ред. П. В. Трусова. -- М.: Логос, 2004. -- ISBN 5-94010-272-7

4. Горбань А. Н., Хлебопрос Р. Г., Демон Дарвина: Идея оптимальности и естественный отбор. -- М: Наука. Гл ред. физ.-мат. лит., 1988. -- 208 с. (Проблемы науки и технического прогресса) ISBN 5-02-013901-7 (Глава «Изготовление моделей»).

5. Журнал Математическое моделирование (основан в 1989 году)

6. Малков С. Ю., 2004. Математическое моделирование исторической динамики: подходы и модели // Моделирование социально-политической и экономической динамики / Ред. М. Г. Дмитриев. -- М.: РГСУ. -- с. 76-188.

7. Мышкис А. Д., Элементы теории математических моделей. -- 3-е изд., испр. -- М.: КомКнига, 2007. -- 192 с ISBN 978-5-484-00953-4

8. Самарский А. А., Михайлов А. П. Математическое моделирование. Идеи. Методы. Примеры.. -- 2-е изд., испр.. -- М.: Физматлит, 2001. -- ISBN 5-9221-0120-X

9. Советов Б. Я., Яковлев С. А., Моделирование систем: Учеб. для вузов -- 3-е изд., перераб. и доп. -- М.: Высш. шк., 2001. -- 343 с. ISBN 5-06-003860-2

Размещено на Allbest.ru

Подобные документы

    Понятие и основные этапы разработки прогноза. Задачи анализа временных рядов. Оценка состояния и тенденций развития прогнозирования на основе анализа временных рядов СУ-167 ОАО "Мозырьпромстрой", практические рекомендации по его совершенствованию.

    курсовая работа , добавлен 01.07.2013

    Методика проведения анализа динамических рядов социально-экономических явлений. Компоненты, формирующие уровни при анализе рядов динамики. Порядок составления модели экспорта и импорта Нидерландов. Уровни автокорреляции. Корреляция рядов динамики.

    курсовая работа , добавлен 13.05.2010

    Методы анализа структуры временных рядов, содержащих сезонные колебания. Рассмотрение подхода методом скользящей средней и построение аддитивной (или мультипликативной) модели временного ряда. Расчет оценок сезонной компоненты в мультипликативной модели.

    контрольная работа , добавлен 12.02.2015

    Анализ системы показателей, характеризующих как адекватность модели, так и ее точность; определение абсолютной и средней ошибок прогноза. Основные показатели динамики экономических явлений, использование средних значений для сглаживания временных рядов.

    контрольная работа , добавлен 13.08.2010

    Сущность и отличительные черты статистических методов анализа: статистическое наблюдение, группировка, анализа рядов динамики, индексный, выборочный. Порядок проведения анализа рядов динамики, анализа основной тенденции развития в рядах динамики.

    курсовая работа , добавлен 09.03.2010

    Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.

    курсовая работа , добавлен 15.03.2011

    Виды временных рядов. Требования, предъявляемые к исходной информации. Описательные характеристики динамики социально-экономических явлений. Прогнозирование по методу экспоненциальных средних. Основные показатели динамики экономических показателей.

    контрольная работа , добавлен 02.03.2012

    Понятие и значение временного ряда в статистике, его структура и основные элементы, значение. Классификация и разновидности временных рядов, особенности сферы их применения, отличительные характеристики и порядок определения в них динамики, стадии, ряды.

    контрольная работа , добавлен 13.03.2010

    Определение понятия цен на продукцию и услуги; принципы их регистрации. Расчет индивидуальных и общих индексов стоимости товаров. Сущность базовых методов социально-экономических исследований - структурных средних, рядов распределения и рядов динамики.

    курсовая работа , добавлен 12.05.2011

    Машинное обучение и статистические методы анализа данных. Оценка точности прогнозирования. Предварительная обработка данных. Методы классификации, регрессии и анализа временных рядов. Методы ближайших соседей, опорных векторов, спрямляющего пространства.

Цели анализа временных рядов. При практическом изучении временных радов на основании экономических данных на определенном промежутке времени эконометрист должен сделать выводы о свойствах этого ряда и о вероятностном механизме, порождающем этот ряд. Чаще всего при изучении временных рядов ставятся следующие цели:

1. Краткое (сжатое) описание характерных особенностей ряда.

2. Подбор статистической модели, описывающей временной ряд.

3. Предсказание будущих значений на основе прошлых наблюдений.

4. Управление процессом, порождающим временной ряд.

На практике эти и подобные цели достижимы далеко не всегда и далеко не в полной мере. Часто этому препятствует недостаточный объем наблюдений из-за ограниченного времени наблюдений. Еще чаще – изменяющаяся с течением времени статистическая структура временного ряда.

Стадии анализа временных рядов . Обычно при практическом анализе временных рядов последовательно проходят следующие этапы:

1. Графическое представление и описание поведения временного рада.

2. Выделение и удаление закономерных составляющих временного рада, зависящих от времени: тренда, сезонных и циклических составляющих.

3. Выделение и удаление низко- или высокочастотных составляющих процесса (фильтрация).

4. Исследование случайной составляющей временного ряда, оставшейся после удаления перечисленных выше составляющих.

5. Построение (подбор) математической модели для описания случайной составляющей и проверка ее адекватности.

6. Прогнозирование будущего развития процесса, представленного временным рядом.

7. Исследование взаимодействий между различными временными радами.

Методы анализа временных рядов. Для решения этих задач существует большое количество различных методов. Из них наиболее распространенными являются следующие:

1. Корреляционный анализ, позволяющий выявить существенные периодические зависимости и их лаги (задержки) внутри одного процесса (автокорреляция) или между несколькими процессами (кросскорреляция).

2. Спектральный анализ, позволяющий находить периодические и квазипериодические составляющие временного ряда.

3. Сглаживание и фильтрация, предназначенные для преобразования временных рядов с целью удаления из них высокочастотных или сезонных колебаний.

5. Прогнозирование, позволяющее на основе подобранной модели поведения временного рада предсказывать его значения в будущем.

Модели тренда и методы его выделения из временного ряда

Простейшие модели тренда. Приведем модели трендов, наиболее часто используемые при анализе экономических временных рядов, а также во многих других областях. Во-первых, это простая линейная модель

где а 0 , а 1 – коэффициенты модели тренда;

t – время.

В качестве единицы времени может быть час, день (сутки), неделя, месяц, квартал или год. Модель 3.1. несмотря на свою простоту, оказывается полезной во многих реальных задачах. Если нелинейный характер тренда очевиден, то может подойти одна из следующих моделей:

1. Полиномиальная :

(3.2)

где значение степени полинома п в практических задачах редко превышает 5;

2. Логарифмическая:

Эта модель чаще всего применяется для данных, имеющих тенденцию сохранять постоянные темпы прироста;

3. Логистическая :

(3.4)

Гомперца

(3.5)

Две последние модели задают кривые тренда S-образной формы. Они соответствуют процессам с постепенно возрастающими темпами роста в начальной стадии и постепенно затухающимитемпами роста в конце. Необходимость подобных моделей обусловлена невозможностью многих экономических процессов продолжительное время развиваться с постоянными темпами роста или по полиномиальным моделям, в связи с их довольно быстрым ростом (или уменьшением).

При прогнозировании тренд используют в первую очередь для долговременных прогнозов. Точность краткосрочных прогнозов, основанных только на подобранной кривой тренда, как правило, недостаточна.

Для оценки и удаления трендов из временных рядов чаще всего используется метод наименьших квадратов. Этот метод достаточно подробно рассматривался во втором разделе пособия в задачах линейного регрессионного анализа. Значения временного ряда рассматриваюткак отклик (зависимую переменную), а время t – какфактор, влияющий на отклик (независимую переменную).

Для временных рядов характерна взаимная зависимость его членов (по крайней мере, не далеко отстоящих по времени) и это является существенным отличием от обычного регрессионного анализа, для которого все наблюдения предполагаются независимыми. Тем не менее, оценки тренда и в этих условиях обычно оказываются разумными, если выбрана адекватная модель тренда и если среди наблюдений нет больших выбросов. Упомянутые выше нарушения ограничений регрессионного анализа сказываются не столько на значениях оценок, сколько наих статистических свойствах. Так, при наличии заметной зависимости между членами временного ряда оценки дисперсии, основанные на остаточнойсумме квадратов (2.3), дают неправильные результаты. Неправильными оказываются и доверительные интервалы для коэффициентов модели, и т.д. В лучшем случае их можно рассматривать как очень приближенные.

Это положение может быть частично исправлено, если применять модифицированные алгоритмы метода наименьших квадратов, такие как взвешенный метод наименьших квадратов. Однако для этих методов требуется дополнительная информация о том, как меняется дисперсия наблюдений или их корреляция. Если же такая информация недоступна, исследователям приходится применять классический метод наименьших квадратов, несмотря на указанные недостатки.

В статистике, обработке сигналов и многих других областях под временным рядом понимаются последовательно измеренные через некоторые (зачастую равные) промежутки времени данные. Анализ временных рядов объединяет методы изучения временных рядов, как пытающиеся понять природу точек данных (откуда они взялись? что их породило?), так и пытающиеся построить прогноз. Прогнозирование временных рядов заключается в построении модели для предсказания будущих событий основываясь на известных событий прошлого, предсказания будущих данных до того как они будут измерены. Типичный пример - предсказание цены открытия биржи основываясь на предыдущей её деятельности.

Понятие анализ временных рядов используется для того, чтобы отделить эту задачу от в первую очередь от более простых задач анализа данных (когда нет естественного порядка поступления наблюдений) и, во-вторых, от анализа пространственных данных, в котором наблюдения зачастую связаны с географическим положением. Модель временного ряда в общем смысле отражает идею, что близкие во времени наблюдения будут теснее связаны, чем удалённые. Кроме того, модели временных рядов зачастую используют однонаправленный порядок по времени в том смысле, что значения в ряду выражаются в некотором виде через прошлые значения, а не через последующие (см. обратимость времени).

Методы анализа временных рядов зачастую делят на два класса: анализ в частотной области и анализ во временной области. Первый основывается на спектральном анализе и с недавних пор вейвлетном анализе , и может рассматриваться в качестве не использующих модели методов анализа, хорошо подходящих для исследований на этапе разведки. Методы анализа во временной области также имеют безмодельное подмножество, состоящее из кросс-корреляционного анализа и автокорреляционного анализа, но именно здесь появляются частично и полностью определённые модели временных рядов.

Анализ временных рядов

Существует несколько методов анализа данных, применимых для временных рядов.

Общее исследование

  • Визуальное изучение графических представлений временных рядов
  • Автокорреляционный анализ для изучения зависимостей
  • Спектральный анализ для изучения циклического поведения, не связанного с сезонностью

Описание

  • Разделение компонент: тренд, сезонность, медленно и быстро меняющиеся компоненты, циклическая нерегулярность
  • Простейшие свойства частных распределений

Прогнозирование и предсказание

  • Полноценные статистические модели при стохастическом моделировании для создания альтернативных версий временных рядов, показывающих, что могло бы случиться на произвольных отрезках времени в будущем (предсказание)
  • Упрощённые или поноценные статистические модели для описания вероятные значения временного ряда в ближайшем будущем при известных последних значениях (прогноз)

Модели временных рядов

Как показано Боксом и Дженкинсом, модели временных рядов могут иметь различные формы и представлять различные стохастические процессы. При моделировании изменений уровня процесса можно выделить три широких класса имеющих практическую ценность: авторегрессионые модели , интегральные модели и модели скользящего среднего . Эти три класса линейно зависят от предшествующих данных. На их основе построены модели авторегрессионного скользящего среднего (Autoregressive Moving Average , ARMA) и авторегрессионного интегрированного скользящего среднего (Autoregressive Integrated Moving Average , ARIMA). Эти модели в свою очередь обобщает модель авторегрессионного дробноинтегрированного скользящего среднего (autoregressive fractionally integrated moving average , ARFIMA). Расширения моделей на случаи, когда данные представляются не скалярно, а векторно, называют моделями многомерных временных рядов. Для таких моделей в сокращённых названиях появляется буква «v» от слова «vector». Существуют расширения моделей на случай, когда исследуемый временной ряд является ведомым для некоторого «вынуждающего» ряда (который, однако, может не быть причиной возникновения исследуемого ряда). Отличие от многомерного ряда заключается в том, что вынуждающий ряд может быть детерминированным или управляться исследователем, проводящим эксперимент. Для таких моделей в сокращении появляется буква «x» от «exogenous» (экзогенный, вызываемый внешними причинами).

Нелинейная зависимость уровня ряда от предыдущих точек интересна, отчасти из-за возможности генерации хаотических временных рядов. Но главным всё же является то, что опытные исследования указывают на превосходство прогнозов, полученных от нелинейных модлей, над прогнозами линейных моделей.

Среди прочих типов нелинейных моделей временных рядов можно выделить модели, описывающие изменения дисперсии ряда со временем (гетероскедатичность). Такие модели называют моделями авторегрессионной условной гетероскедастичности (AutoRegressive Conditional Heteroscedasticity , ARCH). К ним относится большое количество моделей: GARCH, TARCH, EGARCH, FIGARCH, CGARCH и др. В этих моделях изменения дисперсии связывают с ближайшими предшествующими данными. Противовесом такому подходу является представление локально изменчивой дисперсии, при котором дисперсия может быть смоделирована зависящей от отдельного меняющегося со временем процесса, как в бистохастических моделях.

В последнее время значительное внимание снискали исследования в области безмодельного анализа и методы, основанные на вейвлетных преобразованиях (например локально стационарные вейвлеты) в частности. Методы многомасштабного анализа разлагают заданный временной ряд на составные части, чтобы показать зависимость от времени с разным масштабом.

Обозначения

Существует большое число вариантов обозначения временных рядов. Одним из типичных является , обозначающее ряд с натуральными индексами. Другое стандартное представление:

Предположения

Существуют две группы предположений, в условиях которых строится большинство теорий:

  • Стационарность процесса
  • Эргодичность

Идея стационарности трактуется в широком смысле, охватывая две основных идеи: строгая стационарность и стационарность ворого порядка (стационарность в широком смысле). На основании этих предложений могут быть построены и модели, и приложения, хотя модели в дальнейшем могут рассматриваться как частично заданные.

Анализ временного ряда может проводиться и когда ряд сезонно стацонарен или нестационарен.

Модели

,

где - источник случайность, белый шум. Белый шум имеет следующие свойства.

THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама