0:13
Автокорреляция порядка p — это
более богатая модель для структуры зависимости между ε,
а именно: предполагается, что ε_t — это φ_1 ε_{t‒1} + φ_2 ε_{t‒2} + ...
+ φ_p ε_{t‒p} + новая случайная составляющая u_t, которая
удовлетворяет тем же предпосылкам:
u_t независимы между собой, независимы от регрессоров, одинаково распределены,
нулевое математическое ожидание, постоянная дисперсия σ² u.
В отличие от автокорреляции первого порядка,
автокорреляция порядка p допускает более сложную структуру
корреляций между ε_t и ε_{t‒k}, между ε_i и ε_j.
Если раньше корреляция между ε_t и ε_{t‒k} — это просто было ρ в степени k,
то есть она убывала по модулю, то сейчас корреляция не обязана сразу
начинать убывать, она может принимать довольно произвольные значения,
хотя общий факт сохраняется: предел Corr(ε_t, ε_{t‒k})
при k, стремящемся к бесконечности, равен 0.
То есть это означает, что если расстояние по времени между наблюдениями
очень велико, то сила зависимости между ними будет маленькой,
то есть зависимость между ε_t и ε_{t‒k}
убывает с ростом расстояния по времени, предел равен 0.
Посмотрим, как взаимодействует предпосылка об автокорреляции с другими предпосылками.
Во-первых, автоматом оказывается нарушена предпосылка о
независимости отдельных наблюдений.
То есть раньше мы говорили, что вектор из всех объясняющих переменных
и зависимые переменные, относящиеся к наблюдению i, и такой же вектор,
относящийся к наблюдению j, были независимы и одинаково распределены.
Теперь они зависимы, хотя по-прежнему и будут одинаково распределены.
И, во-вторых, очень часто во временных рядах нарушена
предпосылка о строгой экзогенности: о том, что E(ε_t|X) = 0.
Как правило, эта предпосылка нарушена.
Могут быть отдельные редкие исключения, в которых она не нарушена,
а мы для простоты будем предполагать ситуацию, что эта предпосылка не нарушена.
Хотя, например, даже включение предыдущей зависимой переменной в регрессоры,
например, наличие y_{t‒1} среди регрессоров,
автоматически означает нарушение предпосылки о строгой экзогенности.
Для возможности включения прошлого
значения зависимой переменной в регрессоры есть два подхода.
Первый подход — это ослабить предпосылки,
и второй подход — это использовать принципиально другой метод,
метод максимального правдоподобия, и работать с ним,
а не с методом наименьших квадратов и не с его свойствами.
В основном,
большая часть временных рядов построена на методе максимального правдоподобия,
поэтому мы не будем разбирать варианты с ослаблением предпосылок, которые подходит
для того, чтобы принять метод наименьших квадратов для временных рядов.
Итак, посмотрим, что произойдёт, если мы будем использовать прежние формулы для
оценок коэффициентов, для стандартных ошибок, а в ε_t будет
автокорреляция порядка p.
Итак, для оценок мы используем классическую формулу β с крышкой равно
(X'X)^(-1)X'y.
И для оценки ковариационной матрицы — снова RSS, сумма квадратов остатков,
делить на n ‒ k, помножить на (X'X)^(-1).
В частности, это означает использование для оценки дисперсии,
оценки j-того коэффициента, σ² с крышкой, деленное на RSS_j,
где RSS_j — это RSS в регрессии j-того регрессора на остальные регрессоры.
Напомним, что у нас было три группы свойств,
которые возникали при использовании этих формул и выполненных
стандартных предпосылках, а именно: у нас были свойства,
связанные с конечной выборкой без предположения о нормальности ε, свойства
для конечных выборок с предположением о нормальности ε и асимптотические
свойства для больших выборок, то есть когда n стремится к бесконечности.
Рассмотрим, что происходит с каждой группой свойств.
Для конечной выборки без предположения о нормальности ε сохраняется
свойство линейности по y, сохраняется условная несмещённость,
то есть математическое ожидание от β с крышкой при фиксированных X равно β.
Это хорошее свойство, это говорит о том, что наши оценки, которые мы получаем,
β с крышкой, могут оказаться выше, чем неизвестные β, могут оказаться ниже,
чем неизвестные β, но в среднем мы попадаем в неизвестные интересующие нас β.
Оценки как и в случае гетероскедастичности неэффективны: здесь
автокорреляция очень похожа по своим последствиям на гетероскедастичность.
Что касается конечной выборки с предположением о нормальности ε,
здесь мы теряем все свойства, которые были при
выполнении всех предпосылок классической линейной модели регрессии.
То есть распределение t-статистики уже не является t-распределением,
распределение RSS делить на σ² не является хи-квадрат распределением в
точности, и, соответственно, распределение F-статистики,
проверявшей гипотезу о совпадении ограниченной и неограниченной моделей,
также не является в точности F-распределением.
Асимптотические свойства отчасти сохраняются.
В частности, при наличии авторегрессионной схемы порядка p,
фиксированного порядка p в ошибках, β с крышкой по-прежнему
являются состоятельными оценками для β, то есть с ростом количества наблюдений,
если у вас достаточно много наблюдений, то оценки, которые вы получаете,
β с крышкой, будут очень похожи на настоящие β.
Но, к сожалению, проверять гипотезы по стандартным формулам не
получается даже при большом количестве наблюдений.
Даже если n стремится к бесконечности,
t-статистика не становится нормально распределённой.
Вкратце подвести итог последствиям можно следующим образом.
Сами β с крышкой, сами оценки коэффициентов, в условии
автокорреляции можно интерпретировать как и раньше и использовать.
Однако стандартные ошибки, считаемые по стандартным формулам,
несостоятельны, и пооэтому мы не можем, используя обычные формулы,
строить доверительные интервалы для неизвестных коэффициентов и
проверять гипотезы.