Эконометрика. Учебное пособие. Эконометрика: основные формулы с комментариями

В учебнике излагаются основы эконометрики. Большое внимание уделяется классической (парной и множественной) и обобщенной моделям линейной регрессии, классическому и обобщенному методам наименьших квадратов, анализу временных рядов и систем одновременных уравнений, моделям с панельными данными. Обсуждаются различные аспекты многомерной регрессии: мультиколлинеарность, фиктивные переменные, спецификация и линеаризация модели, частная корреляция. Учебный материал сопровождается достаточным числом решенных задач и задач для самостоятельной работы.

Для студентов, бакалавров и магистров экономических направлений и специальностей вузов, аспирантов, преподавателей и специалистов по прикладной экономике и финансам, лиц, обучающихся по программам МВА, второго высшего образования и проходящих профессиональную переподготовку или повышение квалификации.

5.1. Мультиколлинеарность
Под мультиколлинеарностъю понимается высокая взаимная коррелированность объясняющих переменных. Мультиколлинеарность может проявляться в функциональной (явной) и стохастической (скрытой) формах.
При функциональной форме мультиколлинеарности по крайней мере одна из парных связей между объясняющими переменными является линейной функциональной зависимостью. В этом случае матрица Х"Х особенная, так как содержит линейно зависимые векторы-столбцы и ее определитель равен нулю, т. е. нарушается предпосылка 6 регрессионного анализа. Это приводит к невозможности решения соответствующей системы нормальных уравнений и получения оценок параметров регрессионной модели.
Однако в экономических исследованиях мультиколлинеарность чаще проявляется в стохастической форме, когда между хотя бы двумя объясняющими переменными существует тесная корреляционная связь. Матрица Х"Х в этом случае является неособенной, но ее определитель очень мал.

Оглавление
Предисловие
Введение
Глава 1. Основные аспекты эконометрического моделирования
1.1. Введение в эконометрическое моделирование
1.2. Основные математические предпосылки Эконометрического моделирования
1.3. Эконометрическая модель и экспериментальные данные
1.4. Линейная регрессионная модель
1.5. Система одновременных уравнений
1.6. Основные этапы и проблемы эконометрического моделирования
Глава 2. Элементы теории вероятностей и математической статистики
2.1. Случайные величины и их числовые характеристики
2.2. Функция распределения случайной величины.
Непрерывные случайные величины
2.3. Некоторые распределения случайных величин
2.4. Многомерные случайные величины. Условные законы распределения
2.5. Двумерный (n-мерный) нормальный закон распределения
2.6. Закон больших чисел и предельные теоремы
2.7. Точечные и интервальные оценки параметров
2.8. Проверка (тестирование) статистических гипотез
Упражнения
Глава 3. Парный регрессионный анализ
3.1. Функциональная, статистическая и корреляционная зависимости
3.2. Линейная парная регрессия
3.3. Коэффициент корреляции
3.4. Основные положения регрессионного анализа. Оценка параметров парной регрессионной модели. Теорема Гаусса-Маркова
3.5. Интервальная оценка функции регрессии и ее параметров
3.6. Оценка значимости уравнения регрессии. Коэффициент детерминации
3.7. Геометрическая интерпретация регрессии и коэффициента детерминации
3.8. Коэффициент ранговой корреляции Спирмена Упражнения
Глава 4. Множественный регрессионный анализ
4.1. Классическая нормальная линейная модель множественной регрессии
4.2. Оценка параметров классической регрессионной модели методом наименьших квадратов
4.3. Ковариационная матрица и ее выборочная оценка
4.4. Доказательство теоремы Гаусса-Маркова.
Оценка дисперсии возмущений
4.5. Определение доверительных интервалов для коэффициентов и функции регрессии
4.6. Оценка значимости множественной регрессии.
Коэффициенты детерминации R2 и R2 Упражнения
Глава 5. Некоторые вопросы практического использования регрессионных моделей
5.1. Мультиколлинеарность
5.2. Отбор наиболее существенных объясняющих переменных в регрессионной модели
5.3. Линейные регрессионные модели с переменной
структурой. Фиктивные переменные
5.4. Критерий Г. Чоу
5.5. Нелинейные модели регрессии
5.6. Частная корреляция Упражнения
Глава 6. Временные ряды и прогнозирование
6.1. Общие сведения о временных рядах и задачах их анализа
6.2. Стационарные временные ряды и их характеристики. Автокорреляционная функция
6.3. Аналитическое выравнивание (сглаживание) временного ряда (выделение неслучайной компоненты)
6.4. Прогнозирование на основе моделей временных рядов
6.5. Понятие об авторегрессионных моделях и моделях скользящей средней
Упражнения
Глава 7. Обобщенная линейная модель.
Гетероскедастичность и автокорреляция остатков
7.1. Обобщенная линейная модель множественной регрессии
7.2. Обобщенный метод наименьших квадратов
7.3. Гетероскедастичность пространственной выборки
7.4. Тесты на гетероскедастичность
7.5. Устранение гетероскедастичности
7.6. Автокорреляция остатков временного ряда. Положительная и отрицательная автокорреляция
7.7. Авторегрессия первого порядка. Статистика Дарбина-Уотсоно
7.8. Тесты на наличие автокорреляции
7.9. Устранение автокорреляции. Идентификация временного ряда
7.10. Авторегрессионная модель первого порядка
7.11. Доступный (обобщенный) метод наименьших квадратов
Упражнения
Глава 8. Регрессионные динамические модели
8.1. Стохастические регрессоры
8.2. Метод инструментальных переменных
8.3. Оценивание моделей с распределенными лагами. Обычный метод наименьших квадратов
8.4. Оценивание моделей с распределенными лагами. Нелинейный метод наименьших квадратов
326
8.5 Оценивание моделей с лотовыми переменными. Метод максимального правдоподобия
8.6. Модель частичной корректировки
8.7. Модель адаптивных ожиданий
8.8. Модель потребления Фридмено
8.9. Автокорреляция ошибок в моделях со стохастическими регрессорами
8.10 GАRСН-модели
8.11. Нестационарные временные ряды Упражнения
Глава 9. Системы одновременных уравнений
9.1. Общий вид системы одновременных уравнений. Модель спроса и предложения
9.2. Косвенный метод наименьших квадратов
9.3. Проблемы идентифицируемости
9.4. Метод инструментальных переменных
9.5. Одновременное оценивание регрессионных уравнений. Внешне не связанные уравнения
9.6. Трехшаговый метод наименьших квадратов
9.7. Экономически значимые примеры систем одновременных уравнений
Упражнения
Глава 10. Проблемы спецификации модели
10.1. Выбор одной из двух классических моделей. Теоретические аспекты
10.2. Выбор одной из двух классических моделей. Практические аспекты
10.3. Спецификация модели пространственной выборки при наличии гетероскедастичности
10.4. Спецификация регрессионной модели временных рядов
10.5. Важность экономического анализа Упражнения
Глава 11. Модели с различными типами выборочных данных
11.1. Статистические модели с панельными данными
11.2. Межгрупповые оценки с панельными данными
11.3. Модели с фиксированным и случайным эффектами
11.4. Оценивание модели с фиксированным эффектом
11.5. Оценивание модели со случайным эффектом
11.6. Проблема выбора модели с панельными данными
11.7. Бинарные модели с дискретными зависимыми переменными
11.8. Ргоbit- и logit-модели
11.9. Дискретные модели с панельными данными
11.10. Выборка с ограничениями Упражнения
Приложения
Глава 12. Элементы линейной алгебры
12.1. Матрицы
12.2. Определитель и след квадратной матрицы
12.3. Обратная матрица
12.4. Ранг матрицы и линейная зависимость ее строк (столбцов)
12.5. Система линейных уравнений
12.6. Векторы
12.7. Собственные векторы и собственные значения квадратной матрицы
12.8. Симметрические, положительно определенные, ортогональные и идемпотентные матрицы
12.9. Блочные матрицы. Произведение Кронекера
12.10. Матричное дифференцирование Упражнения
Глава 13. Эконометрические компьютерные пакеты
13.1. Оценивание модели с помощью компьютерных программ
13.2. Метод Монте-Карло Упражнения
Литература
Математико-статистические таблицы
Предметный указатель

Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
- fileskachat.com, быстрое и бесплатное скачивание.

Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России. Купить эту книгу


Скачать книгу Эконометрика, учебник для студентов вузов, Кремер Н.Ш., Путко Б.А., 2010 - pdf - Яндекс.Диск

Транскрипт

1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ДАЛЬНЕВОСТОЧНАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ ЭКОНОМИКИ И УПРАВЛЕНИЯ Д.Б. Карп Эконометрика: основные формулы с комментариями Учебно-методическое пособие Владивосток Издательство ДВГАЭУ 2004

2 УДК К26 Карп Д.Б. Эконометрика: основные формулы с комментариями: учебнометодическое пособие. - Владивосток: Изд-во ДВГАЭУ, с. Работа задумана как краткий справочник по основным формулам и алгоритмам, встречающимся в курсе эконометрики и не может заменить собой полноценного курса лекций по предмету. Тем не менее, каждый раздел содержит краткое изложение необходимой теории и подробные комментарии относительно применимости приводимых методов для обработки данных разной природы. Охват затронутых тем и разделов заметно превышает обычный семестровый курс и оставляет для преподавателя свободу выбора тем для практических занятий. Во введении приведен краткий обзор типов данных и моделей, позволяющий читателю видеть излагаемые далее методы в более широком контексте. Внимательный читатель должен быть способен реализовать представленные методы на компьютере - вся необходимая для этого информация содержится в работе. Особенностью пособия является включение в него ряда новых формул и методов, некоторые из которых впервые публикуются на русском языке. Пособие предназначено для студентов специальностей «Прикладная информатика в экономике» и «Статистика», преподавателей соответствующих специальностей и работающих эконометристов. Печатается по решению Учебно-методического совета в области междисциплинарных специальностей экономики и статистики ДВГАЭУ. Рецензенты: Шмидт Ю.Д., д.э.н., зав. кафедрой математики и моделирования, проректор по научной работе ДВГАЭУ Терешко Д.А., к.ф.м.н., старший научный сотрудник Института Прикладной Математики ДВО РАН ISBN c Карп Д.Б, 2004 c Изд-во ДВГАЭУ, 2004


3 Эконометрика: основные формулы с комментариями 3 1 Введение Термин «эконометрика» был введён в 1926 году норвежским экономистом Р. Фришем (Frisch) и в буквальном переводе означает «измерение экономики». Не существует общепринятого определения этой науки. С точки зрения математической статистики эконометрику можно считать одним из разделов многомерного статистического анализа. С точки зрения экономической теории эконометрика является методом (вернее набором методов), позволяющим придать точный количественный характер качественным экономическим зависимостям, постулируемым теорией. Таким образом можно сказать, что эконометрика представляет собой набор статистических методов, предназначенных для обработки экономических данных. Основная причина, по которой эти методы должны отличаться от методов статистической обработки данных других наук (медицины, биологии, психологии, и др.), состоит в том, что экономические данные не являются, как правило, экспериментальными - во-первых, мы не можем произвольно задать параметры (доходы, цены, ставки налогов, уровень инфляции или безработицы, и т. д.) и проследить за реакцией экономики (например увеличить вдвое цены на шоколад, оставив остальное без изменений); во-вторых, мы не можем проводить многократных экспериментов даже при постоянных значениях экономических показателей. Вместо дальнейших рассуждений приведём классический пример, демонстрирующий где пролегает граница между экономической теорией и эконометрикой. Теория потребления Кейнса. В своей Общей теории (1936) Кейнс (Keynes) пишет: Мы определим, поэтому, то, что мы назовем склонностью к потреблению, как функциональное отношение f между данным уровнем дохода X и потреблением или объемом расходов C, соответствующим этому уровню дохода. Сумма, которую некоторое сообщество тратит на потребление, зависит (1) частично от его доходов, (2) частично от объективных сопутствующих обстоятельств и (3) от субъективных потребностей и психологических наклонностей и привычек индивидуумов его (сообщество) составляющих. Фундаментальный психологический закон, на которых мы можем с уверенностью опираться, как исходя из нашего знания человеческой природы, так и из подробных данных наблюдений, состоит в том, что люди предрасположены, как правило и в среднем, увеличивать свое потребление при увеличении дохода, но не


4 4 на столько на сколько увеличился доход. То есть, производная dc/dx положительна и меньше единицы. Однако, если не учитывать краткосрочные изменения в уровне дохода, очевидно также, что более высокий абсолютный уровень дохода имеет тенденцию увеличивать разрыв между доходом и потреблением. По этой причине при увеличении дохода его часть, отводимая на сбережения, будет, как правило, также расти. Теория, таким образом, постулирует зависимость между доходом и потреблением, C = f(x) и утверждает, что мгновенная склонность к потреблению (MPC - marginal propensity to consume), равная dc/dx, лежит между 0 и 1. Последний параграф говорит, что средняя склонность к потреблению (APC - average propensity to consume), равная C/X, падает с увеличением дохода, то есть d(c/x) dx < 0. По правилу дифференцирования дроби и учитывая, что C = C(X), получим d(c/x) dx = C X C X 2 = C C/X X = MP C AP C X < 0. Следовательно, MP C < AP C. Это рассуждение, типичное для экономической теории, служит основой для дальнейшего эконометрического исследования. Такое исследование, базируясь на данных наблюдений, призвано ответить на ряд вопросов, на которые не даёт ответа экономическая теория. Например, какова конкретная форма зависимости C(X)? Чему равны параметры этой зависимости для данного сообщества (например, если мы предположим, что зависимость линейная C = ax + b, то чему равны a и b)? Стабильны ли параметры этой зависимости во времени? Существуют ли систематические различия в виде этой зависимости между странами или регионами? Есть ли другие факторы, которые помогут нам лучше объяснить взаимосвязь между потреблением и доходом? Подтверждают ли данные положения теории? Поведение экономики в целом складывается из поведения множества экономических агентов (фирм, финансовых институтов, семей, и.т.д.). Нет никакой надежды точно описать поведение каждого из этих агентов, находящихся в различных обстоятельствах и движимых различными мотивами. Поэтому эконометрические модели необходимо должны включать случайный, стохастический элемент, в отличие от детерминистских моделей экономической теории Впервые это убедительно показал норвежский экономист Тригве Хаавелмо (Trygve Haavelmo) в своей докторской диссертации 1944 года The Probability Approach in Econometrics (Вероятностный подход в эконометрике). Работа Хаавелмо оказала огромное влияние на дальнейшее развитие эконометрики и была удостоена Нобелевской премии по экономике 1987 года.


5 Эконометрика: основные формулы с комментариями 5 Наконец, экономическая теория относится к равновесному состоянию экономики или к так называемой «долгосрочной перспективе». Так, например, в равновесном состоянии потребность экономики в деньгах и предложение денег равны. В этом случае мы могли бы использовать данные о предложении денег вместо данных о потребности в деньгах. Однако, в действительности, денежный рынок почти никогда не находится в равновесии. При этом экономическая теория не говорит ничего о том, как экономика движется от одного равновесного состояния к другому. То есть, она не описывает процесс корректировки. К сожалению, реальные экономические данные обычно относятся к процессу корректировки, а не к последовательным положениям равновесия. Обычно экономические данные можно отнести к одному из следующих трех типов: Данные среза (известные также как статические или пространственные данные) - это данные, относящиеся к одному моменту времени и дающие нечто вроде поперечного среза некоторой отрасли экономики (отсюда происходит термин cross-sectional data - дословно - данные поперечного сечения). К этому типу принадлежат, например, данные о ценах на автомобили или недвижимость в зависимости от их всевозможных характеристик и относящиеся к определенному моменту времени; данные опроса семей об их уровнях дохода, образования и потребления; или данные о курсах валют в в различных обменных пунктах города на какую-то фиксированную дату. Временные ряды - это наблюдения некоторых экономических показателей, относящиеся к последовательным моментам времени. Промежуток времени между наблюдениями чаще всего постоянный (ежедневные, ежемесячные, ежеквартальные или ежегодные данные), но может быть и переменным. К этому типу данных относятся, например, курс евро за последний месяц; ежеквартальные данные об уровне инфляции или безработицы в России за последние 5 лет; национальный доход или сальдо внешнеторгового баланса за последние 10 лет; уровень процентных ставок или индекс курса акций на бирже за последние 18 месяцев, и т.д. Панельные данные (или продольные данные) - это наблюдения за одной и той же группой экономических агентов, проведенные через определенные промежутки времени, то есть это набор срезов. Здесь мы имеем данные среза в динамике. Это могут быть данные ежегодных опросов избранной группы семей об их уровнях дохода и потребле-


6 6 ния; или ежеквартальный набор сведений (объем продаж, количество работников, прибыть, и т.д.) об избранной группе фирм. Для описания экономических процессов эконометрика использует математические модели. Такие модели представляют собой уравнения или системы уравнений, призванные описать основные черты реального процесса, производящего наблюдаемые данные. Если модель адекватно представляет этот процесс, то её можно использовать для экономического анализа, для прогноза или для исследования реакции системы на изменение некоторых показателей. Можно выделить следующие основные типы моделей: Статические регрессионные модели с одной зависимой переменной - это модели вида Y = f(x 1, X 2,..., X k, ε). (1) Здесь переменные X 1,..., X k принято называть объясняющими (поскольку мы пытаемся объяснить изменения зависимой переменной Y изменениями переменных X 1,..., X k), а ε - это случайная поправка, о которой говорилось выше. В типичном примере автомобильного рынка Y означает цену машины, X 1 - это год выпуска, X 2 - объем двигателя, X 3 - марка машины (которой нетрудно придать числовое значение просто кодируя различные марки: Toyota Corolla - 1, Toyota Corona - 2, Nissan Bluebird - 3, и т.д.), X 4 может быть тип трансмиссии (1 - коробка, 0 - автомат), а вид функции f может быть, например, следующим: Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 + ε. (2) Здесь числа β 0, β 1, β 2, β 3, β 4 - это параметры модели, которые эконометрист должен оценить по имеющимся данным. Данные в нашем случае - это список выставленных на продажу машин вместе с интересующими нас характеристиками (ценами, объемами двигателей, и т.д.). Модели вида (1) подходят для моделирования данных среза или равновесных состояний экономики. Поскольку время явно не входит в уравнение (1), такая модель подразумевает мгновенную реакцию моделируемой системы на изменение значений объясняющих переменных. Динамические модели с одной зависимой переменной - это модели, в которые входят запаздывающие переменные, то есть значения экономических показателей, относящиеся к предыдущим момен-


7 Эконометрика: основные формулы с комментариями 7 там времени. Общий вид этих моделей таков: Y t =f(y t 1, Y t 2,..., Y t m,..., X 1t, X 1(t 1), X 1(t 2),..., X 1(t m1),..., X kt, X k(t mk), ε t). (3) Здесь X n(t i) - значение переменной X n в момент времени t i, то есть запаздывающее на i периодов. Другой популярный термин для запаздывания это лаг (от англ. lag - задержка), i называют тогда длиной лага, а переменную X n(t i) - переменной с лагом. Если в правую часть уравнения (3) не входят запаздывающие значения зависимой переменной, то есть Y t = f(x 1t, X 1(t 1), X 1(t 2),..., X 1(t m1),..., X kt,..., X k(t mk), ε t), (4) то модель называют моделью с распределенным лагом. Если же напротив запаздывающие значения зависимой переменной присутствуют, то говорят про авторегрессивный лаг. Есть ряд причин, по которым запаздывающие значения переменных появляются в эконометрических уравнениях. Во-первых, они могут возникнуть по технологическим причинам. Например, при увеличении спроса на продукт производства некоторой фирмы, она не может мгновенно увеличить производство - требуется время на закупку материалов, а для существенного увеличения объёмов на установку дополнительного оборудования, и т.д. Во-вторых, психологические факторы приводят к задержкам. При изменении доходов, например, в силу потребительских привычек, расходы на потребления изменятся не сразу. В-третьих, запаздывание возникает в силу несовершенной информации - экономическим агентам требуется время для сбора информации, что задерживает принятие решений. В-четвертых, к запаздыванию могут приводить институциональные факторы - контрактные обязательства и т.п. Наконец, значение зависимой переменной в текущий момент времени очень часто зависит от её значений в прошлом. Если наши данные имеют характер временного ряда, то нам необходимо использовать модель вида (3). Если модель (1) описывает равновесное состояние экономики и часто непосредственно опирается на экономическую теорию, то модели (3), (4) описывают процесс корректировки. Если все значения объясняющих переменных долгое время не меняются, то система должна постепенно прийти в состояние равновесия. Пусть X 1 не меняется m 1


8 8 промежутков времени, то есть: Аналогично: X 1t = X 1(t 1) = X 1(t 2) =... = X 1(t m1) = X const 1 X 2t = X 2(t 1) = X 2(t 2) =... = X 2(t m2) = X const 2, и так далее. Тогда в состоянии равновесия модель (4) даст следующую связь между зависимой переменной и объясняющими переменными Y const = f(x1 const, X2 const,..., Xk const, ε). Таким образом, мы пришли к статической модели вида (1). Эта статическая модель должна давать непротиворечащее экономической теории соотношение между переменными. При наличии авторегрессивного лага связь между равновесной статической моделью и динамической моделью (3) проследить не так просто, поскольку все объясняющие переменные должны оставаться постоянными бесконечно долго, прежде чем Y t также придет к равновесию. и Для примера рассмотрим две модели: Y t = β 1 + β 2 X t + β 3 X t 1 + ε t (5) Y t = β 1 + β 2 X t + β 3 Y t 1 + ε t. (6) При изменении объясняющей переменной X на одну единицу изменение Y (или отклик) за один период равно в обеих моделях β 2. По этой причине, β 2 иногда называют импульсным множителем. В модели (5) Y измениться в следующем периоде еще на β 3 после чего будет оставаться постоянным до следующего изменения X. Таким образом, суммарное изменение Y при изменении X на одну единицу равно в модели с распределенным лагом (5) β 2 + β 3. Эту величину называют долгосрочным или равновесным множителем. В модели с авторегрессивным лагом (6) Y t измениться в общей сложности на величину β 2 + β 2 β 3 + β 2 β β 2 β Если β 3 < 1, то этот ряд сходиться и, по формуле для суммы бесконечной геометрической прогрессии, его сумма равна β 2 /(1 β 3). Условие β 3 < 1 является необходимым и достаточным для того, чтобы влияние единичного скачка X затухало во времени. Это условие устойчивости модели (6).


9 Эконометрика: основные формулы с комментариями 9 Системы одновременных уравнений. Для описания некоторой отрасли экономики или, тем более, экономики в целом, одного уравнения, конечно, недостаточно. В этом случае модель состоит из набора уравнений, некоторые их которых могут быть регрессионными уравнениями вида (1) или (3) или тождествами (то есть не содержать случайной поправки, например Сбережения = Доходы - Расходы). Например, модель экономики США уортонской ассоциации содержала 207 уравнений. Аналогичный проект боннского университета для экономики Германии содержал 137 уравнений. Для исследования таких моделей требуется более сложный математический аппарат, чем для моделей первых двух типов и они не рассматриваются в настоящем пособии. В качестве примера рассмотрим следующую простейшую макроэкономическую модель: C t = α 0 + α 1 Y t + α 2 C t 1 + ε 1t I t = β 0 + β 1 R t + β 2 (Y t Y t 1) + ε 2t (7) Y t = C t + I t + G t Здесь потребление C t, инвестиции I t и суммарный спрос Y t определяются из уравнений модели и называются эндогенными (внутренними, внутрисистемными) переменными. Уровень процентных ставок R t и правительственные расходы, не связанные с заработной платой, G t считаются заданными и называются экзогенными (внешними, внесистемными) переменными. Переменные C t 1 и Y t 1 к моменту времени t уже принимают некоторые значения и поэтому называются предопределенными. Кроме перечисленных существуют и другие виды моделей, такие например, как модели для панельных данных, модели с дискретной зависимой переменной, модели с урезанными и цензурированными выборками и другие. 2 Множественная линейная регрессия Простейшей и в тоже время важнейшей статической моделью является множественная линейная регрессия. Она задаётся уравнением: Y = β 1 + β 2 X 2 + β 3 X β k X k + ε, (8) где Y - зависимая переменная, X 1,..., X k - объясняющие переменные, ε - случайное возмущение. Пусть у нас имеются n наблюдений над всеми переменными. Сформируем из этих данных матрицу наблюдений X и вектор


10 10 Y: 1 X 12 X X 1k 1 X 22 X X 2k X =....., Y = 1 X n2 X n3... X nk Через x m мы будем обозначать m-ый столбец матрицы X, то есть n- мерный вектор столбец наблюдений за переменной X m ; x i будет обозначать i-ую строку матрицы X, то есть k-мерный вектор-строку, содержащую i-ое наблюдение за всеми переменными. Согласно (8) X и Y связаны уравнением Y = Xβ + ε, (9) где β = (β 1,..., β k) T и ε = (ε 1,..., ε n) T - набор реализаций случайной величины ε. Классическая модель множественной линейной регрессии добавляет к уравнению (9) следующие предположения: A1 Все столбцы матрицы X линейно независимы, то есть матрица X имеет ранг k. Это означает, что между объясняющими переменными не существует точной линейной зависимости. В противном случае, некоторые из переменных можно безболезненно удалить из модели. A2 Случайные ошибки имеют нулевое математическое ожидание и некоррелированны с объясняющими переменными. Точнее предполагается, что при любой матрице наблюдений X условное математическое ожидание возмущений равно нулю: E(ε X) = 0 2. A3 Случайные возмущения для различных наблюдений не коррелируют друг с другом и имеют постоянную дисперсию для любой фиксированной матрицы наблюдений: E(εε T X) = σ 2 I, где I - единичная матрица размера n n. A4 Случайные возмущения распределены нормально со средним ноль и дисперсией σ 2: ε N(0, σ 2 I). Требуется оценить неизвестный вектор β. Пусть у нас имеется некоторая оценка ˆβ вектора β. Тогда оценкой для возмущений служат остатки: которые образуют вектор Y 1 Y 2. Y n. ˆε i = e i = Y i x i ˆβ, i = 1,..., n, (10) e = (e 1,..., e n) T = Y X ˆβ = Y Ŷ. 2 Символ E(ε X) означает условное математическое ожидание, то есть математическое ожидание в условном распределении ε при заданной матрице X. На практике это условие означает, что значения объясняющих переменных не несут никакой информации о возмущениях.


11 Эконометрика: основные формулы с комментариями 11 Здесь Ŷ = X ˆβ - прогноз значений Y по значениям X. Метод наименьших квадратов состоит в таком выборе ˆβ, который минимизирует сумму квадратов остатков: e 2 i = e T e min. i=1 Оценка методом наименьших квадратов имеет вид: ˆβ = (X T X) 1 X T Y. (11) Матрица X T X обратима благодаря предположению A1. Оценка методом наименьших квадратов будет несмещённой, если выполнено предположение A2. Эта оценка обладает наименьшей дисперсией среди всех линейных оценок вектора β если выполнены предположения A1-A3 3. Наконец, оценка (11) эффективна, то есть обладает наименьшей дисперсией среди всех (а не только линейных) оценок вектора β, если соблюдены все четыре предположения A1-A4. Условия состоятельности этой оценки приведены ниже в разделе 5. Теория статистического вывода, изложенная ниже в этом разделе и разделе 2, опирается на предположение A4 о нормальном распределении возмущений. Для случая парной регрессии формула (11) приводиться к виду: Y = α + βx + ε (12) ˆβ = n i=1 (X i X)(Y i Y) n i=1 (X i X) 2, ˆα = Y ˆβX, (13) где Y = [ n i=1 Y i] /n, X = [ n i=1 X i] /n - средние значения Y и X, соответственно. Несмещенной оценкой для дисперсии σ 2 служит ˆσ 2 = s 2 = 1 n k e 2 i = i=1 et e n k. (14) Матрица вариаций-ковариаций вектора ˆβ, равная E(ˆβ ˆβ T), оценивается при помощи формулы: Var(ˆβ) = Ê(ˆβ ˆβ T) = s 2 (X T X) 1. (15) 3 Это утверждение составляет содержание теоремы Гаусса-Маркова.


12 12 Здесь Ê - оценка математического ожидания. Диагональные элементы этой матрицы являются оценками для дисперсий отдельных коэффициентов, то есть: = s (X T X) 1 jj. (16) s ˆβj При помощи этих оценок строятся доверительные интервалы для индивидуальных коэффициентов. Зададим уровень доверия α. По заданному уровню доверия найдем критические значения t α n k по таблице распределения Стьюдента с n k степенями свободы (в программе MS-Excel это можно сделать при помощи функции «=СТЬЮДРАСПОБР(α, n k)»). Доверительный интервал для коэффициента β j получаются по формуле: ˆβ j t α n ks ˆβj β j ˆβ j + t α n ks ˆβj. (17) Статистика для проверки гипотезы β j = 0 (t-тест) получается по формуле t = ˆβ j s ˆβj (18) и имеет распределение Стьюдента с n k степенями свободы. Соответственно, для проверки гипотезы β j = βj можно использовать статистику t = ˆβ j β j s ˆβj, (19) имеющую такое же распределение. Доверительный интервал для дисперсии σ 2 находится по формуле (n k)s 2 χ 2 α/2 σ 2 (n k)s2 χ 2, (20) 1 α/2 где χ 2 α/2 и χ2 1 α/2 - критические значения χ2 - распределения с n k степенями свободы. Для исследования качества подгонки рассматривают соотношение между полной вариацией Y относительного своего среднего (SST=sum of squares total) SST = (Y i Y) 2 = Y T Y ny 2, (21) i=1 объясненной вариацией (SSE=sum of squares explained) SSE = (Ŷi Y) 2 = ˆβ T X T Y ny 2 = ˆβ T X T X ˆβ ny 2 (22) i=1


13 Эконометрика: основные формулы с комментариями 13 и остаточной вариацией (SSR=sum of squares residual) Имеет место равенство: SSR = e T e. (23) SST = SSE + SSR. (24) Коэффициент детерминации равен доли объясненной вариации Y в полной вариации: R 2 = SSE SST = 1 e T e Y T 2. (25) Y ny Величина s y = SST n 1 = YT Y ny 2 (26) n 1 является несмещенной оценкой дисперсии Y. Коэффициент детерминации никогда не убывает при добавлении нового регрессора, даже не имеющего никакого отношения к объяснению движений зависимой переменной Y. Поэтому предпочтительней использовать модифицированный коэффициент детерминации R 2, в котором введен штраф за увеличение количества переменных: R 2 = 1 n 1 n k (1 R2). (27) Коэффициенты детерминации (25), (27) имеют смысл только если среди регрессоров есть константа (то есть, когда в матрице X есть столбец единиц). Для проверки значимости коэффициента детерминации (или, что то же самое, для проверки совместной значимости всех переменных) применяется F -статистика: F = R 2 /(k 1) (1 R 2)/(n k), (28) которая имеет F -распределение Фишера с степенями свободы в предположении о равенстве нулю всех коэффициентов при переменных: β 2 = β 3 = = β k = 0. Следовательно, для проверки этой гипотезы на выбранном уровне значимости α нам необходимо сравнить наблюдаемое значение F-статистики с полученным по таблицам значением F α k 1,n k (в MS-Excel это значение можно получить функцией «=FРАСПОБР(α, k 1, n k)»). Высокие значения F-статистики свидетельствуют против гипотезы о равенстве нулю всех коэффициентов. Необходимо иметь в виду, что для временных рядов характерны весьма высокие значения коэффициента детерминации (часто > 0.9). Такие значения могут быть результатом совместного тренда, если он присутствует как


14 14 в зависимой переменной, так и в регрессорах, то есть являться следствием так называемой ложной корреляции (подробнее см. раздел 8 настоящего пособия). В то же время для данных среза значения R 2 > 0.3 могут быть вполне приемлемыми. Для линейных комбинаций коэффициентов регрессии также можно строить доверительные интервалы. А именно, для γ = w T β, где w - заданный вектор, на уровне значимости α получаем доверительный интервал где ˆγ t α n ksˆγ γ ˆγ + t α n ksˆγ, (29) ˆγ = w T ˆβ, s 2ˆγ = w T s 2 (X T X) 1 w. Важным аспектом диагностики регрессионной модели (8) является проверка наличия мультиколлинеарности (то есть приближенной линейной зависимости между объясняющими переменными). Важность объясняется следующей формулой для дисперсии оценок коэффициентов: σ 2ˆβj = σ 2 (1 Rj 2) n, (30) (X ji x j) где x j - среднее значение переменной X j, то есть j-ого столбца матрицы X, Rj 2 - коэффициент детерминации при регрессии X j по всем остальным объясняющим переменным. Эта формула показывает, что при значениях Rj 2 близких к единице, дисперсия оценок ˆβ j приближается к бесконечности, что приводит к размыванию доверительных интервалов (17) для коэффициентов регрессии и к низким значениям t-теста, при высокой совместной значимости переменных. Для проверки наличия мультиколлинеарности используется коэффициент возрастания дисперсии (VIF=Variance Inflation Factor): 1 VIF j = 1 Rj 2. (31) Еще один аспект диагностики - выявление выбросов. Для этого можно использовать оценку коэффициентов, полученную по всем наблюдениям, за исключением одного (i-ого): i=1 ˆβ(i) = 1 X(i) T Y(i), (32) где обозначение (i) показывает, что i-ое наблюдение было пропущено. Остаток, соответствующий пропущенному наблюдению, равен e i (i) = Y i x i ˆβ(i),


15 Эконометрика: основные формулы с комментариями 15 а его дисперсия оценивается по формуле: Var(e i (i)) = s 2 (i)(1 + x i 1 x T i). Нормированные остатки e i (i)/ Var(e i (i)) должны иметь распределение близкое к стандартному нормальному распределению. Значения превышающие по модулю 2 указывают на наблюдения, требующие особого изучения (выбросы). Приведем наконец, одну важную для вычислений формулу (формула обновления), которая применяется когда к имеющимся n наблюдениям добавляются еще m наблюдений и нам необходимо обновить оценку вектора коэффициентов β. Пусть X 0 (n k), Y 0 (n 1) - первоначальные наблюдения и A 0 = (X T 0 X 0) 1, B 0 = X T 0 Y 0. Пусть новые m наблюдений собраны в матрицу X 1 (m k) и вектор Y 1 (m 1). Обозначим через X((m + n) k), Y((m + n) 1) объединенные наблюдения. Имеют место формулы: A = (X T X) 1 = A 0 A 0 X T 1 1 X 1 A 0, B = X T Y = B 0 + X T 1 Y 1, ˆβ = (X T X) 1 X T Y = AB. (33) Общие сведения о множественной линейной регрессии завершим следующим замечанием. Для применения метода наименьших квадратов важна лишь линейность модели (8) по параметрам β 1,..., β k. Модель вида g(y) = β 1 + β 2 f 2 (X 2,..., X k) + + β k f k (X 2,..., X k) + ε, (34) где g, f 2,..., f k - заданные функции, сводится к модели (8) при помощи введения новых переменных Y = g(y), X 2 = f 2 (X 2,..., X k),..., X k = f k (X 2,..., X k). Кроме того, модель, зависящая от параметров θ 1,..., θ k называется внутренне линейной, если существует непрерывное взаимнооднозначное отображение набора параметров θ 1,..., θ k в набор параметров β 1,..., β k, относительно которых модель имеет вид (34). 3 Линейные ограничения, стабильность параметров и фиктивные переменные Пусть нам необходимо проверить J линейных ограничений на модель (9): r 11 β 1 + r 12 β r 1k β k = q 1 r 21 β 1 + r 22 β r 2k β k = q 2. r J1 β 1 + r 22 β r Jk β k = q J.


16 16 Запишем ограничения в векторной форме: где Rβ = q, (35) r 11 r 12 r r 1k r 21 r 22 r r 2k R =....., q = r J1 r J2 r J3... r Jk В предположении, что ограничения (35) выполнены F -статистика, равная q 1 q 2. q J. F = (R ˆβ q) T 1 (R ˆβ q)/j, (36) имеет F -распределение Фишера с степенями свободы. F -статистика из формулы (28) получается как частный случай (36), когда ограничения имеют вид β 2 = β 3 = = β k = 0, то есть когда R - единичная матрица размера (k 1) (k 1) с приписанным слева столбцом нулей, а q = 0 (см. формулу (40)). При помощи F -статистики мы можем строить доверительные области для группы коэффициентов. Пусть p - количество коэффициентов, для которых строится доверительная область. Эта область состоит из тех значений β i 1, β i 2,..., β i p, для которых гипотеза β i1 = β i 1, β i2 = β i 2,..., β ip = β i p не может быть отвергнута F -статистикой на заданном уровне значимости α. Обозначим i = {i 1, i 2,..., i p }, β i = (β i 1, β i 2,..., β i p) T, ˆβi = (ˆβ i1,..., ˆβip) T. Найдем по таблице распределения Фишера с степенями свободы критическое значение Fp,n k α. Доверительная область состоит из значений β i, удовлетворяющих неравенству 1 p (ˆβ i β i) T Vari (ˆβ) 1 (ˆβ i β i) F α p,n k, (37) где Var i (ˆβ) - матрица размера p p, состоящая из тех строк и столбцов матрицы (15), которые соответствуют ковариациям компонент ˆβ i. Доверительная область (37) имеет форму многомерного эллипсоида. При наложении ограничений (35) на модель (9) метод наименьших квадратов с ограничениями приводит к следующему вектору оценок: β = ˆβ (X T X) 1 R T 1 (R ˆβ q). (38) Матрица вариаций-ковариаций этого вектора оценок имеет вид: Var(β) = σ 2 (X T X) 1 σ 2 (X T X) 1 R T 1 R(X T X) 1 (39)


17 Эконометрика: основные формулы с комментариями 17 и может быть оценена заменой σ 2 на s 2. Эта матрица меньше матрицы (15) в том смысле, что получается из нее вычитанием положительно определённой матрицы. Обозначим через ẽ вектор остатков в регрессии с ограничениями (35): ẽ = Y X β. Тогда F -статистика (36) может быть также выражена формулой: F = (ẽt ẽ e T e)/j e T e/(n k) = (R2 R 2 1)/J (1 R 2)/(n k), (40) где e и R 2 - вектор остатков и коэффициент детерминации в регрессии (9) без наложения ограничений (35), соответственно, R 2 1- коэффициент детерминации в регрессии (9) c ограничениями (35). Одно из распространенных применений F -статистики это тестирование гипотезы о равенстве нулю некоторого подмножества коэффициентов. В этом случае регрессия с ограничениями - это регрессия в которой просто отсутствуют переменные, коэффициенты при которых предполагаются равными нулю. Вектор остатков этой регрессии и есть в этом случае ẽ и можно воспользоваться формулой (40). Если вычисленная таким образом F -статистика превосходит критическое значение на заданном уровне значимости, то гипотеза о равенстве нулю соответствующего подмножества коэффициентов должна быть отвергнута. Другое применение F -статистики - проверка стабильности параметров регрессии. Такая проверка применяется к временным рядам, когда имеется подозрение на структурный сдвиг, приведший к изменению значений параметров модели и произошедший в период наблюдений. Разобъем наши данные на два подмножества: X 1, Y 1 - до момента возможного структурного сдвига и X 2, Y 2 - после такого момента. Тогда в модели без ограничений вектор параметров может быть различным при X 1 и при X 2. Это соответствует тому, что мы оцениваем две различных модели - одну на данных до момента возможного структурного сдвига, вторую - на данных после такого момента: ˆβ 1 = (X T 1 X 1) 1 X T 1 Y T 1, ˆβ2 = (X T 2 X 2) 1 X T 2 Y T 2. (41) Сумма квадратов остатков в регрессии без ограничений складывается из двух частей, соответствующих двум периодам: e T e = e T 1 e 1 + e T 2 e 2. (42) Ограничение, соответствующее гипотезе об отсутствии структурного сдвига, имеет вид β 1 = β 2 или R = , q = 0, Rβ = q, и можно применить


18 18 формулу (36). Проще однако заметить, что регрессия с ограничениями в данном случае - это просто регрессия, в которой все данные объединены: X1 Y1 X =, Y =, ˆβ = (X T X) 1 X T Y, ẽ = Y X ˆβ. (43) X 2 Y 2 Теперь можно применить формулу (40) c J равным количеству столбцов в X и n k = n 1 + n 2 2k (поскольку в регрессии без ограничений n 1 + n 2 наблюдений и 2k переменных). Если необходимо проверить гипотезу о том, что структурный сдвиг повлиял не на все коэффициенты, а лишь на некоторое их подмножество (против альтернативы, что все коэффициенты изменились), то регрессия без ограничений снова состоит из двух независимых частей (41) с суммой остатков (42), а в регрессии с ограничениями матрица наблюдений имеет вид: Zpre 0 W X R = pre, (44) 0 Z post W post где индексы pre и post - обозначают наблюдения до и после момента структурного сдвига, соответственно; Z pre, Z post - наблюдения за переменными, на коэффициенты при которых не налагается ограничений (то есть они могут быть различными до и после сдвига), W pre, W post - наблюдения за переменными, коэффициенты при которых нам необходимо протестировать на неизменность. Если константа может быть различной до и после момента структурного сдвига, то столбец единиц i входит в группы Z pre, Z post (если есть подозрение, что изменилась только константа, то Z pre = i n1, Z post = i n2); если необходимо протестировать осталась ли константа постоянной, то столбцы единиц подходящего размера входят в W pre, W post. Остатки от регрессии Y на матрицу X R необходимо подставить в формулу (40) вместо ẽ. При этом J - это количество столбцов в W pre (= количество столбцов в W post). Если мы проверяем гипотезу о стабильности некоторой группы коэффициентов против альтернативы о стабильности всех коэффициентов, то (44) играет роль модели без ограничений, в то время как модель с ограничениями задается уравнением (43), в котором все параметры неизменны весь период наблюдений. Наконец в том случае, когда наблюдений в одной из групп X 1 или X 2 (пусть для определенности в X 2) недостаточно для расчета коэффициентов в модели без ограничений (n 2 < k) 4, применяется тест Чау на провал прогноза (Сhow predictive failure test). Он состоит в следующем. Регрессия 4 То есть ранг матрицы X T 2 X 2 меньше k и она необратима.


19 Эконометрика: основные формулы с комментариями 19 с ограничениями проводится с использованием полного набора данных, то есть согласно (43). Остатки в этой регрессии обозначим ẽ. Модель без ограничений рассчитывается на данных из более длинной группы X 1, то есть по первой из формул (41). Это делается потому, что на данных из второй группы мы можем выбрать ˆβ 2 так, чтобы остатки были равны нулю, поскольку оцениваемых параметров больше чем наблюдений. Обозначив остатки в этой регрессии через e, вычислим F -статистику по формуле: F = (ẽt ẽ e T e)/n 1 e T e/(n 2 k) (45) и сравним наблюдаемое значение с критическим по таблице F-распределения с степенями свободы. Приведённые выше тесты применяются в тех случаях, когда момент возможного структурного сдвига известен заранее. Если это не так, можно использовать CUSUM (cumulative sum) тест Брауна-Дёрбина-Эванса (Brown- Durbin-Evans), основанный на рекурсивных остатках. Пусть ˆβ t 1 - оценка вектора β методом наименьших квадратов, построенная по первым t 1 наблюдениям (t 1 k). Тогда рекурсивный остаток e t равен ошибке прогноза значения Y t: e t = Y t x t ˆβt 1, где x t, как прежде, наблюдение с номером t, то есть t-ая строка матрицы X. В предположении о постоянстве параметров модели весь период наблюдений нормированные рекурсивные остатки w t = e t 1 + x T t (X T t 1 X t 1) 1 x t имеют нормальное распределение со средним 0 и дисперсией σ 2 и независимы. В последней формуле матрица X t 1 ((t 1) k) - это первые t 1 строк матрицы X. Оценим дисперсию выражением: ˆσ 2 = 1 n k 1 (w t w) 2, w = 1 n k t=k+1 t=k+1 Тогда величины w t /ˆσ имеют распределение близкое с стандартному нормальному и некоррелированны. Можно использовать график w t /ˆσ в зависимости от t как одно из средств проверки нормальности. Выход за границы диапазона (2, 2) свидетельствует в пользу нарушения гипотезы о стабильности параметров модели. Кумулятивные суммы получаются по формуле s w t W s = ˆσ. t=k+1 w t.


20 20 В предположении о постоянстве параметров модели весь период наблюдений величины W s имеют распределение близкое к нормальному со средним ноль и дисперсией s k. График W s как функции s должен оставаться в коридоре, задаваемом прямыми, соединяющими точки с точками , где значения a зависят от уровня значимости и равны и для уровней доверия 95% и 99%, соответственно. Наконец Хансен (Hansen) предложил в 1992 году следующий тест на стабильность параметров модели (8). Пусть Тогда поскольку f t = T, e 2 = 1 n e 2 t. t=1 получаем Обозначим: X T e = x t e t = 0, (e 2 t e 2) = 0, t s t = f r, r=1 t=1 t=1 f t = 0. t=1 F = 1 n f t ft T, S = s t s T t. t=1 t=1 Статистика Хансена вычисляется по формуле 5 H = tr(f 1 S). Высокие значения H свидетельствуют против нулевой гипотезы о стабильности параметров. Асимптотические критические значения на уровне доверия 95% следующие: при k = ; при k = ; k = ; k = Фиктивные переменные используются для описания качественных факторов в регрессионных моделях. Так например, для квартальных данных мы можем учесть влияние времени года на параметр β 1 в модели (8), добавив в число регрессоров переменную D 1, равную единице для всех наблюдений, относящихся к первому кварталу, и нулю для остальных кварталов, переменную D 2, равную единице для всех наблюдений, относящихся ко второму кварталу, и нулю для остальных кварталов и переменную D 3, равную единице для всех наблюдений, относящихся к третьему кварталу, 5 Напомним, что tr(a) - след матрицы A - это сумма ее диагональных элементов


21 Эконометрика: основные формулы с комментариями 21 и нулю для остальных кварталов. Мы не должны вводить такую переменную для четвёртого квартала, поскольку это привело бы к линейной зависимости столбцов матрицы X (D 1 + D 2 + D 3 + D 4 = 1 для всех наблюдений), то есть к нарушению предположения A1 и необратимости матрицы (X T X)! Мы можем проверить существенность сезонных эффектов по значимости коэффициентов при сезонных фиктивных переменных. При помощи F -статистики можно проверить гипотезу об отсутствии сезонных эффектов, то есть о равенстве нулю всех коэффициентов при сезонных переменных одновременно. Если мы хотим учесть влияние качественного фактора не только на сдвиг β 1, но и на некоторый наклон β j, мы можем добавить в число регрессоров DX j, где D - мультипликативная фиктивная переменная, равная 1 для наблюдений с выделенным значением качественного фактора и 0 для остальных наблюдений. 4 Инструментальные переменные Важнейшим предположением, благодаря которому оценка МНК (11) обладает ключевыми свойствами состоятельности и несмещенности является предположение A2 о некоррелированности объясняющих переменных X i и возмущения ε 6. Часто однако, это предположение не выполняется. Наиболее распространенными причинами являются ошибки измерения и принадлежность рассматриваемого регрессионного уравнения к системе одновременных уравнений. Для оценивания параметров в таких случаях применяется метод инструментальных переменных. Он состоит в следующем. Пусть у нас есть l k переменных Z i, i = 1,..., l, некоррелированных с ε, но коррелированных с X i. Для тех переменных X j, которые некоррелированы с ε можно взять Z j = X j. Для других переменных в качестве инструментов часто выбирают их значения в предыдущем периоде: Z it = X i(t 1). Пусть Z(n l) - матрица наблюдений над инструментальными переменными. Предположим сначала l = k. Тогда оценка вектора параметров β модели (8) методом инструментальных переменных равна: ˆβ IV = (Z T X) 1 Z T Y. (46) Состоятельная оценка дисперсии возмущений σ 2 может быть, как прежде, основана на сумме квадратов остатков: ˆσ 2 = 1 n (Y X ˆβ IV) T (Y X ˆβ IV). (47) 6 Точнее предполагается, что условное математическое ожидание E(ε X) равно нулю для любых наблюдений X. Некоррелированность является следствием этого предположения.

22 22 Коррекция знаменателя для учета степеней свободы здесь не требуется, поскольку оценка в любом случае будет смещённой и необходимо опираться лишь на её асимптотические свойства. Асимптотическая матрица вариаций-ковариаций вектора ˆβ IV оценивается формулой: ÂVar(ˆβ IV) = ˆσ 2 (Z T X) 1 (Z T Z)(X T Z) 1. (48) Эту формулу можно использовать для построения доверительных интервалов для отдельных компонент вектора β, для этого матрица (48) используется вместо матрицы (15) в формулах (16) и (17). Для построения доверительных областей для группы компонент необходимо в формуле (37) заменить матрицу Var i (ˆβ) на соответствующую подматрицу матрицы (48). Пусть теперь инструментальных переменных больше чем первоначальных регрессоров: l > k. В этом случае новый набор инструментов, содержащий ровно k регрессоров получается по формуле: ˆX = Z(Z T Z) 1 Z T X. (49) В этом выражении ˆX можно интерпретировать как набор прогнозов значений столбцов X (то есть значений переменных X i, i = 2,..., k) при регрессии каждого столбца X на все переменные из матрицы Z. Если какие-то переменные из X содержатся в Z (то есть некоторое подмножество столбцов X повторяется в Z), то эти переменные будут без изменения воспроизведены в ˆX. Оценка ˆβ IV вычисляется теперь по любой из трех эквивалентных формул: ˆβ IV =(ˆX T X) 1 ˆXT Y = = 1 X T Z(Z T Z) 1 Z T Y = (ˆX T ˆX) 1 ˆXT Y. (50) Асимптотическая матрица вариаций-ковариаций вектора ˆβ IV снова вычисляется по формуле (48). Асимптотическое распределение вектора ˆβ IV является нормальным со средним β и матрицей вариаций-ковариаций (48). Следовательно, для построения приближенных доверительных областей можно пользоваться таблицами многомерного нормального распределения. В тех случаях, когда наличие корреляции между объясняющими переменными и возмущениями не очевидно из свойств модели, можно использовать следующий тест Ву (Wu, 1973) на наличие такой корреляции. Пусть X - наблюдения над k переменными подозрительными на корреляцию с возмущениями (то есть X некоторое подмножество столбцов матрицы X). Пусть ˆX = Z(Z T Z) 1 Z T X

23 Эконометрика: основные формулы с комментариями 23 - прогнозируемые значения X при регрессии на Z. Составим расширенную регрессию: Y = Xβ + ˆX γ + ε. (51) Совместная значимость всех компонент вектора γ свидетельствует в пользу корреляции между переменными из X и первоначальными возмущениями ε. Для проверки значимости используется F -статистика (40) c степениями свободы. 5 Несферические возмущения - общий случай При рассмотрении регрессионой модели (8) мы предполагали, что возмущения, соответствующие различным наблюдениям, обладают одинаковой дисперсией и некоррелированны друг с другом, то есть E(εε T X) = σ 2 I для любой матрицы наблюдений X (предположение A3). Отказ от этого требования приводит к модели (8) с дополнительным условием: E(εε T X) = σ 2 Ω, (52) где Ω - некоторая положительно-определённая матрица 7. Модель (8) с дополнительным условием (52) называется обобщенной линейной регрессией. Два важнейших частных случая этой модели это гетероскедастичность и автокорреляция возмущений. Возмущения гетероскедастичны, если матрица σ 2 Ω имеет вид: ω σ 2 Ω = σ 2 0 ω , (53) ω n то есть возмущения обладают различными дисперсиями σi 2 = σ 2 ω i, но не коррелированны друг с другом. Для удобства веса ω i и среднюю дисперсию σ 2 часто выбирают так, чтобы tr(ω) = ω i = n. (54) i=1 При такой нормировке классической гомоскедастичной модели соответствуют ω i = 1, i = 1,..., n. Подробнее этот случай рассмотрен ниже. 7 Напомним,что матрица A называется положительно-определенной если x T Ax > 0 для любого вектора x.

24 24 Автокорреляция возмущений встречается в основном во временных рядах. Наиболее часто встречается вид автокорреляции возмущений, задаваемый матрицей 1 ρ 1... ρ n 1 σ 2 Ω = σ 2 ρ ρ n 1.. (55) ρ n 1 ρ n Такой вид матрица вариаций-ковариаций возмущений будет иметь всегда, когда корреляция между возмущениями зависит лишь от временного промежутка между ними, но не от самого момента времени. В этом случае ρ i - это корреляция между возмущениями, отстоящими друг от друга на i промежутков времени. Большинство реальных процессов обладает затухающей памятью, что приводит к убыванию значений ρ i при увеличении i. Одновременно автокорреляция и гетероскедастчность встречается при исследовании панельных данных - то есть данных среза в динамике. Оценка (11) вектора β методом наименьших квадратов в обобщенной модели (8)+(52) сохраняет свойство несмещенности. Будет ли она состоятельной зависит от выполнения ряда условий. В частности, если и plim(x T X/n) = Q 1 plim(x T ΩX/n) = Q 2 - конечные положительно- определенные матрицы, то ˆβ - состоятельная оценка вектора β 8. Альтернативный набор условий состоятельности следующий: а) наименьшее (по модулю) собственное значение матрицы X T X неограниченно возрастает при n ; и б) наибольшее (по модулю) собственное значение Ω конечно при всех n. Первое условие будет выполняться, если с ростом n сумма квадратов значений наблюдений над каждой переменной n i=1 X2 ji неограниченно возрастает, при этом ни одно наблюдение не доминирует над остальным: X jm / Xji 2 0 i=1 при n для каждого j и m. Второе условие означает конечность дисперсий в гетероскедастичной модели (53) и достаточно быстрое убывание автокорреляций при удалении от главной диагонали в модели (55). 8 Обозначение plim означает предел по вероятности.

25 Эконометрика: основные формулы с комментариями 25 Даже если оценка методом наименьших квадратов ˆβ состоятельна для модели (8)+(52), она уже не будет обладать наименьшей дисперсией ни среди всех, ни даже среди линейных оценок вектора β. Еще более серьезное последствие замены предположения A3 на E(εε T X) = σ 2 Ω в том, что перестают выполняться оценка (15) матрицы вариаций-ковариаций ˆβ и оценка (14) для дисперсии возмущений. Следовательно, все использованные нами в разделах 1 и 2 процедуры статистического вывода становятся неверными. Матрица вариаций-ковариаций оценки МНК ˆβ для модели (8)+(52) равна V OLS = 1 () 1 () () n n XT X n XT [σ 2 Ω]X n XT X. (56) Для эффективного оценивания обобщённой регрессионой модели применим спектральное разложение положительно-определенной матрицы Ω: Ω = CΛC T, где столбцы матрицы C - собственные векторы Ω, а Λ - диагональная матрица с собственными значениями Ω на главной диагонали. Эти собственные значения положительны и поэтому определена диагональная матрица Λ 1/2, состоящая из элементов матрицы Λ в степени 1/2. Обозначим Тогда Ω 1 = P T P. Умножим (8) на P: P T = CΛ 1/2. (57) PY = PXβ + Pε или, вводя обозначения Y = PY, X = PX, ε = Pε: Y = X β + ε. (58) Матрица вариаций-ковариаций возмущений в преобразованной модели (58) равна: E(ε ε T) = Pσ 2 ΩP T = σ 2 I, то есть возмущения ε из (58) удовлетворяют требованиям A2, A3 классической регрессионой модели. Более того, если ε имел многомерное нормальное распределение с матрицей вариаций-ковариаций Ω, то ε имеет стандартное нормальное распределение, то есть удовлетворяет также требованию A4. Поэтому эффективная оценка вектора β получается по формуле: β = (X T X) 1 X T Y = (X T Ω 1 X) 1 X T Ω 1 Y. (59)

26 26 Она называется оценкой обобщённым методом наименьших квадратов (ОМНК) или оценкой Айткена (Aitken, 1935). Оценка (59) может быть получена минимизацией обобщённой суммы квадратов остатков: e T e = (Y Xβ) T Ω 1 (Y Xβ) min. Матрица вариаций-ковариаций этой оценки находится по формуле Var(β) = σ 2 (X T Ω 1 X) 1, (60) а дисперсия σ 2 может быть оценена выражением: s 2 = et e n k = (Y Xβ) T Ω 1 (Y Xβ). (61) n k Формулы (36) и (40) для F -статистики для тестирования линейных ограничений в обобщенной модели примут вид: F = (Rβ q) T 1 (Rβ q)/j = (ẽt ẽ e T e)/J, e T e /(n k) (62) где ẽ = Y X β - остатки в модели с ограничениями, полученные при помощи оценки β = β (X T Ω 1 X) 1 R T 1 (Rβ q) вектора параметров β в модели (8)+(52) с ограничениями (35) (ср. с формулой (38)). Наблюдаемое значения F -статистики по-прежнему необходимо сравнить с критическим значением по таблице F -распределения Фишера c степенями свободы на заданном уровне значимости, где J -количество ограничений. Высокие значения F -статистики свидетельствуют против ограничений. Таким образом, с преобразованной моделью (58) можно работать как с классической моделью применяя методы и формулы разделов 1 и 2 с единственной, но важной, оговоркой. Поскольку преобразованная матрица наблюдений X не содержит столбца единиц, модель (58) не содержит свободного члена. По этой причине сумма остатков ẽ i не равна нулю. Это приводит к тому, что коэффициент детерминации для преобразованной модели не ограничен рамками и поэтому не поддается интерпретации как процент объясненных движениями переменных X движений Y. Конечно, практическое применение формул (59)-(62) невозможно без знания матрицы Ω. Эта матрица в наиболее общем случае содержит n(n + 1)/2 различных элементов и не может быть оценена при помощи n наблюдений. Чтобы сделать оценивание возможным, предполагают, что

27 Эконометрика: основные формулы с комментариями 27 все элементы матрицы Ω зависят от небольшого числа параметров θ = (θ 1,..., θ m): Ω = Ω(θ). Количество параметров m чаще всего находится в пределах от одного до пяти. Тогда, если ˆθ - состоятельная оценка вектора параметров θ, мы можем оценить Ω формулой ˆΩ = Ω(ˆθ). Подстановка этой оценки в формулу (59) приводит к следующей оценке вектора β ˆβ = (X T ˆΩ 1 X) 1 X T ˆΩ 1 Y. (63) Эта оценка осуществимым обобщённым методом наименьших квадратов. Для асимптотической эффективности этой оценки достаточно, чтобы оценка ˆθ была состоятельной. 6 Гетероскедастичность Гетероскедастичность типична для данных среза, когда исследуются объекты разного масштаба. Другой распространенный случай возникает при работе с данными в форме средних по группам - дисперсия тогда обратно пропорциональна количеству наблюдений, по которым проводилось усреднение. Для временных рядов (в особенности для данных финансовых рынков) характерно чередование периодов с высокой и низкой дисперсией возмущений - то есть формирование кластеров из наблюдений с высокой дисперсией возмущений (соответствующих периодам нестабильности или высокой волатильности 9 рынка) и кластеров из наблюдений с низкой дисперсией возмущений (соответствующих периодам относительной стабильности или низкой волатильности рынка) 10. Как указано выше, при наличии гетероскедастичности оценка (11) методом наименьших квадратов теряет эффективность. Процедуры статистического вывода, использованные в разделах 1 и 2 перестают быть верными в конечных выборках. Тем не менее, в случае, если гетероскедастичность не коррелирована с переменными модели, формулы и статистические выводы метода наименьших квадратов остаются асимптотически верными и могут быть использованы в больших выборках. В случае, когда трудно оценить последствия гетероскедастичности для метода наименьших квадратов, необходимо использовать формулу (56) для матрицы вариаций-ковариаций оценок. Чтобы оценить эту матрицу Уайт (White, 1980) предложил следующую состоятельную оценку матрицы 9 От англ. volatile - летучий, непостоянный, изменчивый. 10 Для моделирования этого явления применяются ARCH и GARCH модели ( autoregressive conditional heteroscedasticity - [обобщенная] обусловленная авторегрессивная гетероскедастичность). Рассмотрение этих моделей выходит за рамки настоящего пособия.


Лекция 3 7 6 Разложение оценок коэффициентов на неслучайную и случайную компоненты Регрессионный анализ позволяет определять оценки коэффициентов регрессии Чтобы сделать выводы по полученной модели необходимы

Лекция 0.3. Коэффициент корреляции В эконометрическом исследовании вопрос о наличии или отсутствии зависимости между анализируемыми переменными решается с помощью методов корреляционного анализа. Только

Дисциплина «Эконометрика и экономико-математические методы и модели» («Эконометрика и прогнозирование», «Эконометрика» Тестовые вопросы для подготовки к экзаменационному тесту Тема: Проверка общего качества

Лекция 9 ЭКОНОМЕТРИКА 9 Эконометрический анализ в условиях нарушений классических предположений 9 Модели с гетероскедастичностью Рассмотрим частный случай обобщенной регрессионной модели, а именно, модель

ПРИМЕРНЫЙ ВАРИАНТ ТЕСТОВЫХ ЗАДАНИЙ Вопрос 1. Эконометрика изучает a) Электронные методы измерения в экономике b) Количественные закономерности и взаимосвязи в экономике c) Методы математической статистики

Лекция 5 ЭКОНОМЕТРИКА 5 Проверка качества уравнения регрессии Предпосылки метода наименьших квадратов Рассмотрим модель парной линейной регрессии X 5 Пусть на основе выборки из n наблюдений оценивается

1. Тема: Предпосылки МНК, методы их проверки Предпосылками метода наименьших квадратов (МНК) являются следующие функциональная связь между зависимой и независимой переменными присутствие в эконометрической

ФИО: 1. Набор данных содержит 10 переменных по 500 случайно отобранным домохозяйствам за 5 лет. Этот тип данных называется: (a) Временной ряд (b) Панельные данные (c) Пространственная выборка (d) Генеральная

Лекция 9. Множественная линейная регрессия Буре В.М., Грауэр Л.В. ШАД Санкт-Петербург, 2013 Буре В.М., Грауэр Л.В. (ШАД) Множественная регрессия... Санкт-Петербург, 2013 1 / 39 Cодержание Содержание 1

Оглавление Вступительное слово.............................. 8 Предисловие к первому изданию...................... 11 Предисловие к третьему изданию...................... 16 Предисловие к шестому изданию......................

МУЛЬТИКОЛЛИНЕАРНОСТЬ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ Серьезной проблемой при построении моделей множественной регрессии на основе метода наименьших квадратов (МНК) является мультиколлинеарность Мультиколлинеарность

Контрольная работа по дисциплине: «Эконометрика» студента Папченко Антона Алексеевича Задача. Метод наименьших квадратов, уравнения регрессии. Используя метод наименьших квадратов, определить наилучшую

Министерство образования и науки Российской Федерации ФГБОУ ВПО «Уральский государственный лесотехнический университет» Кафедра Информационных технологий и моделирования Г.Л. Нохрина ЭКОНОМЕТРИКА Контрольные

Поиск оценки может быть рассмотрен как измерение параметра (предполагается, что он имеет некоторое фиксированное, но неизвестное значение), основанное на ограниченном числе экспериментальных наблюдений.

Эконометрическое моделирование Лабораторная работа 7 Анализ остатков. Автокорреляция Оглавление Свойства остатков... 3 1-е условие Гаусса-Маркова: Е(ε i) = 0 для всех наблюдений... 3 2-е условие Гаусса-Маркова:

ЛЕКЦИЯ 7 ДИНАМИЧЕСКИЕ МОДЕЛИ ОЦЕНИВАНИЕ МОДЕЛЕЙ С РАСПРЕДЕЛЕННЫМИ ЛАГАМИ ВРЕМЕННЫЕ РЯДЫ (ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ) Эконометрические модели, которые в качестве регрессоров включают лаговые переменные, относятся

РГУ нефти и газа имени И.М. Губкина Коррекция гетероскедастичности. Метод взвешенных наименьших квадратов Иткина Анна Яковлевна, ст. преподаватель кафедры ЭНиГП Список лекций Метод наименьших квадратов

Эконометрическое моделирование Лабораторная работа 3 Парная регрессия Оглавление Парная регрессия... 3 Метод наименьших квадратов (МНК)... 3 Интерпретация уравнения регрессии... 4 Оценка качества построенной

Условия Гаусса-Маркова Теорема Гаусса-Маркова Свойства МНК-оценок Лекция 8 CВОЙСТВА ОЦЕНОК КОЭФФИЦИЕНТОВ РЕГРЕССИИ Для того чтобы полученные по МНК оценки обладали некоторым полезными статистическими свойствами

Вопросы к экзамену «Эконометрика» 1. Эконометрика, её задача и метод. Два принципа их спецификации. Типы уравнений в ЭММ: поведенческие уравнения и тождества (на примере макромодели). 2. Типы переменных

Контрольные тесты по дисциплине «Эконометрика» Первая главная компонента A. Содержит максимальную долю изменчивости всей матрицы факторов. B. Отражает степень влияния первого фактора на результат. C. Отражает

Лекция 7 ЭКОНОМЕТРИКА 7 Анализ качества эмпирического уравнения множественной линейной регрессии Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа Построенное

1. Общий анализ временного ряда. 1.1. Проверка гипотезы о случайности временного ряда. График временного ряда изучаемого показателя «Среднедушевые денежные доходы» изображен на рис. «Доходы населения».

Оглавление Предисловие... 9 Введение... 11 Глава 1. Введение в математические методы... 12 1.1. Моделирование в экономике и его использование в развитии и формализации экономической теории.... 12 1.2.

ЛЕКЦИЯ 4 НАРУШЕНИЯ ПРЕДПОСЫЛОК ТЕОРЕМЫ ГАУССА-МАРКОВА: Ч. II. ГЕТЕРОСКЕДАСТИЧНОСТЬ: ТЕСТИРОВАНИЕ И УСТРАНЕНИЕ. Тестирование гипотез на наличие (отсутствие) гетероскедастичности: тесы Уайта, Глейзера, Бройша-

Б А К А Л А В Р И А Т А.В. Костромин, Р.М. Кундакчян Рекомендовано УМО по образованию в области финансов, учета и мировой экономики в качестве учебного пособия для студентов, обучающихся по специальностям

Эконометрическое моделирование Лабораторная работа Корреляционный анализ Оглавление Понятие корреляционного и регрессионного анализа... 3 Парный корреляционный анализ. Коэффициент корреляции... 4 Задание

Лекция 8. Множественная линейная регрессия Грауэр Л.В., Архипова О.А. CS Center Санкт-Петербург, 2014 Грауэр Л.В., Архипова О.А. (CSC) Множественная регрессия... Санкт-Петербург, 2014 1 / 38 Cодержание

МВДубатовская Теория вероятностей и математическая статистика Лекция 4 Регрессионный анализ Функциональная статистическая и корреляционная зависимости Во многих прикладных (в том числе экономических) задачах

ТЕМА.. СПЕЦИФИКАЦИЯ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ: ПРОБЛЕМА ОТБОРА ФАКТОРОВ Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования,

Перечень вопросов для подготовки к промежуточной аттестации по дисциплине «Эконометрика» 1. Ковариация 2. Ковариация переменных в регрессионной модели 3. Описать основные этапы построения и анализа регрессионной

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Бизнес-информатика»

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ

Финансовый университет при Правительстве РФ Fnancal unversty under the Government of the Russan Federaton Гапаева Марима Абдул-Рахмановна Gapaeva Marma Линейная модель множественной регрессии с гетероскедастичными

Эконометрика Модель линейной регрессии Шишкин Владимир Андреевич Пермский государственный национальный исследовательский университет Вероятностью P(A) события A называется численная мера степени объективной

Полный список контрольных вопросов к экзамену по эконометрике МЕТОД НАИМЕНЬШИХ КВАДРАТОВ. СВОЙСТВА КОЭФФИЦИЕНТОВ РЕГРЕССИИ. 1. Что такое ковариация?. Что выражает ковариация переменных в регрессионной

ЛЕКЦИЯ 12 НАРУШЕНИЯ ПРЕДПОСЫЛОК ТЕОРЕМЫ ГАУССА-МАРКОВА: Ч. I. МУЛЬТИКОЛЛИНЕАРНОСТЬ 1. Что такое мультиколлинеарность? Причины ее возникновения 2. Проявления и последствия мультиколлинеарности 3. «Измерители»

Модель парной регрессии 30 25 20 15 10 В статистических данных редко встречаются точные линейные соотношения: y x 1 2 Обычно они бывают приближенными: y x 1 2 5 0 2 4 6 8 10 12 14 16 18 20

НОВЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ имени Т.РЫСКУЛОВА Научно-педагогическая Магистратура 1курс кафедры Специальности: «6М090200-Таможенное дело», «6М051000-Государственное и местное управление», «6М020200-Международные

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ (МИИТ) Кафедра «Экономика и управление на транспорте»

Эконометрическое моделирование Лабораторная работа 5 Множественная регрессия Оглавление Множественная регрессия... 3 Мультиколлинеарность... 4 Задание 1. Построение модели множественной регрессии... 5

Тесты по дисциплине 3 ТЕСТ. Коэффициент корреляции, равный нулю, означает, что между переменными: а) линейная связь отсутствует; б) существует линейная связь; в) ситуация не определена.. Коэффициент корреляции,

Лекция 3. Лемма Неймана-Пирсона. Две гипотезы: нулевая простая, альтернативная сложная. Последовательный критерий Вальда Грауэр Л.В., Архипова О.А. CS center Санкт-Петербург, 2014 Грауэр Л.В., Архипова

Министерство образования Российской Федерации Новосибирский государственный технический университет Кафедра прикладной математики Контрольная работа по дисциплине Эконометрика Выполнил: Студент группы

Министерство образования и науки Российской Федерации ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «САРАТОВСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Федеральное агентство воздушного транспорта Федеральное государственное образовательное учреждение высшего профессионального образования МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ГРАЖДАНСКОЙ АВИАЦИИ

Задача.Имеются следующие данные: Вариант 8 Номер семьи 3 4 5 6 7 8 9 0 Число совместно проживающих членов семьи, 3 3 4 4 4 5 6 7 7 чел. Годовое потребление электроэнергии, тыс. кв.- час 5 8 0 4 6 9 3 8.

Сибирский математический журнал Январь февраль, 2010. Том 51, 1 УДК 519.233.5+519.654 О СВЯЗИ МЕЖДУ КОЭФФИЦИЕНТАМИ ПРОСТОЙ И МНОЖЕСТВЕННОЙ РЕГРЕССИОННЫХ МОДЕЛЕЙ В. Г. Панов, А. Н. Вараксин Аннотация. Рассмотрена

Эконометрика. Книги 1 и 2. Носко В.П.

М.: 2011.; Кн. 1 - 672с., Кн. 2 - 576с.

В учебнике излагаются методы эконометрического анализа - от самых простых до весьма продвинутых. В основе учебника - курсы лекций, прочитанные автором в Институте экономической политики им. Е.Т. Гайдара, на механико-математическом факультете Московского государственного университета им. М.В. Ломоносова и на экономическом факультете РАНХиГС.

Учебник состоит из двух книг (четырех частей): в кн. 1 рассматриваются линейные модели регрессии; модели стационарных и нестационарных временных рядов, особенности регрессионного анализа для стационарных и нестационарных переменных; в кн. 2 - модели одновременных уравнений, модели с дискретными и цензурированными объясняемыми переменными, модели для анализа панельных данных; модель стохастической границы производственных возможностей, а также содержится дополнительный материал по анализу временных рядов (прогнозирование, методология векторных авторегрессий и др.). В каждой части учебника имеется словарь употребляемых в ней терминов. Для студентов, аспирантов, преподавателей, а также для специалистов по прикладной экономике.

Книга 1. Части 1-2.

Формат: djvu

Размер: 8 ,62 Мб

Скачать: yandex.disk

Книга 2 . Части 3 -4 .

Формат: djvu

Размер: 8,35 Мб

Скачать: yandex.disk

КНИГА 1.
Предисловие 6
Предисловие к первой книге 8
Часть 1 ОСНОВНЫЕ ПОНЯТИЯ, ЭЛЕМЕНТАРНЫЕ МЕТОДЫ
Раздел 1. ЭКОНОМЕТРИКА И ЕЕ СВЯЗЬ С ЭКОНОМИЧЕСКОЙ ТЕОРИЕЙ. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 11
Тема 1.1. Модели связи и модели наблюдений; эконометрическая модель, подобранная модель 11
Тема 1.2. Метод наименьших квадратов. Прямолинейный характер связи между двумя экономическими факторами 26
Тема 1.3. Примеры подбора линейных моделей связи между двумя факторами. Ложная линейная связь 45
Тема 1.4. Нелинейная связь между экономическими факторами 51
Раздел 2. ЛИНЕЙНАЯ МОДЕЛЬ НАБЛЮДЕНИЙ. РЕГРЕССИОННЫЙ АНАЛИЗ 74
Тема 2.1. Линейные модели с несколькими объясняющими переменными. Оценивание и интерпретация коэффициентов 74
Тема 2.2. Свойства оценок коэффициентов при стандартных предположениях о вероятностной структуре ошибок. Доверительные интервалы для коэффициентов 90
Приложение П-2а. Случайные векторы и их характеристики 109
Приложение П-26. Многомерное нормальное распределение 111
Раздел 3. ПРОВЕРКА ГИПОТЕЗ, ВЫБОР «НАИЛУЧШЕЙ» МОДЕЛИ И ПРОГНОЗИРОВАНИЕ ПО ОЦЕНЕННОЙ МОДЕЛИ 113
Тема 3.1. Проверка статистических гипотез о значениях отдельных коэффициентов и общей линейной гипотезы 113
Тема 3.2. Использование F-статистики для редукции исходной эконометрической модели. Проверка односторонних гипотез 127
Тема 3.3. Сравнение альтернативных моделей. Мультиколлинеарность. Прогнозирование по оцененной модели 149
Раздел 4. ПРОВЕРКА ВЫПОЛНЕНИЯ СТАНДАРТНЫХ ПРЕДПОЛОЖЕНИЙ О МОДЕЛИ НАБЛЮДЕНИЙ 170
Тема 4.1. Графические методы 170
Тема 4.2. Формальные статистические критерии 184
Раздел 5. УЧЕТ НАРУШЕНИЙ СТАНДАРТНЫХ ПРЕДПОЛОЖЕНИЙ О МОДЕЛИ 203
Тема 5.1. Включение в модель фиктивных переменных 203
Тема 5.2. Учет гетероскедастичности 215
Тема 5.3. Учет автокоррелированности ошибок 224
Раздел 6. ОСОБЕННОСТИ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯ СТОХАСТИЧЕСКИХ ОБЪЯСНЯЮЩИХ ПЕРЕМЕННЫХ 234
Тема 6.1. Линейные регрессионные модели со стохастическими объясняющими переменными 234
Тема 6.2. Метод инструментальных переменных 243
Задания для семинарских занятий, работы в компьютерном классе и для самостоятельной работы 261
Приложение. Таблицы статистических данных к заданиям 287
Литература 291
Глоссарий 292
Часть 2 РЕГРЕССИОННЫЙ АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
Раздел 7. СТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ. МОДЕЛИ ARMA 307
Тема 7.1. Стационарные модели ARMA 307
Тема 7.2. Подбор стационарной модели ARMA для ряда наблюдений 340
Приложение П-7. Проверка гипотезы случайности 369
Раздел 8. РЕГРЕССИОННЫЙ АНАЛИЗ ДЛЯ СТАЦИОНАРНЫХ ПЕРЕМЕННЫХ 377
Тема 8.1. Асимптотическая обоснованность стандартных процедур 377
Тема 8.2. Динамические модели. Векторная авторегрессия 383
Раздел 9. НЕСТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ. МОДЕЛИ ARIMA 423
Тема 9.1. Нестационарные ARMA модели 423
Тема 9.2. Проблема различения TS- и AS-рядов. Гипотеза единичного корня 448
Раздел 10. ПРОЦЕДУРЫ ДЛЯ РАЗЛИЧЕНИЯ TS- И DS-РЯДОВ 454
Тема 10.1. Критерии Дики-Фуллера. Многовариантные процедуры проверки гипотезы единичного корня 454
Тема 10.2. Обзор некоторых других процедур 489
Раздел 11. РЕГРЕССИОННЫЙ АНАЛИЗ ДЛЯ НЕСТАЦИОНАРНЫХ ПЕРЕМЕННЫХ. КОИНТЕГРИРОВАННЫЕ ВРЕМЕННЫЕ РЯДЫ. МОДЕЛИ КОРРЕКЦИИ ОШИБОК 520
Тема 11.1. Проблема ложной регрессии. Коинтегрированные временные ряды. Модели коррекции ошибок 520
Тема 11.2. Оценивание коинтегрированных систем временных рядов 558
Тема 11.3. Оценивание ранга коинтеграции и модели коррекции ошибок методом Йохансена 579
Задания для семинарских занятий, работы в компьютерном классе и для самостоятельной работы 605
Приложение. Таблицы статистических данных к заданиям 637
Литература 647
Глоссарий 651
Предметный указатель 665

КНИГА 2.
Предисловие 6
Предисловие ко второй книге 8
Часть 3 СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ, ПАНЕЛЬНЫЕ ДАННЫЕ, МОДЕЛИ С ДИСКРЕТНЫМИ И ОГРАНИЧЕННЫМИ ОБЪЯСНЯЕМЫМИ ПЕРЕМЕННЫМИ
Раздел 1. СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ 11
Тема 1.1. Идентифицируемость структурной формы системы одновременных уравнений 11
Тема 1.2. Оценивание систем одновременных уравнений 42
Раздел 2. СТРУКТУРНЫЕ И ПРИВЕДЕННЫЕ ФОРМЫ МОДЕЛЕЙ КОРРЕКЦИИ ОШИБОК 86
Тема 2.1. Структурные и приведенные формы векторных авторегрессий и моделей коррекции ошибок 86
Раздел 3. ПАНЕЛЬНЫЕ ДАННЫЕ 105
Тема 3.1. Панельные данные: модель пула, модель ковариационного анализа, модель кажущихся несвязанными регрессий 105
Тема 3.2. Модели с фиксированными и случайными эффектами 129
Тема 3.3. Двунаправленные модели 156
Тема 3.4. Несбалансированные панели, эндогенные объясняющие переменные, модели с индивидуально-специфическими переменными 163
Тема 3.5. Динамические модели 173
Раздел 4. МОДЕЛИ С ДИСКРЕТНЫМИ И ОГРАНИЧЕННЫМИ ОБЪЯСНЯЕМЫМИ ПЕРЕМЕННЫМИ 185
Тема 4.1. Модели, в которых объясняемая переменная принимает только два различных значения 185
Тема 4.2. Модели, в которых объясняемая переменная принимает несколько различных значений 212
Тема 4.3. Цензурированные модели регрессии (тобит-модели) 228
Тема 4.4. Модели бинарного выбора для панельных данных 249
Тема 4.5. Тобит-модели для панельных данных 261
Задания для семинарских занятий, работы в компьютерном классе и для самостоятельной работы 271
Приложение. Статистические данные к заданиям 306
Литература 311
Глоссарий 313
Часть 4 ВРЕМЕННЫЕ РЯДЫ: ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ. МОДЕЛЬ СТОХАСТИЧЕСКОЙ ГРАНИЦЫ
Раздел 5. СГЛАЖИВАНИЕ И ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ 327
Тема 5.1. Адаптивные методы, метод наименьших квадратов 327
Тема 5.2. Прогнозирование по моделям AR, M A, ARM A, ARIM А 360
Раздел 6. МЕТОДОЛОГИЯ ВЕКТОРНЫХ АВТОРЕГРЕССИЙ 392
Тема 6.1. Прогнозирование по модели векторной авторегрессии, проверка наличия причинности по Грейнджеру для двух и более рядов 392
Тема 6.2. Методология VAR 414
Тема 6.3. Эмпирические исследования 440
Тема 6.4. Нестабильные VAR 467
Раздел 7. ТЕСТЫ НА ЕДИНИЧНЫЕ КОРНИ И НЕЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ. ДИНАМИЧЕСКИЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 489
Тема 7.1. Тесты на единичные корни и нелинейные преобразования 489
Тема 7.2. Динамический метод наименьших квадратов для оценивания коинтегрирующего вектора системы интегрированных рядов 504
Раздел 8. МОДЕЛЬ СТОХАСТИЧЕСКОЙ ГРАНИЦЫ 515
Тема 8.1. Модель стохастической границы для перекрестной выборки 515
Тема 8.2. Модели стохастической границы для панельных данных 531
Задания для семинарских занятий, работы в компьютерном классе н для самостоятельной работы 537
Приложение. Таблицы статистических данных к заданиям 558
Литература 563
Глоссарий 567
Предметный указатель 572

Федеральное агентство железнодорожного транспорта

Уральский государственный университет путей сообщения

Кафедра «Высшая и прикладная математика»

Г.А. Тимофеева

А.В. Мартыненко

ЭКОНОМЕТРИКА

Учебное пособие для студентов экономических направлений подготовки бакалавров: 080100.62 – «Экономика»

Екатеринбург

Эконометрика: учеб. Пособие / Г.А. Тимофеева, А.В. Мартыненко. – Екатеринбург: УрГУПС, 2015.

Излагаются основы эконометрики, приводятся основные эконометрические идеи и методы анализа экономических процессов и явлений. Приводится большое количество примеров эконометрических расчетов с использованием электронных таблиц.

Основной материал учебного пособия соответствует структуре курса «Эконометрика» направления подготовки бакалавров 080100.62 Экономика (специализаций «Бухгалтерский учет, анализ и аудит», «Мировая экономика», «Экономика предприятий и организаций»).

Пособие также содержит разделы, которые требуют углубленных знаний математики и математической статистики и ориентированы на изучение в курсе «Эконометрика» (продвинутый уровень) магистратуры по направлению 080100.68 «Экономика».

А.В. Мартыненко, доц. кафедры «Высшая и прикладная математика», канд. физ.-мат. наук, УрГУПС

Рецензенты: Д.Б. Берг, профессор кафедры «Анализ систем и принятие решений», д-р физ.-мат. наук, УрФУ

С.В. Рачек, зав. кафедрой «Экономика транспорта», д-р экон. наук, профессор, УрГУПС

ВВЕДЕНИЕ.............................................................................................................

1. ВСПОМОГАТЕЛЬНЫЕ СВЕДЕНИЯ ИЗ МАТЕМАТИЧЕСКОЙ

СТАТИСТИКИ.........................................................................................................

1.1. Основные статистические формулы................................................................

1.2. Стандартные статистические распределения................................................

1.3. Проверка статистических гипотез..................................................................

1.4. Проверка гипотезы о значимости коэффициента корреляции.....................

2. ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ..............................................................

2.1. Парная регрессия.............................................................................................

2.2. Модель парной регрессии...............................................................................

2.3. Регрессия по методу наименьших квадратов................................................

2.4. Основное дисперсионное тождество регрессионного анализа.....................

2.5. Коэффициент детерминации. Критерий Фишера (F-тест)............................

2.6. Интервальные оценки параметров уравнения регрессии.............................

3. ПАРНАЯ НЕЛИНЕЙНАЯ РЕГРЕССИЯ.........................................................

3.1. Виды нелинейных регрессий..........................................................................

3.2. Линеаризация нелинейных регрессий............................................................

3.3. Выбор нелинейной зависимости....................................................................

3.4. Индексы корреляции и детерминации...........................................................

3.5. Средняя ошибка аппроксимации....................................................................

3.6. Коэффициент эластичности............................................................................

4. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ...........................................

4.1. Оценка коэффициентов регрессии по МНК для двух независимых

переменных............................................................................................................

4.2. Оценка коэффициентов по МНК для множественной регрессии.................

4.3. Условия применения МНК.............................................................................

4.4. Спецификация модели....................................................................................

4.5. Коэффициент детерминации..........................................................................

4.6. Проверка значимости линейной регрессионной модели..............................

4.7. Сравнение «короткой» и «длинной» моделей...............................................

4.8. Оценка значимости коэффициентов регрессии по t-критерию Стьюдента.65

4.9. Фиктивные переменные..................................................................................

4.10. Нарушение предпосылок МНК....................................................................

4.11. Проверка гомоскедастичности. Критерий Голдфелда-Квандта.................

5. ВРЕМЕННЫЕ РЯДЫ. ОСНОВНЫЕ ПОНЯТИЯ............................................

5.1. Аддитивная и мультипликативная модели временного ряда.......................

5.2. Коэффициент автокорреляции. Коррелограмма............................................

5.3. Выделение тенденции при помощи скользящего среднего..........................

5.4. Проверка остатков на автокорреляцию. Критерий Дарбина-Уотсона.........

ПРИЛОЖЕНИЕ. РАСПРЕДЕЛЕНИЕ ДАРБИНА-УОТСОНА..........................

БИБЛИОГРАФИЧЕСКИЙ СПИСОК..................................................................

Введение

Эконометрика – это наука, изучающая методами математической статистики количественные закономерности и связи в экономике, выражаемые в виде математических моделей.

Центральной проблемой эконометрики является построение экономет-

рической модели и определение возможностей ее использования для описания, анализа и прогнозирования реальных экономических процессов.

Основная цель эконометрики – вывод экономических закономерностей в виде математических зависимостей на основе анализа эмпирических данных.

Зависимость между переменными (показателями) может быть функциональной (встречается редко) или статистической (в экономике, как правило, является преобладающей).

Функциональная зависимость (иначе ее называют детерминированной) задается в виде формулы, которая каждому значению одной переменной ставит в соответствие строго определенное значение другой переменной, например, по доходу рассчитывают налог.

Статистическая зависимость – это связь переменных, при которой изменение одной переменной приводит к изменению среднего ожидаемого значения другой переменной. Например, чем больше население региона, тем больше валовой региональный продукт. Наиболее распространенной формулой статистической связи между переменными является уравнение регрессии. Если зависимость линейная (нелинейная), то регрессию называют линейной (нелинейной). Многие нелинейные модели можно преобразовать в линейные.

Процессы эконометрического анализа могут характеризоваться двумя типами обрабатываемых данных: пространственными данными и временными рядами.

Пространственные данные – это относящиеся к одному и тому же моменту времени данные о каком-либо экономическом показателе, характеризующем однотипные объекты. Например, данные об объеме производства на разных промышленных предприятиях за один и тот же период времени или о количестве работников разных промышленных предприятий в один и тот же момент времени.

Временные ряды – это данные о каких-либо показателях, характеризующих одни и те же объекты в различные моменты времени. К такому типу данных относятся ежемесячные или ежегодные статистические данные по стране в целом или по отдельным регионам. Например, по объему промышленного производства или о количестве безработных. Особенность временных данных состоит в том, что они упорядочены во времени.

Регрессионная модель – это уравнение, в котором объясняемая переменная представляется в виде функции от объясняющих переменных. Например, модель спроса на некоторый товар в зависимости от его цены и дохода по-

купателей. По виду функции различают линейные инелинейные регрессионные модели. Наиболее детально изучены и потому наиболее часто встречается в эконометрическом анализе методы оценки и анализа линейных регрессионных моделей.

К простейшим моделям временных рядовотносятся модели трендаи модели сезонности. Тренд представляет собой устойчивое изменение уровня показателя в течение длительного времени. Сезонность характеризует устойчивые внутригодовые колебания уровня показателя. Основная особенность моделей этого класса состоит в том, что они объясняют поведение временного ряда исходя из его предыдущих значений.

Основные задачи эконометрики состоят в построении моделей, выражающих выводимые закономерности, оценке их параметров, и проверке гипотез о полученных закономерностях и связях экономических показателей.

Эконометрическая модель, как правило, основана на теоретическом предположении о взаимосвязанности переменных и характере связи между ними. В

качестве основных этапов эконометрического исследованияможно указать:

Постановка проблемы; Получение данных, анализ их качества; Спецификация модели; Оценка параметров;

Интерпретация и верификация результатов.

Спецификация модели является ключевым моментом эконометрического исследования. На этом этапе решения любой эконометрической задачи необходимо сформулировать эконометрическую модель, т.е. представить модель в виде уравнений, характеризующих связи между экономическими показателями. Например, в качестве модели связи между доходами и сбережениями семей можно выбрать линейное уравнение

Y X ,

где X – доход семьи,Y – сбережения семьи, – случайная составляющая (ошибка); и – параметры уравнения, заранее не известные и подлежащие определению в результате эконометрического анализа задачи.

Подчеркнем, что выбор эконометрической модели осуществляется исследователем субъективно, т.е. на основе своего личного опыта и знаний. Правильность (неправильность) сделанного выбора определяется исключительно тем, насколько хорошо полученная модель описывает исследуемое экономическое явление. Поэтому при решении любой задачи эконометрики необходима проверка соответствия полученной модели реальным экономическим данным.

Настоящее пособие ориентировано, прежде всего, на студентов экономических специальностей университетов. Оно также может быть полезно для аспирантов и преподавателей экономических дисциплин.

Изложение материала подразумевает, что читатель знаком с базовыми курсами высшей математики и теории вероятностей и математической статистики. Однако опыт преподавания эконометрики показывает, что в начале кур-

са студентам необходимо восстановить знания основных положений базовых курсов. Поэтому первая глава пособия посвящена изложению некоторых понятий и фактов математической статистики.

Во второй главе рассматривается парная линейная регрессия. Основное внимание в этой главе сосредоточено на получении оценок коэффициентов уравнения регрессии с помощью метода наименьших квадратов (МНК), а также на проверке качества, как полученных оценок коэффициентов, так и всей модели в целом.

Третья глава посвящена парной нелинейной регрессии. Здесь приведены методы линеаризации различных нелинейных моделей, даны основные показатели качества нелинейной модели, а также раскрыты некоторые аспекты спецификации модели парной регрессии.

В четвертой главе рассматривается множественная регрессия. Излагается метод наименьших квадратов для получения оценок коэффициентов уравнения множественной регрессии, а также детально рассмотрены предпосылки использования МНК. Приводятся основные способы проверки качества модели и ее параметров.

В пятой главе изучаются временные ряды. Подробно описываются все этапы построения аддитивной модели временного ряда. Приводится критерий Дарбина-Уотсона проверки остатков на автокорреляцию.

Вся излагаемая теория сопровождается большим количеством примеров, которые выполнены в программе Microsoft Excel 2003. Выбор именно этой версии был продиктован тем, что, с одной стороны, возможностей Microsoft Excel 2003 вполне достаточно для выполнения статистических и эконометрических расчетов. А с другой стороны, реализация таких расчетов во всех более поздних версиях осуществляется почти так же как в Microsoft Excel 2003, поэтому адаптация приведенных в книге примеров для других версий Microsoft Excel не представляет особого труда.

1. Вспомогательные сведения из математической статистики

1.1. Основные статистические формулы

Пусть из некоторой генеральной совокупности получена выборка

Основными числовыми характеристиками выборки являются выбороч-

ные средние

выборочные дисперсии

D D(X) (x i

x i 2

D(Y)

(y i

y i 2

выборочные средние квадратичные отклонения

Sx S(X) Dx , Sy S(Y) Dy

и выборочные коэффициенты ковариации и корреляции

cov(X ,Y )

(x i

)(y i

x y,

cov(x ,y )

S (X )S (Y )

Эти величины вычисляются по данной выборке и, естественно, они будут отличаться от соответствующих характеристик генеральной совокупности, которые называют истинными илитеоретическими значениями. Если мы возьмем другую выборку, то получим другие значения характеристик. Выборочные характеристики являютсяоценками теоретических характеристик . Выбороч-

ные характеристики принято обозначать латинскими буквами, а теоретические

– соответствующими греческими буквами. В частности, теоретический коэффициент корреляции будем обозначать через ρ B илиxy .

Отметим, что дисперсия, вычисляемая по формулам (1.1) и (1.2), называ-

ется неисправленнойв отличии от исправленной дисперсии, которая вычис-

ной оценкой теоретической дисперсии и используется при построении доверительных оценок X иY . Однако, для расчета парной регрессииD x испр не понадобится.

Отметим, что рассматриваемую выборку можно интерпретировать как результаты n наблюдений двумерной случайной величины(X,Y) . Тогда выборочные характеристики интерпретируются как оценки соответствующих характеристик случайных величинX иY .

Коэффициент корреляции будет играть очень важную роль в нашем курсе. Он является основным показателем тесноты линейной связи между случайными величинами. Коэффициент корреляции xy принимает значения от1 до

1. При xy 1 связь междуX иY является линейной функциональ-

ной зависимостью (самая сильная связь);

2. При xy 0 линейная корреляционная связь междуX иY отсутст-

3. При xy 0 корреляционная связь междуX иY является прямой,

т.е. Y увеличивается при увеличенииX , а приxy 0 – обратной,

т.е. Y уменьшается при увеличенииX .

Выборочный коэффициент корреляции r xy является оценкойxy и обла-

дает аналогичными свойствами.

Пример 1. Заданы себестоимостьY (руб.) одного экземпляра книги в зависимости от тиражаX (тыс.шт.)

Для данной выборки найти выборочные средние, дисперсии и СКО величин X иY , а также выборочные коэффициенты ковариации и корреляции.

Отыскание этих числовых характеристик в программе Microsoft Excel можно выполнить несколькими способами.

Способ 1 . Найдем характеристики непосредственно по формулам. Для этого составим расчетную таблицу (рисунок 1.1). Формулы, по которым производятся вычисления в ячейках, представлены на рисунке 1.2.

Рис. 1.1. Расчет основных выборочных характеристик

Рис. 1.2. Формулы для расчета основных выборочных характеристик

Способ 2. Найдем характеристики, используя встроенные функции Microsoft Excel. Таблицы с результатами и формулами представлены на рисунках 1.3 и 1.4.

Рис. 1.3. Расчет выборочных характеристик с помощью встроенных функций

Рис. 1.4. Формулы для расчета выборочных характеристик с помощью встроенных функций

Замечание. В Microsoft Excel есть две функции для вычисления дисперсии: функцияДИСПР возвращает неисправленную дисперсию (в терминологии Microsoft Excel она называетсядисперсией для генеральной совокупности ), функцияДИСП

возвращает исправленную дисперсию (в терминологии Microsoft Excel она называет-