Эконометрика. Обратная и пропорциональная модель парной линейной регрессии. Фиктивная линейная зависимость презентация

Содержание


Презентации» Математика» Эконометрика. Обратная и пропорциональная модель парной линейной регрессии. Фиктивная линейная зависимость
Обратная и пропорциональная модель парной линейной регрессии.
 Фиктивная линейная зависимость.Задача состоит в оценивании модели прямолинейной связи между некоторыми переменными xПо первой модели наблюдений мы получаем наилучшую прямую 
 По первойПри       получаем   Пусть получены наблюдения        Оценка единственного параметра пропорциональной модели будет:
 И, следовательно,   выражение          сумма квадратов, не центрированных значений переменной y (отклонений значений переменной yДоказать заявленное равенство не сложно. Действительно,
 Но,
 что и приводит кНа практике часто встречаются ситуации, при которых существует заметный тренд (убываниеи      , значение   значение      будет тем ближе к -1,Свойства МНК-оценок параметров регрессии. Показатели качества регрессииСпособ оценивания дает состоятельные оценки, если при бесконечно большом объеме выборкиДокажем, что   является несмещенной оценкой . Если выполнены предпосылкиДисперсии МНК–оценок параметров регрессии будут
 Дисперсии МНК–оценок параметров регрессии будут
 гдесвязывают с адекватностью модели по наблюдаемым (эмпирическим) данным. Проверка адекватности (илигде          Теоретический коэффициент детерминации (индекс для нелинейных форм связей)   Коэффициент (индекс) множественной корреляции рассчитывается как корень квадратный из коэффициента 
Средняя ошибка аппроксимации 
 Чем меньше рассеяние эмпирических точек вокруг теоретическойПРОВЕРКА ГИПОТЕЗ О ЗНАЧИМОСТИ ПАРАМЕТРОВ РЕГРЕССИИ, КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ И УРАВНЕНИЯ РЕГРЕССИИС помощью метода наименьших квадратов можно получить лишь оценки параметров модели,Для проверки гипотез используют t–статистику распределения Стьюдента, критическое значение которой определяетсяДля проверки гипотезы: =0 статистика критерия будет
 Для проверки гипотезы: =0Для проверки гипотезы: =0 статистика критерия будет 
 Для проверки гипотезы:Для проверки гипотез о незначительном отклонении от нуля «истинного» коэффициента линейнойСуществует взаимосвязь 
 Рассмотренная формула статистики критерия проверки гипотез применима, если:
Если же величина выборочного коэффициента корреляции близка к 1, то распределениеОценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно лиПРОГНОЗ ОЖИДАЕМОГО ЗНАЧЕНИЯ РЕЗУЛЬТИРУЮЩЕГО ПРИЗНАКА.Предположим, необходимо определить для заданного значения фактора xp с доверительной вероятностьюВокруг линии регрессии образуется доверительный интервал («коридор», в который попадет прогнозируемоеНЕЛИНЕЙНАЯ РЕГРЕССИЯБольшинство экономических ситуаций характеризуются нелинейной зависимостью между результирующим и факторными признаками.
Полиномы различных степеней – 
 yi=a0+ a1xi+…+ amxim+i. 
 Равностороння гиперболаСтепенная функция – 
 ;
 Показательная функция – 
 ;
 ЭкспоненциальнаяМодель описывается уравнением:
 Модель описывается уравнением:
 y – спрашиваемое количество товара,



Слайды и текст этой презентации
Слайд 1
Описание слайда:
Обратная и пропорциональная модель парной линейной регрессии. Фиктивная линейная зависимость.


Слайд 2
Описание слайда:
Задача состоит в оценивании модели прямолинейной связи между некоторыми переменными x и y на основе наблюдений n пар значений этих переменных. Вопрос об оценивании параметров модели наблюдений уже рассмотрен ранее. Встает вопрос о том, что изменится, если исходить из «обратной» модели: Задача состоит в оценивании модели прямолинейной связи между некоторыми переменными x и y на основе наблюдений n пар значений этих переменных. Вопрос об оценивании параметров модели наблюдений уже рассмотрен ранее. Встает вопрос о том, что изменится, если исходить из «обратной» модели: Пусть – оценки параметров  и  в модели наблюдений , а – оценки параметров в модели наблюдений . Тогда: т.е. или

Слайд 3
Описание слайда:
По первой модели наблюдений мы получаем наилучшую прямую По первой модели наблюдений мы получаем наилучшую прямую а по второй – прямую Первую прямую мы можем записать в виде Сравнивая коэффициенты при x в двух последних уравнениях, находим, что эти коэффициенты равны в том и только в том случае, когда выполнено соотношение т. е. или, с учетом предыдущего, когда . Что касается отрезков на осях, то они будут совпадать тогда и только тогда, когда или Но так что

Слайд 4
Описание слайда:
При получаем В то же время, При получаем В то же время, При совпадают и отрезки на осях, т. е. наилучшая прямая одна для обоих моделей, это прямая, на которой расположены все наблюдаемые точки Наилучшие прямые, построенные по двум альтернативным моделям, совпадают в том и только в том случае, когда все точки , расположены на одной прямой (так что ); при этом, . В противном случае , и подобранные «наилучшие» прямые имеют разные угловые коэффициенты.

Слайд 5
Описание слайда:
Пусть получены наблюдения , такие, что гипотетическая линейная связь между переменными и имеет вид (пропорциональная связь между переменными), и ей соответствует модель наблюдений: Пусть получены наблюдения , такие, что гипотетическая линейная связь между переменными и имеет вид (пропорциональная связь между переменными), и ей соответствует модель наблюдений: Применение метода наименьших квадратов в этой ситуации сводится к минимизации суммы квадратов по всем возможным значениям . Последняя сумма квадратов является функцией единственной переменной  (при известных значениях ), и точка минимума этой функции легко находится. Для этого мы приравниваем нулю производную по : (нормальное уравнение)

Слайд 6
Описание слайда:
Оценка единственного параметра пропорциональной модели будет: И, следовательно, а точка не лежит на полученной прямой . Более того, в такой ситуации где

Слайд 7
Описание слайда:
выражение не имеет смысла. И можно воспользоваться формулой . Однако, такой подход к определению коэффициента детерминации не решает проблемы, поскольку, в принципе, при оценивании модели без постоянной составляющей возможны ситуации, при которых возникают отрицательные значения . Преодолеть возникающие затруднения можно, если определить в модели наблюдений без постоянной составляющей формулой:

Слайд 8
Описание слайда:
сумма квадратов, не центрированных значений переменной y (отклонений значений переменной y от «нулевого уровня»). При таком определении, неотрицательность коэффициента гарантируется соотношением: сумма квадратов, не центрированных значений переменной y (отклонений значений переменной y от «нулевого уровня»). При таком определении, неотрицательность коэффициента гарантируется соотношением: которое отражает геометрическую сущность метода наименьших квадратов (аналог знаменитой теоремы Пифагора для многомерного пространства) и выполняется как для модели без постоянной составляющей, так и для модели с наличием постоянной составляющей в правой части модели наблюдений. Деля обе части последнего равенства на приходим к соотношению:

Слайд 9
Описание слайда:
Доказать заявленное равенство не сложно. Действительно, Но, что и приводит к искомому результату.

Слайд 10
Описание слайда:
На практике часто встречаются ситуации, при которых существует заметный тренд (убывание или возрастание) в динамике изменений различных показателей. Однако, объективной связи между этими показателями не существует. В этом случае принято говорить о фиктивной (ложной, паразитной) линейной связи между показателями. На практике часто встречаются ситуации, при которых существует заметный тренд (убывание или возрастание) в динамике изменений различных показателей. Однако, объективной связи между этими показателями не существует. В этом случае принято говорить о фиктивной (ложной, паразитной) линейной связи между показателями. Для объяснения этого явления необходимо обратиться к уже полученному ранее равенству Из него вытекает, что близкие к единице значения коэффициента детерминации соответствуют близким по абсолютной величине к единице значениям коэффициента корреляции между переменными x и y. Но коэффициент корреляции Равен где

Слайд 11
Описание слайда:
и , значение будет тем ближе к 1, чем большим будет значение Последнее же обеспечивается совпадением знаков разностей и и , значение будет тем ближе к 1, чем большим будет значение Последнее же обеспечивается совпадением знаков разностей и для максимально возможной доли наблюдений переменных x и y, что как раз и имеет место, когда в процессе наблюдения обе переменные возрастают или обе переменные убывают по величине. При этом превышение одной из переменных своего среднего значения сопровождается, как правило, и превышением второй переменной от своего среднего значения. Если же одна из переменных принимает значение, меньшее среднего значения этой переменной, то и вторая переменная, как правило, принимает значение, меньшее своего среднего.

Слайд 12
Описание слайда:
значение будет тем ближе к -1, чем меньшим будет значение Последнее же обеспечивается несовпадением знаков разностей и для максимально возможной доли наблюдений переменных x и y, что имеет место, когда в процессе наблюдения одна из переменных возрастает, а вторая убывает. В этом случае, если одна из переменных принимает значение, меньшее среднего значения этой переменной, то вторая переменная, как правило, принимает значение, большее своего среднего. значение будет тем ближе к -1, чем меньшим будет значение Последнее же обеспечивается несовпадением знаков разностей и для максимально возможной доли наблюдений переменных x и y, что имеет место, когда в процессе наблюдения одна из переменных возрастает, а вторая убывает. В этом случае, если одна из переменных принимает значение, меньшее среднего значения этой переменной, то вторая переменная, как правило, принимает значение, большее своего среднего. Из этого следует, что близость к единице наблюдаемого значения коэффициента детерминации не обязательно означает наличие причинной связи между двумя рассматриваемыми переменными, а может являться лишь следствием тренда значений обеих переменных. Последнее обстоятельство часто наблюдается при анализе различных экономических показателей, вычисленных без поправки на инфляцию (недефлированные данные).

Слайд 13
Описание слайда:
Свойства МНК-оценок параметров регрессии. Показатели качества регрессии

Слайд 14
Описание слайда:
Способ оценивания дает состоятельные оценки, если при бесконечно большом объеме выборки значение статистической оценки стремится к искомому значению параметра (характеристики) генеральной совокупности. Способ оценивания дает состоятельные оценки, если при бесконечно большом объеме выборки значение статистической оценки стремится к искомому значению параметра (характеристики) генеральной совокупности. Способ оценивания дает несмещенные оценки, если математическое ожидание оценки при данном способе оценивания тождественно искомому параметру генеральной совокупности (при любом объеме выборки). Оценка называется эффективной, если ее дисперсия минимальна (при заданном объеме выборки n). Оценки по методу наименьших квадратов являются наилучшими, то есть несмещенными, состоятельными и эффективными!!!

Слайд 15
Описание слайда:
Докажем, что является несмещенной оценкой . Если выполнены предпосылки нормальной линейной модели регрессии, то х – неслучайная величина, а является известной константой, а математическое ожидание E(Cov(x,))=0. Тогда Докажем, что является несмещенной оценкой . Если выполнены предпосылки нормальной линейной модели регрессии, то х – неслучайная величина, а является известной константой, а математическое ожидание E(Cov(x,))=0. Тогда Что и требовалось доказать. Аналогично доказывается несмещенность . Эффективность МНК–оценок параметров доказывается с помощью теоремы Гаусса–Маркова, которая гласит, что МНК дает оценки, имеющие наименьшую дисперсию в классе всех линейных несмещенных оценок, если выполняются предпосылки нормальной линейной модели. Состоятельность МНК-оценок параметров является следствием закона больших чисел теории вероятностей.

Слайд 16
Описание слайда:
Дисперсии МНК–оценок параметров регрессии будут Дисперсии МНК–оценок параметров регрессии будут где – дисперсия случайной составляющей, – дисперсия фактора х. А так как неизвестна, то пользуются оценкой . Оценка дисперсии случайной составляющей применяется в эконометрических задачах для анализа качества полученной модели регрессии. В случае парной линейной регрессии несмещенная оценка дисперсии случайной составляющей будет: где ei – остаток, равный разности между фактическим и рассчитанным по уравнению регрессии значениям y.

Слайд 17
Описание слайда:
связывают с адекватностью модели по наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков – ei. связывают с адекватностью модели по наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков – ei. Если значения остатков для всех наблюдений ei=0, то фактическое значение значимой (результирующей) переменной совпадает с расчетным: , но на практике это, зачастую, не верно. При анализе качества модели используется теорема о разложении дисперсии, согласно которой общая дисперсия результативного признака может быть разложена на две составляющие – объясненную и необъясненную уравнением регрессии.

Слайд 18
Описание слайда:
где – объясненная уравнением регрессии дисперсия результирующего признака, а – необъясненная уравнением регрессии дисперсия результирующего признака. На основе этой теоремы рассчитываются показатели качества модели регрессии. Общая дисперсия при этом будет:

Слайд 19
Описание слайда:
Теоретический коэффициент детерминации (индекс для нелинейных форм связей) Теоретический коэффициент детерминации (индекс для нелинейных форм связей) . Этот коэффициент характеризует долю вариации (дисперсии) результирующего признака, объясняемую регрессией в общей дисперсии и, соответственно, 1– характеризует долю вариации необъясненную уравнением регрессии, вызванную влиянием прочих неучтенных в модели факторов. В случае парной регрессии: . Коэффициент детерминации изменяется на промежутке [0; 1], близость его к 0 означает отсутствие линейной связи, а близость к 1 наличие тесной линейной зависимости.

Слайд 20
Описание слайда:
Коэффициент (индекс) множественной корреляции рассчитывается как корень квадратный из коэффициента Коэффициент (индекс) множественной корреляции рассчитывается как корень квадратный из коэффициента детерминации . Он тоже изменяется на промежутке [0; 1]. Для случая парной регрессии . Средняя квадратическая ошибка уравнения регрессии , где h – число параметров модели. Величину Se можно сравнить с дисперсией результирующего признака . Если Se< , то использование данной модели регрессии является целесообразным.

Слайд 21
Описание слайда:
Средняя ошибка аппроксимации Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации менее 7% свидетельствует о хорошем качестве модели.

Слайд 22
Описание слайда:
ПРОВЕРКА ГИПОТЕЗ О ЗНАЧИМОСТИ ПАРАМЕТРОВ РЕГРЕССИИ, КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ И УРАВНЕНИЯ РЕГРЕССИИ В ЦЕЛОМ

Слайд 23
Описание слайда:
С помощью метода наименьших квадратов можно получить лишь оценки параметров модели, чтобы проверить, значимы ли они (значимо ли отличаются от нуля) в «истинном» уравнении (в генеральной совокупности), значим ли коэффициент корреляции, требуется обратиться к проверке гипотез. С помощью метода наименьших квадратов можно получить лишь оценки параметров модели, чтобы проверить, значимы ли они (значимо ли отличаются от нуля) в «истинном» уравнении (в генеральной совокупности), значим ли коэффициент корреляции, требуется обратиться к проверке гипотез. В качестве основной гипотезы (Н0) выдвигают гипотезу о незначительном отличии от нуля «истинного» параметра или коэффициента корреляции. Альтернативной гипотезой (Н1) является обратная – о неравенстве нулю «истинного» параметра или коэффициента.

Слайд 24
Описание слайда:
Для проверки гипотез используют t–статистику распределения Стьюдента, критическое значение которой определяется по таблице (или с помощью функции СТЬЮДРАСПОБР пакета Excel) в зависимости от уровня значимости  и числа степеней свободы равного (n–h), где n – число наблюдений, а h – число параметров модели. Для проверки гипотез используют t–статистику распределения Стьюдента, критическое значение которой определяется по таблице (или с помощью функции СТЬЮДРАСПОБР пакета Excel) в зависимости от уровня значимости  и числа степеней свободы равного (n–h), где n – число наблюдений, а h – число параметров модели. Если фактическое значение t–статистики (по модулю) меньше критического, то нет оснований отвергать основную гипотезу, то есть «истинный» параметр регрессии (либо коэффициент корреляции) незначительно отличается от нуля при заданном уровне значимости.

Слайд 25
Описание слайда:
Для проверки гипотезы: =0 статистика критерия будет Для проверки гипотезы: =0 статистика критерия будет где – оценка параметра , полученная по наблюдаемым данным, а – стандартная ошибка оценки коэффициента регрессии . Для линейной парной регрессии:

Слайд 26
Описание слайда:
Для проверки гипотезы: =0 статистика критерия будет Для проверки гипотезы: =0 статистика критерия будет В случае парной линейной регрессии:

Слайд 27
Описание слайда:
Для проверки гипотез о незначительном отклонении от нуля «истинного» коэффициента линейной парной корреляции используют статистику при этом:

Слайд 28
Описание слайда:
Существует взаимосвязь Рассмотренная формула статистики критерия проверки гипотез применима, если: Оценки делаются по большому числу наблюдений n. Величина не близка к единице.

Слайд 29
Описание слайда:
Если же величина выборочного коэффициента корреляции близка к 1, то распределение его оценок отличается от распределения Стьюдента. В данном случае используют статистику Фишера. Вводится вспомогательная величина Если же величина выборочного коэффициента корреляции близка к 1, то распределение его оценок отличается от распределения Стьюдента. В данном случае используют статистику Фишера. Вводится вспомогательная величина при этом можно пользоваться готовыми таблицами преобразований. Эта величина изменяется на промежутке (–; +), что соответствует нормальному распределению. Для проверки гипотезы о незначительном отклонении от нуля «истинного» значения коэффициента парной линейной корреляции используется статистика где Критическое значение находят по таблице стандартного нормального распределения с доверительной вероятностью (1–). Основную гипотезу отвергают, если

Слайд 30
Описание слайда:
Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно ли уравнение для практического применения. Основная гипотеза утверждает, что уравнение регрессии незначительно в целом, что формально сводится к равенству нулю параметров модели или коэффициента детерминации. Для ее проверки используют F–статистику: Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно ли уравнение для практического применения. Основная гипотеза утверждает, что уравнение регрессии незначительно в целом, что формально сводится к равенству нулю параметров модели или коэффициента детерминации. Для ее проверки используют F–статистику: Данная статистика имеет распределение Фишера–Снедоккора, критическое значение которой можно найти в таблицах этого распределения для =0,05 и двух степеней свободы k1=h –1 и k1=n –h. В случае парной линейной регрессии существует взаимосвязь :

Слайд 31
Описание слайда:
ПРОГНОЗ ОЖИДАЕМОГО ЗНАЧЕНИЯ РЕЗУЛЬТИРУЮЩЕГО ПРИЗНАКА.

Слайд 32
Описание слайда:
Предположим, необходимо определить для заданного значения фактора xp с доверительной вероятностью (1–) прогнозируемое значение результирующего признака. Тогда, прогнозируемое значение результата должно принадлежать интервалу (yp–tp; yp+tp), где yp – точечный прогноз, t – коэффициент доверия (определяется по таблицам распределения Стьюдента в зависимости от уровня значимости  и числа степеней свободы (n–2)), а p – средняя ошибка прогноза. Предположим, необходимо определить для заданного значения фактора xp с доверительной вероятностью (1–) прогнозируемое значение результирующего признака. Тогда, прогнозируемое значение результата должно принадлежать интервалу (yp–tp; yp+tp), где yp – точечный прогноз, t – коэффициент доверия (определяется по таблицам распределения Стьюдента в зависимости от уровня значимости  и числа степеней свободы (n–2)), а p – средняя ошибка прогноза. Точечный прогноз рассчитывается по линейному уравнению регрессии: yp=+xp, а средняя ошибка прогноза будет:

Слайд 33
Описание слайда:
Вокруг линии регрессии образуется доверительный интервал («коридор», в который попадет прогнозируемое значение результирующего признака): Вокруг линии регрессии образуется доверительный интервал («коридор», в который попадет прогнозируемое значение результирующего признака):

Слайд 34
Описание слайда:
НЕЛИНЕЙНАЯ РЕГРЕССИЯ

Слайд 35
Описание слайда:
Большинство экономических ситуаций характеризуются нелинейной зависимостью между результирующим и факторными признаками. Большинство экономических ситуаций характеризуются нелинейной зависимостью между результирующим и факторными признаками.

Слайд 36
Описание слайда:
Полиномы различных степеней – yi=a0+ a1xi+…+ amxim+i. Равностороння гипербола –

Слайд 37
Описание слайда:
Степенная функция – ; Показательная функция – ; Экспоненциальная функция – .

Слайд 38
Описание слайда:
Модель описывается уравнением: Модель описывается уравнением: y – спрашиваемое количество товара, x – цена, i– случайная составляющая. Преобразуем данную модель к линейному виду. Так как данная модель нелинейна относительно оцениваемых параметров, то необходимо произвести преобразование переменных. Логарифмическое преобразование приведет данное уравнение к линейному виду: Введя новые переменные и введя новое обозначение для параметра а и ошибки, получим линейную регрессию.


Скачать презентацию на тему Эконометрика. Обратная и пропорциональная модель парной линейной регрессии. Фиктивная линейная зависимость можно ниже:

Похожие презентации