Регрессионный анализ. Регрессионный анализ — это статистический метод исследования зависимости случайной величины у от переменных

  Вся электронная библиотека >>>

 Социально-экономическая статистика >>

 

Учебные пособия

Курс социально-экономической статистики


Раздел: Экономика

 

53.2. Регрессионный анализ

 

Регрессионный анализ — это статистический метод исследования зависимости случайной величины у от переменных (аргументов) хj (j = 1, 2,..., k), рассматриваемых в регрессионном анализе как неслучайные величины независимо от истинного закона распределения xj.

Обычно предполагается, что случайная величина у имеет нормальный закон распределения с условным математическим ожиданием  = φ(x1, ..., хk), являющимся функцией от аргументов хj и с постоянной, не зависящей от аргументов дисперсией σ2.

Для проведения регрессионного анализа из (k + 1)-мерной генеральной совокупности (у, x1, х2, ..., хj, ..., хk) берется выборка объемом n, и каждое i-е наблюдение (объект) характеризуется значениями переменных i, xi1, хi2, ..., хij, ..., xik), где хij значение j-й переменной для i-го наблюдения (i = 1, 2,..., n), уi значение результативного признака для i-го наблюдения.

Наиболее часто используемая множественная линейная модель регрессионного анализа имеет вид

 

                     (53.8)

 

где βj — параметры регрессионной модели;

εj — случайные ошибки наблюдения, не зависимые друг от друга, имеют нулевую среднюю и дисперсию σ2.

Отметим, что модель (53.8) справедлива для всех i = 1,2, ..., n, линейна относительно неизвестных параметров β0, β1,…, βj, …, βk и аргументов.

Как следует из (53.8), коэффициент регрессии Bj показывает, на какую величину в среднем изменится результативный признак у, если переменную хj увеличить на единицу измерения, т.е. является нормативным коэффициентом.

В матричной форме регрессионная модель имеет вид

 

                    (53.9)

 

где Y — случайный вектор-столбец размерности п х 1 наблюдаемых значений результативного признака 1, у2,.... уn); Х— матрица размерности п х (k + 1) наблюдаемых значений аргументов, элемент матрицы х,, рассматривается как неслучайная величина (i = 1, 2, ..., n; j=0,1, ..., k; x0i, = 1); β — вектор-столбец размерности (k + 1) х 1 неизвестных, подлежащих оценке параметров модели (коэффициентов регрессии); ε — случайный вектор-столбец размерности п х 1 ошибок наблюдений (остатков). Компоненты вектора εi не зависимы друг от друга, имеют нормальный закон распределения с нулевым математическим ожиданием (Mεi = 0) и неизвестной постоянной σ2 (Dεi = σ2).

На практике рекомендуется, чтобы значение п превышало k не менее чем в три раза.

В модели (53.9)

 

 

 

 

 

 

В первом столбце матрицы Х указываются единицы при наличии свободного члена в модели (53.8). Здесь предполагается, что существует переменная x0, которая во всех наблюдениях принимает значения, равные единице.

Основная задача регрессионного анализа заключается в нахождении по выборке объемом п оценки неизвестных коэффициентов регрессии β0, β1, …, βk модели (53.8) или вектора β в (53.9).

Так как в регрессионном анализе хj рассматриваются как неслучайные величины, a Mεi = 0, то согласно (53.8) уравнение регрессии имеет вид

 

                  (53.10)

 

для всех i = 1, 2, ..., п, или в матричной форме:

 

                (53.11)

 

где — вектор-столбец с элементами  1..., i,..., n.

Для оценки вектора-столбца β наиболее часто используют метод наименьших квадратов, согласно которому в качестве оценки принимают вектор-столбец b, который минимизирует сумму квадратов отклонений наблюдаемых значений уi от модельных значений i, т.е. квадратичную форму:

 

 

где символом «Т» обозначена транспонированная матрица.

Наблюдаемые и модельные значения результативного признака у показаны на рис. 53.1.

 

Рис. 53.1. Наблюдаемые и модельные значения результативного признака у

 

Дифференцируя, с учетом (53.11) и (53.10), квадратичную форму Q по β0, β1, …, βk и приравнивая частные производные к нулю, получим систему нормальных уравнений

 

 

решая которую получим вектор-столбец оценок b, где b = (b0, b1, ..., bk)T. Согласно методу наименьших квадратов, вектор-столбец оценок коэффициентов регрессии получается по формуле

 

                     (53.12)

 

 

ХT — транспонированная матрица X;

TХ)-1 матрица, обратная матрице ХTХ.

Зная вектор-столбец b оценок коэффициентов регрессии, найдем оценку  уравнения регрессии

 

                      (53.13)

 

или в матричном виде:

 

 

Оценка ковариационной матрицы вектора коэффициентов регрессии b определяется выражением   

                       (53.14)

 

где

                       (53.15)

 

Учитывая, что на главной диагонали ковариационной матрицы находятся дисперсии коэффициентов регрессии, имеем  

 

             (53.16)

 

Значимость уравнения регрессии, т.е. гипотеза Н0: β = 0 (β0,= β1 = βk = 0), проверяется по F-критерию, наблюдаемое значение которого определяется по формуле

 

                       (53.17)

 

По таблице F-распределения для заданных α, v 1 = k + l,v2 = nk - l находят Fкр.

Гипотеза H0 отклоняется с вероятностью α, если Fнабл > Fкр. Из этого следует, что уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии отличен от нуля.

Для проверки значимости отдельных коэффициентов регрессии, т.е. гипотезы Н0: βj = 0, где j = 1, 2, ..., k, используют t-критерий и вычисляют tнабл(bj) = bj / bj. По таблице t-распределения для заданного α и v = п - k - 1 находят tкр.

Гипотеза H0 отвергается с вероятностью α, если tнабл > tкр. Из этого следует, что соответствующий коэффициент регрессии βj значим, т.е. βj 0. В противном случае коэффициент регрессии незначим и соответствующая переменная в модель не включается. Тогда реализуется алгоритм пошагового регрессионного анализа, состоящий в том, что исключается одна из незначительных переменных, которой соответствует минимальное по абсолютной величине значение tнабл. После этого вновь проводят регрессионный анализ с числом факторов, уменьшенным на единицу. Алгоритм заканчивается получением уравнения регрессии со значимыми коэффициентами.

Существуют и другие алгоритмы пошагового регрессионного анализа, например с последовательным включением факторов.

Наряду с точечными оценками bj генеральных коэффициентов регрессии βj регрессионный анализ позволяет получать и интервальные оценки последних с доверительной вероятностью γ.

Интервальная оценка с доверительной вероятностью γ для параметра βj имеет вид

 

             (53.19)

 

где tα находят по таблице t-распределения при вероятности α = 1 - γ и числе степеней свободы v = п - k - 1.

Интервальная оценка для уравнения регрессии  в точке, определяемой вектором-столбцом начальных условий X0 = (1, x, x,,..., x)T записывается в виде

 

            (53.20)

 

Интервал предсказания n+1 с доверительной вероятностью у определяется как

 

                (53.21)

 

где tα определяется по таблице t-распределения при α = 1 - γ и числе степеней свободы v = п - k - 1.

По мере удаления вектора начальных условий х0 от вектора средних  ширина доверительного интервала при заданном значении γ будет увеличиваться (рис. 53.2), где = (1, ).

 

Рис. 53.2. Точечная  и интервальная  оценки уравнения регрессии .

 

К содержанию книги: Курс социально-экономической статистики

 

Смотрите также:

  

 СТАТИСТИКА ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая ...

СТАТИСТИКА ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая материальное
производство с целью выявления пропорций, тенденций и закономерностей развития ...
bibliotekar.ru/biznes-15-6/133.htm

 

  ПРОГНОЗ ЭКОНОМИЧЕСКОЙ АКТИВНОСТИ статистика ...

ПРОГНОЗ ЭКОНОМИЧЕСКОЙ АКТИВНОСТИ ... Вводный курс по
экономической теории ... Главные направления современной экономической
bibliotekar.ru/biznes-64/164.htm

 

  Деньги. Кредит. Банки

Л.П. Кроливецкой. - М.: Финансы и статистика, 1996. Березина М.П.
Безналичные расчеты в экономике России. - М.: Консалт-банкир, 1997.
bibliotekar.ru/biznes-36/index.htm

 

  ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ

ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ ... Статистика дает
общую картину состояния и развития национального хозяйства, освещает ...
bibliotekar.ru/mezhdunarodnye-otnosheniya.../184.htm

 

  Моделирование рисковых ситуаций в экономике и бизнесе

Для студентов, обучающихся по специальностям «Статистика», «
Математические методы и исследование операций в экономике», «
bibliotekar.ru/riskovye-situacii-2/index.htm

 

  Практическое значение экономической теории. Главные ...

межотраслевых (экономическая география, демография, статистика и др.).
Экономическая теория — одна из общественных наук наряду с историей, ...
bibliotekar.ru/biznes-38/9.htm

 

  Принципы экономической науки

Азимов Л.Б., Журавская Е.В., Макарова О.Ю. Преподавание экономики в
школе. ... М.: Финансы и статистика, 1994. ... Антология экономической
bibliotekar.ru/biznes-63/25.htm

 

  Деятельность предприятия. Экономика предприятия

М.: Финансы и статистика, 1996. 11. Настольная книга финансиста / Под ред.
В.Г. Панскова. – М: Международный центр финансово-экономического ...
www.bibliotekar.ru/economika-predpriyatiya/

 

ВНЕШНЕЭКОНОМИЧЕСКИЕ СВЯЗИ   Внешнеэкономическая деятельность предприятия