Мультиколлинеарность. Построение регрессионного уравнения. Исходные данные для анализа.

  Вся электронная библиотека >>>

 Социально-экономическая статистика >>

 

Учебные пособия

Курс социально-экономической статистики


Раздел: Экономика

 

Мультиколлинеарность

 

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она связана с линейной зависимостью между аргументами х1, х2, ..., хk. В результате мультиколлинеарности матрица парных коэффициентов корреляции и матрица (XTX) становятся слабообусловленными, т.е. их определители близки к нулю.

Это приводит к неустойчивости оценок коэффициентов регрессии (53.12), завышению дисперсии s, оценок этих коэффициентов (53.14), так как в их выражения входит обратная матрица (XTX)-1, получение которой связано с делением на определитель матрицы TХ). Отсюда следуют заниженные значения t(bj). Кроме того, мультиколлинеарность приводит к завышению значения множественного коэффициента корреляции.

На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8, т.е. | rjl | > 0,8, то считают, что имеет место мультиколлинеарность, и в уравнение регрессии следует включать один из показателей — хj или xl.

Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа или строят уравнение регрессии на главных компонентах.

 

Пример. Построение регрессионного уравнения

 

Согласно данным двадцати (п = 20) сельскохозяйственных районов, требуется построить регрессионную модель урожайности на основе следующих показателей:

у — урожайность зерновых культур (ц/га);

x1 — число колесных тракторов (приведенной мощности) на 100 га;

х2 число зерноуборочных комбайнов на 100 га;

х3 число орудий поверхностной обработки почвы на 100 га;

x4 — количество удобрений, расходуемых на гектар;

 

 

 

 

х5 количество химических средств оздоровления растений, расходуемых на гектар.

Исходные данные для анализа приведены в табл. 53.1.

 

Таблица 53.1

Исходные данные для анализа

 

 

Решение. С целью предварительного анализа взаимосвязи показателей построена матрица R — таблица парных коэффициентов корреляции.

 

 

Анализ матрицы парных коэффициентов корреляции показывает, что результативный признак наиболее тесно связан с показателем х4 количеством удобрений, расходуемых на гектар (ryx4 = 0,58).

В то же время связь между аргументами достаточно тесная. Так, существует практически функциональная связь между числом колесных тракторов (x1) и числом орудий поверхностной обработки почвы x3(rx1x3) = 0,98.

О наличии мультиколлинеарности свидетельствуют также коэффициенты корреляции rx1x2 = 0,85 и rx3x2 = 0,88.

Чтобы продемонстрировать отрицательное влияние мультиколлинеарности, рассмотрим рассчитанное на ЭВМ регрессионное уравнение урожайности, включив в него все исходные показатели:

 

 = 3,515 – 0,006x1 + 15,542x2 + 110x3 + 4,475х4 - 2,932x5.                            (53.22)

                                               (-0,01)       (0,72)        (0,13)    (2,90)     (-0,95)

 

В скобках указаны tнаблj) = tj — расчетные значения t-критерия для проверки гипотезы о значимости коэффициента регрессии Н0: βj = 0, j = 1, 2, 3, 4, 5. Критическое значение tкр = 1,76 найдено по таблице t-распределения при уровне значимости α = 0,1 и числе степеней свободы v = 14. Из уравнения следует, что статистически значимым является коэффициент регрессии только при х4, так как |t4| = 2,90 > tкр = 1,76. Не поддаются экономической интерпретации отрицательные значения коэффициентов регрессии при х1 и x5, из чего следует, что повышение насыщенности сельского хозяйства колесными тракторами 1) и средствами оздоровления растений (x5) отрицательно сказывается на урожайности. Таким образом, полученное уравнение регрессии неприемлемо.

После реализации алгоритма пошагового регрессионного анализа с исключением переменных и учетом того, что в уравнение должна войти только одна из трех тесно связанных переменных (x1, х2 или x3), получаем окончательное уравнение регрессии

 

 = 7,342 + 0,345x1 + 3,294x4.                    (53.23)

                                                             (11,12)   (2,09)       (3,02)

 

Уравнение значимо при α = 0,05, так как Fнабл = 266 > Fкр = 3,20, найденного по таблице F-распределения при α = 0,05, v1 = 3 и v2 = 17. Значимы и коэффициенты регрессии β1 и β4, так как |tj| > tкр = 2,11 (при α = 0,05, v = 17). Коэффициент регрессии β1 следует признать значимым (β1 ≠ 0) из экономических соображений; при этом t1 = 2,09 лишь незначительно меньше tкр = 2,11. В случае если α = 0,1, tкр = 1,74 и коэффициент регрессии β1 статистически значим.

Из уравнения регрессии следует, что увеличение на единицу числа тракторов на 100 га пашни приводит к росту урожайности зерновых в среднем на 0,345 ц/га (b1 = 0,345).

Коэффициенты эластичности Э1 = 0,068 и Э4 = 0,161 (Эj = ) показывают, что при увеличении показателей x1 и х4 на 1% урожайность зерновых повышается соответственно на 0,068% и 0,161%.

Множественный коэффициент детерминации r = 0,469 свидетельствует о том, что только 46,9% вариации урожайности объясняется вошедними в модель показателями (x1 и x4), т.е. насыщенностью растениеводства тракторами и  удобрениями. Остальная часть вариации обусловлена действием неучтенных факторов 2, x3, х5, погодными условиями и др.). Средняя относительная ошибка аппроксимации  = 10,5% свидетельствует об адекватности модели, так же как и величина остаточной дисперсии s2 = 1,97.

 

К содержанию книги: Курс социально-экономической статистики

 

Смотрите также:

  

 СТАТИСТИКА ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая ...

СТАТИСТИКА ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая материальное
производство с целью выявления пропорций, тенденций и закономерностей развития ...
bibliotekar.ru/biznes-15-6/133.htm

 

  ПРОГНОЗ ЭКОНОМИЧЕСКОЙ АКТИВНОСТИ статистика ...

ПРОГНОЗ ЭКОНОМИЧЕСКОЙ АКТИВНОСТИ ... Вводный курс по
экономической теории ... Главные направления современной экономической
bibliotekar.ru/biznes-64/164.htm

 

  Деньги. Кредит. Банки

Л.П. Кроливецкой. - М.: Финансы и статистика, 1996. Березина М.П.
Безналичные расчеты в экономике России. - М.: Консалт-банкир, 1997.
bibliotekar.ru/biznes-36/index.htm

 

  ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ

ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ ... Статистика дает
общую картину состояния и развития национального хозяйства, освещает ...
bibliotekar.ru/mezhdunarodnye-otnosheniya.../184.htm

 

  Моделирование рисковых ситуаций в экономике и бизнесе

Для студентов, обучающихся по специальностям «Статистика», «
Математические методы и исследование операций в экономике», «
bibliotekar.ru/riskovye-situacii-2/index.htm

 

  Практическое значение экономической теории. Главные ...

межотраслевых (экономическая география, демография, статистика и др.).
Экономическая теория — одна из общественных наук наряду с историей, ...
bibliotekar.ru/biznes-38/9.htm

 

  Принципы экономической науки

Азимов Л.Б., Журавская Е.В., Макарова О.Ю. Преподавание экономики в
школе. ... М.: Финансы и статистика, 1994. ... Антология экономической
bibliotekar.ru/biznes-63/25.htm

 

  Деятельность предприятия. Экономика предприятия

М.: Финансы и статистика, 1996. 11. Настольная книга финансиста / Под ред.
В.Г. Панскова. – М: Международный центр финансово-экономического ...
www.bibliotekar.ru/economika-predpriyatiya/

 

ВНЕШНЕЭКОНОМИЧЕСКИЕ СВЯЗИ   Внешнеэкономическая деятельность предприятия