Учебные пособия |
Курс социально-экономической статистики Раздел: Экономика
|
Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она связана с линейной зависимостью между аргументами х1, х2, ..., хk. В результате мультиколлинеарности матрица парных коэффициентов корреляции и матрица (XTX) становятся слабообусловленными, т.е. их определители близки к нулю.
Это приводит к
неустойчивости оценок коэффициентов регрессии (53.12), завышению дисперсии s, оценок этих
коэффициентов (53.14), так как в их выражения входит обратная матрица (XTX)-1,
получение которой связано с делением на определитель матрицы (ХTХ).
Отсюда следуют заниженные значения t(bj). Кроме того, мультиколлинеарность приводит
к завышению значения множественного коэффициента корреляции.
На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8, т.е. | rjl | > 0,8, то считают, что имеет место мультиколлинеарность, и в уравнение регрессии следует включать один из показателей — хj или xl.
Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа или строят уравнение регрессии на главных компонентах.
Пример. Построение регрессионного уравнения
Согласно данным двадцати (п = 20) сельскохозяйственных районов, требуется построить регрессионную модель урожайности на основе следующих показателей:
у — урожайность зерновых культур (ц/га);
x1 — число колесных тракторов (приведенной мощности) на 100 га;
х2 — число зерноуборочных комбайнов на 100 га;
х3 — число орудий поверхностной обработки почвы на 100 га;
x4 — количество удобрений, расходуемых на гектар;
х5 — количество химических средств оздоровления растений, расходуемых на гектар.
Исходные данные для анализа приведены в табл. 53.1.
Таблица 53.1
Исходные данные для анализа
Решение. С целью предварительного анализа взаимосвязи показателей построена матрица R — таблица парных коэффициентов корреляции.
Анализ матрицы парных коэффициентов корреляции показывает, что результативный признак наиболее тесно связан с показателем х4 — количеством удобрений, расходуемых на гектар (ryx4 = 0,58).
В то же время связь между аргументами достаточно тесная. Так, существует практически функциональная связь между числом колесных тракторов (x1) и числом орудий поверхностной обработки почвы x3(rx1x3) = 0,98.
О наличии мультиколлинеарности свидетельствуют также коэффициенты корреляции rx1x2 = 0,85 и rx3x2 = 0,88.
Чтобы продемонстрировать отрицательное влияние мультиколлинеарности, рассмотрим рассчитанное на ЭВМ регрессионное уравнение урожайности, включив в него все исходные показатели:
= 3,515 – 0,006x1 + 15,542x2 + 110x3 + 4,475х4 - 2,932x5.
(53.22)
(-0,01) (0,72) (0,13) (2,90) (-0,95)
В скобках указаны tнабл (βj) = tj — расчетные значения t-критерия для проверки гипотезы о значимости коэффициента регрессии Н0: βj = 0, j = 1, 2, 3, 4, 5. Критическое значение tкр = 1,76 найдено по таблице t-распределения при уровне значимости α = 0,1 и числе степеней свободы v = 14. Из уравнения следует, что статистически значимым является коэффициент регрессии только при х4, так как |t4| = 2,90 > tкр = 1,76. Не поддаются экономической интерпретации отрицательные значения коэффициентов регрессии при х1 и x5, из чего следует, что повышение насыщенности сельского хозяйства колесными тракторами (х1) и средствами оздоровления растений (x5) отрицательно сказывается на урожайности. Таким образом, полученное уравнение регрессии неприемлемо.
После реализации алгоритма пошагового регрессионного анализа с исключением переменных и учетом того, что в уравнение должна войти только одна из трех тесно связанных переменных (x1, х2 или x3), получаем окончательное уравнение регрессии
= 7,342 + 0,345x1 + 3,294x4.
(53.23)
(11,12) (2,09) (3,02)
Уравнение значимо при α = 0,05, так как Fнабл = 266 > Fкр = 3,20, найденного по таблице F-распределения при α = 0,05, v1 = 3 и v2 = 17. Значимы и коэффициенты регрессии β1 и β4, так как |tj| > tкр = 2,11 (при α = 0,05, v = 17). Коэффициент регрессии β1 следует признать значимым (β1 ≠ 0) из экономических соображений; при этом t1 = 2,09 лишь незначительно меньше tкр = 2,11. В случае если α = 0,1, tкр = 1,74 и коэффициент регрессии β1 статистически значим.
Из уравнения регрессии следует, что увеличение на единицу числа тракторов на 100 га пашни приводит к росту урожайности зерновых в среднем на 0,345 ц/га (b1 = 0,345).
Коэффициенты эластичности Э1 = 0,068 и Э4
= 0,161 (Эj = ) показывают, что при увеличении показателей x1 и х4
на 1% урожайность зерновых повышается соответственно на 0,068% и 0,161%.
Множественный коэффициент детерминации r = 0,469 свидетельствует о том,
что только 46,9% вариации урожайности объясняется вошедними в модель
показателями (x1 и x4),
т.е. насыщенностью растениеводства тракторами и удобрениями. Остальная
часть вариации обусловлена действием неучтенных факторов (х2,
x3, х5,
погодными условиями и др.). Средняя относительная ошибка аппроксимации
= 10,5% свидетельствует об адекватности
модели, так же как и величина остаточной дисперсии s2 = 1,97.
К содержанию книги: Курс социально-экономической статистики
Смотрите также:
СТАТИСТИКА ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая ...
СТАТИСТИКА
ЭКОНОМИЧЕСКАЯ. Отрасль статистики, изучающая материальное |
ПРОГНОЗ ЭКОНОМИЧЕСКОЙ АКТИВНОСТИ статистика ...
ПРОГНОЗ ЭКОНОМИЧЕСКОЙ
АКТИВНОСТИ ... Вводный курс по |
Л.П. Кроливецкой. -
М.: Финансы и статистика, 1996. Березина М.П. |
ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ
ОСНОВНЫЕ ВИДЫ ЭКОНОМИЧЕСКОЙ
ИНФОРМАЦИИ ... Статистика дает |
Моделирование рисковых ситуаций в экономике и бизнесе
Для студентов,
обучающихся по специальностям «Статистика», « |
Практическое значение экономической теории. Главные ...
межотраслевых (экономическая
география, демография, статистика и др.). |
Азимов Л.Б.,
Журавская Е.В., Макарова О.Ю. Преподавание экономики в |
Деятельность предприятия. Экономика предприятия
М.: Финансы и статистика,
1996. 11. Настольная книга финансиста / Под ред. |
ВНЕШНЕЭКОНОМИЧЕСКИЕ СВЯЗИ Внешнеэкономическая деятельность предприятия