Денисова Ю.Э.
Научный руководитель:
Щетинина Е.К.
Донецкий национальный университет экономики и торговли им.
М. Туган-Барановского
Анализ и способы снижения влияния мультиколлинеарности на значимость
модели
Выбор факторов- основа для построения
многофакторной корреляционно- регрессионной модели.
На этапе формирования перечня факторов и их
логического анализа собираются все возможные факторы, обычно более 20-30
факторов. Но это не удобно для анализа и влечет за собой неустойчивость модели.
Неустойчивость модели находит выражение в том, что в ней изменение некоторых
факторов ведет к увеличению Y вместо снижения Y.
Мало факторов- тоже плохо. Это может привести к
ошибкам при принятии решений в ходе анализа модели. При этом проводят анализ
факторов на мультиколлинеарность. Мультиколлинеарность- попарная корреляционная
зависимость между факторами.
Мультиколлинеарная зависимость присутствует,
если коэффициент парной корреляции =0,70 + 0,80.
Негативное воздействие мультиколлинеарности
состоит в следующем :
1.
Усложняется
процедура выбора главных факторов;
2.
Искажается
смысл коэффициента множественной корреляции (он предполагает независимость
факторов);
3.
Усложняются
вычисления при построении самой модели;
4.
Снижается
точность оценки параметров регрессии, искажается оценка дисперсии.
Следствием
снижения точности является ненадежность коэффициентов регрессии и отчасти
неприемлемость их использования для интерпретации как меры воздействия
соответствующей объясняющей переменной на зависимую переменную.
Оценки коэффициента становятся очень
чувствительными к выборочным наблюдениям. Небольшое увеличение объема выборки
может привести к очень сильным сдвигам в значениях оценок. Кроме того,
стандартные ошибки оценок входят в формулы критерия значимости, поэтому применение
самих критериев становится также ненадежным.
Для измерения мультиколлинеарности можно
использовать коэффициент множественной детерминации Д= ,
где
R- коэффициент множественной корреляции.
При
отсутствии мультиколлинеарности факторов
Д= (1)
где
dn- коэффициент парной детерминации, вычисляемой по формуле =.
При наличии мультиколлинеарности соотношение (1) не
соблюдается. Поэтому в качестве меры мультиколлинеарности используется
следующая разность: М= Д-
Чем меньше эта разность , тем меньше
мультиколлинеарность. Для устранения мультиколлинеарности используется метод
исключения переменных. Этот метод заключается в том,что высоко коррелированны
факторы устраняются из регрессии и она заново оценивается. Отбор переменных,
подлежащих исключению, производится с помощью коэффициентов парной корреляции.
Опыт показывает, что если ǀǀ ≥ 0,70, то одну из переменных можно исключить, но
какую переменную исключать из анализа, решают исходя из управляемости факторов
на уровне предприятия.
Обычно в модели оставляют тот фактор, на который
можно разработать мероприятие, обеспечивающее улучшение значения этого фактора
в планируемом году. озможна ситуация, когда оба мультиколлинеарных фактора
управляемы на уровне предприятия. Решить вопрос об исключении того или иного
фактора можно только в соответствии с процедурой отбора главных факторов.
Отбор факторов не самостоятельный процесс, он
сопровождается построением модели. Принятие решения об исключении факторов
производится на основе анализа значений специальных статистических
характеристик и с учетом управляемости факторов на уровне предприятия.
Анализ матрицы коэффициентов парной корреляции
показывает, что зависимая переменная, т.е. общий объем товарооборота
предприятия торговли, имеет сильную связь с оборотом по продукции собственного
производства (= 0,995479), связь с объемом реализации покупных товаров
менее тесная (= 0,87335).Величина фактических затрат на рекламу имеет
умеренную связь с переменной- критерием Y. Но факторы Y и очень тесно связаны между собой, что свидетельствует о
наличии мультиколлинеарности. Поэтому из всех переменных оставим в модели - величину фактических затрат на рекламу.