Мултиколинеарност - какво е това, определение и концепция

Съдържание:

Anonim

Мултиколинеарността е силната линейна зависимост на зависимостта между повече от две обяснителни променливи при множествена регресия, която нарушава предположението на Гаус-Марков, когато е точно.

С други думи, мултиколинеарността е високата корелация между повече от две обяснителни променливи.

Ние подчертаваме, че линейната връзка (корелация) между обяснителните променливи трябва да бъде силна. Много е често обяснителните променливи на регресията да бъдат корелирани. Така че, трябва да се отбележи, че тази връзка трябва да бъде силна, но никога перфектна, за да се разглежда като случай на мултиколинеарност. Линейната връзка би била идеална, ако коефициентът на корелация е 1.

Когато тази силна линейна (но не перфектна) връзка възниква само между две обяснителни променливи, ние казваме, че това е случай на колинеарност. Би било мултиколинеарност, когато силната линейна връзка възникне между повече от две независими променливи.

Предположението на Гаус-Марков за точната немултиколинеарност определя, че обяснителните променливи в извадката не могат да бъдат постоянни. Освен това не трябва да има точни линейни връзки между обяснителните променливи (няма точна мултиколинеарност). Гаус-Марков не ни позволява точна мултиколинеарност, но сближава мултиколинеарността.

Регресионен анализ

Приложения

Има много особени случаи, обикновено нереалистични, в които регресивните променливи са напълно несвързани помежду си. В тези случаи говорим за екзогенност на обяснителните променливи. Обществените науки обикновено са известни с включването на приблизителна мултиколинеарност в своите регресии.

Точна мултиколинеарност

Точна мултиколинеарност възниква, когато повече от две независими променливи са линейна комбинация от други независими променливи в регресията.

Проблеми

Когато Гаус Марков забранява точната мултиколинеарност, това е така, защото не можем да получим оценката на обикновените най-малки квадрати (OLS).

Математически изразяване на очакваната бета sub-i в матрична форма:

Така че, ако има точна мултиколинеарност, това кара матрицата (X'X) да има детерминанта 0 и следователно да не е обратима. Необратимостта означава невъзможност за изчисляване (X'X)-1 и следователно нито прогнозната Beta sub-i.

Приблизителна мултиколинеарност

Приблизителна мултиколинеарност възниква, когато повече от две независими променливи не са точно (приближение) линейна комбинация от други независими променливи в регресията.

Променливата k представлява произволна променлива (независима и идентично разпределена (i.i.d)). Честотата на вашите наблюдения може да бъде апроксимирана задоволително до стандартно нормално разпределение със средна стойност 0 и дисперсия 1. Тъй като това е случайна променлива, това означава, че във всяко наблюдение i стойността на k ще бъде различна и независима от всяка предишна стойност.

Проблеми

Математически израз в матрична форма:

Така че, ако има приблизителна мултиколинеарност, това води до това, че матрицата (X'X) е приблизително 0 и коефициентът на определяне много близък до 1.

Решение

Мултиколинеарността може да бъде намалена чрез елиминиране на регресорите на променливите с висока линейна връзка между тях.

Коефициент на линейна корелация