Съответната променлива е пропусната

Съдържание

Пропускането на съответна променлива е невключването на важна обяснителна променлива в регресия. Предвид предположенията на Гаус-Марков, този пропуск би довел до пристрастие и непоследователност в нашите оценки.

С други думи, пропускането на съответната променлива възниква, когато я включим в термина за грешка u, защото не го вземаме предвид. Това ще доведе до корелация между зависимата променлива и термина за грешка u.

Математически предполагаме, че:

Cov (x, u) = 0

Ако включим съответната променлива в термина за грешка или, тогава:

Cov (x, u) ≠ 0

Предвид предположенията на Гаус-Марков, това съотношение:

(ρ (x, u) ≠ 0)

Това не би изпълнило това:

E (u | x) = E (u) = 0

Тоест, очакването на грешките, обусловени от обяснителните, е равно на очакването на грешката и че също е нула. Това са предположенията за безпристрастност (строга екзогенност + нулева стойност)

В случаи на пропуск на съответната променлива, оценката на OLS е предубедена и става несъвместима. Така че нарушава две от свойствата на оценителя и причинява грешка в нашата оценка.

Теоретичен пример

Предполагаме, че искаме да проучим броя на сезонните скиори (t), като вземем предвид няколко фактора: цената на ски картите (ски карти) и броя на отворените писти (писти) и качеството на снега (снега).

Модел 0

Предполагаме, че обяснителните променливи (ски пропуски, писти и сняг) са подходящи променливи за Модел 0, тъй като принадлежат към модела на населението. С други думи, обяснителните променливи на нашия модел 0 имат частичен ефект върху зависимите променливи скиори в модела на населението. Тогава както в популационния модел, така и в примерните модели (Модел 0) ще имат коефициенти, различни от нула.

Интерпретация

Повишаването на качеството на снега (сняг) и на броя на отворените писти (писти) причинява увеличаване на оценките на β2 и β3. Следователно това се отразява в броя на скиорите (скиорите).

Процентното увеличение на цените на ски картите води до намаляване на β1/ 100 в броя на скиорите (скиори)

Процес

Ние третираме променливата за сняг като пропусната променлива от модела. Тогава:

Модел 1

Разграничаваме термина за грешка u от Модел 0 и термина за грешка v от Модел 1, тъй като единият не включва съответната променлива сняг, а другият го прави.

В Модел 1 пропуснахме съответна променлива от модела и я въведохме в термина за грешка u. Това означава, че:

  • Cov (сняг, v) ≠ 0 → ρ (сняг, v) ≠ 0
  • E (v | сняг) ≠ 0

Ако пропуснем съответната променлива сняг в нашия Модел 1, ще накараме оценката на OLS да представи пристрастия и несъответствие. Така че нашата оценка за броя на сезонните скиори ще бъде погрешна. Ски курортът може да има сериозни финансови затруднения, ако вземете предвид оценката на Модел 1.