Пропускането на съответна променлива е невключването на важна обяснителна променлива в регресия. Предвид предположенията на Гаус-Марков, този пропуск би довел до пристрастие и непоследователност в нашите оценки.
С други думи, пропускането на съответната променлива възниква, когато я включим в термина за грешка u, защото не го вземаме предвид. Това ще доведе до корелация между зависимата променлива и термина за грешка u.
Математически предполагаме, че:
Cov (x, u) = 0
Ако включим съответната променлива в термина за грешка или, тогава:
Cov (x, u) ≠ 0
Предвид предположенията на Гаус-Марков, това съотношение:
(ρ (x, u) ≠ 0)
Това не би изпълнило това:
E (u | x) = E (u) = 0
Тоест, очакването на грешките, обусловени от обяснителните, е равно на очакването на грешката и че също е нула. Това са предположенията за безпристрастност (строга екзогенност + нулева стойност)
В случаи на пропуск на съответната променлива, оценката на OLS е предубедена и става несъвместима. Така че нарушава две от свойствата на оценителя и причинява грешка в нашата оценка.
Теоретичен пример
Предполагаме, че искаме да проучим броя на сезонните скиори (t), като вземем предвид няколко фактора: цената на ски картите (ски карти) и броя на отворените писти (писти) и качеството на снега (снега).
Модел 0
Предполагаме, че обяснителните променливи (ски пропуски, писти и сняг) са подходящи променливи за Модел 0, тъй като принадлежат към модела на населението. С други думи, обяснителните променливи на нашия модел 0 имат частичен ефект върху зависимите променливи скиори в модела на населението. Тогава както в популационния модел, така и в примерните модели (Модел 0) ще имат коефициенти, различни от нула.
Интерпретация
Повишаването на качеството на снега (сняг) и на броя на отворените писти (писти) причинява увеличаване на оценките на β2 и β3. Следователно това се отразява в броя на скиорите (скиорите).
Процентното увеличение на цените на ски картите води до намаляване на β1/ 100 в броя на скиорите (скиори)
Процес
Ние третираме променливата за сняг като пропусната променлива от модела. Тогава:
Модел 1
Разграничаваме термина за грешка u от Модел 0 и термина за грешка v от Модел 1, тъй като единият не включва съответната променлива сняг, а другият го прави.
В Модел 1 пропуснахме съответна променлива от модела и я въведохме в термина за грешка u. Това означава, че:
- Cov (сняг, v) ≠ 0 → ρ (сняг, v) ≠ 0
- E (v | сняг) ≠ 0
Ако пропуснем съответната променлива сняг в нашия Модел 1, ще накараме оценката на OLS да представи пристрастия и несъответствие. Така че нашата оценка за броя на сезонните скиори ще бъде погрешна. Ски курортът може да има сериозни финансови затруднения, ако вземете предвид оценката на Модел 1.