Теоремата на Гаус-Марков е набор от предположения, които трябва да изпълни оценителят на OLS (обикновени най-малки квадрати), за да бъде считан за ELIO (Оптимален линеен безпристрастен оценител). ИТеоремата на Гаус-Марков е формулирана от Карл Фридерих Гаус и Андрей Марков.
Карл Фридерих Гаус и Андрей Марков установиха някои предположения, така че оценителят на OLS да стане ELIO.
Ако тези 5 предположения са изпълнени, можем да потвърдим, че оценителят е този с минималната дисперсия (най-точна) от всички линейни и непредубедени оценки. В случай, че някое от предположенията на първите три се провали (линейност, нулева средна строга екзогенност или липса на перфектна мултиколинеарност), оценката на OLS вече не е безпристрастна. Ако само 4 или 5 се провалят (хомосцедастичност и няма автокорелация), оценката все още е линейна и безпристрастна, но вече не е най-точната. Обобщавайки, теоремата на Гаус-Марков гласи, че:
- При предположения 1, 2 и 3, оценката на OLS е линейна и безпристрастна. Сега, докато не бъдат изпълнени първите три предположения, може да се гарантира, че оценката е безпристрастна. За да бъде оценителят последователен, трябва да имаме голяма извадка, колкото повече, толкова по-добре.
- При предположения 1, 2, 3, 4 и 5, оценката на OLS е линейна, безпристрастна и оптимална (ELIO).
Предположения на теоремата на Гаус-Марков
По-конкретно има 5 предположения:
1. Линеен модел в параметрите
Това е доста гъвкаво предположение. Тя позволява да се използват функции на променливите, които представляват интерес.
2. Нула средна и строга екзогенност
Това предполага, че средната стойност на грешката, обусловена от обясненията, е равна на безусловната очаквана стойност и е равна на нула. Освен това, стриктната екзогенност изисква грешките в модела да не са свързани с каквито и да било наблюдения.
Нула означава:
Строга екзогенност:
Нулева средна стойност и строга екзогенност се провалят, ако:
- Моделът е слабо определен (пропуск на съответните променливи например).
- Във променливите има грешки в измерването (данните не са прегледани).
- Във времеви редове строгата екзогенност се проваля в моделите със забавена ендогенност (въпреки че може да съществува съвременна екзогенност) и в случаите, когато има ефект на обратна връзка.
В данните за напречното сечение е много по-лесно да се постигне предположението за екзогенност, отколкото в случая на времеви редове.
3. Няма точна мултиколинеарност
В извадката нито една от обяснителните променливи не е постоянна. Няма точни линейни връзки между обяснителните променливи. Това не изключва някаква (не перфектна) корелация между променливите. Според Гаус и Марков, когато даден модел има точна мултиколинеарност, това обикновено се дължи на грешка на анализатор.
4. Хомосцедастичност
Дисперсията на грешката и следователно на Y е независима от обяснителните стойности и в допълнение от дисперсията на постоянната грешка. Математически се изразява като:
Ето поредица от данни с хомосцедастичен вид.
5. Без автокорелация
Условията за грешки на две различни наблюдения, зависими от X, не са свързани. Ако пробата е произволна, няма да има автокорелация.
Където трябва да имам различна стойност от h. Ако извадката е произволна, данните и грешките в наблюдението "i" и "h" ще бъдат независими за всяка двойка наблюдения "i" и "h".