Линеен вероятностен модел

Съдържание:

Anonim

Линейният вероятностен модел е двоичен модел на избор. При това условното очакване на зависимата променлива е линейна функция, т.е. връзката на зависимата променлива с обяснителната променлива (и) е постоянна.

За да го видим по друг начин, линейният вероятностен модел е модел, при който имаме зависима променлива и независима променлива (и), умножена по постоянен коефициент (и).

Трябва да отбележим, че линейният вероятностен модел е двоичен модел на избор, т.е. където зависимата променлива може да приеме две стойности. Тези стойности са 1 или 0, за да покажат съответно успех или неуспех.

Линейният вероятностен модел се изразява, както следва:

E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x

В показаното уравнение условното очакване на Y, дадено X, се интерпретира като равно на β0 + β1x.

В този случай ние приемаме условните очаквания, тъй като ни интересува вероятността даден индивид да вземе решение, като се имат предвид техните характеристики, например (или друга независима променлива може да се вземе като референция).

Недостатъци на линейния вероятностен модел

Някои недостатъци на линейния вероятностен модел са следните:

  • Линейният вероятностен модел може да покаже хетероскедастичност. А именно, дисперсията на грешките не е еднаква при всички направени наблюдения. В този случай се използват стандартни грешки.
  • Не може да се приеме, че грешките обикновено се разпределят.
  • Зависимата променлива може да приема само две стойности.
  • Предполага се, че независимите и зависимите променливи имат линейна връзка, т.е. скоростта на промяна винаги е една и съща. Може обаче да е по-точно да се изгради модел, при който скоростта на промяна се увеличава, когато Y достига по-висока стойност, а обратното се случва, когато Y намалява.

Предвид тези недостатъци съществуват моделите logit и probit.

Пример за линеен вероятностен модел

Може да се изгради линеен модел на вероятност, например, където зависимата променлива е дали лицето в момента има официална работа, която е заемал една година или повече. Независимите променливи могат да бъдат нивото на обучение или образователно ниво, пол и възраст.

В показания пример зависимата променлива ще бъде 1 или 0, но тя трябва да бъде интерпретирана качествено, независимо от нейната числена стойност. По този начин 1 означава, че лицето има официална работа, която се запазва повече от 1 година, а 0 би била ситуацията, при която това не се случва.