Модели с двоичен избор

Съдържание:

Anonim

Моделите с двоичен избор са модели, при които зависимата променлива приема само две стойности: 1, за да посочи "успех" или "0", за да посочи неуспех. Конкретните модели за оценка са: линейна вероятност, logit и probit.

В модела на проста или многократна регресия, който се преподава в уводния курс по иконометрия, зависимата променлива обикновено има икономическа интерпретация (като увеличение на БВП, инвестиции или потребление) от други обяснителни променливи.

Но какъв модел използваме, когато искаме да обясним събития, които имат само две възможности? Например: преминаване на предмета или не успешно преминаване, завършване на колеж или недовършване, работа или безработица и т.н. На това реагират моделите с двоичен избор.

Във всеки от тези случаи можете да направите Y. = 1 означава "успех"; Y. = 0 означават "неуспех". По тази причина те се наричат ​​бинарни модели за избор и уравнението, което използва, е следното:

По този начин ще получим вероятността за успех на определена променлива.

Засега няма сериозно усложнение. Оценката и интерпретацията на параметрите обаче изисква по-голямо внимание.

Регресионен модел

Модели за оценка на двоични параметри

Предвид гореспоменатите характеристики на независимата променлива, има три модела за оценка на параметрите:

  • Линеен вероятностен модел. Изчислява се чрез нормален OLS.
  • Модел на Logit. Изчислява се със стандартна логистична функция за разпределение.
  • Пробит модел. Изчислява се със стандартна нормална функция на разпределение.

Линеен вероятностен модел

Линейният вероятностен модел (MPL) е наречен така, защото вероятността
реакцията е линейна по отношение на параметрите на уравнението. За оценката използвайте обикновени най-малки квадрати (OLS)

Описаното уравнение е написано

Независимата променлива (и шапка) е прогнозираната вероятност за успех.

Б0 cap е прогнозираната вероятност за успех, когато всеки от x е равен на нула. Коефициентът B1 cap измерва вариацията на прогнозираната вероятност за успех, когато x1 увеличава една единица.

За да интерпретираме правилно линейния вероятностен модел, трябва да вземем предвид какво се счита за успех и кое не.

Пример за двоичен модел за избор

Икономистът Джефри Уолдридж изчисли иконометричен модел, при който двоичната променлива показва дали омъжена жена е участвала в работната сила (обяснена променлива) през 1975 г. В този случай Y. = 1 означава, че е участвал Y. = 0, което не е.

Моделът използва нивото на дохода на съпруга като обяснителни променливи (хинк), години образование (просвета), години опит на пазара на труда (опит), възраст (възраст), броят на децата на възраст под шест години (kidslt6) и броя на децата между 6 и 18 години (kidsge6).

Можем да проверим дали всички променливи с изключение на kidsge6 са статистически значими и всички значими променливи имат очаквания ефект.

Тълкуването на параметрите е следното:

  • Ако увеличите една година образование, ceteris paribus, вероятността да се присъедините към работната сила се увеличава с 3,8%.
  • Ако опитът се увеличи за една година, вероятността да бъдете част от работната сила се увеличава с 3,9%.
  • Ако имате дете под 6-годишна възраст, ceteris paribus, вероятността да бъдете част от работната сила се намалява с 26,2%.

И така, виждаме, че този модел ни казва ефекта от всяка ситуация върху вероятността жена да бъде официално наета.

Този модел може да се използва за оценка на публични политики и социални програми, тъй като промяната в „прогнозираната вероятност за успех“ може да бъде измерена количествено по отношение на единични или пределни промени в обяснителните променливи.

Недостатъци на линейния вероятностен модел

Този модел обаче има два основни недостатъка:

  • Може да даде вероятности по-малки от нула и по-големи от единица, което няма смисъл от гледна точка на тълкуване на тези стойности.
  • Частичните ефекти винаги са постоянни. В този модел няма разлика между преминаването от нула деца на едно дете, отколкото преминаването от две на три деца.
  • Тъй като обяснителната променлива приема стойности само нула или единица, може да се генерира хетероскедастичност. За решаване на това се използват стандартни грешки.

За да се решат първите два проблема, които са най-важните в линейния вероятностен модел, са проектирани моделите Logit и Probit.

Препратки:

Улдридж, Дж. (2010) Въведение в иконометрията. (4-то издание) Мексико: Cengage Learning.