Баесов информационен критерий

Съдържание:

Anonim

Баесовият информационен критерий или критерият на Шварц е метод, който се фокусира върху сумата от квадратите на остатъците, за да намери броя на изоставащите периоди стр които минимизират този модел.

С други думи, искаме да намерим минималния брой изоставащи периоди, които включваме в авторегресията, за да ни помогне с прогнозирането на зависимата променлива.

По този начин ще имаме контрол върху броя на изоставащите периоди стр че включваме в регресията. Когато надвишим това оптимално ниво, моделът на Шварц ще спре да намалява и следователно ще сме достигнали минимума. Тоест ще сме достигнали броя на изоставащите периоди стр които минимизират модела на Шварц.

Нарича се още информационен критерий на Байес (BIC).

Препоръчителни статии: авторегресия, сума от квадрати на остатъци (SCE).

Формула за критерий за байесов информационен критерий

Въпреки че на пръв поглед изглежда сложна формула, ще разгледаме частите, за да я разберем. На първо място, като цяло трябва да:

  • Логаритмите и в двата фактора на формулата представляват пределния ефект от включването на изоставащ период стр повече в саморегресия.
  • N е общият брой наблюдения.
  • Можем да разделим формулата на две части: лява и дясна част.

Частта вляво:

Представлява сумата от квадратите на остатъците (SCE) на авторегресията настр изоставащи периоди, разделени на общия брой наблюдения (N).

За да изчислим коефициентите, използваме обикновени най-малки квадрати (OLS). Така че, когато включваме нови изоставащи периоди, SCE (p) може само да се поддържа или намалява.

След това увеличаването на изоставащ период в авторегресията причинява:

  • SCE (p): намалява или остава постоянен.
  • Коефициент на определяне: увеличава се.
  • ОБЩ ЕФЕКТ: увеличаването в един забавен период води до намаляване на лявата част на формулата.

Сега дясната част:

(p + 1) представлява общият брой на коефициентите в авторегресията, т.е. регресорите с изоставащи периоди (стр) и прихващането (1).

След това увеличаването на изоставащ период в авторегресията причинява:

  • (p + 1): увеличава се, защото включваме забавен период.
  • ОБЩ ЕФЕКТ: увеличаването в един забавен период води до увеличаване на дясната част на формулата.

Практически пример

Предполагаме, че искаме да направим прогноза за цените наски карти за следващия сезон 2020 с 5-годишна извадка, но не знаем колко периоди на забавяне да използваме: AR (2) или AR (3)?

  • Изтегляме данните и изчисляваме естествените логаритми на цените на ски карти.

1. Изчисляваме коефициентите с помощта на OLS и получаваме:

Сума от квадрати на остатъци (SCE) за AR (2) = 0,011753112

Коефициент на определяне за AR (2) = 0,085

2. Добавяме още 1 изоставащ период, за да видим как се променя SCE:

Сума от квадрати на остатъци за AR (3) = 0,006805295

Коефициент на определяне за AR (3) = 0,47

Можем да видим, че когато добавим период на изоставане в авторегресията, коефициентът на определяне се увеличава и SCE намалява в този случай.

  • Изчисляваме байесов информационен критерий:

Колкото по-малък е моделът BIC, толкова по-предпочитан е моделът. Тогава AR (3) ще бъде предпочитаният модел по отношение на AR (2), като се има предвид, че коефициентът му на определяне е по-висок, SCE е по-нисък и моделът на Шварц или байесов информационен критерий също е по-нисък.