Баесовият информационен критерий или критерият на Шварц е метод, който се фокусира върху сумата от квадратите на остатъците, за да намери броя на изоставащите периоди стр които минимизират този модел.
С други думи, искаме да намерим минималния брой изоставащи периоди, които включваме в авторегресията, за да ни помогне с прогнозирането на зависимата променлива.
По този начин ще имаме контрол върху броя на изоставащите периоди стр че включваме в регресията. Когато надвишим това оптимално ниво, моделът на Шварц ще спре да намалява и следователно ще сме достигнали минимума. Тоест ще сме достигнали броя на изоставащите периоди стр които минимизират модела на Шварц.
Нарича се още информационен критерий на Байес (BIC).
Препоръчителни статии: авторегресия, сума от квадрати на остатъци (SCE).
Формула за критерий за байесов информационен критерий
Въпреки че на пръв поглед изглежда сложна формула, ще разгледаме частите, за да я разберем. На първо място, като цяло трябва да:
- Логаритмите и в двата фактора на формулата представляват пределния ефект от включването на изоставащ период стр повече в саморегресия.
- N е общият брой наблюдения.
- Можем да разделим формулата на две части: лява и дясна част.
Частта вляво:
Представлява сумата от квадратите на остатъците (SCE) на авторегресията настр изоставащи периоди, разделени на общия брой наблюдения (N).
За да изчислим коефициентите, използваме обикновени най-малки квадрати (OLS). Така че, когато включваме нови изоставащи периоди, SCE (p) може само да се поддържа или намалява.
След това увеличаването на изоставащ период в авторегресията причинява:
- SCE (p): намалява или остава постоянен.
- Коефициент на определяне: увеличава се.
- ОБЩ ЕФЕКТ: увеличаването в един забавен период води до намаляване на лявата част на формулата.
Сега дясната част:
(p + 1) представлява общият брой на коефициентите в авторегресията, т.е. регресорите с изоставащи периоди (стр) и прихващането (1).
След това увеличаването на изоставащ период в авторегресията причинява:
- (p + 1): увеличава се, защото включваме забавен период.
- ОБЩ ЕФЕКТ: увеличаването в един забавен период води до увеличаване на дясната част на формулата.
Практически пример
Предполагаме, че искаме да направим прогноза за цените наски карти за следващия сезон 2020 с 5-годишна извадка, но не знаем колко периоди на забавяне да използваме: AR (2) или AR (3)?
- Изтегляме данните и изчисляваме естествените логаритми на цените на ски карти.
1. Изчисляваме коефициентите с помощта на OLS и получаваме:
Сума от квадрати на остатъци (SCE) за AR (2) = 0,011753112
Коефициент на определяне за AR (2) = 0,085
2. Добавяме още 1 изоставащ период, за да видим как се променя SCE:
Сума от квадрати на остатъци за AR (3) = 0,006805295
Коефициент на определяне за AR (3) = 0,47
Можем да видим, че когато добавим период на изоставане в авторегресията, коефициентът на определяне се увеличава и SCE намалява в този случай.
- Изчисляваме байесов информационен критерий:
Колкото по-малък е моделът BIC, толкова по-предпочитан е моделът. Тогава AR (3) ще бъде предпочитаният модел по отношение на AR (2), като се има предвид, че коефициентът му на определяне е по-висок, SCE е по-нисък и моделът на Шварц или байесов информационен критерий също е по-нисък.