Линейният дискриминант анализ или Линеен дискриминант анализ (LDA) е статистическа техника, която създава функция, способна да класифицира явленията, като взема предвид серия от дискриминиращи променливи и вероятност за принадлежност.
Следователно ние имаме работа с тип статистическа процедура, която се стреми да групира въз основа на определени прилики. По този начин позволява количествено определяне на вероятността за принадлежност към едната или другата група. Тези групи са известни априори, за разлика от клъстерния анализ.
Математически модел на дискриминантния анализ
Нека да видим как би изглеждал математическият модел на дискриминантния анализ.
Това е много просто, тъй като се основава на система от линейни уравнения. Разбира се, анализът е по-сложен, но това би било извън работата на Economy-Wiki.com, простата икономика.
Както виждаме, те са набор от уравнения, чиято зависима променлива (y) представлява определени резултати. Това от своя страна са линейни функции на други дискриминантни променливи (X) и на поредица от параметри (a).
Чрез тези линейни комбинации целта е да се увеличи максимално разликата между групите и да се сведе до минимум тази, която възниква между групите. По този начин могат да се групират нови случаи с определена вероятност, за които можем да знаем тяхната стойност, при условие че отговарят на тези критерии.
Процес, който следва, за да се извърши дискриминант анализ
Нека да видим как може да се извърши анализ от този тип:
- Първо трябва да създадете таблица с данни с случаи и променливи. Включена е и категорична променлива, която определя всяка от групите.
- След това се генерира математически модел с цифрови данни. Това ще се основава на това, което видяхме в предишния раздел. Статистическият софтуер като SPSS или безплатният R автоматизира целия процес.
- И накрая, с този анализ ще можем да обясним защо всеки случай принадлежи към една или друга група и освен това да установим критерий за членство за нови случаи. Това ще се основава на вероятността да бъдете обхванати в рамките на едното или другото.
Примери за приложение на дискриминантния анализ
За финал нека разгледаме някои примери за прилагането на дискриминантния анализ.
Нека помним също, че при всички тях целта е да се създаде дискриминантна функция, която групира всеки нов случай според вероятност.
- Искаме да класифицираме различни страни въз основа на техните макроикономически данни: Неразвити, нововъзникващи или развити страни (групи). Ние създаваме дискриминантната функция, за да можем да изчислим вероятността дадена държава да принадлежи към едната или другата група.
- Искаме да проведем маркетингова кампания и ни е интересно да знаем в кои групи да класираме индивидите: По този начин можем да отговорим на определени въпроси, като например какви биха били характеристиките на случаен клиент.
- Искаме да знаем нивото на риск (група) на определени клиенти по отношение на отпускането на заем: Ще използваме променливи, свързани с Вашите доходи, месечни разходи, история или вид работа. Функцията дискриминант ни предоставя подходяща информация за платежоспособността.
Както виждаме, дискриминантният анализ е много полезен в много ситуации. Но не само свързано с икономиката, то се използва и в медицината, геологията или биологията, наред с други области.