Категоричната променлива е тази, която позволява класифициране на поредица от данни посредством фиксирани стойности, свързани със специфично качество или категория.
Категоричната променлива, за разлика от основните или непрекъснатите променливи (които позволяват числени изчисления), класифицира индивиди или случаи. Те обикновено приемат стойности, представени с цели числа, като едно или нула, но това са точно това, представления.
В примера ще го видим по-подробно.
Разлики между категорична и непрекъсната променлива
Има някои разлики между категориалната променлива и непрекъснатата или основната променлива, които трябва да бъдат известни. Нека видим най-подходящите.
- Първо, категориалната променлива се използва за групиране, а непрекъснатата променлива за броене. С други думи, първият позволява да се формират категории с поредица от данни. Например пол или брой деца. Втората ни дава цифрова информация. Например възраст.
- Кардиналната променлива позволява числени изчисления, а другите не. По този начин в първите можем да знаем средствата или отклоненията, докато в другите само някои данни, като например режима или процента на категориите.
- Категоричните са много полезни, за да се знае качествена информация, тоест някакво качество на данните. Непрекъснатите ни предоставят количествени данни, тоест количества и стойности, представени с числа.
Статистически техники за категориални променливи
След това нека видим статистическите техники, най-използвани в категориалните променливи, като ги сравняваме с тези на непрекъснатите или основните променливи.
- Описателна статистика: При този тип променливи, анализите обикновено се основават на диаграми и проценти, наред с други. Кардиналите позволяват прилагането на техники за анализ за изчисляване на статистика на позицията като квантили или статистика на дисперсията като дисперсии.
- Контраст на хипотезата: В категоричното, резултатите могат да бъдат екстраполирани с помощта на непараметрични тестове на хипотези. От друга страна, непрекъснатите използват параметрични контрасти, които също могат да бъдат изведени.
- Техники на регресия: В този случай за първите се използват, наред с други, логистична регресия или подобни. За другия тип променливи най-използваната техника е линейната регресия.
Пример за категорична променлива
За финал нека разгледаме един много често срещан пример в маркетинга. Нека си представим, че искаме да продадем продукт и се интересуваме да знаем семейното положение.
За целта ще назначим 1 на неженен, 2 на женен, 3 на разведен, 4 на партньор и 5 на други.
Нека да видим изображението и след това да го коментираме:
В него можем да видим, че най-голям процент лица са самотни, женени и разведени, като другите две възможности са само 5%.
Както виждаме, категоричните променливи са полезни за групиране. Стълбовидната диаграма ни позволява да наблюдаваме по-добре тези проценти, тъй като е по-лесно да сравним размера на лентите.