Куртозата е статистическа мярка, която определя степента на концентрация, която стойностите на променлива присъстват около централната зона на честотното разпределение. Известен е и като мярка за насочване.
Когато измерваме случайна променлива, като цяло резултатите с най-висока честота са тези около средната стойност на разпределението. Нека си представим височината на учениците в клас. Ако средната височина на класа е 1,72 см, най-нормалното е височините на останалите ученици да са около тази стойност (с известна степен на вариабилност, но без да са твърде големи). Ако това се случи, разпределението на случайната променлива се счита за нормално разпределено. Но като се има предвид безкрайността на променливите, които могат да бъдат измерени, това не винаги е така.
Има някои променливи, които представят по-висока степен на концентрация (по-малко дисперсия) на стойностите около средната им стойност, а други, напротив, представят по-ниска степен на концентрация (по-голяма дисперсия) на техните стойности около централната им стойност. Следователно, куртозата ни информира колко заострена (по-висока концентрация) или сплескана (по-ниска концентрация) е разпределението.
Мерки от централна тенденцияКумулативна честотаВидове куртози
В зависимост от степента на куртоза имаме три вида разпределения:
1. Лептокуртик: Има голяма концентрация на стойности около средната им стойност (g2>3)
2. Mesocúrtic: Има нормална концентрация на стойности около средната им стойност (g2=3).
3. Platicúrtica: Има ниска концентрация на стойностите около средната им стойност (g2<3).
Измервания на куртоза според данните
В зависимост от групирането или не на данните се използва една или друга формула.
Негрупирани данни:
Данни, групирани в честотни таблици:
Данни, групирани в интервали:
Пример за изчисляване на куртоза за негрупирани данни
Да предположим, че искаме да изчислим куртозата на следното разпределение:
8,5,9,10,12,7,2,6,8,9,10,7,7.
Първо изчисляваме средната аритметична стойност (µ), която би била 7,69.
След това изчисляваме стандартното отклонение, което би било 2,43.
След получаване на тези данни и за удобство при изчислението може да се направи таблица за изчисляване на частта от числителя (четвърти момент от разпределението). За първото изчисление ще бъде: (Xi-µ) 4 = (8-7.69) 4 = 0.009.
Данни | (Xi-µ) 4 |
---|---|
8 | 0,0090 |
5 | 52,5411 |
9 | 2,9243 |
10 | 28,3604 |
12 | 344,3330 |
7 | 0,2297 |
2 | 1049,9134 |
6 | 8,2020 |
8 | 0,0090 |
9 | 2,9243 |
10 | 28,3604 |
7 | 0,2297 |
7 | 0,2297 |
N = 13 | ∑ = 1.518,27 |
След като направим тази таблица, просто ще трябва да приложим формулата, изложена по-рано, за да имаме куртозата.
ж2 = 1.518,27/13*(2,43)^4 = 3,34
В този случай, тъй като g2 е по-голямо от 3, разпределението ще бъде лептокуртично, представящо по-голямо насочване от нормалното разпределение.
Излишна куртоза
В някои ръководства куртозата се представя като излишна куртоза. В този случай тя се сравнява директно с тази на нормалното разпределение. Тъй като нормалното разпределение има куртоза 3, за да получим излишъка, ще трябва само да извадим 3 от нашия резултат.
Излишната куртоза = g2-3 = 3,34-3 = 0,34.
Тълкуването на резултата в този случай би било следното:
ж2-3> 0 -> лептокуртично разпределение.
ж2-3 = 0 -> мезокортикално (или нормално) разпределение.
ж2-3 платикуртично разпределение.
Описателна статистика