Квартилното отклонение е статистическа мярка за дисперсия, която връща централната стойност на интерквартилния диапазон и се използва в изкривени набори от данни.
С други думи, квартилното отклонение е да се изчисли медианата на интерквартилния диапазон (IQR) и се използва в масиви от данни с доста екстремни стойности.
Стенографията за отклонение на квартила е DQ.
Интерквартилен обхват
Интерквартилният диапазон е мярка за разпръскване на набор от данни, който обикновено се използва в графиката на полето. С други думи, интерквартилният обхват е разликата между предпоследния и първия квартил от разпределението, използвано в полето на полето.
IQR = Q3 - Q1
Предимството на използването на интерквартилния обхват е, че квартилното отклонение (DQ) може да бъде изчислено, което е много адекватна мярка за дисперсия, когато имаме пристрастни набори от данни.
Формула за квартилно отклонение
Квартилното отклонение се изчислява като разделяне на интерквартилния диапазон на 2.
DQ = (Q3 - Q1) / 2 = RIC / 2
Тъй като разглеждаме само разсейването между третия и първия квартил, ние пренебрегваме всички данни извън този диапазон. И следователно всички ценности, близки до екстремни. Така че, ако разделим интерквартилния диапазон на две, ще получим средната стойност на дисперсията.
Пример за квартилно отклонение
Предполагаме, че искаме да изчислим интерквартилния обхват и квартилното отклонение на броя велосипедисти, които минават покрай нашата къща през годината.
- Първо, броим велосипедистите и събираме информацията в таблица.
- Второ, изчисляваме първия и третия квартил, за да получим интерквартилния диапазон.
Q3 = 550
Q1 = 200
IQR = Q3 - Q1 = 550 - 200 = 350
- Трето, изчисляваме дисперсията на квартилите, като просто разделяме междуквартилния диапазон на две.
DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175
Квартилният спред за този набор от данни е 175. Това число е централната стойност на интерквартилния диапазон.
Важно е да се отбележи, че данните за месец юли са екстремни данни, тъй като са няколко пъти по-високи от всички останали данни. Така че, можем да кажем, че този набор от данни е пристрастен към този месец. Благодарение на „невежеството“ на дисперсията на квартилите към екстремни данни, резултатът от тази мярка е много подобен на този, ако само 600 велосипедисти са циркулирали през юли. Ако през юли имаше само 600 колоездачи, дисперсията на квартилите щеше да бъде 162,5, много близо до 175, като се има предвид, че броят на велосипедистите през този месец е 10 пъти по-малък.