Boxplot, от английски, boxplot, е представяне на количествена или категориална променлива с цел бързо идентифициране на квартилите на набора от данни.
С други думи, кутията е графика, която представлява количествена или качествена променлива през квартилите.
В статистиката това е полезен инструмент за представяне на дискретни и непрекъснати набори от данни.
Важно е да се има предвид, че качествените променливи променливи или които са предназначени да представляват ред или категория, винаги трябва да бъдат свързани с числов индекс, по-голям от 0, за да могат да се появят на графиката и да се изчисли съответната статистика.
Графика на кутията и хистограма
Графиката на кутията не е нищо повече от хистограма, гледана отгоре, и по същия начин хистограмата е кутия, гледана отстрани. Пример може да се види по-долу.
Първата характеристика, която двете диаграми споделят, е минимумът и максимумът от набора от данни. Крайните ленти след тиретата показват минимума (долната лента) и максимума (горната лента). Отклоненията ще бъдат представени извън диапазона на максимума и минимума. Тоест отвъд решетките след тиретата. Можем да намерим и хоризонтални парцели.
С един поглед можете да видите, че по-голямата част от данните са концентрирани върху наблюденията близо до минимума в двете графики. Това се показва от графиката на кутията, в която кутията е по-близо до минимума от максимума. Ако разгледаме хистограмата, ще видим, че най-честите наблюдения са наблюденията, които са близки до минимума и далеч от максимума.
Информация за парцела в полето
Информацията, предоставена от графика, е както следва:
- Дъното на кутията е първият квартил (Q1).
- Лентата в средата на кутията е медиана или втори квартил (Q2).
- В горната част на кутията е третият квартил (Q3).
- Интерквартилният диапазон или IQR ще бъде височината на кутията, тоест разликата между Q3 и Q1.
Ключ за графика на кутията
Това графично представяне се нарича кутия, защото изглежда като кутия. Следователно, за да запомним тази графика, ще трябва да мислим само за квадратен обект или кутия.
За читателите, които са запознати с цената на финансовите активи, те ще видят повече прилика със свещ. Свещите, които виждате в офертата, са графични полета, приспособени към избрания времеви прозорец.
Предимства и недостатъци на парцела на кутията
Сред предимствата и недостатъците на тази диаграма откриваме следното:
Предимство
- Глобализирана визия за абсолютната честота на количествена или качествена променлива.
- Познаване на минимума, максимума и квартилите на набора от данни, без да се налага да ги изчислявате.
- Разпознаване на екстремни стойности по-бързо, отколкото с хистограма, защото екстремните стойности са посочени с кръгове извън максимума и минимума.
Недостатъци
- Ако наборът от данни е малък, създаването на графичен график за изразяване на тези данни ще затрудни разбирането.
Пример за парцел с кутия
Предполагаме, че искаме да представим броя на велосипедистите, които минават покрай нашата къща в течение на една година. Първо, броим велосипедистите и събираме информацията в таблица.
Чрез някои програми като R или Excel можем да генерираме графиката, показана по-долу.
Благодарение на представянето на броя на колоездачите чрез графика, можем бързо да разберем къде е медианата, другите квартили, максималната и минималната. В този случай нямаме нетипични данни, тъй като над максимума и минимума няма нищо.
Прилагането на този тип графики е много често, като се има предвид неговата простота и полезност в много области извън финансите и икономиката.