Описателната статистика е дисциплина, която отговаря за събирането, съхраняването, подреждането, изработването на таблици или графики и изчисляването на основните параметри в набора от данни.
Описателната статистика е, заедно със статистическия извод или извеждащата статистика, един от двата големи клона на статистиката. Собственото му име го показва, той се опитва да опише нещо. Но не го описвайте по никакъв начин, а по количествен начин. Помислете за теглото на кутия със зеленчуци, височината на човек или сумата пари, която бизнесът печели. Можем да кажем много неща за тези променливи. Например бихме могли да посочим, че тази или онази кутия домати тежат много или тежат по-малко от другите. Продължавайки с друг пример, бихме могли да кажем, че доходите на дадена компания варират много във времето или че човек има среден ръст.
За да диктуваме горните твърдения, за много, малко, високо, ниско, много променливо или малко променливо се нуждаем от променливи за измерване. Тоест, трябва да ги измерим количествено, да предложим номер. Имайки това предвид, бихме могли да използваме грамове или килограми като мерна единица, за да намерим теглото на толкова кутии домати, колкото считаме. След като претеглим тридесет кутии, ще знаем кои тежат повече, кои тежат по-малко, колко се повтаря най-много или ако има голямо несъответствие между теглото на различните кутии.
Описателната статистика се роди с тази идея, за да събираме данни, да ги съхраняваме, да правим таблици или дори графики, които ни предлагат информация по даден предмет. Освен това те ни предлагат мерки, обобщаващи информацията за голямо количество данни.
Видове статистически променливи
В рамките на описателната статистика можем да опишем данните качествено или количествено.
- Качествена променлива: Отнася се за качество. Примери: цвят на очите на човек или цвят на косата.
- Количествена променлива: То се отнася до количествена мярка. Примери: ръст на човек в сантиметри или тегло на човек в килограми.
По този начин върху тези променливи могат да се изчислят определени параметри. Особено върху количествените променливи. Тъй като например каква е средната стойност на цвета на очите? Ако има петима души със син цвят на очите и петима със зелен цвят на очите, средната стойност няма да бъде, че те имат средно синьо-зелен цвят на очите. Следователно в този случай не би било възможно да се изчислят някои от параметрите, които ще видим по-долу.
Статистическа променливаОсновни статистически параметри
За да се обобщи информацията, бяха измислени различни формули, които предлагаха мерки от определен тип. По този начин има такива, които ни предлагат информация за центъра, други за дисперсията или променливостта и трети за позицията на ценност.
- Мерки за централна тенденция: Така наречени, защото предоставят информация за центъра на набора от данни. Например средната стойност е мярка за тенденция или централна позиция, тъй като средната стойност ни дава центрирана стойност на набора от данни. Къде бихме могли да кажем, че се намира средната точка? В центъра, в средата приблизително. Друг пример за мярка за централна тенденция е медианата.
- Мерки за дисперсия: Те са известни и като мерки за променливост. Например стандартното отклонение е мярка за променливост, тъй като ни казва дали стойностите на даден набор от данни са много различни или не. Още два примера за мерки за дисперсия могат да бъдат дисперсията и статистическият обхват.
- Измервания на позицията: Те не са най-известните, но се използват често. Пример за това се намира в процентилите или децилите. Когато конкретни данни са в 90-ия процентил, това означава, че 90% от данните са под тези данни. Има и други измервателни позиции като квартили или някои варианти като първия квартил.
Честотно разпределение
Също така е интересно да се види как се разпределят честотите. За това има определени понятия, които трябва да знаем:
- Абсолютна честота: Това е общият брой повторения на наблюдението. Понякога могат да се представят наблюдения на интервали.
- Относителна честота: Това е числото в проценти, което наблюдение или набор от тях се повтаря.
- Натрупана честота: Тя може да бъде натрупана относителна или натрупана абсолютна. Показва сумата, натрупана до определено наблюдение.
Таблици и графики в описателната статистика
Въпреки че таблиците и графиките не са уникални за описателната статистика, те я характеризират. В доклади, проучвания и изследвания използването на графики е много често. Те ни помагат да показваме информацията по-опростен и ограничен начин.
Разбира се, в таблиците и графиките има огромно количество типове. Ето няколко примера за често използвани графики и таблици.
- Хистограма.
- Бар графика.
- Кръгова диаграма.
- Таблици на вероятностите.
- Двуизмерни таблици.
- Бокс диаграма.
Описателни статистически примери
Пример за описателна статистика би бил, когато искаме да изчислим средните голове на игра на футболист. Това е описателна статистика, тъй като се опитваме да опишем променлива (брой цели). В този случай чрез изчисляване на метрика.
Така че да се каже, че Роналдо е вкарвал 1,05 гола на мач през последните 30 мача, е правилна описателна статистическа фраза.
Можем също да кажем например, че 30% от съучениците на Хуан имат сини очи, 60% кафяви и останалите 10% черни. Това би било качествена променлива (цвят на очите), но ние описваме честотата, с която се появява.