Медианата е статистика на централната позиция, която разделя разпределението на две, тоест оставя същия брой стойности от едната страна, както от другата.
За изчисляване на медианата е важно данните да са подредени от най-високото към най-ниското или обратно от най-ниското към най-високото. Тоест те имат поръчка.
Медианата, заедно със средната стойност и дисперсията, е много илюстративна статистика на разпределението. За разлика от средната стойност, която може да бъде изместена на едната или другата страна, в зависимост от разпределението, медианата винаги се намира в центъра на нея. Между другото, формата на разпределението е известна като куртоза. С куртоза можем да видим къде се движи разпределението. Вижте куртоза
Мерки от централна тенденцияСредна формула
След като медианата бъде дефинирана, ние ще продължим да я изчисляваме. За целта ще ни трябва формула.
Формулата няма да ни даде стойността на медианата, а това, което ще ни даде, е позицията, в която тя е в набора от данни. В този смисъл трябва да вземем предвид дали общият брой данни или наблюдения, които имаме (n), е четен или нечетен. Така че средната формула е:
- Когато броят на наблюденията е четен:
Медиана = (n + 1) / 2 → Средна стойност на наблюденията
- Когато броят на наблюденията е нечетен:
Медиана = (n + 1) / 2 → Стойност на наблюдението
Тоест, ако имаме 50 данни, подредени за предпочитане от най-малкия до най-големия, медианата ще бъде в числото на наблюдение 25,5. Това е резултатът от прилагането на формулата към четен набор от данни (50 е четно число) и разделяне на 2. Резултатът е 25,5, тъй като делим на 50 + 1. Медианата ще бъде средната стойност между наблюдение 25 и 26.
В следващия раздел ще го видим по-подробно, с визуални примери.
Пример за изчисляване на медианата
Нека си представим, че имаме следните данни:
2,4,12,6,8,14,16,10,18.
На първо място ги нареждаме от най-малките до най-големите с това, което бихме имали следното:
2,4,6,8,10,12,14,16,18.
Е, средната стойност, както показва формулата, е тази, която оставя същото количество стойности от едната страна, както от другата. Колко наблюдения имаме? 9 наблюдения. Изчисляваме позицията със съответната средна формула.
Медиана = 9 + 1/2 = 5
Какво означава това 5? Това ни казва, че средната стойност се намира в наблюдението, чиято позиция е петата.
Следователно медианата на тези данни би била числото 10, тъй като тя е на пета позиция. Освен това можем да проверим как и вляво от 5 има 4 стойности (2, 4, 6 и 8), а вдясно от 10 има други 4 стойности (12, 14, 16 и 18) .
Друг пример за медиана
Сега нека си представим, че имаме следните числа:
1,2,4,2,5,9,8,9.
Ако ги поръчаме, ще имаме следното:
1,2,2,4,6,8,9,9.
В този случай броят на наблюденията е четен. Следователно, за да се вземат предвид съображенията за броя на наблюденията дори. Формулата ни казва следното:
Медиана = 8 + 1/2 = 4,5
Разбира се, ще си помислите, какво е позиция 4.5? Или е в позиция 4, или е в позиция 5, но 4,5 не съществува. Това, което ще направим, е средна стойност на стойностите, които са в позиция 4 и 5. Тези числа са 4 и 6. Средната стойност между тези две числа е 5 ((4 + 6) / 2).
Следователно средната стойност ще бъде 5. Числото 5 (ние си го представяме) ще остави същия брой наблюдения от лявата страна (1, 2, 2 и 4), както от дясната страна (6, 8, 9 и 9).
Средно аритметично