Дисперсията е мярка за дисперсия, която представлява променливостта на поредица от данни по отношение на нейната средна стойност. Формално той се изчислява като сумата на квадратите на остатъците, разделена на общия брой наблюдения.
Може да се изчисли и като стандартно отклонение на квадрат. Между другото, разбираме остатъчното като разлика между стойността на дадена променлива в даден момент и средната стойност на цялата променлива.
Вижте всички мерки за дисперсияПреди да разгледаме формулата на дисперсията, трябва да кажем, че дисперсията в статистиката е много важна. Тъй като макар да е проста мярка, тя може да предостави много информация за конкретна променлива.
Формула за изчисляване на дисперсията
Единицата за измерване на дисперсията винаги ще бъде мерната единица, съответстваща на данните, но на квадрат. Дисперсията винаги е по-голяма или равна на нула. Тъй като остатъците са на квадрат, математически е невъзможно вариацията да излезе отрицателна. И по този начин не може да бъде по-малко от нула.
Където
- Х: променлива, върху която трябва да се изчисли дисперсията
- хi: номер на наблюдение i на променлива X. мога да приема стойности между 1 и n.
- н: брой наблюдения.
- х: Това е средната стойност на променливата X.
Или какво е същото:
Защо остатъците са на квадрат?
Причината остатъците да са в квадрат е проста. Ако те не бяха на квадрат, сумата на остатъците ще бъде нула. Това е свойство на отпадъците. Така че, за да се избегне това, както при стандартното отклонение, те са на квадрат. Резултатът е мерната единица, в която данните се измерват, но на квадрат.
Например, ако имахме данни за заплатите на набор от хора в евро, данните, които дават отклонението, ще бъдат в квадратни евро. За да има смисъл тълкуването, бихме изчислили стандартното отклонение и бихме прехвърлили данните в евро.
- Отклонение -> (2-3) = -1
- Отклонение -> (4-3) = 1
- Отклонение -> (2-3) = -1
- Отклонение -> (4-3) = 1
- Отклонение -> (2-3) = -1
- Отклонение -> (4-3) = 1
Ако добавим всички отклонения, резултатът е нула.
РангКаква е разликата между дисперсията и стандартното отклонение?
Един въпрос, който би могъл да бъде зададен и с основателна причина, би бил разликата между дисперсията и стандартното отклонение. В действителност те идват да измерват едно и също нещо. Дисперсията е стандартното отклонение на квадрат. Или обратното, стандартното отклонение е квадратен корен от дисперсията.
Стандартното отклонение е направено, за да може да се работи в началните мерни единици. Разбира се, както е нормално, човек може да се запита каква е ползата от това да имаме вариация като концепция? Е, въпреки че интерпретацията на стойността, която тя връща, не ни дава много информация, нейното изчисление е необходимо, за да се получи стойността на други параметри.
За да изчислим ковариацията, се нуждаем от дисперсията, а не от стандартното отклонение, за изчисляване на някои иконометрични матрици се използва дисперсията, а не стандартното отклонение. Въпрос на комфорт е при работа с данните според какви изчисления.
Пример за изчисление на дисперсията
Ще съберем поредица от данни за заплатите. Имаме петима души, всеки с различна заплата:
Хуан: 1500 евро
Пепе: 1200 евро
Хосе: 1700 евро
Мигел: 1300 евро
Матео: 1800 евро
Средната заплата, която ни е необходима за нашето изчисление, е ((1500 + 1200 + 1700 + 1300 + 1800) / 5) 1500 евро.
Тъй като дисперсионната формула в нейната разбита форма е формулирана, както следва:
Ще получим, че трябва да се изчислява така, че:
Резултатът е 52 000 евро на квадрат. Важно е да запомните, че когато изчисляваме дисперсията, имаме мерните единици на квадрат. За да го конвертираме в евро, в този случай ще трябва да изпълним стандартното отклонение. Приблизителният резултат би бил 228 евро. Това означава, че средно разликата между заплатите на различните хора ще бъде 228 евро.