Rho на Spearman - какво е това, определение и концепция

Съдържание:

Anonim

Rho на Spearman е непараметрична мярка за зависимост, при която се изчислява средната йерархия на наблюденията, разликите се изчисляват на квадрат и се включват във формулата.

С други думи, ние присвояваме класиране на наблюденията на всяка променлива и изследваме зависимостта на зависимостта между две дадени променливи.

Класифицираните корелации са непараметрична алтернатива като мярка за зависимост между две променливи, когато не можем да приложим коефициента на корелация на Пиърсън.

Обикновено се задава буквата giega rho към коефициента на корелация.

Rho оценката на Spearman се дава от:

Процедура на Rho Spearman

0. Започваме от извадка от н наблюдения (Ai, Бi).

1. Класифицирайте наблюденията на всяка променлива, като ги коригирате за връзки.

  • Използваме функция на excel, която класифицира наблюденията вместо нас и ги коригира автоматично, ако открие връзки между елементите. Тази функция се нарича HERARCH.MEDIA (класификация Ai; Класификациян;поръчка).
  • Последният фактор на функцията е незадължителен и ни казва в какъв ред искаме да подредим наблюденията. Ненулево число ще сортира наблюденията във възходящ ред. Например ще присвои на най-малкия елемент ранг 1. Ако поставим нула в променливата поръчка, ще присвои на най-големия елемент ранг 1 (низходящ ред).

Практически пример

  • В нашия случай ние присвояваме на променливата на порядъка ненулево число, за да подредим наблюденията във възходящ ред. Тоест, присвояване на най-малкия елемент на променливата ранг 1.
  • Проверяваме дали общите суми на колоните на Клас А Y. Класификация Б те са равни помежду си и отговарят:

В този случай n = 10, защото имаме общо 10 елемента / наблюдения във всяка променлива ДА СЕ Y. Б..

Общата сума на класификация А е равна на общата сума на класификация Y и те също изпълняват горната формула.

ДА СЕ Б. Класификация А Класификация Б Разлики на квадрат
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Обща сума 55 55 130

2. Добавете разликите между класирането и ги каре.

  • След като имаме всички класифицирани наблюдения, отчитайки връзките между тях, изчисляваме разликата във формата:

дi = Ai - Бi

Определяме (di) като разликата между класификацията на Ai и класификацията на Bi.

  • След като се получи разликата, ние я квадратираме. Квадратите на разликите се прилагат, за да имат само положителни стойности.

Определяме di2 като квадратичната разлика между класификацията на Ai и класификацията на Бi.

В колоната с квадратни разлики ще имаме:

дi2 = (Ai - Бi)2

3. Изчислете rho на Spearman:

  • Изчисляваме общата сума на квадратите разлики във формата:

В нашия пример:

  • Включваме резултата във формулата на Spearman rho:

В нашия пример:

Сравнение: Пиърсън срещу Спиърман

Ако изчислим коефициента на корелация на Пиърсън предвид предходните наблюдения и го сравним с коефициента на корелация на Спиърман, ще получим:

  • Пиърсън = 0,1109
  • Копиеносец = 0,2121

Виждаме, че зависимостта между променливите A и B остава слаба дори при използване на Spearman вместо Pearson.

Ако отклоненията оказаха голямо влияние върху резултатите, щяхме да открием голяма разлика между Пиърсън и Спиърман и следователно трябва да използваме Спиърман като мярка за зависимост.