Tau (I) на Кендъл - Какво представлява, определение и концепция

Съдържание:

Tau (I) на Кендъл - Какво представлява, определение и концепция
Tau (I) на Кендъл - Какво представлява, определение и концепция
Anonim

Това е непараметрична мярка на зависимост, която идентифицира съгласуваните и несъответстващите двойки на две променливи. След като бъдат идентифицирани, сумите се изчисляват и се изчислява коефициентът.

Класифицираните корелации са непараметрична алтернатива като мярка за зависимост между две променливи, когато не можем да приложим коефициента на корелация на Пиърсън.

С други думи, ние присвояваме класиране на наблюденията на всяка променлива и изследваме зависимостта на зависимостта между две дадени променливи. Има два начина за изчисляване на Тау на Кендъл; избираме да изчислим зависимостта на зависимостта, след като наблюденията на всяка променлива са подредени. В нашия пример ще видим, че сме сортирали класирането в колона X във възходящ ред.

Математически,

Ние определяме:

° Сн = общ брой съвпадащи двойки.

NCн = общ брой несъгласувани (несъответстващи) двойки.

Процедура и практически пример

За да получим Тау на Кендъл, първо трябва да знаем как да идентифицираме съгласуващите и несъответстващите двойки на две променливи.

Ще използваме предпочитанията на скиорите. В този пример предполагаме, че искаме да оценим дали скиорите класифицират своите предпочитания към алпийски ски или скандинавски ски в същия ред в станция i. Оценките им могат да варират от 1 (много за предпочитане) до 7 (много малко за предпочитане).

Нашият въпрос би бил: има ли зависимост между предпочитанията на скиорите и скандинавите в дадените ски курорти?

Ние определяме:

X = рейтинг на скиорите за алпийски ски в станция i.

Y = оценка на скиорите за скандинавски ски на гара i.

C = съгласувани двойки.

NC = несъответстващи / несъответстващи двойки.

Иi = ски курорт i.

Процес

  • Започваме от извадка от n = 7 наблюдения на ски курорта. Всеки ред от таблицата са класификации, дадени от скиорите. Всяка двойка станции може да бъде съгласувана или несъответстваща. В колони C и NC броим двойките само в една посока. Например двойката AB и BA се броят като единична двойка, за да се избегнат повторения.

Получените наблюдения са:

Ски курорт (i) х Z.
ДА СЕ 1 1
Б. 2 3
° С 3 4
д 4 2
И 5 7
F 6 6
G 7 5
  1. Ние сме сортирали елементите на колона X във възходящ ред, за да можем да ги сравним с елементите на колона Z
  2. Намираме двойките конкорданти и двойките дискорданти.
Ски курорт (i) х Z. ° СNC
ДА СЕ 1 1 6 0
Б. 2 3 5 0
° С 3 4 5 1
д 4 2 4 0
И 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Обща сума
  • Първо разглеждаме колона Z, тъй като колона X вече е сортирана във възходящ ред. Следователно всички класификации в колона Z, които не са възходящи, ще бъдат несъответстващи двойки станции.
    • Когато търсим двойки станции (съгласувани и несъгласувани), винаги ще имаме последния ред от наблюдения, защото търсим двойки (групи от две наблюдения).
    • Всички, които са под референтната класификация, ще бъдат съгласувани двойки. В първия случай и двамата скиори установяват, че референтната класификация е на 1. Всички класификации под 1 ще бъдат двойки, съответстващи на А. Общо имаме 7 станции за класиране. И така, ще има 6 съгласувани двойки на А. Тъй като нямаме несъответстващи двойки, свързани с A, ще сложим нула.

Прочетете втората част на Tau на Кендъл (II)