Това е непараметрична мярка на зависимост, която идентифицира съгласуваните и несъответстващите двойки на две променливи. След като бъдат идентифицирани, сумите се изчисляват и се изчислява коефициентът.
Класифицираните корелации са непараметрична алтернатива като мярка за зависимост между две променливи, когато не можем да приложим коефициента на корелация на Пиърсън.
С други думи, ние присвояваме класиране на наблюденията на всяка променлива и изследваме зависимостта на зависимостта между две дадени променливи. Има два начина за изчисляване на Тау на Кендъл; избираме да изчислим зависимостта на зависимостта, след като наблюденията на всяка променлива са подредени. В нашия пример ще видим, че сме сортирали класирането в колона X във възходящ ред.
Математически,
Ние определяме:
° Сн = общ брой съвпадащи двойки.
NCн = общ брой несъгласувани (несъответстващи) двойки.
Процедура и практически пример
За да получим Тау на Кендъл, първо трябва да знаем как да идентифицираме съгласуващите и несъответстващите двойки на две променливи.
Ще използваме предпочитанията на скиорите. В този пример предполагаме, че искаме да оценим дали скиорите класифицират своите предпочитания към алпийски ски или скандинавски ски в същия ред в станция i. Оценките им могат да варират от 1 (много за предпочитане) до 7 (много малко за предпочитане).
Нашият въпрос би бил: има ли зависимост между предпочитанията на скиорите и скандинавите в дадените ски курорти?
Ние определяме:
X = рейтинг на скиорите за алпийски ски в станция i.
Y = оценка на скиорите за скандинавски ски на гара i.
C = съгласувани двойки.
NC = несъответстващи / несъответстващи двойки.
Иi = ски курорт i.
Процес
- Започваме от извадка от n = 7 наблюдения на ски курорта. Всеки ред от таблицата са класификации, дадени от скиорите. Всяка двойка станции може да бъде съгласувана или несъответстваща. В колони C и NC броим двойките само в една посока. Например двойката AB и BA се броят като единична двойка, за да се избегнат повторения.
Получените наблюдения са:
Ски курорт (i) | х | Z. |
ДА СЕ | 1 | 1 |
Б. | 2 | 3 |
° С | 3 | 4 |
д | 4 | 2 |
И | 5 | 7 |
F | 6 | 6 |
G | 7 | 5 |
- Ние сме сортирали елементите на колона X във възходящ ред, за да можем да ги сравним с елементите на колона Z
- Намираме двойките конкорданти и двойките дискорданти.
Ски курорт (i) | х | Z. | ° С | NC | |
ДА СЕ | 1 | 1 | 6 | 0 | |
Б. | 2 | 3 | 5 | 0 | |
° С | 3 | 4 | 5 | 1 | |
д | 4 | 2 | 4 | 0 | |
И | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | Обща сума |
- Първо разглеждаме колона Z, тъй като колона X вече е сортирана във възходящ ред. Следователно всички класификации в колона Z, които не са възходящи, ще бъдат несъответстващи двойки станции.
- Когато търсим двойки станции (съгласувани и несъгласувани), винаги ще имаме последния ред от наблюдения, защото търсим двойки (групи от две наблюдения).
- Всички, които са под референтната класификация, ще бъдат съгласувани двойки. В първия случай и двамата скиори установяват, че референтната класификация е на 1. Всички класификации под 1 ще бъдат двойки, съответстващи на А. Общо имаме 7 станции за класиране. И така, ще има 6 съгласувани двойки на А. Тъй като нямаме несъответстващи двойки, свързани с A, ще сложим нула.
Прочетете втората част на Tau на Кендъл (II)