Тау на Кендъл (II) - какво представлява, определение и концепция

Това е непараметрична мярка на зависимост, която идентифицира съгласуваните и несъответстващите двойки на две променливи. След като бъдат идентифицирани, сумите се изчисляват и се изчислява коефициентът.

С други думи, ние присвояваме класиране на наблюденията на всяка променлива и изследваме зависимостта на зависимостта между две дадени променливи.

Има два начина за изчисляване на Тау на Кендъл; избираме да изчислим зависимостта на зависимостта, след като наблюденията на всяка променлива са подредени. В нашия пример ще видим, че сортираме класирането в колона X във възходящ ред.

Класифицираните корелации са непараметрична алтернатива като мярка за зависимост между две променливи, когато не можем да приложим коефициента на корелация на Пиърсън.

Това са резултатите, на които се позовахме в първата статия -> Tau на Кендъл (I):

Ски курорт (i) х Z. ° С NC
ДА СЕ 1 1 6 0
Б. 2 3 5 0
° С 3 4 5 1
д 4 2 4 0
И 5 7 4 1
F 6 6 4 1
G 7 5 43 3 ОБЩА СУМА
  • Двойката BC-CB е несъответстваща двойка. Въвеждаме 1 в NC колоната и замразяваме брояча в последната позиция, докато отново намерим съответстваща двойка. В този случай сме замразили броя на съвпадащите двойки на 5 до станция D. Станция D може да образува само 4 съвпадащи двойки: AD-DA, DE-ED, DF-FD, DG-GD.

Друга противоречива двойка би била EF-FE:

  • Двойката EF-FE е несъответстваща двойка. Пишем 1 в колоната NC и продължаваме да плъзгаме числото 4 на съгласуваните двойки, които могат да се образуват. Съответстващите двойки станция E биха били: EA-AE, EB-BE, EC-CE, ED-DE, тъй като EF-FE е несъответстващ.
    • Двойката FG-GF е несъответстваща двойка. Пишем 1 в колоната NC и продължаваме да плъзгаме числото 4 на съгласувани двойки, които могат да се образуват. Съгласуващите двойки на станцията F s (не сме варирали вместо 4. Съгласуващите двойки, които бихме могли да покажем преди (не сме варирали, биха били: FA-AF, FB-BF, FC-CF, FD-DF защото FG-GF тревожи.

Изчисляваме Tau на Kendall

Тау на Кендъл няма тайна, освен че е коефициент на двойките съгласувани и несъгласувани от извадка от наблюдения.

Интерпретация

Първоначалният ни въпрос беше: има ли зависимост между предпочитанията на скиорите и скандинавите в дадени ски курорти?

В този случай имаме зависимост между двете променливи от 0,8695. Резултат много близо до горната граница. Този резултат ни казва, че алпийските скиори (X) и скандинавските скиори (Z) са класифицирали курортите с подобни класификации.

Без да се налага да правим какъвто и да е вид изчисление, можем да видим, че първите станции (A, B, C) получават най-добрите резултати от двете групи. С други думи, рейтингите на скиорите следват същата посока.

Сравнение: Пиърсън срещу Кендъл

Ако изчислим коефициента на корелация на Пиърсън предвид предходните наблюдения и го сравним с Тау на Кендъл, получаваме:

В този случай Tau на Кендъл ни казва, че има по-силна зависимост на зависимостта между променливите X и Z в сравнение с коефициента на корелация на Пиърсън: 0.8695> 0.75.

Ако отклоненията оказаха голямо влияние върху резултатите, щяхме да открием голяма разлика между Пиърсън и Спиърман и следователно трябва да използваме Спиърман като мярка за зависимост.