Дисперсионен анализ - какво е това, определение и концепция

Дисперсионният анализ или ANOVA (анализ на дисперсията) са техники за анализ на многовариантна зависимост, използвани за определяне дали има значителни разлики между средните стойности на три или повече популационни групи.

Следователно, с този анализ ще разберем дали има разлики между определени групи, когато модифицираме една или повече характеристики. За да разберем, използваме стойността на средната стойност на данните.

Използването му е много често в области като икономика или медицина.

Предишни предположения от дисперсионния анализ

Има редица предпоставки за извършване на ANOVA, които трябва да бъдат известни. Те са от съществено значение, за да бъдат адекватни резултатите.

  • Първо, популацията трябва да следва нормално разпределение. Следователно имаме работа с тип параметричен контраст, тъй като параметрите на популацията на средното и стандартното отклонение са известни.
  • Освен това използваните проби трябва да са независими една от друга. Това означава, че модификацията в един от тях не трябва да влияе върху стойността на останалите.
  • От друга страна, вариациите на изследваните популации трябва да бъдат равни. Това се нарича хомосцедастичност.

Класификация на анализа на дисперсионните модели

За анализ на дисперсионните модели могат да се използват трите класификации, показани по-долу:

  • Модел с фиксирани ефекти: Популациите са нормални и се различават само по стойността на съответните им средства.
  • Модел на случайни ефекти: В този случай данните имат йерархия и разликите в популацията зависят от нея.
  • Модел на смесени ефекти: Ще се изправим пред модел, който е смесица от предишните две.

Пример за ANOVA: важни понятия

Има математически уравнения с известна сложност за извършване на ANOVA. Въпреки това, в Economy-Wiki.com ние избираме простата икономия и следователно, възползвайки се от технологията, ще покажем как това може да се направи в електронна таблица.

Нека си представим, че искаме да знаем дали има значителни разлики между читателите на Economy-Wiki.com въз основа на афинитета на тяхната степен с икономиката.

Предупреждение: Данните, които ще използваме, са фиктивни.

Трябва да отидем на Данни, Анализ на данни и ще изберем анализа на дисперсията на фактор.

Рангът би бил матрицата на трите групи. Може да е по-интересно да включите заглавията след това и да дадете желаното форматиране. В нашия случай с логото и синия цвят.

Виждаме, че има някои понятия като степени на свобода и вероятност или значимост. Първият се изчислява автоматично и е броят на групите минус една. Вторият ни казва дали разликите са значителни или не.

Обикновено започвате от прието ниво на доверие. В икономиката обикновено е 95% (0,95), което е свързано със значимост от 0,05 (1-0,095). По този начин, ако тази вероятност или р стойност е под приетата значимост, разликите са значителни.

В този случай изглежда, че степента не влияе върху броя на читателите (значимост> 0,05). Следователно анализът на вариацията изглежда показва, че Economy-Wiki.com интересува всички, а не само специализираните читатели. Разбира се, че са измислени данни или не?