Коригиран R на квадрат (Коригиран коефициент на определяне)

Съдържание:

Коригиран R на квадрат (Коригиран коефициент на определяне)
Коригиран R на квадрат (Коригиран коефициент на определяне)
Anonim

Коригираният R на квадрат (или коригиран коефициент на определяне) се използва при многократна регресия, за да се види степента на интензивност или ефективност на независимите променливи при обяснението на зависимата променлива.

С по-прости думи, коригираният R-квадрат ни казва какъв процент от вариацията на зависимата променлива се обяснява колективно от всички независими променливи.

Използването на този коефициент е оправдано с това, че когато добавяме променливи към регресия, некоригираният коефициент на детерминация има тенденция да се увеличава. Дори когато пределният принос на всяка от новите добавени променливи няма статистическа значимост.

Следователно, чрез добавяне на променливи към модела, коефициентът на детерминация може да се увеличи и можем да помислим погрешно, че избраният набор от променливи е способен да обясни по-голяма част от вариацията на независимата променлива. Този проблем е известен като „надценяване на модела“.

Коефициент на вариацияРегресионен анализ

Коригиран коефициент на формула за определяне

За да разрешат описания по-горе проблем, много изследователи предлагат да се коригира коефициентът на определяне, като се използва следната формула:

R2 да се → Коригиран R на квадрат или коригиран коефициент на определяне

R2 → R на квадрат или коефициент на определяне

н → Брой наблюдения в извадката

к → Брой независими променливи

Като се има предвид, че 1-R2 е константно число и тъй като n е по-голямо от k, тъй като добавяме променливи към модела, коефициентът в скоби става по-голям. Следователно. също резултатът от умножаването на това по 1-R2 . С което виждаме, че формулата е изградена, за да коригира и санкционира включването на коефициенти в модела.

В допълнение към предишното предимство, корекцията, използвана в предишната формула, също ни позволява да сравняваме модели с различен брой независими променливи. Отново формулата коригира броя на променливите между един и друг модел и ни позволява да направим еднородно сравнение.

Връщайки се към предишната формула, можем да заключим, че коригираният коефициент на определяне винаги ще бъде равен или по-малък от коефициента на R2. За разлика от коефициента на определяне, който варира между 0 и 1, коригираният коефициент на определяне може да бъде отрицателен по две причини:

  • Колкото по-близо k се приближава до n.
  • Колкото по-нисък е коефициентът на определяне.
Коефициент на линейна корелация