Нива на значимост - какво е това, определение и концепция

Съдържание:

Anonim

Нивата на значимост са допълнение към доверителния интервал на разпределение и се използват за тестване на нулевата хипотеза (H0) при тест за статистическо заключение.

С други думи, нивата на значимост са вероятностите, които оставяме извън доверителния интервал на разпределение и ни помагат да определим дали тестовата статистика е в зоната на отхвърляне или не.

Връзка между ниво на значимост и ниво на доверие

Със сигурност всички сме чували някой да пита каква стойност трябва да присвоим на алфата на разпределението или с каква степен на доверие изчисляваме интервала, математически, (1-алфа). Отговорът обикновено е 1%, 5% или 10% за алфа или 99%, 95% и 90% за нивото на доверие.

Важно е да сте наясно със следното:

  • 1%, 5%, 10% = алфа => Нива на значимост.
  • 99%, 95%, 90% = (1-алфа) => Доверителен интервал.

Доверителните интервали и нивата на значимост се допълват, тъй като сумата от двете е площта на функцията на плътността. Тогава,

Вече знаем, че площта на функцията на плътността е 1. Математически ние сме в състояние да решим този интеграл:

Представяне на нивото на значимост

В този случай, t разпределението на Student с 16 степени на свобода е използвано, за да покаже кои области на функцията принадлежат към нивата на значимост. Процентите (2,5%, 2,5% и 95%) съответстват на площта под функцията на плътността. Тъй като това разпределение има две опашки, нивото на значимост е разделено наполовина, така че 2,5% + 2,5% = 5%. Критичната стойност на това разпределение с 16 степени на свобода и 5% като ниво на значимост е 2,11991 във всяка опашка.

2,5% + 2,5% + 95% = 1%

Универсален

Ние определяме нивата на значимост като универсални, тъй като тези нива са известни и се използват във всички статистически тестове. Много е необичайно да се намери ниво на значимост от 20% или 35%, освен ако не е изрично условие на теста.

Вярно е, че нива 1% и 5% са по-популярни от ниво 10%, но това е от съображения за точност. По-добре е да се даде резултат 1 от 100 пъти (1/100 = 0,01 = 1%) или 5 от 100 пъти (5/100 = 0,05 = 5%), отколкото 10 от 100 пъти (10/100 = 0,1 = 10%), нали?

Също така нивата на значимост се наричат ​​процентил, например 1% процентил или 5% процентил. Тази номенклатура се използва широко за изчисляване на метриката на рисковата стойност (VaR).

Произволни и непроизволни

Нивата на значимост могат да бъдат произволни и не произволни. Произволните са стойностите, които избираме априори (преди) знаейки характеристиките на експеримента. В този случай това би било преди изчисляването на тестовата статистика. Непроизволните са тези, които са получени в резултат на експеримента. В този случай р-стойността, тъй като зависи от стойността, взета от тестовата статистика. И двете зависят от разпределението, което данните следват.