Доверителният интервал е техника за оценка, използвана при статистическото заключение, която позволява да се ограничи двойка или няколко двойки стойности, в рамките на които ще бъде намерена желаната точкова оценка (с определена вероятност).
Доверителен интервал ще ни позволи да изчислим две стойности около средната стойност на пробата (една горна и една долна). Тези стойности ще ограничат диапазон, в който с определена вероятност ще бъде разположен параметърът на популацията.
Доверителен интервал = средна стойност + - грешка
Познаването на истинското население като цяло е нещо много сложно. Помислете за население от 4 милиона души. Можем ли да знаем средните разходи за потребление на домакинство от това население? По принцип да. Просто ще трябва да изследваме всички домакинства и да изчислим средната стойност. Следването на този процес обаче би било изключително трудоемко и би направило проучването доста сложно.
В подобни ситуации е по-възможно да се избере статистическа извадка. Например 500 души. И върху посочената проба изчислете средната стойност. Въпреки че все още не бихме знаели истинската стойност на популацията, бихме могли да предположим, че тя ще бъде близка до стойността на извадката. Към това означава, че добавяме граница на грешка и имаме стойност на доверителен интервал. От друга страна, изваждаме тази грешка от средната стойност и ще имаме друга стойност. Между тези две стойности ще бъде средната популация.
В заключение, интервалът на доверие не служи за даване на точкова оценка на параметъра на популацията, ако ще ни помогне да получим приблизителна представа кой може да е истинският. Позволява ни да ограничим между две стойности, където ще бъде намерена средната стойност на популацията.
коефициент на вариацияКумулативна честотаФактори, от които зависи доверителният интервал
Изчисляването на доверителен интервал зависи главно от следните фактори:
- Избран размер на извадката: В зависимост от количеството данни, използвано за изчисляване на стойността на извадката, тя ще бъде повече или по-малко близка до истинския параметър на популацията.
- Ниво на увереност: Той ще ни информира в какъв процент от случаите нашата оценка е вярна. Обичайните нива са 95% и 99%.
- Допустима грешка на нашата оценка: Това се нарича алфа и ни информира за вероятността стойността на популацията да е извън нашия диапазон.
- Оценената в извадката (средна стойност, отклонение, разлика в средните стойности …): Статистиката на ос за изчисляване на интервала ще зависи от това.
Пример за доверителен интервал за средната стойност, приемайки нормалност и стандартно отклонение, известни
Статистиката на ос, използвана за изчислението, ще бъде следната:
Полученият интервал ще бъде следният:
Виждаме как в интервала отляво и отдясно на неравенството имаме съответно долната и горната граница. Следователно изразът ни казва, че вероятността средното население да се намира между тези стойности е 1-алфа (ниво на доверие).
Нека разгледаме по-добре горното с упражнение, решено като пример.
Искате да изчислите средното време, необходимо на бегача, за да завърши маратон. За това са планирани 10 маратона и са получени средно 4 часа със стандартно отклонение от 33 минути (0,55 часа). Искате да получите 95% доверителен интервал.
За да получим интервала, трябва само да заместим данните във формулата на интервала.
Доверителният интервал би бил частта от разпределението, която е засенчена в синьо. Двете стойности, ограничени от това, ще бъдат тези, съответстващи на 2-те червени линии. Централната линия, която разделя разпределението на 2, би била истинската стойност на популацията.
Важно е да се отбележи, че в този случай, като се има предвид, че функцията на плътността на разпределението N (0,1) ни дава кумулативната вероятност (отляво до критичната стойност), трябва да намерим стойността, която ни оставя 0,975 на лявата% (това е 1,96).