Теорема за централната граница (TCL)

Съдържание:

Теорема за централната граница (TCL)
Теорема за централната граница (TCL)
Anonim

Теоремата за централната граница (TCL) е статистическа теория, която гласи, че при достатъчно голяма случайна извадка от популацията разпределението на средствата от извадката ще следва нормално разпределение.

Освен това, TCL заявява, че с увеличаване на размера на извадката средната стойност на извадката ще се доближи до средната популация. Следователно, чрез TCL можем да определим разпределението на средната стойност на пробата на определена популация с известна дисперсия. Така че разпределението ще следва нормално разпределение, ако размерът на извадката е достатъчно голям.

Основни свойства на централната гранична теорема

Теоремата за централната граница има поредица от много полезни свойства в статистическото и вероятностното поле. Основните са:

  • Ако размерът на пробата е достатъчно голям, разпределението на пробата означава приблизително да следва нормално разпределение. TCL счита пробата за голяма, когато нейният размер е по-голям от 30. Следователно, ако пробата е по-голяма от 30, средната стойност на пробата ще има функция на разпределение, близка до нормалната. И това е вярно, независимо от формата на дистрибуцията, с която работим.
  • Средното за популацията и средното за извадката ще бъдат еднакви. Тоест, средната стойност на разпределението на всички извадкови средства ще бъде равна на средната стойност на общата популация.
  • Дисперсията на разпределението на средните стойности на пробата ще бъде σ² / n. Което е дисперсията на популацията, разделена на размера на извадката.

Това, че разпределението на пробата означава, че прилича на нормално, е изключително полезно. Тъй като нормалното разпределение е много лесно да се приложи за извършване на тестове за хипотези и изграждане на доверителни интервали. В статистиката нормалното разпределение е доста важно, тъй като много статистики изискват този вид разпределение. В допълнение, TCL ще ни позволи да направим извод за средното за популацията чрез средното на извадката. И това е много полезно, когато поради липса на средства не можем да събираме данни от цяла популация.

Пример за централната гранична теорема

Нека си представим, че искаме да анализираме историческата средна възвръщаемост на индекса S&P 500, който, както знаем, има около 500 компании в него. Но нямаме достатъчно информация, за да анализираме всички 500 компании в индекса. В този случай средната рентабилност на S&P 500 ще бъде средната за населението.

Сега, следвайки TCL, можем да вземем проба от тези 500 компании, за да извършим анализа. Единственото ограничение, което имаме, е, че в извадката трябва да има повече от 30 компании, за да бъде изпълнена теоремата. Така че нека си представим, че произволно избираме 50 компании от индекса и повтаряме процеса няколко пъти. Стъпките, които трябва да следвате в примера, ще бъдат следните:

  • Избираме извадката от около 50 компании и получаваме средната рентабилност на цялата извадка.
  • Ние непрекъснато избираме 50 компании и получаваме средна рентабилност.
  • Разпределението на всички средни възвръщаемости на всички избрани проби ще бъде приблизително нормално разпределение.
  • Средната възвръщаемост на всички избрани извадки ще се доближи до средната възвръщаемост на общия индекс. Както е показано от централната гранична теорема.

Следователно, като заключим от средната възвръщаемост на извадката, можем да се доближим до средната възвръщаемост на индекса.