Достатъчна статистика - какво представлява, определение и концепция

Достатъчна статистика за параметър Θ е тази, способна да събира или обобщава цялата информация, която извадката на случайна променлива X съдържа.

Знаем, че статистиката е реална функция на извадката. Тоест взема реални стойности, съдържащи се в извадката. Оттам, както видяхме в статията, в която се дефинира понятието статистика, трябва да гарантираме, че статистикът има определени свойства. Защо да изисквате такива имоти? За да гарантираме, че статистическите данни са полезни за нашите цели.

Достатъчността е едно от тези свойства. По много по-опростен начин ще кажем, че статистиката е достатъчна, ако използва цялата информация, съдържаща се в извадката.

Как да разбера дали статистиката е достатъчна?

Логично възникващият въпрос е: Как мога да разбера дали Т статистика отговаря на свойството за достатъчност? Или Как мога да намеря, ако съществува, статистика, която отговаря на свойството за достатъчност. Отговорът на тези два въпроса се намира в две теореми:

  • Критерий за факторизация на Фишър-Нейман: Този критерий гласи, че при дадена статистика Т, ако отговаря на определени условия, тогава тя ще бъде достатъчна статистика.
  • Теорема на Дармуа: Тази теорема отговаря на втория въпрос. Тоест, позволява ни да намерим достатъчна статистика чрез поредица от процедури.

Пример за достатъчна статистика

Да предположим, че искаме да изчислим средногодишния доход на семейства, пребиваващи в Чили. За целта ще следваме следния процес:

  1. Събиране на информация (проба): Тъй като не можем да попитаме всяко семейство, пребиваващо в Чили, колко печелят годишно, ще вземем представителна извадка от примерно 1000 семейства.
  2. Идентифицирайте изследваната случайна променлива: Проучваната случайна променлива е семейният доход. По този начин: X → Семеен доход
  3. Изберете правилната статистика: Подходящата статистика за изчисляване на средния доход е не друго, а очакването на X. С други думи, примерната средна стойност на X.
  4. Как мога да разбера дали статистическата извадка е достатъчна? Тъй като вече имаме математическия израз на статистиката, ще използваме критерия за факториране на Фишер-Нейман. Или теоремата за Дармуа. Те са формули, създадени за тази цел.

След прилагане на правилните изчисления, стигаме до заключението, че средните статистически данни на пробата отговарят на изискването или свойството на достатъчността. Като гарантираме, че отговаря на това изискване, ние гарантираме, че тази (статистическа) функция, която ни позволява да синтезираме информацията (средният доход), използва цялата информация, съдържаща се в извадката (1000 семейства).

Защо е важно да използвам цялата информация в извадката?

Сега, след като знаем, че примерното средно е достатъчна статистика, нека приемем случай. Какъв смисъл би имало да искаме да изчислим средния доход въз основа на тези 1000 чилийски семейства и че използваме данните само на 500 семейства?

Разбира се, нямаше да има смисъл. Искаме обобщение на цялата информация. Тоест това, което определихме като достатъчна статистика.

Популярни Публикации