Статистически знак - какво представлява, определение и понятие

Съдържание:

Статистически знак - какво представлява, определение и понятие
Статистически знак - какво представлява, определение и понятие
Anonim

Статистическата извадка е подмножество от данни, принадлежащи към съвкупност от данни. Статистически погледнато, тя трябва да се състои от определен брой наблюдения, които адекватно представляват общите данни.

Статистиката като клон на математиката отговаря за събирането на данни, подреждането и анализа им. С други думи, когато искаме да изучим определен феномен, ние се обръщаме към статистиката. Добър пример за изследван от статистиката феномен е средната заплата на гражданите на дадена държава

В този смисъл, поради причини и време, не можем да съберем всички данни. Тази съвкупност от данни е това, което е известно като популация от данни или просто популация.

Защо работите със статистически извадки?

За да обясним защо се използва статистическа извадка вместо общата популация, ще прибегнем до примера, повдигнат по-горе.

Да предположим, че искаме да изучим всяко явление. В нашия случай това явление е средната заплата на гражданите на дадена държава. Популацията от данни се състои от всеки работник в страната. Разбира се, поради причини и време би било невъзможно да попитаме всеки работник каква е годишната му заплата. Ще отнеме много време или ще ни трябват много ресурси.

На този етап се появява концепцията за статистическа извадка. Вместо да питаме милионите работници в дадена държава или регион, ние събираме само малко количество данни. Например попитахме 100 000 души. Тази задача все още е сложна, но е много по-достъпно да се искат 100 000 души, отколкото 30 милиона.

Това малко количество данни трябва да бъде представително. Тоест, тя трябва да представлява адекватно населението. Ако 100 000 души, които поискахме, са съсредоточени в богати квартали, ще получим данни, които не са представителни. Средната заплата би била много по-висока, отколкото е в действителност.

Характеристики на представителна статистическа извадка

Ако искате да направите добро проучване, качеството на статистическата извадка е от съществено значение. Безполезно е да се извършват най-сложните статистически показатели с най-сложните модели, ако статистическата извадка е предубедена. Тоест, ако пробата не е представителна.

При получаване на представителна извадка има определени аспекти, които изследователят трябва да знае предварително. Сред тези аспекти са характеристиките на представителна извадка. Характеристиките на представителна извадка са както следва:

  • Достатъчно голям размер: Когато работим с извадки, обикновено работим с количество данни, което е по-малко от популацията. Въпреки това, за да бъде статистическата извадка представителна, тя трябва да е достатъчно голяма, за да се счита за представителна. Например, ако нашата популация се състои от 10 милиона данни и ние изберем 10, е трудно тя да бъде представителна. Разбира се, по-голямата извадка не винаги е по-представителна.
  • Случайност: Изборът на данни от статистическа извадка трябва да бъде случаен. Тоест трябва да е напълно произволно. Ако вместо да го правим на случаен принцип, ние извършваме планиран процес за избор на данни, ние въвеждаме пристрастия към събирането на данни. Следователно, за да избегнем пристрастността на извадката и следователно, за да я направим представителна извадка, трябва да направим произволен избор.

Статистическо заключение

Веднъж получени имаме представителна извадка, тогава е необходимо да се направят изводи за определени показатели. Често ни интересува да знаем определена мярка на променлива. В първоначалния пример променливата би била заплатата на гражданите на дадена държава. В този смисъл показателят, който искаме да анализираме, е средната заплата на гражданите на дадена държава.

С други думи, имаме популация от данни, съставена от всички работници в Мексико. От това население получаваме променлива, т.е. годишната заплата. Използвайки подходящите техники, ние получаваме представителна проба. И накрая, след като имаме набор от данни, с който можем да работим, използваме статистически техники за извод, за да изчислим средната заплата.

Разбира се, след като разполагаме с набора от данни, бихме могли да заключим и за други мерки. Например как се разпределя заплатата, какъв процент работници са под определена заплата или колко голяма е разликата в заплатите.

Пример за статистическа извадка

Да предположим, че искаме да проведем проучване на средните разходи на колумбийските семейства през месец януари. За това имаме две възможности:

  1. Въведете банковите сметки на всички семейства в Колумбия
  2. Попитайте представителния брой хора

Първият вариант не е жизнеспособен по няколко причини. Първо, че семействата няма да се откажат от данните си и второ, че и ние не бихме могли да ходим на семейство, гледайки данните. Главно, защото населението на Колумбия е близо 50 милиона. Междувременно втората е опцията за събиране на статистическа извадка.

Това, което ще направим, следвайки посочените по-горе характеристики, ще бъде да попитаме 100 000 семейства. Донякъде е сложно, но много по-лесно, отколкото да се искат 50 милиона колумбийци. Разликата е значителна. По този начин, въз основа на тази извадка от 100 000 семейства, ще се опитаме да изчислим средните разходи на семействата през януари.

Извлечените данни ще бъдат повече или по-малко надеждни според поредица от показатели, които се вземат предвид при статистическите изследвания. Разбира се, тези видове показатели са по-напреднали и следователно няма да ги обсъждаме тук.