Обикновена случайна извадка - какво е това, определение и концепция

Съдържание:

Anonim

Като се има предвид случайна променлива X, обикновена случайна извадка е набор от случайни променливи, независими и идентично разпределени, получени от случайната променлива X и които се разпределят по същия начин.

Формално предишната дефиниция е тази, която определя обикновена случайна извадка. Сега всъщност понятието може да бъде дефинирано по-просто. Разбира се, за да разберем правилно концепцията за обикновена случайна извадка е важно да я дефинираме точно.

Тъй като официалната дефиниция е сложна, ще развихрим всяка част от дефиницията малко по малко.

Простата концепция за случайни проби стъпка по стъпка

По този начин, на първо място, трябва да вземем предвид, че обикновена случайна извадка е извадка. Като извадка се получава от случайна променлива. Нарекохме тази случайна променлива X. Пример за произволна променлива може да бъде оценката по математика на ученици в гимназията. Следователно първата част от определението е ясна. Обикновена случайна извадка е извадка, получена от произволна случайна променлива.

Втората част на определението е по-сложна. Преди всичко от понятията „независим и идентично разпределен случаен“. Понятието случаен означава случайност. Тъй като пробата е получена на случаен принцип, променливите следователно са произволни. Понятието независим се отнася до факта, че получените данни не са свързани помежду си. Тоест изборът на определени данни не зависи от данните, които са били избрани по-рано или ще бъдат избрани по-късно. И накрая, идентично разпределено се отнася до статистическото разпределение, което е същото.

В обобщение имаме, че обикновена произволна извадка е извадка, която е получена по напълно случаен начин. По този начин данните, които съставляват извадката, не са свързани помежду си и наследяват характеристиките на случайната променлива на популацията X.

Защо простата концепция за произволна извадка е толкова важна?

Когато искаме да проведем изследвания върху определени характеристики на набор от данни, качеството на пробата е от съществено значение. За да бъдат изчислените показатели и следователно заключенията от изследването надеждни, трябва да имаме това, което е известно като представителна извадка. Тоест, извадка, която адекватно представя характеристиките на общото население.

Една от основните характеристики на представителната извадка е, че тя е произволна. Следователно, познаването на концепцията за обикновена случайна извадка е от жизненоважно значение за нашето изследване, за да бъде валидно в научната общност.

Прост случаен пример

Да предположим, че искаме да проведем проучване на месечните заплати на гражданите на дадена държава. Нашата случайна променлива ще бъде месечната заплата на гражданите.

Примерната концепция възниква поради невъзможността да се попита всеки един от гражданите на дадена държава. Това би отнело много време или много финансови ресурси. Затова вместо да поискаме 50 милиона души, решихме да поискаме 50 000.

След като дефинираме променливата, върху която ще работим, и популацията от данни, трябва да продължим, за да получим извадката. Има обширна литература за получаване на правилната проба. Но тъй като целта на това определение е да подходим към тази концепция по прост начин, няма да навлизаме в въпроса.

Като опростим много, като цяло ще имаме две възможности. Или попитайте гражданите по напълно случаен начин или изберете процес на подбор. За да отговаря пробата на критерия „произволен“, трябва да го направим напълно произволно. Не можем да избираме градове, зони, квартали или каквото и да било.

Ако изберем процеса на подбор съзнателно, тогава нашата извадка вероятно ще бъде пристрастна. Правилното нещо би било да се използва инструмент, който произволно извлича имената на гражданите.

След като имаме нашата проста случайна извадка, тогава трябва да работим с данните. Тоест направете статистически изводи. Това статистическо заключение ще ни позволи да направим заключения от проучването. Например изявления като: „средната месечна заплата в Испания е 1200 евро“ или „само 5% от гражданите с най-високи заплати печелят еквивалента на най-бедните 30%“.

Всичко това с ясна граница на грешка. Но за това вече се погрижи статистическото заключение.