Статистическият процес е набор от етапи или фази, които трябва да бъдат завършени, за да се извърши разследване, основаващо се на количествена информация и да се получат резултати, които са верни на изследваната реалност.
Когато говорим за статистическия процес, ние говорим за поредица от стъпки, които е препоръчително да се извършат, за да се получат резултати, които са верни на реалността, която изучаваме в статистическото проучване, което е предназначено да бъде извършено. Това е необходимо, тъй като ако не изпълним тези стъпки, можем да получим грешни заключения и следователно да вземем лоши решения.
Например, нека си представим, че имаме салон за сладолед. Трябва приблизително да знаем колко сладолед трябва да купим въз основа на количеството търсене, което ще имаме. Така че, ако не успеем, клиентите могат да се свържат с когото трябва да им кажем, че в този салон за сладолед няма сладолед. Напротив, ако имаме твърде много, може да се развали. Ето защо е необходимо да се опитаме да преценим колко трябва да купим или поне приблизителен диапазон. Ако изчислим този диапазон, събираме данни, които не са представителни (например сладоледена зала, намираща се в друг град с по-малко богатство), бихме могли да сгрешим.
Така че, имайки това ясно, ние трябва да знаем поредицата от стъпки и подробности, които трябва да следваме, така че резултатите да се адаптират към реалността и да вземаме по-добри решения.
Етапи на статистическия процес
В зависимост от посетеното ръководство или автора можем да видим различни етапи с различни имена. По същество почти всички документи по темата включват едни и същи раздели, само че някои включват няколко фази в една, а други фрагментират процеса повече.
В нашия случай считаме, че статистическият процес се състои от:
Декларация за проблема
В постановката на проблема е разположена централната ос, върху която да се артикулира всичко останало. Тази фаза отговаря на следния въпрос: Какво трябва да уча и защо? Понякога, колкото и невероятно да изглежда проблемът, това може да ни доведе до заключението, че всъщност не е нужно да правим статистическо проучване.
Събиране на данни
След като повдигнем проблема, трябва да съберем данните. Тук е важна методологията. Така че има различни съображения. По този начин трябва да установим вида на извадката, размера на извадката, вида на събирането на данни (например чрез бази данни или персонализирани проучвания), лично, онлайн или по телефона и т.н.
Организиране на данни
След като разполагаме с всички данни, остава да ги обединим и организираме. Както във всичко, трябва да въведем данните в програма или платформа, която след това ни позволява да изчислим определени показатели и да анализираме правилно. За да направите това, винаги е удобно да организирате данните. Нещо повече, понякога ще трябва да събираме данни от различни бази данни, които предлагат различни файлови формати и ще е необходимо да обединим всичко в същия формат.
Анализ на данни
След като проблемът бъде повдигнат, данните събрани и организирани, ние можем да ги анализираме ефективно. В зависимост от постановката на проблема ще се извърши един или друг вид анализ. Например, ако искаме да знаем дали две променливи са зависими, бихме могли да използваме анализ на коинтеграция. Докато ако това, което искаме да проучим, е общото разпръскване на финансов актив, ние ще изчислим статистическия диапазон.
Тълкуване на данните
Не на последно място имаме интерпретацията на данните. Безполезно е да се извършват правилно всички фази на статистическия процес, ако в крайна сметка тълкуването е грешно. Това е така, защото ако тълкуването е грешно, тогава решенията ще имат нежелан ефект. Да предположим например, че провеждаме проучване за променливостта на продажбите на дадена компания. Ако след като получим резултатите се окаже, че има много дисперсия, тя трябва да бъде намалена и ние тълкуваме, че не е, това може да се отрази негативно на компанията.
Петте стъпки са отразени в следната диаграма:
Описателна статистика