Statistikas zīme - kas tas ir, definīcija un jēdziens 2021. gads

Satura rādītājs:

Statistikas zīme - kas tas ir, definīcija un jēdziens 2021. gads
Statistikas zīme - kas tas ir, definīcija un jēdziens 2021. gads
Anonim

Statistikas izlase ir datu apakškopa, kas pieder datu kopai. Statistiski runājot, tas jāsastāv no noteikta novērojumu skaita, kas pienācīgi atspoguļo kopējos datus.

Statistika kā matemātikas nozare ir atbildīga par datu vākšanu, to pasūtīšanu un analīzi. Citiem vārdiem sakot, kad mēs vēlamies izpētīt noteiktu parādību, mēs pievēršamies statistikai. Labs statistikas pētītā fenomena piemērs ir valsts pilsoņu vidējā alga

Šajā ziņā laika un izmaksu dēļ mēs nevaram apkopot visus datus. Šī datu kopa ir tā dēvētā datu kopa vai vienkārši populācija.

Kāpēc jūs strādājat ar statistikas paraugiem?

Lai izskaidrotu, kāpēc kopējā iedzīvotāju skaita vietā tiek izmantota statistikas izlase, mēs izmantosim iepriekš minēto piemēru.

Pieņemsim, ka mēs vēlamies izpētīt jebkuru parādību. Mūsu gadījumā šī parādība ir valsts pilsoņu vidējā alga. Datu kopumu veido katrs darba ņēmējs valstī. Protams, laika un izmaksu dēļ nebūtu iespējams pajautāt katram darba ņēmējam gada algu. Tas prasītu daudz laika, vai arī mums būtu vajadzīgi daudz resursu.

Šajā brīdī parādās statistiskās izlases jēdziens. Tā vietā, lai jautātu miljoniem darba ņēmēju kādā valstī vai reģionā, mēs apkopojam tikai nelielu datu apjomu. Piemēram, mēs lūdzām 100 000 cilvēku. Šis uzdevums joprojām ir sarežģīts, taču daudz izdevīgāk ir lūgt 100 000 cilvēku nekā prasīt 30 miljonus.

Šim nelielajam datu apjomam jābūt reprezentatīvam. Tas ir, tai ir pienācīgi jāpārstāv iedzīvotāji. Ja 100 000 cilvēku, kuriem mēs lūdzām, ir koncentrēti turīgos rajonos, mēs iegūsim datus, kas nav reprezentatīvi. Vidējā alga būtu daudz lielāka nekā patiesībā.

Reprezentatīvās statistiskās izlases raksturojums

Ja vēlaties veikt labu pētījumu, statistikas parauga kvalitāte ir būtiska. Ja statistikas izlase ir neobjektīva, ir bezjēdzīgi veikt vissarežģītāko statistikas metriku ar vismodernākajiem modeļiem. Tas ir, ja izlase nav reprezentatīva.

Iegūstot reprezentatīvu izlasi, pētniekam ir jāzina iepriekš. Starp šiem aspektiem ir reprezentatīvās izlases raksturojums. Reprezentatīvās izlases raksturojums ir šāds:

  • Pietiekami liels izmērs: Strādājot ar izlasēm, mēs parasti strādājam ar datu daudzumu, kas ir mazāks par populāciju. Tomēr, lai statistikas izlase būtu reprezentatīva, tai jābūt pietiekami lielai, lai to varētu uzskatīt par reprezentatīvu. Piemēram, ja mūsu populāciju veido 10 miljoni datu, un mēs izvēlamies 10, tam ir grūti būt reprezentatīvam. Protams, jo lielāka izlase ne vienmēr ir reprezentatīvāka.
  • Nejaušība: Datu atlasei no statistiskās izlases jābūt nejaušai. Tas ir, tam jābūt pilnīgi nejaušam. Ja tā vietā, lai to izdarītu nejauši, mēs veicam plānoto datu atlases procesu, mēs ieviešam neobjektivitāti datu vākšanā. Tāpēc, lai izvairītos no tā, ka izlase ir neobjektīva, un tāpēc, lai to padarītu par reprezentatīvu izlasi, mums jāveic nejauša atlase.

Statistikas secinājums

Kad tas ir iegūts, mums ir reprezentatīvs paraugs, tad ir nepieciešams secināt noteiktus rādītājus. Bieži vien mēs esam ieinteresēti zināt noteiktu mainīgā lielumu. Sākotnējā piemērā mainīgais būtu kādas valsts pilsoņu alga. Šajā ziņā metrika, kuru mēs vēlamies analizēt, ir valsts pilsoņu vidējā alga.

Citiem vārdiem sakot, mums ir datu kopa, kuru veido visi strādājošie Meksikā. No šīs populācijas mēs iegūstam mainīgo, tas ir, gada algu. Izmantojot piemērotus paņēmienus, iegūstam reprezentatīvu paraugu. Un visbeidzot, kad mums ir datu kopa, ar kuru mēs varam strādāt, mēs izmantojam statistikas secināšanas paņēmienus, lai aprēķinātu vidējo algu.

Protams, kad mums būs datu kopa, mēs varētu secināt par citiem pasākumiem. Piemēram, kā tiek sadalīta alga, cik procentu strādājošo ir zem noteiktas algas vai cik liela ir algu atšķirība.

Statistikas parauga piemērs

Pieņemsim, ka mēs vēlamies veikt pētījumu par Kolumbijas ģimeņu vidējiem izdevumiem janvārī. Tam mums ir divas iespējas:

  1. Ievadiet visu Kolumbijas ģimeņu bankas kontus
  2. Jautājiet reprezentatīvam cilvēku skaitam

Pirmais variants nav dzīvotspējīgs vairāku iemeslu dēļ. Pirmkārt, tas, ka ģimenes negrasās atteikties no saviem datiem, un, otrkārt, ka mēs arī nevarējām iet ģimenes lokā, skatoties arī datus. Galvenokārt tāpēc, ka Kolumbijas iedzīvotāju skaits ir tuvu 50 miljoniem. Tikmēr otrā ir iespēja apkopot statistikas paraugu.

Tas, ko mēs darīsim, ievērojot iepriekš minētās īpašības, būs lūgt 100 000 ģimeņu. Tas ir nedaudz sarežģīti, bet daudz vieglāk nekā jautāt 50 miljoniem kolumbiešu. Atšķirība ir ievērojama. Tādējādi, pamatojoties uz šo 100 000 ģimeņu izlasi, mēs centīsimies aprēķināt ģimeņu vidējos izdevumus janvārī.

Iegūtie dati būs vairāk vai mazāk ticami saskaņā ar metrikas sēriju, kas tiek ņemta vērā statistikas pētījumos. Protams, šāda veida metrika ir uzlabota, un tāpēc mēs tos šeit neapspriedīsim.