Pietiekama statistika - kāda tā ir, definīcija un jēdziens 2021. gads

Satura rādītājs:

Anonim

Parametra Θ pietiekama statistika spēj apkopot vai apkopot visu informāciju, ko satur nejauša mainīgā X izlase.

Mēs zinām, ka statistika ir reāla izlases funkcija. Tas ir, tas prasa reālās vērtības, kas ietvertas izlasē. Turpmāk, kā mēs redzējām rakstā, kurā definēts statistikas jēdziens, mums jānodrošina, lai statistiķim būtu noteiktas īpašības. Kāpēc pieprasīt šādus īpašumus? Lai nodrošinātu, ka statistika ir noderīga mūsu mērķiem.

Pietiekamība ir viena no šīm īpašībām. Daudz vienkāršākā veidā mēs teiksim, ka statistika ir pietiekama, ja tā izmanto visu izlasē ietverto informāciju.

Kā uzzināt, vai pietiek ar statistiku?

Loģiski, ka rodas jautājums: kā es varu uzzināt, vai T statistika atbilst pietiekamības īpašībai? Vai kā es varu atrast statistiku, ja tā pastāv, kas atbilst pietiekamības īpašībai. Atbilde uz šiem diviem jautājumiem ir atrodama divās teorēmās:

  • Fišera-Neimana faktorizācijas kritērijs: Šis kritērijs nosaka, ka, ņemot vērā statistiku T, ja tā atbilst noteiktiem nosacījumiem, tad tā būs pietiekama statistika.
  • Darmois teorēma: Šī teorēma atbild uz otro jautājumu. Tas nozīmē, ka tas ļauj mums atrast pietiekamu statistiku, izmantojot virkni procedūru.

Pietiekamas statistikas piemērs

Pieņemsim, ka mēs vēlamies aprēķināt Čīlē dzīvojošo ģimeņu vidējos gada ienākumus. Lai to izdarītu, mēs sekosim šādam procesam:

  1. Apkopot informāciju (paraugs): Tā kā mēs nevaram pajautāt katrai ģimenei, kas dzīvo Čīlē, cik viņi nopelna gadā, mēs ņemsim reprezentatīvu paraugu, piemēram, no 1000 ģimenēm.
  2. Identificējiet pētāmo izlases mainīgo: Izlases lielums, uz kuru attiecas pētījums, ir ģimenes ienākumi. Tādējādi: X → Ģimenes ienākumi
  3. Izvēlieties pareizo statistiku: Atbilstoša statistika vidējo ienākumu aprēķināšanai nav nekas cits kā sagaidāmais X. Citiem vārdiem sakot, X vidējais paraugs.
  4. Kā es varu zināt, vai izlases vidējā statistika ir pietiekama statistika? Tā kā mums jau ir statistikas matemātiskā izteiksme, mēs izmantosim Fišera-Neimana faktoringa kritēriju. Vai arī Darmoisa teorēma. Tās ir šim nolūkam izveidotas formulas.

Pēc pareizu aprēķinu izmantošanas mēs secinām, ka vidējā statistikas statistika atbilst pietiekamības prasībai vai īpašībai. Nodrošinot, ka tā atbilst šai prasībai, mēs nodrošinām, ka šī (statistiskā) funkcija, kas ļauj mums sintezēt informāciju (vidējos ienākumus), izmanto visu izlasē iekļauto informāciju (1000 ģimenes).

Kāpēc ir svarīgi, lai es izmantotu visu izlasē iekļauto informāciju?

Tagad, kad mēs zinām, ka izlases vidējā vērtība ir pietiekama statistika, pieņemsim gadījumu. Kāda jēga būtu vēlēties aprēķināt vidējos ienākumus, pamatojoties uz šīm 1000 Čīles ģimenēm un ka mēs izmantotu tikai 500 ģimeņu datus?

Protams, tam nebūtu nekādas jēgas. Mēs vēlamies apkopot visu informāciju. Tas ir, tas, ko mēs esam definējuši kā pietiekamu statistiku.