Statistiskā normalizācija - kas tas ir, definīcija un jēdziens 2021. gads

Satura rādītājs:

Anonim

Statistiskā normalizācija ir mainīgā sadalījuma mēroga transformācija, lai varētu veikt salīdzinājumus ar elementu kopām un vidējo, novēršot ietekmes ietekmi.

Citiem vārdiem sakot, normalizācija ir proporcijas bez mērvienībām (bez dimensijām vai nemainīgas mēroga), kas ļauj salīdzināt dažādu mainīgo un dažādu mērvienību elementus.

Statistikā un ekonometrijā tiek izmantotas standartizētas varbūtību sadalījuma tabulas, lai atrastu varbūtību, kādu novērojums veic, ņemot vērā sadalījuma funkciju, kurai mainīgais seko.

Ir svarīgi neierobežot normalizācijas terminu tikai ar elementu kopām, kur normālais sadalījums ir labs tuvinājums to biežumam.

Statistiskais mainīgais

Tabula

Šajā tabulā ir sīki aprakstītas statistikā visbiežāk izmantotās standartizācijas, ko piemēro finansēm un ekonomikai.

  • Tipizētais vai standarta rādītājs normalizē kļūdas, kad mēs varam aprēķināt parauga parametrus.
  • Normalizācija Studenta t sadalījumā normalizē atlikumus, kad parametri nav zināmi, un mēs veicam aplēsi, lai tos iegūtu.
  • Variācijas koeficients kā mēroga mērījumu izmanto vidējo, atšķirībā no standartizētā rādītāja un Studenta t, kur tiek izmantota standartnovirze. Sadalījums tiek normalizēts Puasona un eksponenciālajiem sadalījumiem.
  • Standartizēto momentu var piemērot jebkuram varbūtības sadalījumam, kam ir momentu ģenerējoša funkcija. Citiem vārdiem sakot, ka momentu integrāļi ir saplūstoši.

Pieteikumi

Cik reizes mēs esam lasījuši, ka normālais varbūtības sadalījums šķiet pietiekami labs tuvinājums novērojumu biežumam, un mums tiek lūgts atrast varbūtību, ka mainīgais X iegūst noteiktu vērtību?

Citiem vārdiem sakot, mēs iestatām X ~ N (μ, σ2), un mums tiek lūgts atrast P (X ≤ xi)

Mēs zinām, ka, lai atrastu P (X ≤ xi), mums ir jāmeklē varbūtība varbūtību sadalījuma tabulās. Šajā gadījumā parastā sadalījuma sadalījuma tabulās. Ekonometrikā un kvantitatīvajā finansēšanā visplašāk izmantotās varbūtību sadalījuma tabulas ir: chi-square, Student's t, Fisher-Snedecor F, Poisson, eksponenciālais, cauchy un standarta normāls.

Sadalījuma tabulās aprēķinātās varbūtības atbilst īpašumam:

Tas ir, varbūtības (skaitļi tabulā) ir tipizētas. Tad mums arī būs jāievada mainīgais atbilstoši sadalījuma funkcijas parametriem, ja mēs vēlamies atrast P varbūtību (X ≤ xi).

Praktisks piemērs

Mēs vēlamies uzzināt varbūtību, ka slēpotāju skaits, kas piektdienas rītā dodas slēpot, ir 288.

Slēpošanas kūrorts mums saka, ka slēpotāju mainīgā biežums var tuvināt vidējo 280 normālo sadalījumu un 16 dispersiju.

Tātad, mums ir:

X ~ N (μ, σ2)

kur X ir definēts kā mainīgais “slēpotāji”

Viņi mums prasa varbūtību, ka slēpotāju skaits, kas piektdien dodas slēpot, ir mazāks vai vienāds ar 288. Tas ir:

P (X ≤ 288)

Process

Lai atrastu varbūtību, ka slēpotāju skaits ir vienāds ar 288, mums vispirms ir jāievada mainīgais.

Tad mēs aplūkojam nepārtrauktā standarta normāla sadalījuma tabulu:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Varbūtība, ka piektdienas rītā 288 slēpotāji dosies slēpot, ņemot vērā vidējos un dispersijas parametrus, ir 97,72%.