Bajesa informācijas kritērijs 2021. gads

Bajesa informācijas kritērijs vai Švarca kritērijs ir metode, kas koncentrējas uz atlikumu kvadrātu summu, lai atrastu aizkavēto periodu skaitu lpp kas samazina šo modeli.

Citiem vārdiem sakot, mēs vēlamies atrast minimālo atlikto periodu skaitu, ko mēs iekļaujam autoregresijā, lai palīdzētu mums prognozēt atkarīgo mainīgo.

Tādā veidā mums būs kontrole pār aizkavēto periodu skaitu lpp ka mēs iekļaujamies regresā. Kad mēs pārsniegsim šo optimālo līmeni, Schwarz modelis pārstās samazināties, un tāpēc mēs būsim sasnieguši minimumu. Tas ir, mēs būsim sasnieguši atpalikušo periodu skaitu lpp kas samazina Schwarz modeli.

To sauc arī par Bayes informācijas kritēriju (BIC).

Ieteicamie raksti: autoregresija, atlikumu kvadrātu summa (SCE).

Bajesa informācijas kritērija formula

Lai gan no pirmā acu uzmetiena tā šķiet sarežģīta formula, mēs to aplūkosim, lai to saprastu. Pirmkārt, mums vispārīgi ir:

  • Abos formulas faktoros esošie logaritmi atspoguļo novēlota perioda iekļaušanas marginālo efektu lpp vairāk sevis regresā.
  • N ir kopējais novērojumu skaits.
  • Mēs varam sadalīt formulu divās daļās: kreisajā un labajā.

Daļa kreisajā pusē:

Attēlo autoregresijas atlikumu kvadrātu summu (SCE)lpp kavētie periodi, dalīti ar kopējo novērojumu skaitu (N).

Lai novērtētu koeficientus, mēs izmantojam parastos mazākos kvadrātus (OLS). Tātad, kad mēs iekļaujam jaunus novēlotus periodus, SCE (p) var saglabāt vai samazināt tikai.

Tad novēlota perioda pieaugums autoregresijā izraisa:

  • SCE (p): samazinās vai paliek nemainīgs.
  • Noteikšanas koeficients: palielinās.
  • KOPĀ IETEKME: novēlota perioda palielināšanās izraisa formulas kreisās daļas samazināšanos.

Tagad pareizā daļa:

(p + 1) parāda kopējo koeficientu skaitu autoregresijā, tas ir, regresorus ar novēlotiem periodiem (lpp) un pārtveršana (1).

Tad novēlota perioda pieaugums autoregresijā izraisa:

  • (p + 1): palielinās, jo mēs iekļaujam novēlotu periodu.
  • KOPĀ IETEKME: novēlota perioda palielināšanās izraisa formulas labās daļas pieaugumu.

Praktisks piemērs

Mēs pieņemam, ka mēs vēlamies izteikt prognozi parslēpošanas caurlaides nākamajai 2020. gada sezonai ar 5 gadu izlasi, bet mēs nezinām, cik lag periodus izmantot: AR (2) vai AR (3)?

  • Mēs lejupielādējam datus un aprēķinām KM cenu naturālos logaritmus slēpošanas caurlaides.

1. Mēs novērtējam koeficientus, izmantojot OLS, un iegūstam:

Atlikumu kvadrātu summa (SCE) AR (2) = 0,0111753112

AR (2) noteikšanas koeficients = 0,085

2. Lai redzētu, kā mainās SCE, pievienojam vēl 1 novēlotu periodu:

AR (3) atlikumu kvadrātu summa = 0,006805295

AR noteikšanas koeficients (3) = 0,47

Mēs varam redzēt, ka, pievienojot novēlotu periodu autoregresijā, noteikšanas koeficients palielinās un SCE šajā gadījumā samazinās.

  • Mēs aprēķinām Bajesa informācijas kritēriju:

Jo mazāks BIC modelis, jo labāk izvēlēts modelis. Tad AR (3) būtu vēlamais modelis attiecībā pret AR (2), ņemot vērā, ka tā noteikšanas koeficients ir lielāks, SCE ir mazāks un Švarca modeļa vai Bajesa informācijas kritērijs arī ir zemāks.

Jums palīdzēs attīstību vietā, daloties lapu ar draugiem

wave wave wave wave wave