Pielāgots R kvadrāts (koriģēts noteikšanas koeficients) 2021. gads

Satura rādītājs:

Pielāgots R kvadrāts (koriģēts noteikšanas koeficients) 2021. gads
Pielāgots R kvadrāts (koriģēts noteikšanas koeficients) 2021. gads
Anonim

Pielāgotais R kvadrāts (vai koriģētais noteikšanas koeficients) tiek izmantots daudzkārtējā regresijā, lai noskaidrotu neatkarīgo mainīgo intensitātes vai efektivitātes pakāpi, skaidrojot atkarīgo mainīgo.

Vienkāršāk sakot, koriģētais R kvadrāts mums norāda, cik procentus no atkarīgā mainīgā variācijas kolektīvi izskaidro visi neatkarīgie mainīgie.

Šī koeficienta izmantošana ir pamatota ar to, ka, regresijai pievienojot mainīgos, nepielāgotais noteikšanas koeficients mēdz palielināties. Pat tad, ja katra jaunā pievienotā mainīgā lieluma ieguldījumam nav statistikas nozīmes.

Tāpēc, modelim pievienojot mainīgos, noteikšanas koeficients varētu palielināties, un mēs kļūdaini varētu domāt, ka izvēlētais mainīgo lielumu kopums spēj izskaidrot lielāku daļu no neatkarīgā mainīgā lieluma. Šo problēmu parasti sauc par “modeļa pārvērtēšanu”.

Variācijas koeficientsRegresijas analīze

Pielāgota noteikšanas koeficienta formula

Lai atrisinātu iepriekš aprakstīto problēmu, daudzi pētnieki iesaka pielāgot noteikšanas koeficientu, izmantojot šādu formulu:

R2 uz → Pielāgots R kvadrātā vai koriģēts noteikšanas koeficients

R2 → R kvadrātā vai noteikšanas koeficients

n → Novērojumu skaits izlasē

k → Neatkarīgo mainīgo skaits

Ņemot vērā, ka 1-R2 ir nemainīgs skaitlis, un, tā kā n ir lielāks par k, modelim pievienojot mainīgos, iekavās esošais koeficients kļūst lielāks. Sekojoši. arī rezultāts, reizinot to ar 1-R2 . Ar kuru mēs redzam, ka formula ir veidota, lai pielāgotu un sodītu koeficientu iekļaušanu modelī.

Papildus iepriekšējai priekšrocībai iepriekšējā formulā izmantotā korekcija ļauj mums arī salīdzināt modeļus ar atšķirīgu neatkarīgo mainīgo skaitu. Atkal šī formula koriģē mainīgo skaitu starp vienu modeli un citu un ļauj mums veikt viendabīgu salīdzinājumu.

Atgriežoties pie iepriekšējās formulas, mēs varam secināt, ka koriģētais noteikšanas koeficients vienmēr būs vienāds vai mazāks par R koeficientu2. Atšķirībā no noteikšanas koeficienta, kas svārstās no 0 līdz 1, koriģētais noteikšanas koeficients varētu būt negatīvs divu iemeslu dēļ:

  • Jo tuvāk k tuvojas n.
  • Zemāks noteikšanas koeficients.
Lineārās korelācijas koeficients