Kvartiles novirze - kas tas ir, definīcija un jēdziens
Kvartiles novirze ir statistisks izkliedes mērs, kas atgriež starpkvartilu diapazona centrālo vērtību un tiek izmantots šķībās datu kopās.
Citiem vārdiem sakot, kvartiles novirze ir starpkvartilu diapazona (IQR) mediānas aprēķināšana, un to izmanto datu kopās ar diezgan daudzām galējām vērtībām.
Kvartila novirzes stenogramma ir DQ.
Starpkvartilu diapazons
Starpkvartilu diapazons ir datu kopas izkliedes mērs, ko parasti izmanto lodziņā. Citiem vārdiem sakot, starpkvartiles diapazons ir starpība starp priekšpēdējo un pirmo kvadrātā izmantoto sadalījuma kvartili.
IQR = Q3 - Q1
Starpkvartilu diapazona izmantošanas priekšrocība ir tā, ka var aprēķināt kvartiles novirzi (DQ), kas ir ļoti piemērots dispersijas mērs, ja mums ir tendenciozas datu kopas.
Kvartiles novirzes formula
Kvartiles novirzi aprēķina kā starpkvartiles diapazona dalījumu ar 2.
DQ = (Q3 - Q1) / 2 = RIC / 2
Tā kā mēs ņemam vērā tikai dispersiju starp trešo un pirmo kvartili, mēs ignorējam visus datus ārpus šī diapazona. Un tāpēc visas vērtības tuvojas ekstrēmumam. Tātad, sadalot starpkvartilu diapazonu ar diviem, mēs iegūsim dispersijas vidējo vērtību.
Kvartiles novirzes piemērs
Mēs pieņemam, ka mēs vēlamies aprēķināt starpkvartilu diapazonu un to kvartālu novirzi, kuri velosipēdisti gada laikā iet garām mūsu mājai.
- Pirmkārt, mēs skaitām velosipēdistus un apkopojam informāciju tabulā.

- Otrkārt, mēs aprēķinām pirmo un trešo kvartili, lai iegūtu starpkvartilu diapazonu.
Q3 = 550
Q1 = 200
IQR = Q3 - Q1 = 550 - 200 = 350
- Treškārt, mēs aprēķinām kvartiles dispersiju, vienkārši sadalot starpkvartiles diapazonu ar diviem.
DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175
Šīs datu kopas kvartiles starpība ir 175. Šis skaitlis ir starpkvartilu diapazona centrālā vērtība.
Ir svarīgi atzīmēt, ka jūlija mēneša dati ir ekstremāli dati, jo tie ir vairākas reizes lielāki nekā visi pārējie dati. Tātad, mēs varētu teikt, ka šī datu kopa ir tendencioza pret šo mēnesi. Pateicoties kvartiles izkliedes “nezināšanai” attiecībā uz ekstremāliem datiem, šī pasākuma rezultāts ir ļoti līdzīgs, ja jūlijā pārvietotos tikai 600 velosipēdisti. Ja jūlijā būtu tikai 600 riteņbraucēju, kvartiles dispersija būtu 162,5, kas ir ļoti tuvu 175, ņemot vērā, ka šajā mēnesī velosipēdistu skaits ir 10 reizes mazāks.