Klasteru analīze - kas tas ir, definīcija un jēdziens 2021. gads

Klasteru analīze ir daudzveidīgu statistikas metožu kopums, kura mērķis ir grupēt gadījumu vai indivīdu kopas kopās vai kopās.

Tāpēc klasteru analīze ir statistikas grupēšanas veids. Mērķis ir padarīt datus katrā klasterī pēc iespējas līdzīgākus un pēc iespējas atšķirīgākus attiecībā pret pārējām grupām. To var izdarīt arī ar mainīgajiem.

Datu transformācija klasteru analīzē

Viena no problēmām, ar kuru mēs sastopamies, grupējot datus, ir tā, ka dati dažreiz ir dažādās mērvienībās. Šī iemesla dēļ ir jāveic pirms klastera analīzes solis, kas ļauj grupēt.

Visizplatītākā metode ir standartizācija. To izmanto, lai pārveidotu datus tā, lai tiem būtu līdzīgas mērvienības. Jāņem vērā divi noteikumi, binārie mainīgie netiek standartizēti un, ja tie ir kategoriski, tie kļūst bināri (klātbūtne / neesamība).

Metodes klasteru analīzē

Klasteru analīzes veikšanai ir daudz metožu, taču vietnē Economy-Wiki.com, ievērojot mūs raksturojošo vienkāršības principu, visatbilstošāko redzēsim shematiski.

Hierarhiskas metodes

Pirmā klasifikācija būtu hierarhiskas vai nehierarhiskas metodes. Iepriekšējie grupē indivīdus hierarhiskās fāzēs (līdz ar to arī viņu vārds). Tādā veidā tikai viens objekts vienlaikus maina grupu, pārējie paliek tajā pašā vietā.

Tos savukārt iedala:

Aglomerācijas metodes

Tas sastāv no indivīdu grupēšanas katru reizi mazākās grupās. Tas sākas no grupu skaita, kas vienāds ar gadījumu skaitu, un samazinās.

Vispazīstamākie ir:

  • Tuvākā kaimiņa metode: Šajā gadījumā datu grupēšanai izmantojat algoritmu. Jūs meklējat minimālo attālumu starp tuvākajiem cilvēkiem. Tas ir ļoti jutīgs pret datiem, kas var izraisīt tā saukto "troksni". Tālākā kaimiņa metode ir līdzīga.
  • Vidējā metode starp grupām: Ko tas dara, ir aprēķināt vidējo attālumu starp indivīdiem grupā un jo īpaši vienu no viņiem. Ir ļoti noderīgi samazināt tā saukto "troksni".
  • Vorda metode: Lai izvairītos no informācijas zuduma, tiek pievienoti noviržu kvadrāti starp katru indivīdu un viņa kopas vidējo vērtību. Tā ir viena no pazīstamākajām, un tai ir metodes priekšrocības, kas balstītas uz vidējo, bet lielāku diskriminācijas spēku.

Disociatīvās metodes

Šajā gadījumā tas, ko jūs darāt, ir šķelšanās. Tas sākas ar vienu kopu, un sadalījumi tiek piedāvāti, pamatojoties uz virkni prasību.

Visizplatītākie ir:

  • Starp grupas vidējo, tuvāko kaimiņu un vistālāko kaimiņu metodi: Šīs trīs metodes ir līdzīgas iepriekšējam gadījumam, bet izmantojot disociatīvo metodi. Tas ir, šoreiz tas, ko mēs darām, ir atsevišķi, nevis grupēti.
  • Centroid metode: To plaši izmanto objekta atrašanās vietas optimizācijas problēmās. Izmantojiet šāda veida analīzi, lai atrastu vispiemērotākās.

Nehierarhiskas metodes

Šajā gadījumā tie sākas ar iepriekš iestatītu risinājumu. Tas ir sākumpunkts klasteru analīzei. Tādā veidā grupas tiek izveidotas iepriekš, un katrs gadījums tiks ievietots vienā no tām, atkarībā no tā īpašībām. Savukārt mēs tos varam sadalīt citās apakšgrupās.

  • Pārejas metodes: Visatbilstošākās ir centroid metodes, piemēram, k-mean. Medioīdu, piemēram, PAM. Vai dinamisko mākoņu.
  • Tiešās metodes: Vissvarīgākais ir bloku kopu veidošana, ko plaši izmanto datu ieguvē.
  • Reduktīvās metodes: Tie ir balstīti uz faktoru analīzi.
  • Blīvuma meklēšanas metodes: No vienas puses, būtu tipoloģiskās pieejas, piemēram, modālā analīze. No otras puses, mums ir varbūtības varbūtības, piemēram, Vilka.

Klasteru analīzes piemēri

Apskatīsim visbeidzot dažus klasteru analīzes lietojumu piemērus.

  • Iedomāsimies, ka mums ir valstu grupa, kuras mēs vēlamies grupēt, pamatojoties uz noteiktiem makroekonomiskiem mainīgajiem lielumiem, piemēram, inflāciju vai bezdarbu. Mēs varam izmantot šāda veida analīzi, lai izveidotu viendabīgas grupas, piemēram, vairāk vai mazāk attīstītas valstis.
  • Cits piemērs varētu būt virkne patērētāju ar noteiktām sociodemogrāfiskām īpašībām. Ideja ir izveidot grupas ar līdzīgiem indivīdiem, kas, savukārt, ļoti atšķiras viens no otra.
  • Bet papildus ekonomikai klasteru analīze ir noderīga arī citās zinātnēs. Piemēram, bioloģijā, sugu klasificēšanai vai ģeoloģijā, darīt to pašu ar minerāliem.

Jums palīdzēs attīstību vietā, daloties lapu ar draugiem

wave wave wave wave wave