Datu ieguve - kas tas ir, definīcija un jēdziens 2021. gads

Satura rādītājs:

Datu ieguve - kas tas ir, definīcija un jēdziens 2021. gads
Datu ieguve - kas tas ir, definīcija un jēdziens 2021. gads
Anonim

Datu iegūšana ir process lielās datubāzēs, lai atrastu noderīgu informāciju, ko var izmantot lēmumu pieņemšanai. Tiek izmantots arī angliskais termins "data mining".

To var saprast kā tehnoloģiju un programmatūru, ko izmanto, lai atrastu uzvedības modeļus datu bāzē. Pamata pamats tam ir tas, ka šie modeļi palīdz pieņemt lēmumus. Piemēram, tas varētu palīdzēt uzņēmumiem izprast klientu uzvedības modeļus. Tādā veidā, lai tas veicinātu stratēģiju izveidi pārdošanas palielināšanai vai izmaksu samazināšanai.

Datu ieguves priekšrocības

Šī datu analīzes procesa galvenā priekšrocība ir liels biznesa scenāriju skaits, kuriem to var piemērot, kā piemērs mums ir:

  • Prognozēšana: Uzņēmuma pārdošanas prognoze.
  • VarbūtībaLabāko klientu atlase tiešai saziņai pa tālruni vai e-pastu.
  • Secības analīze: Klientu nopirkto produktu analīze un pārbauda to savstarpējo saistību.

Datu ieguves posmi

Datu ieguves procesā mēs varam atrast piecas fāzes:

  • Mērķis un datu vākšana: Vispirms ir jākoncentrējas uz to, kāda veida informāciju mēs vēlamies iegūt. Iedomāsimies piemēru, ka lielveikals vēlas uzzināt, kurā diennakts laikā visvairāk apmeklē klienti. Tas būtu mērķis un informācija, ko tirdzniecība vēlas iegūt šajā gadījumā.
  • Datu apstrāde un pārvaldība: Kad mēs zinām datus, kurus vēlamies apkopot, mēs tos izmantojam. Tas, iespējams, ir visgrūtākais procesa posms. Tas prasa atlasīt reprezentatīvo paraugu, ar kuru tiks veikta analīze. Kad izlase ir izvēlēta, ir jāanalizē, kāda veida mainīgos vai regresijas modeli veiks izlasē.
  • Modeļa izvēle: Tas ir cieši saistīts ar iepriekšējo posmu. Tas ir par modeļa vai algoritma izveidi, kas mums dod vislabāko iespējamo rezultātu. Lai to izdarītu, jāveic pilnīga mainīgo, kas jāiekļauj modelī, analīze. Tas kļūst par sarežģītu uzdevumu, jo tas būs atkarīgs no analizējamās informācijas veida. Tāpēc datu ieguvēji veic dažādus algoritma testus, piemēram: lineāro regresiju, lēmumu koku, laika rindas, neironu tīklu utt.
  • Rezultātu analīze un pārskatīšana: Būtībā ir jāanalizē rezultāti, lai redzētu, vai tie dod loģisku skaidrojumu. Paskaidrojums, kas atvieglo lēmumu pieņemšanu, pamatojoties uz rezultātu sniegto informāciju.
  • Modeļa atjaunināšana: Procesa pēdējais solis būtu modeļa atjaunināšana. Ir ļoti svarīgi, lai tas tiktu veikts laika gaitā, lai tas nebūtu novecojis. Modeļa mainīgie varētu kļūt nenozīmīgi, tāpēc ir nepieciešama periodiska modeļa kontrole.