Datu zinātne ir disciplīna, kas pēta, no kurienes nāk noteikta informācijas bāze. Tajā arī apspriests, kā šos resursus var interpretēt un attēlot produktīvai izmantošanai.
Tas ir, datu zinātne ir saistīta ar datu bāzu pārvaldību, kas glabājas digitālajos failos, no kuriem daudz noderīgas informācijas var iegūt kā statistikas rādītājus. Tie var palīdzēt, piemēram, uzņēmumam pieņemt biznesa lēmumus.
Tāpat datu zinātne nodrošina rīkus, kas ļauj ne tikai interpretēt, bet arī attēlot pieejamos datus, piemēram, attēlos. Tādējādi mums cita starpā ir histogramma, joslu diagramma, sektoru diagramma.
Kā var secināt, šī zinātne ir starpdisciplināra, jo galvenokārt aptver zināšanas matemātikā, statistikā un datorzinātnēs.
Datu zinātne un datu veidi
Jāatzīmē arī tas, ka datu zinātne var strādāt ar divu veidu datiem:
- Strukturēts: Tie ir sakārtoti, piemēram, tabulas ar dažādām kolonnām, katrai ar atšķirīgu kategoriju, piemēram: vārds, uzvārds, vecums, personu apliecinoša dokumenta numurs utt.
- Nestrukturēts: Tie, kas neatbilst noteiktam formātam, piemēram, brīvi rakstīts teksts. Tādā gadījumā jums ir jāinterpretē saturs un jāiegūst dati, kurus var pārvaldīt.
Ņemot vērā visu izskaidroto, datu zinātnē specializētajiem profesionāļiem jābūt ne tikai analītiskām prasmēm, bet arī jāspēj paziņot apstrādātās informācijas saturu.
Datu zinātnes nozīme
Datu zinātne ir svarīga uzņēmumiem vai iestādēm, kurām jāstrādā ar lielu datu apjomu. Tādējādi tā var kļūt par vērtīgu informāciju.
Datu zinātni mēs varam saistīt ar lielajiem datiem, kas sastāv no tādu mehānismu izstrādes, kas spēj apstrādāt un pārvaldīt masveida datus, kas nāk no dažādiem avotiem. Mērķis ir pārveidot tos par informāciju, ko cilvēks var interpretēt, un kas viņam palīdz pieņemt lēmumus.
Šie apstrādājamie dati var būt iegūti no darījumiem starp privātpersonām un organizācijām (piemēram, bankas operācijām), cilvēku ikdienas darbībām (piemēram, meklējumiem internetā), mašīnām (piemēram, mobilā tālruņa GPS, kas reģistrē lietotāja atrašanās vietu) vai no informācijas biometriskie (piemēram, pirkstu nospiedumi).
Datu zinātnes vēsture
Var teikt, ka amerikāņu statistiķis Džons Vailders Tukijs 1960. gados bija datu zinātnes aizsācējs, uzsverot datu analīzes, nevis statistisko modeļu pārbaudes nozīmi.
Tomēr tikai 1996. gadā termins datu zinātne pirmo reizi tika izmantots lekcijas nosaukumā, sarunā ar nosaukumu "Datu zinātne, klasifikācija un saistītās metodes". Tas notika Starptautiskās klasifikācijas sabiedrību federācijas (IFCS) dalībnieku sanāksmes ietvaros, kas notika Kobē, Japānā.
Vēl viens nozīmīgs pavērsiens bija 2005. gadā, kad Nacionālā zinātnes padome publicēja "Ilgi dzīvojušas digitālās datu kolekcijas, kas ļauj pētniecību un izglītību 21. gadsimtā". Šajā dokumentā datu zinātnieki ir definēti kā datoru eksperti, datubāzu un programmatūras programmētāji un citu nozaru profesionāļi (piemēram, bibliotekāri un arhivāri), kuriem ir izšķiroša nozīme digitālās datu vākšanas veiksmīgā pārvaldībā.
Tomēr tas joprojām ir pētniecības lauks, kas joprojām ir izstrādes stadijā.