Data Management Vs Data Science

"Hola, Chichi. Encantat de coneixe't. Així, què faries tu?"

Amb el meu millor somriure "Sóc gestor de dades".

Amb un somriure confós "Ermm ... què vol dir això?"

**********************

Com que Data es va fer molt popular, puc apostar (tot i que no hi juguo) per haver d'haver sentit a parlar del paper de Data Scientist. Si no enteneu bé què és, tingueu cura de la meva publicació sobre algunes professions clau de dades. D'altra banda, el paper del gestor de dades és poc freqüent. I què és realment?

En un sentit ampli, la direcció és la coordinació de les persones i / o activitats per assolir alguns objectius. De la mateixa manera, la gestió de dades ho és

"La coordinació de persones, processos i fluxos de dades per assolir uns objectius fixats, que haurien d'incloure o derivar en el valor de les dades."

Una mirada minuciosa a aquesta definició pot pintar una imatge de gestió de dades com a simple govern de dades. La veritat és que la gestió de dades és una gran quantitat de govern de dades, però molt més. El Cos de Coneixement de Gestió de Dades defineix com a gestió de dades

"El desenvolupament, l'execució i la supervisió de plans, polítiques, programes i pràctiques per proporcionar, controlar, protegir i millorar el valor de les dades i els actius d'informació al llarg dels seus cicles de vida."

Les activitats de gestió de dades van des de les tècniques com ara l’enginyeria de dades fins a les no tècniques, com ara el govern de dades. El Cos de coneixement de gestió de dades especifica 11 àrees de coneixement que cobreixen:

  • Arquitectura i modelatge
  • Emmagatzematge i operacions
  • Seguretat
  • Dades mestres, dades de referència, gestió de documents, contingut i metadades
  • Integració i interoperabilitat
  • Magatzematge i Intel·ligència comercial
  • Qualitat
  • Governança

Per tant, "on es troba la ciència de dades?", És possible que us pregunteu. (Si no us importa una mica d'humor, és al capítol 14 de la segona edició del Cos de Coneixement.)

Data Science és l’anàlisi i visualització de Big Data. És un paper tècnic específic basat en l’aplicació de diverses àrees de coneixement de gestió de dades.

Anem a ser una mica més pràctics.

Un científic de les dades es preocupa principalment de veure què és possible amb un gran conjunt de dades particular. El Data Scientist necessita trobar informació i respostes per a preguntes no predeterminades (a diferència de l’analista que explora com respondre a algunes preguntes comercials conegudes amb dades). Mentrestant, el gestor de dades es preocupa de totes les dades de l'empresa / departament / domini, no només d'un conjunt de dades específic. El gestor es preocupa de mantenir la integritat de les dades a través de tot el seu cicle de vida i assegura que les persones que necessiten aprofitar-les de manera eficaç puguin accedir-hi. Aquest paper de dades requereix una consciència aguda dels objectius comercials, així com el que s’hauria de fer des del punt de vista tècnic.

I ara, siguem una mica més realistes!

El dilema dels professionals de les dades és que les línies entre rols es difuminen encara més, però la demanda de profunditat en àrees específiques és alhora a la demanda. Si voleu ser un gestor de dades més valuós, haureu de tenir més que un nivell bàsic d’expertesa en ciències de dades. De la mateixa manera, un científic científic de dades no hauria de sentir-se orgullós només de la seva habilitat estadística i algorítmica, sinó que hauria de pensar en les dades com una entitat viva que passa per un cicle i que s’ha de gestionar.

*********************

Llavors, què faig?

Ajudo a les organitzacions a obtenir valor desenvolupant, executant i supervisant estratègies, polítiques, processos i projectes que adquireixen, milloren i utilitzen dades i proporcionen un accés fàcil a les mateixes. Si les dades són grans i es necessita un aprenentatge automàtic, no dubteu a formar els models.