Cuando hablamos de inteligencia de negocio, big data o data science, nos centramos en la creación de valor a partir del dato. Sin embargo, la viabilidad de los proyectos de datos pasa por tener una gestión eficiente del mismo. No solo se trata de analizar el dato, ni tampoco de almacenarlo o procesarlo. Para dar respuesta a estas necesidades emerge el concepto de gobierno del datos.
El gobierno de datos es el conjunto de políticas dentro de una organización que tiene como objetivo mantener la integridad y seguridad de los datos. Se define a nivel de Personas, Procesos y Tecnología.
- Se deben establecer normas y procesos sobre las formas en que los datos son adquiridos manejados, mantenidos, transformados y compartidos.
- Se debe asignar un responsable, que decida quién puede manejar datos y en qué situaciones utilizarlos.
- Transmitir una cultura organizacional "Data Driven", donde los datos impulsen la toma de decisiones.
Pasos para una buena gobernanza
Establecer objetivos.
Definir métricas y KPIs que parmitan evaluar la efectividad del programa.
Tomar decisiones.
Comunicar políticas.
Medir resultados.
Auditar.
Equipo de trabajo
Consta de tres roles fundamentales:
Ingeniero de datos: Trabaja sobre la infraestructura del Big data, es responsable sobre el almacenamiento y procesamiento de los datos. Prepara el ecosistema para que el científico de datos puede trabajar con los datos.
Científico de datos: Se encarga de aplicar técnicas de Machine Learning y AI, generando valor a los datos iniciales.
Analista de datos: Se enfoca en la visualización de los datos resultantes del proceso aplicado por el científico de datos, como en el armado de infografías y Dashboards.
Infraestructura
También es importante definir la infraestructura a utilizar. La misma puede ser física (O-premise) o en la nube. El servidor físico requiere de una alta inversión inicial, el mantenimiento y sus actualizaciones se encuentra a cargo de la empresa y el alcance se encuentra limitado al lugar en donde se encuentra. El servidor en la nube tiene un costo fijo bajo, tanto el mantenimiento como actualizaciones dependen del provedor y su alcance es global
Dentro de la infraestructura Cloud existen diferentes tipos de servicios según el grado de centralización de los recursos:
Sofware as a Service (SaaS): aloja el software de la empresa, así como sus datos, en servidores externos a la misma, y paga una cuota por su utilización. Cualquier empleado de una empresa podrá acceder desde cualquier lugara las aplicaciones de la empresa sin necesidad de instalarlas en un equipo local. Cuando hablamos de software en la nube estamos hablando de SaaS. Con un SaaS la preocupación de la empresa será sólo cómo utilizar los programas de software necesarios para su funcionamiento, olvidándose del resto de recursos. El hardware requerido, sistemas operativos, aplicaciones, etc. son provistas por el proveedor del servicio que, además, se encarga de mantenerlas funcionando correctamente y actualizadas.
Platform as a Service (PaaS): En estas plataformas se pueden lanzar aplicaciones como bases de datos, middleware, herramientas de desarrollo, servicios de inteligencia empresarial, etc. Este tipo de servicios es el ideal para los desarrolladores que sólo quieran centrarse en la implementación y administración de sus aplicaciones. Al no tener que preocuparse por los recursos de hardware y software (sistemas operativo), mejoran su eficacia, centrándose sólo en la parte que les interesa.
Infrastructure as a Service (IaaS): Las empresas contratan la infraestructura de hardware a un tercero a cambio de una cuota o alquiler. La contratación de este hardware permite elegir la capacidad de proceso (procesadores), la memoria a utilizar (memoria RAM) y el espacio de almacenamiento (disco duro). IaaS ofrece también servicios de virtualización como máquinas virtuales, cortafuegos, sistemas de backups o balanceadores de carga.
En resumidas cuentas, para lograr una correcta adecuación de nuestra empresa debemos definir objetivos concretos relacionados a lo que se quiere lograr con los datos. Luego es necesario establecer una política de gobierno de datos que garantice la seguridad e integridad de los mismos. Posteriormente elegir el nivel de inversión en infraestructura y recursos humanos. Si bien podemos contratar un servicio de infraestructura CLoud y terciarizar el analisis de costos para reducir costos, es recomendable a mediano plazo armar un equipo propio especializado en datos con una visión exclusiva de la empresa.
Comentarios
Publicar un comentario