Ir al contenido principal

¿Cómo preparar una empresa para trabajar con Big Data?

Cuando hablamos de inteligencia de negocio, big data o data science, nos centramos en la creación de valor a partir del dato. Sin embargo, la viabilidad de los proyectos de datos pasa por tener una gestión eficiente del mismo. No solo se trata de analizar el dato, ni tampoco de almacenarlo o procesarlo. Para dar respuesta a estas necesidades emerge el concepto de gobierno del datos.

El gobierno de datos es el conjunto de políticas dentro de una organización que tiene como objetivo mantener la integridad y seguridad de los datos. Se define a nivel de Personas, Procesos y Tecnología.

  • Se deben establecer normas y procesos sobre las formas en que los datos son adquiridos manejados, mantenidos, transformados y compartidos.
  • Se debe asignar un responsable, que decida quién puede manejar datos y en qué situaciones utilizarlos.
  • Transmitir una cultura organizacional "Data Driven", donde los datos impulsen la toma de decisiones.


Pasos para una buena gobernanza

Establecer objetivos.

Definir métricas y KPIs que parmitan evaluar la efectividad del programa.

Tomar decisiones.

Comunicar políticas.

Medir resultados.

Auditar.


Equipo de trabajo

Consta de tres roles fundamentales:

Ingeniero de datos: Trabaja sobre la infraestructura del Big data, es responsable sobre el almacenamiento y procesamiento de los datos. Prepara el ecosistema para que el científico de datos puede trabajar con los datos. 

Científico de datos: Se encarga de aplicar técnicas de Machine Learning y AI, generando valor a los datos iniciales.

Analista de datos: Se enfoca en la visualización de los datos resultantes del proceso aplicado por el científico de datos, como en el armado de infografías y Dashboards. 


Infraestructura

También es importante definir la infraestructura a utilizar. La misma puede ser física (O-premise) o en la nube. El servidor físico requiere de una alta inversión inicial, el mantenimiento y sus actualizaciones se encuentra a cargo de la empresa y el alcance se encuentra limitado al lugar en donde se encuentra. El servidor en la nube tiene un costo fijo bajo, tanto el mantenimiento como actualizaciones dependen del provedor y su alcance es global 

Dentro de la infraestructura Cloud existen diferentes tipos de servicios según el grado de centralización de los recursos:

Sofware as a Service (SaaS): aloja el software de la empresa, así como sus datos, en servidores externos a la misma, y paga una cuota por su utilización. Cualquier empleado de una empresa podrá acceder desde cualquier lugara las aplicaciones de la empresa sin necesidad de instalarlas en un equipo local. Cuando hablamos de software en la nube estamos hablando de SaaS. Con un SaaS la preocupación de la empresa será sólo cómo utilizar los programas de software necesarios para su funcionamiento, olvidándose del resto de recursos. El hardware requerido, sistemas operativos, aplicaciones, etc. son provistas por el proveedor del servicio que, además, se encarga de mantenerlas funcionando correctamente y actualizadas.

Platform as a Service (PaaS): En estas plataformas se pueden lanzar aplicaciones como bases de datos, middleware, herramientas de desarrollo, servicios de inteligencia empresarial, etc. Este tipo de servicios es el ideal para los desarrolladores que sólo quieran centrarse en la implementación y administración de sus aplicaciones. Al no tener que preocuparse por los recursos de hardware y software (sistemas operativo), mejoran su eficacia, centrándose sólo en la parte que les interesa.

Infrastructure as a Service (IaaS): Las empresas contratan la infraestructura de hardware a un tercero a cambio de una cuota o alquiler. La contratación de este hardware permite elegir la capacidad de proceso (procesadores), la memoria a utilizar (memoria RAM) y el espacio de almacenamiento (disco duro). IaaS ofrece también servicios de virtualización como máquinas virtuales, cortafuegos, sistemas de backups o balanceadores de carga.


En resumidas cuentas, para lograr una correcta adecuación de nuestra empresa debemos definir objetivos concretos relacionados a lo que se quiere lograr con los datos. Luego es necesario establecer una política de gobierno de datos que garantice la seguridad e integridad de los mismos. Posteriormente elegir el nivel de inversión en infraestructura y recursos humanos. Si bien podemos contratar un servicio de infraestructura CLoud y terciarizar el analisis de costos para reducir costos, es recomendable a mediano plazo armar un equipo propio especializado en datos con una visión exclusiva de la empresa.

Comentarios

Entradas populares de este blog

La pirámide del Conocimiento

  Han pasado más de 30 años desde que el arquitecto estadounidense Russell Ackoff desarrolló la "Pirámide del Conocimiento”, base de casi de cualquier explicación sobre la  Gestión del Conocimiento , tanto desde un punto de vista teórico como de aplicación a las Organizaciones. Básicamente, la pirámide del conocimiento establece una estructura jerárquica entre datos, información, conocimiento y sabiduría, colocando los datos en la parte inferior y la sabiduría en la posición más alta o valiosa.   Dato Son una representación, característica o atributo simbólico de algo. No tiene ningún valor en sí mismo, porque ha sido disociado del contexto, pero puede procesarse adecuadamente para obtener información. Son el nivel más básico, es información sin procesar. Dentro de los datos se pueden incluir: ·          Hechos o del mundo real en bruto. Como carecen de interpretación y de contexto no tienen ninguna utilidad por sí mism...

¿En qué consiste el proceso de exportación?

  Consiste en una serie de etapas metodológicas para el desarrollo de mercados internacionales y la creación de negocios de exportación sostenidos. Etapa 1: Aspectos locales e internos En esta etapa se toma contacto con el proceso de exportación para comprenderlo, analizar las particularidades internas de la empresa y de su oferta y tener claras las exigencias aduaneras de exportación (costos, actividades y tiempos). Ingresar en el proceso de exportación significa conocer su funcionamiento y los resultados que se pueden esperar en función de las actividades que se realizan. La siguiente etapa del proceso de exportación es saber exactamente qué hace la empresa y conocer su perfil completo. Antes que nada, es necesario realizar un análisis FODA (Fortalezas, Oportunidades, Debilidades y Amenazas) sobre la empresa y sus productos. También debe realizarse un análisis de la calidad de los productos para que la misma pueda ser realmente calificada como una fortaleza de un producto con mir...

Machine Learning

El machine learning es una rama de la inteligencia artificial que permite que las máquinas aprendan sin ser expresamente programadas para ello. Esta es una habilidad escencial para hacer sistemas capaces de identificar patrones entre los datos que permitan hacer predicciones.  Estos sistemas son capaces de convertir una muestra de datos en un programa informático capaz de extraer inferencias de nuevos conjuntos de datos para los que no ha sido entrenado previamente. Un algoritmo de machine learning desarrolla la capacidad de modificarse a sí mismo con el fin de adaptarse a los datos que está procesando. El objetivo que persigue el machine learning es claro. Busca conseguir que las personas y las máquinas puedan trabajar juntas. Por eso es imprescindible que las máquinas sean capaces de comprender las cosas como un humano. Ante un mundo cada vez más complejo, cada vez hay más interacciones entre usuarios y sistemas, cada vez más información. Es por esto que las técnicas de aprendiza...