Business Intelligence – Proceso ETL

Excel y Pentaho

El primer problema con el que se encuentran las empresas en el proceso de transformación digital es que, o bien no recogen datos, o lo hacen de manera desordenada e ineficiente. El desafío principal de cualquier organización en la actualidad es estandarizar sus procesos de recogida y crear una estructura sólida que facilite su tratamiento. Además, este es el primer paso para poder implementar soluciones de Business Intelligence en su compañía.

Proceso ETL

Los datos que se recogen en una organización suelen proceder de diversas fuentes y presentar diferentes formatos, representaciones y grado de calidad, por lo que es necesario conciliar estas diferencias. El problema se presenta entonces en la necesidad de integrar y limpiar los datos y establecer un formato estandarizado. Este proceso se compone de tres fases: la extracción, la transformación y la carga de datos; conocido como proceso ETL (Extract, Transform and Load).

El proceso ETL es la fase previa a la explotación de los datos y es muy importante abordarlo adecuadamente. Sin un correcto tratamiento de los datos no podremos generar un conocimiento de calidad que nos permita mejorar la toma de decisiones.

Para llevar a cabo el proceso ETL existen diferentes soluciones que se ajustan al nivel de complejidad de las herramientas con las que trabaja la empresa.

  • En caso de basar su gestión documental en hojas de Excel, se puede automatizar el almacenamiento de datos y ahorrar así un valioso tiempo de trabajo.
  • Si se encuentra en una etapa de madurez tecnológica superior y quiere dar el siguiente paso hacia el Business Intelligence, encontrará la solución en las posibilidades de Pentaho.

Excel – Visual Basic

Excel es un programa informático desarrollado y distribuido por Microsoft. Se trata de un software que permite realizar tareas contables y financieras gracias a sus funciones, desarrolladas específicamente para ayudar a crear y trabajar con hojas de cálculo.

Existe un nivel avanzado de Excel que encuentra su máximo exponente en las famosas “Macros”. Éstas se implementan en un entorno de trabajo dentro de la herramienta mediante un lenguaje de programación llamado Visual Basic.

Las macros se usan en el proceso ETL y buscan la forma de otorgar a los datos orden, estructura y consistencia mediante una serie de algoritmos.

Ventajas
  • Conocido: es el programa por excelencia en las empresas.
  • Sencillo: tiene una interfaz amigable que facilita el trabajo.
  • Compatible: los ficheros de Excel tienen conectores en casi cualquier programa.
  • Integrable: al ser una herramienta de Microsoft se puede integrar con infinidad de aplicaciones.
  • Modifica al mínimo su manera de trabajar, puesto que no tiene que cambiar de programa.

Pentaho

Pentaho es una suite de programas libres de Business Intelligence. A través de su aplicación Pentaho Data Integration, busca la forma de ordenar, depurar y dar una estructura a los datos, los transforma en  algoritmos completamente sofisticados, revelando significantes patrones y correlaciones que no son fáciles de observar.

Abre, limpia e integra esta valiosa información y la pone en manos del usuario adhiriéndole una consistencia a la misma, que es uno de los más grandes desafíos para las organizaciones TI hoy en día, evitando grandes cargas de trabajo manual.

Ventajas
  • OpenSource: no requiere de licencia para su uso.
  • Multiplataforma: permite trabajar con Windows, Macintosh o Linux.
  • Modular: dispone de diversas aplicaciones para realizar todo tipo de funciones sobre los datos.
  • Usa tecnologías estándar como Java, XML o Javascript.
  • Es una solución flexible que permite crear soluciones adaptadas a la organización.
  • Enfocado en el Big Data.
Share This