DataLakes: llevando el ‘big data’ a su organización

En 2020, se espera que existan 40 Zettabytes de información, generados por los habitantes del planeta.

‘big data’

El ‘big data’ es una implementación fundamental de los modelos de analítica de grandes cantidades de datos; nos ayuda a tomar decisiones.

Archivo Portafolio.co

Empresas
POR:
Portafolio
junio 08 de 2017 - 10:36 p.m.
2017-06-08

Todos los procesos de toma de decisiones se soportan en la mayor cantidad de información posible; es por esto, que el universo de datos llamado big data será la variable diferenciadora del éxito, que le dará una ventaja competitiva a las organizaciones que tengan la habilidad de analizar y comprender la información de su compañía.

(Lea: Interpretar bien los datos es la clave en la comunicación de las empresas

Para superar los retos de la administración y elmanejo de grandes cantidades de información en las organizaciones, existe la implementación de lo que se denomina DataLakes. Estos son repositorios donde almacenamos todos los datos de las compañías –estructurados y sin estructurar–, sin ningún tipo de preprocesamiento (raw data) y sin ningún tipo de esquema, para ser analizados posteriormente. Estos repositorios de grandes cantidades de datos, nos permiten ayudar a las empresas a generar un valor adicional en la explotación y organización de toda esta información. Los ahorros de costos en arquitecturas DataLakes vs. almacenes de Datos representan el 15 por ciento de lo que actualmente invierten las organizaciones.

(Lea: Los retos y las oportunidades de la digitalización

Sin embargo, enfrentamos varias problemáticas en la actualidad: más del 80 por ciento de la información no es usada para la toma de decisiones, es lo que llamamos ‘punto ciego’. El costo de guardar información en almacenes de datos Data Warehouse, bases de datos relacionales, es altamente costoso y poco escalable. Para crecer un 20 por ciento el espacio en resguardo se realizan proyectos con una duración de 3 a 6 meses, lo que impacta en objetivos estratégicos como Time to Market.

(Lea: Big Data, la revolución analítica

En las arquitecturas de DataLakes no vemos pre-procesamiento ni fase de limpieza de datos, lo que para unos puede ser un problema, para nosotros es una oportunidad, ya que no hay agregación, lo que permite más resolución, capacidades de reconstrucción y análisis libre de la información.

Estas arquitecturas, le garantizan a la organización colectar información de fuentes internas o externas de datos en descanso, en movimiento o en bodegas de datos para ser procesadas y explotadas con el fin de que la compañía sea capaz de reaccionar y tomar decisiones antes de que sucedan las cosas.

Las grandes empresas de TI como: Google, Facebook, LinkedIn, Twitter y Netflix han desarrollado las tecnologías para recolectar, resguardar, procesar y explotar sus datos.
Dichas herramientas tecnológicas han venido evolucionando y se han llevado a otros sectores, mostrando grandes beneficios. Uno de ellos es el crecimiento hasta del 317 por ciento de las empresas que soportan su negocio en la explotación de grandes cantidades de datos en arquitecturas de DataLake.

El big data es una implementación fundamental de los modelos de analítica de grandes cantidades de datos, nos ayuda a tomar decisiones en términos de ofertas de valor y operaciones, buscando que los procesos productivos sean, en lo posible, más efectivos. Además, nos permite minimizar riesgos, aprovechar oportunidades, identificar eventos no comunes y anomalías.

Finalmente, el impacto del big data es en beneficio de las organizaciones; vemos algunos casos de uso aplicados para comprender cómo funciona la empresa, predecir y contrarrestar ataques informáticos, fraudes o fallas en los servicios, además, comprender los gustos y hábitos de compra de los clientes para convertir las ventas en experiencias personalizadas.

En 2020, se espera que existan 40 Zettabytes de información, generados por cada uno de los habitantes del planeta, quienes contribuirán con 5.247 GB de información, a través del Internet de las Cosas: sensores, ciudades inteligentes, etc., con sus equipos móviles e interacciones con la internet de las personas y organizaciones; sin embargo, deben ser organizadas, analizadas y comprendidas de forma oportuna para una mejor toma de decisiones y desarrollo de mejores oportunidades.

Javier Díaz Evans,
VP Américas y director general A3SEC.