miércoles, marzo 07, 2018

Big Data Congress: Evolución de los Ecosistemas de Datos - Del Data Warehouse al Data Lake

En el pasado Big Data Congress Barcelona 2017 asistí a la conferencia Evolución de los Ecosistemas de Datos  - Del Data Warehouse al Data Lake de Oscar Romero del DTIM Research Group de la UPC (Universitat Politècnica de Catalunya)


En primer lugar se habló de What is Big Data? Qué es Big Data? y cómo afectan las diferentes Vs:

  • Volume
  • Velocity
  • Value
  • Variety
  • Veracity
  • Variability
Aunque al principio eran 3 ó 4 las Vs que afectaban en el diseño de un sistema Big Data, donde siempre debías sacrificar una de ellas, actualmente nos debemos focalizar en la VARIETY - Variedad según afirma MIT Sloan Review:


El último objetivo del Big Data es Integrar las nuevas fuentes de datos a demanda:

  • Legacy systems
  • External data (semiestructurado o no estructurados)
  • Social media and Behavioural data sources
Y proporcionar la requerieda flexibilidad para aplicar las técnicas de análisis de datos a demanda y por tanto con la necesaria preparación de los datos.

A continuación se plantean distintos modelos para el Big Data y el Data Lake:





No hay comentarios: