Wednesday, December 12, 2018

Big Data Congress 2018: Predicting churn in subscription with Machine Learning (by Marc Guirao & Oscar Martinez)

Luego se realizó la conferencia Predicting churn in subscription with Machine Learning por parte de Marc Guirao & Oscar Martinez, ambos consultores de BigData de Clearpeaks.

Predicting churn in subscription with Machine Learning (Clearpeaks)


En primer lugar explicaron el proceso que empieza con Business Understanding y Data Understanding:


Modern architectures for BI, Big Data & Machine Learning


How to get started in Big Data, Cloud & Machine Learning:

  1. Think Big, start smart and iterate often
  2. Get advice on use cases, architecture, technology stacks, tools
  3. Startegy to find balance with previous investments
  4. Maintenance - administration - costs
  5. Consider the profiles/skillset of people involved
  6. Big Data = engine ; Cloud = platform & tools



Cualquier modelo de suscripción tiene las siguientes fases:

Subscription Model Lifecycle:

  1. CONSIDER trial options
  2. BUY subscription process
  3. ENGAGE loyalty programs, anniversary offers
  4. GROWTH cross & upselling
  5. RETENTION offers, service increase



El ejemplo que explicaron era el caso de cómo evitar el churn, las bajas, en un modelo de suscripción como el de una ONG

Use case


De esta forma podían tener un dashboard de resultados con el tipo de cliente con más probabilidad de darse de baja, y por tanto en los que debían realizar alguna acción directa de forma inmediata para tratar de avanzarse a la posible baja de la suscripción:

Big Data Congress 2018: Risk analysis of companies in online media (by Juan Francisco García)

La siguiente conferencia sobre la temática Lessons learnt from successful applications la realizó Juan Francisco García, Director BigData & Advances Analytics de DatKnoSys grupo CMC, con el título Risk analysis of companies in online media

Modelo de Gestión de Riesgon On-line

Los datos disponibles actuales para realizar un scoring financiero de una empresa son:


Pero debemos aprovechar todo el potencial de nuestro entorno para controlar todo tipo de riesgo:

De esta forma, de la empresa que debemos analizar podemos recoger todos los mensajes y webs, y realizar un score de riesgo según las temáticas seleccionadas y sus pesos.

De esta forma seremos capaces de calcular on-line el riesgo empresarial total con datos financieros más el score on-line

Algunos resultados analizados:


Y ejemplos de tipos de resultados:


Así podremos dibujar una matriz de riesgo por empresas y tipología de riesgo:


Algunos resultados en forma de KPIs:


En definitiva estas son las conclusiones y beneficios:




Tuesday, December 11, 2018

Big Data Congress 2018: The road to predictive Management of industrial value chains (by Gabriel Aranzadi - Eurecat)

La segunda de las conferencias en este bloque del Big Data Congress 2018 en Barcelona llamado Lessons Learnt from successful applications fue de Gabriel Aranzadi de Eurecat titulada “The road to predictive Management of  industrial value chains”


Algunos challenges que se plantean:

  •          Flexible production
  •           Linking Physical-Virtual
  •           Autonomous Production
  •           Predictive Management
  •           Knowledge Sharing
  •           Zero Waste
  •           Zero Defect


Digital Opportunity:



Inductry Transformation powered by:



Right Decission at the Right Level



Self-Diagnosis, Optimization, Organization


En el desarrollo de proyectos debe aplicarse un acercamiento que contemple tanto a los expertos de datos como también a los expertos del dominio, es decir del tema en el que se está trabajando.



Deploying industrial data driven projects


A.-Problem? Understand the concept and ptoblem objective from domain point of view
B.-Inputs - Outputs?
B.1.-Measurements (Really? How?)
B.2.-Relation with results
B.3.-Output parametres which match objectives
B.4.-Iterative and tireless process
C.-Data Exploration
C.1.-Graphing
C.2.-Strage things (always are there)
C.3.-Meetings to clarify doubts
C.4.-Propose changes / improvements in the structure of the data
C.5.-Homogenize the data
C.6.-Do we have enough data, samples?
D.-Data Processing - Data Cleaning, Feature engineering
D.1.-Time series? Batch?
D.2.-Noise
D.3.-Interest regions
D.4.-Data fusion?
D.5.-Metrics for new models
D.6.-PCA, PLS?
D.7.-Graphical representation
E.Data Modelling
E.1.-Classifier? Regressor? Optimizer? Anormally detector? ...
E.2.-Test framework
E.3.-Test data representations
E.4.-Initial algorithms selection
E.5.-Debugging
E.6.-Improvements, statistics, etc
E.7.-If they do not work
E.8.-Important: Logic of the results. Distrust from excellent outcomes (overfiting)
F.Results: Do not save efforts on tools that facilitate understanding and use of the prediction/prescription models


Un ejemplo práctico con: Predictive Quality: Plastic Injection



Success Stories: KPIs



Lessons Learnt:

  • -          Define the target, question to answer
  • -          Data availability – quality
  • -          Operation accuracy
  • -          Interoperability
  • -          ROI – OEE – TCO – TPM
  • -          Models usability
  • -          Cultural barriers

The Pathway:

  1. Map your Digital Strategy
  2. Create initial Pilot Projects
  3. Define the capabilities you need
  4. Become a virtuoso in data analytics
  5. Transform into a data driven company
  6. Actively plan an ecosystem approach





Big Data Congress 2018: Let’s put data to Work (by Jaume Ferrarons - SmartMonkey)

El siguiente grupo de conferencias en el marco del Big Data Congress 2018 en Barcelona versaron sobre la temática “Lessons Learnt from Successful Applications”, empezando por Jaume Ferrarons de SmartMonkey y su conferencia “Let’s put data to Work”.



Business intelligence 4 Last-Mile Operations con un aumento de más del 20% en productividad con casos de éxito como en Heineken, Volkswagen, Agbar y Suez
What SmartMonkey Do?

How? Tools & profiles & visibility

Long story short

The lesson: People do nasty things (to data)

Asset Geolocalization


1st user case: Asset Geolocalization



2nd User case: Driver profiling





Find the best matching
-          Score driver suitability
-          Using Deep Learning
-          Maximize worker score
-          Less tan time



Nice Data is POWER!



Monday, December 10, 2018

Big Data Congress 2018: Leadership in the Data/Driven Organization (by Manu Carricano from Esade)

 Luego la conferencia de Manu Carricano de ESADE Business School que llevaba por título “Leadership in the Data/Driven Organization"


The 6s of the Data/Driven Organization:
  •       Society
  •       Sciense
  •       Strategy
  •       Serendipity
  •       Scalability
  •       Skepticism


Un libro interesante al respect es “Weapons of Math Destruction” de Cathy O-Neil




A nivel de ciencia
1.Debemos eliminar todo lo que no es importante
2.Obserbar comportamientos y refinar el an’alisis
3.Focalizarse en el proceso de decisi’on, y no en el resultado
4.Automatizar cuando sea eficiente



El ejemplo de Netflix nos indica que todo trata de testear para encontrar el modelo




Y también lo decía Jeff Bezos fundador de Amazon.com> “Our success of Amazon is a function of how many Experience we do per year, per month, per week, per day…”
Según algunos datos, el n’umero de experimentos realizados durante el año 2017
-          Amazon 2.000
-          Procter & Gamble 7.000 – 10.000
-          Google 7.000

-          Netflix 1.000


Algunas otras best practices realizadas por otras empresas como en el caso de WalmartLabs para que sus empleados puedan solucionar en tiempo real algunas problemáticas de forma gráfica mientras se encuentran tomando el café… Data Café @WalmartLabs



P&G Business Sphere es una espectacular sala de reuniones donde se exhiben las predicciones y los modelos predictivos para ayudar en su toma de decisiones.





La escalabilidad tiene en los desarrollos de Machine Learning un rol crítico de negocio
El proceso de Data-Driven Transformation & Acceleration Paths siempre debve pasar por una etapa de equipo piloto, para luego a un grupo más amplio de Super Users, para finalizar con la Democratization en la empresa.




Data-Driven Transformation & Acceleration Paths

Luego se realizaron Elevator Pitch de 3 minutos de duración de las empresas que daban soporte al evento Big Data Congress 2018: Capside, Clearpeaks, Datahack, Dalknosys, Dominion Digital, ESADE Business School, Eurecat, Grupo ICA, Minsait, Kschool, Trovit Search.