Ing. Ivan Oscco Cossio, PMP® 

En el mundo del BigData, solemos destacar con frecuencia solo los aspectos y novedades técnicas de las plataformas tecnológicas emergentes y que vienen siendo adoptadas para la explotación de las potencialidades del Data Analytics; y solemos hablar solo de infraestructuras como Hadoop, Cassandra, Amazon S3, BigTable, Google Map Reduce (hoy DataFlow: FlumeJava); IBM Spectrum Scale, NoSQL, etc.  Subestimando de otro lado los desafíos organizativos y humanos que deberíamos considerar en una iniciativa de BigData; Data Driven: es pues un término relativamente nuevo, y que surge como aquel que se aboca a cubrir las brechas existentes de los aspectos organizativos a tener en cuenta en el mundo del BigData y por ende deberíamos considerarlo dentro de nuestra estrategia de adopción y operación de la misma, si es que realmente anhelamos obtener el mayor provecho para nuestra inversión.

¿Pero que es data driven? Antes de responder a la interrogante planteada, tengamos en cuenta que en la actualidad existe muy poca discusión sobre cómo las organizaciones pueden hacer que los datos trabajen exitosamente para sus propósitos.  Y que además lo realicen de una manera efectiva y eficiente; y ojo que esto no es sobre cual base de datos usar o que plataforma tecnológica implementar e inclusive sobre tampoco sobre cuantos científicos de datos – Data Scientists – o  – Data Engineers – he de enrollar en mi organización; esta discusión en sí, va más allá de la interacción compleja entre los datos que se tiene (si es que los tienen) y como estos vienen siendo almacenados, procesados y sobre los problemas que puede y vale la pena resolver 1.

Shadow of businesswoman by projection screen

Suele ser, y como ocurre con frecuencia que tenemos esta tendencia a veces de solo enfocarnos demasiado en la tecnología, y sin embargo aunque las organizaciones líderes reconocen que las personas son el centro de toda complejidad, y en verdad lo suelen ser.

Pues sucede en la mayoría de las organizaciones, que las respuestas a otras interrogantes como: quien controla los datos, a quien reportan, y como ellos eligen que datos trabajar, son desestimadas y resultan también en realidad actividades tan o mas importantes que las otras, y suelen recibir menos atención que las relacionadas a  cuestiones de infraestructura como: sí usare una base de datos como PostgreSQL o Amazon Redshift o HDFS.

Así pues, debemos tener en cuenta que si una organización aspira a ser exitosa en el manejo de datos – y considerando que los datos muy pronto cambiarán la manera en que una organización interactúa con el mundo – deberá definitivamente desarrollar una cultura de datos al interior de su organización, es decir una data-driven organization.

Pero nuevamente, ¿qué es data driven? o mejor dicho que es una data-driven organization u Organización Conducida por Datos; en principio diremos que es aquella organización en la que sus actividades  son conducidas por datos, y las decisiones tomadas son basadas en evidencias más que en la experiencia e intuición; teniendo como ejemplo de tales a algunas compañías de Internet y que son sus claros exponentes: Google, Amazon, Facebook y Linkedin o grande retailers como Walmart, todas son ejemplos de ello; ahora bien estas compañías están lejos de nuestra realidad latinoamericana y peruana, pero sin embargo es importante ir aprendiendo de su experiencia adquirida en el manejo de los datos para nuestros procesos de analítica de datos que posiblemente estemos operando; Por ejemplo podemos citar un caso, el de generación de “datos de calidad”, el caso de como Walmart reconoció allá en 1980 que la calidad de sus datos era insuficiente para luego convertirse en la primera compañía en usar códigos de barra en sus cajeros registradores. La compañía deseaba saber que productos se vendían y como la ubicación de estos en sus almacenes impactaban en sus ventas, también necesitaba entender como las tendencias estacionales y las diferencias regionales entre sus locales afectaban a sus clientes. Pues conforme el número de tiendas y volumen de productos aumentaba, la complejidad de la gestión de sus inventarios se incrementó. Pero gracias a su data histórica y de calidad, sus procesos organizacionales orientados a datos, y combinado con modelos predictivos ágiles, la compañía estuvo apta para soportar su curva de crecimiento de una manera sostenible.

Fedex y UPS  son también otros casos de compañías conocidas por usar los datos para competir. Los datos de UPS, lo han conducido a la realización de que, si sus conductores de camiones solo toman vueltas a la derecha (limitando las vueltas a la izquierda) producirá una mejora considerable en el ahorro de combustibles y en su seguridad, a la vez que reducirá los tiempos perdidos. Estos resultados fueron y son sorprendentes, pues UPS ha eliminado algo de 20 millones de millas innecesarias de sus rutas en solo un año.

Hemos visto una breve introducción al Data Driven, en el siguiente artículo profundizaremos más en sus desafíos.

1 Libro Data Driven (free)

2 Muestra del Libro Data Science for Business

 

 

Data Driven y su contexto en el Big Data
Si te gusto, comparte ...Email this to someone
email
Share on Facebook
Facebook
Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Share on Google+
Google+
Etiquetado en:                

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Facebook
A %d blogueros les gusta esto: