jueves, 21 de mayo de 2015

Preparando el panel: ¿Qué es Big Data?

Con relación al panel de IIR México, si bien la primera cuestión que debo revisar es Cómo transformar el Big Data en información relevante para su empresa, me parece sensato contar con una breve introducción de este concepto tan difundido; afortunadamente no faltan fuentes de información al respecto en la red y sólo es cuestión de buscar, leer y sintetizar. Es así que armado con una taza de café y una selección ecléctica de música, dispóngome a encontrar una fuente que me permita introducir decentemente un tema tan indecentemente amplio.

Así, navegando entre los contenidos de los grandes fabricantes como Oracle o IBM, me encuentro con el enlace del Glosario de IT de Gartner:
"Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making."
Es decir, Big Data se trata de ingentes volúmenes de datos sumamente diversos generados muy rápidamente; ciertamente la definición habla de información, pero en mi particular punto de vista me parece que ésta se obtiene a partir de algún proceso -que no necesariamente automático- sobre los datos. Sin embargo, habiendo hecho la aclaración, resultará más fácil para la narrativa tratar indistintamente ambos conceptos.

Por otro lado y siguiendo con Gartner, el objetivo de procesar estos datos es generar información que permita tanto mejorar el conocimiento interno de una organización como apoyar la toma de decisiones de la misma, 

Ahora bien ¿de dónde procede toda esta información? De prácticamente todos lados; podríamos decir incluso que los datos siempre han estado ahí y sólo era necesario encontrar el mecanismo para recolectarlos. Un ejemplo burdo: un automóvil. Como usuario normal de un vehículo, probablemente me interesa saber en términos generales la velocidad que puedo alcanzar y los kilómetros por litro que me dará como una medida de su desempeño. Estas variables podría empezar a almacenarlas y procesarlas para mejorar mi planeación para viajar, pues conociendo la distancia hacia un destino, estaré en condiciones de estimar el costo de la gasolina que requiere el viaje así como el tiempo en el que estaré llegando. 

Hasta ahí, los datos recolectados son manejables en términos de almacenamiento y procesamiento incluso con una hoja Excel; sin embargo ¿qué pasaría si además me gustaría considerar otros factores tales como la temperatura del automóvil, el consumo del aceite, el estado de la batería, el desgaste de los frenos, la presión de las llantas y de hecho, prácticamente todos los datos que proporciona cada uno de los sensores que se instalan actualmente en un vehículo? ¿Y si además quisiera esta información en intervalos cada vez más cortos? En ese momento, la información generada crece exponencialmente y sin hablar aún del procesamiento, se requerirá de una capacidad de almacenamiento muchísimo mayor que la requerida originalmente para la velocidad y el consumo de gasolina. 

Si hasta este momento hemos determinado que la capacidad de almacenamiento para toda esta información debe ser enorme, la capacidad de procesamiento no se queda atrás. Y es entonces que de manera natural, se hace presente Big Data.





No hay comentarios:

Publicar un comentario