Más allá de las tres V’s de Big Data

Francisco Conteras, líder de Big Data nos explica el impresionante mundo de los datos y el cómo sacarle provecho a esta ciencia de datos…

Actualmente, el termino Big Data es mencionado con bastante frecuencia en nuestro entorno, sin embargo, no contamos con una conceptualización clara de qué es, para qué sirve o cómo utilizar Big Data en la empresa… Si eres un usuario de redes sociales, realizas compras en línea o ves series de televisión y películas a través de internet, lo más probable es que ya eres un usuario de Big Data y no lo sabías.

Cuando realizamos una consulta en Internet buscando una definición para el término Big Data, seguramente encontraremos una gran variedad de definiciones, pero el común denominador de estas definiciones sean las denominadas tres V´s: volumen, variedad y velocidad.

Si bien estos tres componentes son características que pueden diferenciar a Big Data de otras Tecnologías de Información, por si solas no conformarían un Big Data.

Manejar Teras o Peta bytes de información (volumen), captar datos en tiempo real, en streaming o a través de un puerto de comunicación (velocidad) e integrar datos estructurados con no estructurados en un mismo almacén (variedad); lo anterior quizá lo podríamos conseguir con tecnologías tradicionales que conocemos, no obstante, su costo sería muy alto.

Los costos para habilitar un almacén de datos (Data Warehouse) que soporte Petabytes son muy altos, tanto por el licenciamiento como por el hardware requerido, el costo de desarrollo para integrar información externa (redes sociales, por ejemplo) quizá no sea muy alto, pero lo oportuno del resultado obtenido y el esfuerzo de su mantenimiento si lo será.

El par de casos mencionados en el párrafo anterior traen consigo otra característica: el costo- beneficio (o valor).  Es aquí donde podemos conjugar el volumen, la variedad y la velocidad con el costo – beneficio para comprender el valor que Big Data trae consigo al negocio.

Para ilustrar mejor el campo de Big Data, es pertinente revisar brevemente el panorama actual de los datos, para posteriormente adentrarnos al mundo Big Data.

El panorama actual de los datos digitales

Las fuentes donde actualmente se generan y almacenan los datos han evolucionado y diversificado drásticamente, ya no sólo son las grandes bases de datos de la empresa o el tráfico generado por las páginas tradicionales de los sitios Web, lo podemos constatar además con las redes sociales, la tecnología móvil o el Internet de las Cosas.

Esta evolución y diversificación de los datos digitales lleva consigo grandes retos:

  • Integración de diversos tipos de datos en una sola plataforma.
  • Manejo de altos volúmenes de datos: bases de datos históricas o datos provenientes de redes sociales, por ejemplo.
  • Control de diferentes frecuencias en que los datos son generados y transmitidos: dispositivos de geolocalización, redes sociales o IoT.
  • Diversidad de formatos de datos.

¿Cómo generar valor a partir de todos estos datos?

Intentar solventar cualquiera de estos retos con las Tecnologías de Información tradicionales es inviable en ciertos casos, y en otros, los costos de inversión y de operación son muy altos. Si requerimos utilizar alguna de estas fuentes de datos, un buen inicio sería identificar su tipo para saber cómo tratarla.

De una manera práctica los podemos clasificar en Datos Estructurados y No Estructurados; para ello nos podemos apoyar de las siguientes figura:

Probablemente te estas preguntando, de qué me sirve utilizar o integrar datos no estructurados en mis plataformas corporativas (donde sólo hay datos estructurados), sin embargo, no te has cuestionado… ¿realmente conoces a fondo a tus clientes?, ¿sabes qué les gusta o en qué se interesan?, ¿sabes lo que el público en general opina de tus productos y/o servicios?, ¿puedes identificar que clientes están a punto de irse con la competencia y por qué causas?, ¿tienes la capacidad de detectar en tiempo real alguna transacción inusual o sospechosa en tus sistemas?… Estas y muchas otras preguntas las podrías contestar integrando las fuentes de datos de la nueva era digital.

Big Data

En primer lugar, hay que mencionar que Big Data no es una tecnología, en realidad es un concepto, el cual podemos definir como:

“El conjunto de datos constituido por fuentes de cualquier tipo (estructuradas y no estructuradas), y que por su naturaleza, ya sea volumen, velocidad de respuesta requerida o variedad, no puede ser recolectado, gestionado y analizado por herramientas tradicionales de software.”

Al mundo de Big Data se han incorporado métodos y herramientas de análisis para obtener un mejor entendimiento de los datos, y por ende un mayor y profundo conocimiento. En estas herramientas básicamente se implementan métodos estadísticos y algoritmos de aprendizaje automático (principalmente machine-learning y redes neuronales) para realizar predicciones, generar recomendaciones, mejorar procesos o identificar comportamientos, a todo esto, se le ha denominado Ciencia de Datos.

Se le denomina Ciencia, ya que su labor se fundamenta en el método científico (demostración de la verdad -o falsedad- de una hipótesis o pregunta); es interdisciplinaria por que toma elementos de las Ciencias de la Computación, las Matemáticas y Negocios. Si bien la Ciencia de Datos puede estar separada de Big Data y de Hadoop, al combinarlas el potencial que se puede generar es incomparable con cualquier otra plataforma de análisis de datos.

La contribución al negocio – VALOR

Un proyecto Big Data debe ser conducido por casos de uso, es decir, identificar que deseo conocer o qué incógnita pretendo aclarar de mi negocio para posteriormente delimitar los recursos necesarios, lo anterior es la base para llevar a buen término el proyecto. Existen casos de usos específicos por industria, sin embargo, existen otros que pueden ser utilizados en cualquier sector.

También es importante mencionar que hay casos de uso cuya fuente es 100% información estructurada, pero por algún requerimiento de negocio y/o tecnológico el resolverlo con Big Data es la opción más factible.

A continuación, encontrarás información de casos de uso típicos de Big Data en la empresa:

Estas son solo algunas de sus aplicaciones reales, y cada vez son implementadas más soluciones Big Data dentro de las compañías (ver gráfica), ya que brinda una oportunidad para diseñar nuevas formas de hacer negocios, re descubriendo a la organización, manteniéndose competitivo en el mercado y además a la vanguardia tecnológica.

Fuente: Dresner Advisory Services, Big Data Analytics Market Study, Diciembre 2016.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *