Implementando una estrategia de Big Data

Big Data no es una tecnología única, sino una combinación de tecnologías antiguas y nuevas que ayudan a las empresas a obtener información procesable. Por lo tanto, el big data es la capacidad de administrar un gran volumen de datos dispares, a la velocidad adecuada y dentro del marco de tiempo adecuado para permitir el análisis y la reacción en tiempo real. Como notamos anteriormente, los macrodatos generalmente se dividen en tres características:

Volumen: la cantidad de datos

Velocidad: qué tan rápido se procesan esos datos

Variedad: los diversos tipos de datos

Aunque es conveniente simplificar los grandes datos en los tres Vs, puede ser engañoso y demasiado simplista. Por ejemplo, puede estar administrando una cantidad relativamente pequeña de datos muy dispares y complejos, o puede estar procesando un gran volumen de datos muy simples. Esa información simple puede estar estructurada o no estructurada. Aún más importante es la cuarta V: veracidad. ¿Cuán precisos son esos datos para predecir el valor comercial? ¿Los resultados de un análisis de big data realmente tienen sentido?

Es fundamental que no subestimemoss la tarea que se tiene entre manos. Los datos deben poder verificarse en función de la precisión y el contexto. Por ejemplo, una empresa innovadora puede querer analizar cantidades masivas de datos en tiempo real para evaluar rápidamente el valor de ese cliente y el potencial de ofrecer ofertas adicionales al mismo. El Big Data incorpora todos los datos, incluidos datos estructurados y datos no estructurados de correo electrónico, redes sociales, secuencias de texto y más. Este tipo de gestión de datos requiere que las empresas aprovechen sus datos estructurados y no estructurados.

Info: Datos estructurados son los datos que se pueden agrupar en una base de datos de manera sencilla, por lo general en filas y columnas. Los datos no estructurados no tienen un orden definidos previamente.

Construir una arquitectura exitosa de gestión Big Data.

Hemos pasado de una era en la que una organización podría implementar una base de datos para satisfacer una necesidad específica del proyecto y listo, pero a medida que los datos se han convertido en el combustible del crecimiento y la innovación, es más importante que nunca tener una arquitectura subyacente para satisfacer los crecientes requisitos.

Comenzando con capturar, organizar, integrar, analizar y actuar

Antes de profundizar en la arquitectura, es importante tener en cuenta los requisitos funcionales. La Figura siguiente ilustra que los datos primero deben ser capturados, y luego organizados e integrados. Después de que esta fase se implemente con éxito, los datos se pueden analizar en función del problema que se está abordando. Finalmente, la administración toma medidas basadas en el resultado de ese análisis.

Por ejemplo, Amazon podría recomendar un libro basado en una compra anterior o un cliente podría recibir un cupón por un descuento para una futura compra de un producto relacionado a uno que acaba de comprar. Aunque esto suena sencillo, ciertos matices de estas funciones son complicados. La validación es un tema particularmente importante. Si su organización está combinando fuentes de datos, es fundamental que tenga la capacidad de validar que estas fuentes tengan sentido cuando se combinan. Además, ciertas fuentes de datos pueden contener información sensible, por lo que debe implementar niveles suficientes de seguridad. Por supuesto, cualquier incursión en Big Data primero debe comenzar con el problema que estás tratando de resolver. Eso dictará el tipo de datos que necesita y cómo se verá la arquitectura.

Establecer la base arquitectónica

Además de soportar los requisitos funcionales, es importante respaldar el rendimiento requerido. Sus necesidades dependerán de la naturaleza del análisis que esté apoyando. Necesitará la cantidad correcta de potencia y velocidad computacionales. Si bien parte del análisis que hará se realizará en tiempo real, inevitablemente también almacenará cierta cantidad de datos. Su arquitectura también debe tener la cantidad correcta de redundancia para que esté protegido de la latencia y el tiempo de inactividad no previstos.

Su organización y sus necesidades determinarán cuánta atención tiene que poner a estos problemas de rendimiento.

  • ¿Cuántos datos necesitará gestionar mi organización hoy y en el futuro?
  • ¿Con qué frecuencia necesitará mi organización administrar datos en tiempo real o casi en tiempo real?
  • ¿Cuánto riesgo puede afrontar mi organización?
  • ¿Está mi industria sujeta a estrictos requisitos de seguridad, y cumplimiento?
  • ¿Qué tan importante es la velocidad para mi necesidad de administrar los datos?
  • ¿Cuán ciertos o precisos deben ser los datos?

Para comprender el Big Data, ayuda a diseñar los componentes de la arquitectura. Una arquitectura de administración de datos grandes debe incluir una variedad de servicios que permitan a las empresas hacer uso de innumerables fuentes de datos de una manera rápida y efectiva. En el siguiente artículo, explicamos cada componente y describiremos cómo se relacionan entre sí.