Tecnología
Nov 6, 2020

Analítica en tiempo real para la rápida toma de decisiones

Para un alto número de organizaciones el contexto analítica de datos tradicional no es suficiente. Usualmente, la analítica tradicional evoluciona en periodos de tiempo fijos (batch), en intervalos de tiempo requeridos por el negocio. Típicamente estos intervalos suelen ser de varias horas, días o semanas. En este contexto la analítica evoluciona en periodos de tiempos fijos.

En muchos contextos, este esquema de análisis y soporte a la toma de decisiones no es suficiente y se requiere realizar consumo de los datos en un tiempo muy cercano al momento en que se originan: cercano al tiempo real. La analítica en tiempo real, no se asocia a la velocidad de consumo de los datos, sino al procesamiento inmediato de la información para su consumo; en un stream de información. Usualmente, al contrario de la analítica tradicional, la analítica en tiempo real (RTA)es utilizada en aplicaciones y procesos de misión crítica, donde el contexto de las decisiones necesita ser prácticamente inmediato.

Aplicabilidad

Son múltiples las aplicaciones, servicios y contextos en los que la RTA representa la piedra angular: 

  • Contextos de IoT, en el cual se deben analizar y tomar decisiones con base en sensores y métricas críticas de procesos o eventos.
  • Experiencia de clientes en tiempo real, analizando el comportamiento de los usuarios y ajustando el funcionamiento de los servios y la experiencia a las necesidades.
  • Contextos de alta demanda, como click-stream, motores de recomendación u otros que requieren un rápido ajuste a las necesidades.

Servicios RTA en AWS 

Existen tres servicios principales para la realización de analítica en tiempo real en Amazon Web Services, más un cuarto servicio enfocado principalmente en la captura y procesamiento de streams media.

Kinesis Data Streams

Es un servicio de recopilación y manipulación de streams de datos, que ofrece las siguientes características: 

  • Rendimiento real-Time
  • Alta durabilidad de datos
  • Capacidad escalable configurable
  • Encriptación vía KMS
  • Esquemas de pago por uso en el stream

Los casos de negocio más comunes más comunes para el uso de Kinesis Data Stream son analítica de logs, IoT,Telemetría, Feeds de videojuegos, Fintech, Detección de fraudes, etc. En Kinesis Data Streams, el contexto de generación de datos continuos (stream) y la toma de decisiones en los datos continua, puede hacerse en un tiempo inferior a 70 ms.

Kinesis Data Firehose

Es un servicio de Delivery de datos hacia diferentes servicios de analítica con las siguientes características:

  • Completamente Autoadministrado
  • Autoscaling basado en throughput
  • NearReal-Time Delivery Stream
  • Soporte para Transformaciones, compresión y conversión
  • Encriptación vía KMS
  • Modelo de pago por uso

Los casos de negocio más comunes más comunes para el uso de Kinesis Data Firehose son analítica de logs, IoT, analítica de tráfico y click-streams, etc. En Kinesis Data Firehose, el contexto de generación de datos continuos (stream) y la toma de decisiones en los datos continua, puede hacerse en un tiempo de 1 a 5 min, o 1 MB a 128MB (lo que primero ocurra).

Kinesis Data Analytics

Es un servicio de Análisis de datos en tiempo real con sintaxis SQL con las siguientes características:

  • Sin infraestructura (Serverless)
  • Autoelasticidad
  • Schema Discovery de los datos
  • Procesamiento menor a 1 seg
  • Soporte sintaxis SQL-Like
  • Modelo de pago por uso

El contexto de uso más común para el servicio es el procesamiento y enriquecimiento continuo de datos, análisis SQL a medida que los datos son producidos.

Otras entradas