Entradas

Mostrando entradas de marzo, 2016

Partición real-time en un Datawarehouse

Imagen
Es cada vez más habitual la necesidad de tener los datos en nuestros sistemas de Business Intelligence lo más actualizados posibles y eso implica el tener un datawarehouse lo más próximo al real-time que podamos.




Vamos a ver una forma de implementarlo:

En un DW nos puede interesar combinar la actualización de datos en batch con una actualización real-time. El objetivo podría ser obtener informes de los datos procedentes de un proceso batch diario nocturno que nos muestran el estado de los eventos de negocio a cierre del día anterior y por otro lado poder obtener informes sobre los eventos de negocio que ocurren durante el mismo día de la solicitud del informe.
- ¿Cómo debo almacenar la información para guardar los datos procedentes del batch diario nocturno y los datos real-time?- ¿Cómo debo implementar los procesos ETL para realizar esta doble actualización?
En nuestro DW tendremos una tabla de hechos que guarde los datos cargados en el proceso batch diario que llamaremos partición estát…