domingo, 14 de julio de 2013

Soluciones analíticas in-database. Caso SAS - Teradata

Dentro de las soluciones de SAS enfocadas a la mejora de rendimientos y tiempos de respuesta en entornos analíticos destaca el esfuerzo realizado con la propuesta SAS In-Database. Esta propuesta va acompañada de otro tipo de soluciones high-performance como son SAS Grid Computing y SAS In-memory, que igualmente mejoran rendimiento, ayudan a gestionar la carga de trabajo y facilitan la escalabilidad de los entornos analíticos.
La solución SAS In-Database reduce la necesidad de mover grandes volúmenes de datos entre las soluciones SAS y los SGBD. Realizar el tratamiento de datos, los procesos analíticos o de reporting dentro de la base de datos donde reside esta información reduce movimientos de datos innecesarios y facilita las funciones de data governance. Por otra parte, permite aprovechar la arquitectura MPP de las bases de datos y entornos data Warehouse para mejorar la escalabilidad y el rendimiento de los procesos.
En particular, destaca la integración de SAS con Teradata. Este acuerdo ha creado SAS and Teradata Analytic Advantage Program, combinando la potencia analítica de SAS con las prestaciones en entornos data warehouse de Teradata.  
La solución reduce los costes en la preparación de datos para los procesos analíticos y mejora los tiempos en la obtención de los resultados analíticos. Optimiza la creación de modelos analíticos, convirtiendo los modelos SAS en objetos de base de datos. Se reduce el movimiento de datos, la redundancia y los problemas de refresco de datos.
El programa ofrece tres niveles, en función de las necesidades analíticas de la organización:
Express: Un primer nivel para facilitar el uso de estadística para resolver cuestiones de negocio. Integra los módulos de SASSAS Analytics Pro, SAS/ACCESS Interface to Teradata y SAS Enterprise Guide.
Advanced: Ofrece más soluciones de in-database analytics, como rápida creación y entrenamiento de modelos estadísticos. Integra los módulos de SAS: SAS SAS Analytics Pro, SAS/ACCESS Interface to Teradata y SAS Enterprise Miner y SAS Scoring Accelerator for Teradara.
Entreprise: Una solución completa que ofrece un completo portfolio de modelos analíticos. Centraliza la creación, desarrollo, implantación y gestión de modelos. Automatiza los procesos analíticos de apoyo a la toma de decisiones en cualquier nivel de la organización. ntegra los módulos de SAS: SAS SAS Analytics Pro, SAS/ACCESS Interface to Teradata y SAS Enterprise Miner, SAS Model Manager y SAS Scoring Accelerator for Teradara.
Como ejemplo sencillo de integración de los procedimientos SAS en Teradata, la documentación de SAS, nos ofrece el siguiente caso:
Un procedimiento de uso bastante extendido en SAS es el procedimiento PROC FREQ. Este procedimiento realiza una estadística descriptiva sencilla en base a un set de datos de SAS.
Veamos un caso:
proc freq data=customer.credit_data;
table state * credit_score;
La especificación DATA= indica al procedimiento PRO FREQ que la tabla de entrada es custormer.credit_data, donde customer indica el esquema de base de datos. credit_data es el nombre de la tabla de la BBDD de Teradata. El procedimiento obtiene estadísticas de los valores de la columna credit_score agrupados por el campo state.
Para obtener los resultados, los valores únicos de la columna crédito_score de la tabla crédito_data deben ser contados por el campo state. El procedimiento PROC FREQ obtiene   también los valores mínimos y máximos.
Para obtener estos mismos resultados in-database, se genera dinámicamente el SAS SQL equivalente al procedimiento PROC FREQ. Esta SQL es enviada al módulo SAS/ACCESS que a su vez lo envía al motor de la base de datos Teradata
select count(*) as f1, state, min(state) as f2, credit_score,
min(credit_score) as f3, max(credit_score) as f4
from customer.credit_score group by state, credit_score

No hay comentarios:

Publicar un comentario