lunes, 27 de julio de 2015

SAS Visual Analytics

SAS Visual Analytics es una  solución de analítica de negocio que  permite explorar visualmente todos los datos con un interfaz fácil de usar y accesible a usuarios de todos los niveles, sin necesidad de conocimientos estadísticos, técnicos o de diseño. 


Visual Analytics dentro de las soluciones B.I. disponibles en el mercado se posiciona dentro de las soluciones de visualización analítica. En este grupo tenemos soluciones como Qlikview, Tableau, Tibco Spotfire y otros. De forma resumida la propuesta de este tipo de soluciones es la siguiente:

  • Las herramientas de visualización analítica permiten realizar análisis interactivo apoyándose en ágiles funcionalidades de visualización y gestión de datos, permitiendo realizar un análisis libre sobre el modelo de datos importado en la herramienta.
  • La orientación de estas herramientas suele ser de autoservicio B.I., facilitando la integración y análisis de datos con poca intervención de IT
  •  Las capacidades de visualización, permiten así mismo realizar presentaciones claras y eficaces que ayuden en la toma de decisiones.
  • Agilidad y rapidez  en el manejo de datos apoyándose en tecnologías in-memory.
  • Estas herramientas se apoyan en una interfaz intuitiva que facilita la exploración de datos orientada tanto a perfiles TI como analistas de negocio

SAS Visual Analytics ofrece una plataforma completa para la visualización analítica, lo que permite identificar los patrones y las relaciones de los datos que antes no eran evidentes. Las capacidades interactivas de BI y reporting de autoservicio se combinan con la analítica avanzada para que todos puedan descubrir conocimientos de cualquier tamaño y tipo de datos.
Vamos a conocer las características de la herramienta, analizando cada uno de sus módulo principales, así como su arquitectura técnica:

  • Preparación de datos:  importación y preparación de datos para su posterior visualización y análisis.
  • Análisis exploratorio: módulo para explorar, analizar y visualizar los datos, con objeto de identificar patrones, tendencias y conocimiento en los dato.
  • Diseñador de informes: módulo de reporting para diseño de informes y dahboards.
               
Preparación de datos:

SAS/VA dispone de un módulo de importación de datos y otro de  preparación de datos basado en SQL que permite adecuar los datos importados a la estructura óptima para su explotación. Para obtener la mayor potencialidad de análisis es recomendable que  la herramienta trabaje sobre una tabla agregada que consolide la información de varias tablas y fichero de partida. Se trata de el clásico tablón obtenido como cruce de N tablas de hechos y dimensiones. La herramienta también habilita la opción de trabajar con un modelo en estrella en el que la tala de hechos y las dimensiones serían tablas independientes.

La herramienta dispone de un módulo para preparación de datos que permite realizar transformaciones sobre los datos importados basadas en SQL realizados en un query builder. Es posible que este módulo se quede un tanto escaso cuando las transformaciones a realizar son medianamente complejas, en este caso SAS propone el uso de Enterprise Guide, ofreciendo la opción Visual Analytic Pro (Visual Analytics + Enterprise Guide).

 Sobre los campos de las tablas importadas es relativamente sencillo derivar campos utilizando los elementos calculados que de una forma sencilla da acceso a un potente editor de expresiones.



Análisis exploratorio:

Una de las principales diferencias de SAS con respecto a otras herramientas de visualización analítica son su capacidades de análisis avanzado (técnicas predictivas, series temporales, asociaciones, etc..) basándose en la larga experiencia de SAS en herramientas de este tipo como SAS/Enterprise Miner.  Los algoritmos a aplicar en análisis predictivo  se detectan automáticamente, pudiendo obtener info de detalle del algoritmo seleccionado. Es posible crear de forma sencilla árboles de decisión para realizar grupos o clasificaciones en los datos, así como diagramas de box-plot para conocer en profundidad la distribución de los datos.

Posibilidad de obtener de forma sencilla series temporales para realizar proceso de forecasts. Estos procesos son muy sencillos de implementar, pero se quedarían cortos si pensamos en un forecast más industrializado que permitiera realizar un forecast masivo cuyo resultado sería entrada para otros sistemas (ejemplo previsión de necesidad de stocks), en estos casos es más recomendable ir a soluciones tipo SAS Forecast Server.

En los procesos predictivos, podemos emplear la funcionalidad "factores subyacentes" que nos permite evaluar cómo afectan otras variables a nuestra predicción pudiendo realizar análisis de escenarios y simulaciones “what-if”.

Posibilidad de conectarse mediante add-in a Visual Statistics para procesos de análisis estadístico más avanzados.

Utilidades para conocer las relaciones entre las variables, tales como matrices de correlación. Estadísticas descriptivas que permiten conocer la distribución de valores en las variables (mínimas, máximas, media, nulos, etc..)


Diseñador de informes:

Diseñador de informes de uso muy intuitivo (arrastar y soltar). De forma sencilla podemos crear informes o dashboard utilizando los objetos de gráficos y visualización en lo que incluimos los indicadores o clasificadores que seleccionemos.

Posibilidad de incorporar a los dashboards documentos de análisis obtenidos en los procesos de análisis exploratorio.

Una vez diseñados un serie de objetos gráficos sobre un documento podemos definir interacciones entre ellas, para relacionar las selecciones realizadas en algunos de ellos con otros objetos o para definir una navegación entre los mismos.

SAS Visual Analytics  incorpora múltiples posibles visualizaciones  diagramas de cajas, mapas de calor, gráficas de burbuja animadas, diagramas de red, árboles de decisiones, geolocalización. Así mismo, las capacidades de autocharting que ayuda a determinar la gráfica más adecuada para desplegar los datos según los elementos seleccionados para el análisis. Una barra de visión general permite hacer zoom sobre los rangos de datos que se deseen sin perder la visión completa.

Organización en dimensiones y jerarquías para realizar análisis OLAP multidimensional.

Creación, visualización, publicación y distribución de análisis e informes multidispositivo. Integración con Office: Outlook, SharePoint, Excel y Power Point

Arquitectura técnica:

Los tiempos de respuesta son ágiles debido a que los datos son cargados en memoria, basándose en SAS LASR (servidor analítico en memoria de alto desempeño).
Solución orientada a Cloud con opción también on premise

En resumen se trata de una potente herramienta de visualización analítica, que es una interesante opción  para aquellas empresas que sin tener que realizar una gran inversión inicial, quieran empezar a realizar analítica, con la posibilidad de escalar y crecer hacia otras herramientas.

Más info y formación en SAS: Formación SAS




6 comentarios:

  1. Hola! Tengo una duda a la hora de realizar lo siguiente con SAS:
    como puedo limpiar de una vez la base de datos con la que estoy trabajando de valores perdidos? Es decir, quedarme con una base solo con registros completos.
    Un saludo y muchas gracias!

    ResponderEliminar
  2. Tienes que quedarte con los registros que no sean nulos.
    Si tu clave es: campo1, campo2, ..., campoN
    proc sql;
    create table tablasas as
    (select * from ....
    where campo1 is no null and campo2 is not null and...... and campoN is not null);
    quit;

    El tema de validar nulos en SAS a veces da problemas. según el tipo de dato (alfanumérico, numerico) si alguno te da problemas dímelo y buscamos otra forma de validarlo. Saludos




    ResponderEliminar
  3. Hola,

    Estamos interesados en SAS visual analytics, pero tenemos una duda con la herramienta. Cuando te refieres a construir una tabla agregada que consolide la información de varias tablas y fichero de partida.

    ¿Signifca que en un cuadro de mando solo puede haber una sola tabla agregada?.
    ¿Pueden haber varias tablas agregadas, ya sea de diferentes consultas o de diferentes bases de datos?.
    ¿Ha de haber una única tabla agregada por cada pestaña?.
    ¿Pueden haber tablas sin agregar para hacer el drill down?.

    Muchas gracias por tus respuestas y felicidades por tu blog.

    ResponderEliminar
  4. Hola,

    Me refiero por tabla agregada al clásico tablon con muchas columnas que aglutina información procedente de múltiples fuentes. La típica tabla obtenida después de muchos cruces. La tabla está al detalle que necesites y luego la herramienta agrega y hace drill down.
    Un dashboard tira de una tabla agregada y todas las pestañas de este dshboard tiran de esta tabla.
    Puedes generar varias tablas agregadas para tus diferentes exploraciones, informes o dashboards si son muchas ten cuidado con la gestión de memoria ya que si son muy voluminosas no podrás subirlas todas a la vez a memoria.

    Cualquier otra duda, me dices e intento ayudar, si puedo

    Saludos y gracias

    ResponderEliminar
  5. Hola,

    Muchas gracias por tu ayuda. Entonces me confirmas que puedo en un solo dashboard cargar varias tablas agregadas al detalle que necesite.Pero recomiendas que se haga en una única tabla.

    Me puedes más o menos estimar cuantas tablas , en teoria, puede aguantar subidas.

    De aquí, me surge otra duda. Si tengo varios dashboards y cada uno con su "tabla" o "tablas". el hecho de que hayan varios dashboards a la vez con sus tablas subidas ¿me puede afectar eso también en la memoria?.

    Gracias un cordial saludo.

    ResponderEliminar
  6. Efectivamente, SAS recomienda trabajar sobre un único tablón. El número de tablas subidas depende del tamaño de las tablas y de la memoria que tenga el LASR. Si varios dasboards acceden a diferents tablas y necesitan que estén subidas a memoria, tienen igualmente que revisar el monitor de memoria del LASR.
    saludos,

    ResponderEliminar