Entradas

Mostrando entradas de septiembre, 2015

Ejecutar modelos SAS/Enterprise Miner desde SAS/Enterprise Guide

Imagen
Muchos de los procesos de analítica que habitualmente realizamos en los proyectos SAS  quedan soportados por las funcionalidades de SAS/Enterprise Guide, en los casos en los que trabajamos con modelos más avanzados una de las herramientas de SAS que permite hacerlos es SAS/Enterprise Miner. En este post vamos a ver cómo integrar un modelo generado en Miner en un flujo de proceso de Guide.
En el siguiente ejemplo, tenemos un modelo basado en el algortimo de árbol de decisión generado en Enterprise Miner.


El siguiente paso es generar el modelo como paquete en Miner, para ello:


A continuación es necesario registrar el modelo:



Una vez registrado, ya es posible acceder a él desde un proceso de Enterprise Guide. Para ello hacemos uso de la tarea 'Model scoring' del grupo de tareas 'Data mining'.


Seleccionamos desde la tarea el modelo a aplicar en el flujo:


Finalmente lo integramos dentro del proceso guide para aplicar el modelo a los datasets del proceso.


Más info y formación práct…

Mapas en Qlikview

Imagen
Qlikview es una de las principales herramientas de visualización analítica de la actualidad, disponiendo de múltiples opciones de visualización gráfica:




En lo relativo a georeferenciar la información tenemos distintas opciones.

Componentes (de pago):

http://www.qlikmaps.com/ http://www.geoqlik.com/
Extensiones (gratuitas):

Google maps cluster New QlikView Mapping Extensions on QlikMarket Google Maps - Heatmap Another Google Maps Extension google map extension objects.
A continuación mostramos un breve ejemplo de creación de mapas utilizando la extensión Google maps Cluster.

Cargamos un conjunto de datos breve como ejemplo para georeferenciar:
ventas: LOAD * INLINE[
latitude, longitude, ciudad, ventas
40.41 , -3.7 , Madrid, 100
48.85, 2.35, Paris, 200
51.51 , -0.12 ,Londres, 100
38.9, -9.1, Lisboa, 50
]
El primer paso es bajar el archivo .qar: GoogleMaps - Cluster.qar e instalarlo. 

A continuación desde Qlikview trabajamos en vista webview:

Incluimos objeto de hoja y seleccionamos extensiones:

Seleccionamos l…

Análisis exploratorio de datos en R

Imagen
Dentro de las actividades de análisis de datos, está el análisis exploratorio de los datos fuente. Datos fuente que se utilizarán en diferentes tipos de procesos: integración de datos, reporting, modelos predictivos, etc..

Dicho análisis se basa en gráficos y estadísticos que permiten explorar la distribución identificando características tales como: valores atípicos o outliers, saltos o discontinuidades, concentraciones de valores, forma de la distribución, etc...

Es un paso básico y necesario en lo que llamamos data science y en general muchas actividades relacionadas con el análisis y tratamiento avanzado de datos.




El lenguaje estadístico R dispone de una gran cantidad de funciones y utilidades que facilitan este trabajo.  A continuación listamos algunas de las más importantes y útiles con ejemplos. Los pasos del ejemplo se basan en un dataset creado en el paso inicial, lo cual facilita su reproducción.


# Análisis exploratorio
# dataset de ejemplo: dataf
producto <- sample(c("P1&…