Entradas

Mostrando entradas de 2016

SAS Cheat sheet (esos chuletarios que nunca vienen mal)

Imagen
Adjunto un link a un cheat sheet de SAS que puede resultar de utilidad:

Chuletario SAS


Formación SAS

Notificaciones desde procesos SAS: envio de mails

Imagen
Es común el tener que realizar notificaciones de distinto tipo al finalizar un proceso de reporting. En el siguiente ejemplo mostramos como enviar un e-mail desde un proceso SAS.




filename outbox email
   to='formacion@datademy.es'
   type='text/html'
   subject='Informe SAS'
   attach='/home/datademy/ficheros/consumo_clientes.txt' ;


ods html
   body=outbox /* Enviar por correo, en lugar de una ruta se le indica buzón email */
   rs=none;

title 'Informe consumo clientes';

data clientes_consumo;
id_cliente = 1; cod_periodo = 201610; consumo = 20; output;
id_cliente = 1; cod_periodo = 201611; consumo = 30; output;
id_cliente = 1; cod_periodo = 201612; consumo = 10; output;
id_cliente = 2; cod_periodo = 201610; consumo = 24; output;
id_cliente = 2; cod_periodo = 201611; consumo = 26; output;
id_cliente = 2; cod_periodo = 201612; consumo = 20; output;
run;


proc tabulate data=clientes_consumo;
class id_cliente cod_periodo;
var consumo;
table id_cliente , cod_periodo*consu…

Video tutorial: trasponer datos en SAS

Imagen
Adjuntamos un nuevo videotutorial donde mediante un ejemplo vemos como trasponer datos en SAS (procedimiento proc transpose) reorganizando la estructura de la tabla pasando campos de filas a columnas.



Esperamos que os sea de utilidad.

Más info:  Formación SAS

Nulos en SAS

Imagen
Es frecuente la necesidad de validar y gestionar la existencia de nulos en SAS en los datos que manejamos en los procesos de análisis de reporting.


A continuación añadimos un pequeño script SAS en el que aparecen ejemplos de asignación de nulos a columnas de tablas o de la validación de los nulos. En el ejemplo se ven los casos en los que el tratamiento de nulos difiere si la columna es numérica o alfanumérica y se muestran ejemplos de funciones útiles tales como: missing(), nmiss() y cmiss(). Igualmente se muestra alguna diferencia que existe entre validar nulos en una sentencia condicional if o en una clausula where. Esperamos sea de utilidad y nos sirva como breve compendio que nos evite los problemas comunes en la detección de nulos.

/* Validar nulos: diferentes opciones */

/* Tabla con campos nulos. Asignación de nulos */

data tabinput;
length campo1 $10 campo2 8.;
campo1 = ""; /* asignar nulos en alfanuméricos */
campo2 = 3;
output;
campo1 = "b";
campo2 = .; /* asignar…

Estandarización de variables en SAS

Imagen
Un paso muy habitual en los procesos de analítica es la estandarización o normalización de variables.  La normalización o estandarización es una técnica muy útil a la hora de comparar datos de diferentes distribuciones o que estén en unidades de medida diferentes.
Consiste en aplicar un cálculo sencillo a la variable objeto de estudio, de forma que conseguimos que los datos de la distribución normalizada tengan una media aritmética de 0 y una desviación típica de 1. 
Z i= (Xi - media aritmética)/(desv. típica) Zies el valor normalizado y lo obtenemos restando a cada valor original  Xi la media aritmética y dividiendo el resultado por la desviación típica
Es un paso previo que puede ser necesario en alguno algoritmos tales como la clusterización o las redes neuronales.
Para realizar este proceso en SAS nos basamos en el procedimiento proc standard.
Partimos del siguiente dataset de entrada:

Nos interesa estandarizar las variables: edad, antiguedad y consumo_yyyymm. Para ello:
data clientes1; se…

Integrar SAS y R. Procedimiento proc_R

Imagen
Vimos en una entrada anterior, como integrar SAS y R de diferentes formar:

Ejecutar script R desde SAS

En esta entrada, recomendamos otra forma de hacerlo basada en la macro proc_R:



Para ello es necesario descargar la macro: macro proc_R  y seguir los pasos que se indican en el siguiente post:

run R from SAS

Aprovechamos para recomendar la página www.listendata.com/ , donde es posible encontrar múltiples recursos de SAS.

Formación SAS

Videotutorial introducción a la importación de datos y constructor de queries con SAS

Imagen
Adjunto link sobre el video que he generado sobre cómo realizar una importación de datos en SAS




y un posterior paso para tratar la información importada con el constructor de queries:


Más info en:

Formación SAS


Descomposición de series temporales con SAS

Imagen
En este post vamos a ver un caso práctico de descomposición de series temporales con SAS. Inicialmente introducimos el concepto de serie temporal y su descomposición:

Una serie temporal se define como una colección de observaciones de una variable recogidas secuencialmente en el tiempo. Este tipo de datos son útiles cuando se quiere predecir la evolución de una variable que cambia a lo largo del tiempo. Las series temporales pueden mostrar una gran variedad de patrones. Suele ser útil descomponer una serie en partes, de forma de cada parte represente una parte del comportamiento:

Tendencia: incremento o decremento sostenido a medio o largo plazo en la serie
Estacionalidad: efectos estacionales (momento del año, mes, día de la semana..)
Ciclos: Subidas y bajadas variables e inestables sin aparente periodicidad fija. Puede ser ruido o puede contener información.



Podemos trabajar con series temporales en SAS en distintos módulos: SAS Enterprise Guide, SAS Visual Analytics, SAS Forecast Stu…

Convocatoria cursos SAS en Septiembre

Imagen
Próximas convocatoria del curso de SAS/BASE y Enterprise Guide en Madrid:





- Intensivo fin de semana (viernes tarde + sábado mañana): 9/10 Sept y 16/17  Sept . 20h

Profesorado: Consultores senior Business Intelligence ( > 15 años experiencia) con dilatada experiencia en SAS

Interesados: formacion@datademy.es

Localización: Madrid (zona metro Diego de León). Precio: 500 euros (descuento 40% para desempleados)
Es una formación muy práctica y el objetivo es conocer mediante la introducción de conceptos y la realización de ejercicios prácticos la herramienta SAS/Enterprise Guide y la programación SAS/BASE.

Perfiles a los que puede interesar:

- Consultores business intelligence
- Data scientists
- Actuarios de seguros
- Analistas de riesgos
- Perfil investigación: bioestadísticos, físicos, quimicos, etc..
No es necesario tener conocimientos iniciales en SAS, aunque es útil conocer a nivel básico el lenguaje SQL.

A las personas que hayan realizado un aprovechamiento óptimo del curso y estén interesadas…

Jornada calidad de datos (Deyde)

Imagen
Interesante jornada  la celebrada por  Deyde y que desde  datademy hemos podido asistir. Los temas relativos a la calidad del dato nos parecen cada vez más relevantes de cara a asegurar una base de información confiable para nuestros procesos analíticos.

En la jornada organizada por Deyde hemos podido ver las presentaciones de Luis Martinez
(director general Deyde) y de Jaime Roig (director comercial de Deyde) sobre la compañía y
sus interesantes productos a la que ha seguido la intervención de María Hernández (data scientist
de BBVA) que nos han mostrado interesantes ejemplos de innovadores proyectos de data science. Posteriormente Miguel Cruz (director marketing Reale) nos explicó los diferentes retos a los que la gestión de clientes se enfrenta en el sector seguros y como su estrategia se apoya en unos datos de clientes de calidad y confiables. Por último David Dominguez nos presentó los servicios de la compañia Wysedo-deyde  y Ana Calvo (analista datos Deyde) nos hizo una interesante …

Decisiones basadas en datos

Imagen
Ante los grandes eventos hay que tomar las mejores decisiones. Para ello es fundamental apoyarse en análisis y en datos.



Para ello es necesario formarse en Business Analytics y conocer las mejores herramientas del mercado: www.datademy.es


Segmentación de clientes basada en RFM con SAS

Imagen
El análisis RFM es una conocida técnica de segmentación del clientes. El modelo toma en consideración tres métricas:

1) Ticket medio de compra (Money)
2) Frecuencia de compra (Frecuency)
3) Tiempo qué hace que no compra (Recency)



En base a los resultados encontraré clientes de diferentes características. Alguno de los grupos que encuentro son:

- frecuencia de compra alta y ticket medio alto: clientes de alto valor (que debo cuidar)
- frecuencia de compra alta y bajo ticket medio: me interesa subir ticket medio (ofrecer otros productos)
- frecuencia de compra baja y ticket medio alto: me interesa subir frecuencia de visita (promociones con fecha)
- frecuencia alta y ticket medio alto, pero recencia baja: buenos clientes que debo recuperar ya que hace tiempo que no compran

Son sólo algunos de los grupos que puedo identificar y algunas acciones a tomar.

A continuación vamos a ver los pasos a dar para realizar un análisis RFM con SAS Enterprise Guide.

Partimos de un datasets con transacciones de com…

Formación Business Intelligence

Imagen
Un grupo de profesionales expertos en tecnologías Business Intelligence con amplia experiencia en proyectos ofrece formación en B.I. en las tecnologías líderes en el mercado:



El conjunto de tecnologías que se imparte es el siguiente:

Arquitecturas Business IntelligenceDiseño y creación de un Data Warehouse (integración, modelos dimensionales y reporting)Plataforma B.I. PentahoPlataforma B.I. OracleQlikviewTableauSAS BASE y Enterprise GuideSAS Visual AnalyticsAnálisis de datos con R Base de datos Oracle. SQL (básico, avanzado y tunning)Oracle PL-SQLIntroducción a Big Data

Con objeto de cubrir todas las áreas tecnológicas contamos con colaboradores especializados en tecnologías específicas.

El modelo que proponemos va desde un máster B.I., a formación en cápsulas que se pueden impartir de manera independiente y formando itinerarios formativos. Asimismo la formación está perfectamente acoplada para on-line como presencial.

El detalle de los itinerarios y de algunos de los módulos está en las …