Entradas

Mostrando entradas de abril, 2014

Ejemplo procedimiento ANOVA en SAS

Imagen
En este post incluímos un ejemplo muy sencillo de empleo de procedimiento anova en SAS. En el ejemplo queremos ver la influencia de la variable ciudad en el consumo de un conjunto de clientes.  Se trata de validar si la ciudad influye en el consumo medio cliente, para ello empleamos el procedimiento anova.



Sin entrar a definir con detalle lo que es el Análisis de Varianza (ANOVA, ANalysis Of VAriance), si indicar que es un método que se basa en el estudio de las varianzas y que se puede utilizar para establecer diferencias entre medias arítmeticas de 2 o más grupos.
En nuestro ejemplo, vamos a analizar las medias de consumo mensual de clientes en base a su ciudad, pudiendo tomar la variable ciudad tres valores (Madrid, Barcelona y Valencia), para saber si existe alguna relación entre la ciudad y el consumo, Queremos comprobar si hay diferencias estadísticas significativas en las medias de los tres grupos o no las hay.
En primer lugar realizamos un proc means en base a la variable ciudad:

Calidad de datos: Detectar y eliminar duplicados en tablas SAS

Imagen
En el siguiente post mostramos diferentes formas de detectar y eliminar duplicados en SAS. Es un problema que nos encontramos con frecuencia en el tratamiento de datos y que debe estar bien controlado para asegurar la calidad de nuestra información.


En primer lugar mostramos diferentes técnicas para detectar duplicados:
/* Creamos tabla de ejemplo */
data ventas(drop = i j); length oficina $100.; oficina = 'Madrid'; do j = 1to20; producto = compress('P'||j); unidades = round(ranuni(1)*20); fecha = 20140401; output; if unidades > 15thendo;        fecha = 20140402; output; end; end; oficina = 'Barcelona'; do j = 1to20; producto = compress('P'||j); unidades = round(ranuni(1)*20); fecha = 20140401; output; if unidades > 15thendo;        fecha = 20140402; output; end; end; oficina = 'Valencia'; do j = 1to20; producto = compress('P'||j); unidades = round(ranuni(1)*20); fecha = 20140401; output;

¿Soporta tu plataforma B.I. el origen de datos que quieres analizar?

Imagen
Aunque las últimas versiones de la mayoría de las plataformas B.I. soportan una amplia gama de orígenes de datos, esta es una pregunta frecuente en la cual intervienen la versión de tu herramienta B.I, la versión de la base de datos, formato de fichero o ERP que actúa como origen de datos y el sistema operativo.



En el caso de SAS se pueden resolver estas dudas consultando la SAS/ACCESS Validation Matrix: seleccionas la versión de SAS, la base de datos, el sistema operativo y tienes la respuesta.

support.sas.com/matrix/list?SAS=All&Engine=All&OS=All&googleTrack=on



Procedimientos de agregación en SAS (proc sql, proc summary y proc means)

Imagen
En el siguiente post mostramos con ejemplos los diferentes métodos de agregación de los que disponemos en el módulo BASE de SAS. Se incluye un script con ejemplos utilizando el procedimientos generalista 'proc sql' o bien procedimientos propios de agregación como 'proc means' o 'proc summary'


En primer lugar mostramos el mismo agregado realizado en vía proc sql y vía proc summary o proc means:
proc sql: procsql; createtable agregado as (select dimension1, dimension2, sum(indicador1), avg(indicador2), max(indicador3) from detalle groupby dimension1, dimension2); quit;
proc summary: procsummary data=detalle nway; class dimension1 dimension2; var indicador1 indicador2 indicador3; output out=agregado(drop=_type_ _freq_)    sum=indicador1; run;
proc means: procmeansdata=detalle noprintnway; class dimension1 dimension2; var