Entradas

Mostrando entradas de octubre, 2016

Estandarización de variables en SAS

Imagen
Un paso muy habitual en los procesos de analítica es la estandarización o normalización de variables.  La normalización o estandarización es una técnica muy útil a la hora de comparar datos de diferentes distribuciones o que estén en unidades de medida diferentes.
Consiste en aplicar un cálculo sencillo a la variable objeto de estudio, de forma que conseguimos que los datos de la distribución normalizada tengan una media aritmética de 0 y una desviación típica de 1. 
Z i= (Xi - media aritmética)/(desv. típica) Zies el valor normalizado y lo obtenemos restando a cada valor original  Xi la media aritmética y dividiendo el resultado por la desviación típica
Es un paso previo que puede ser necesario en alguno algoritmos tales como la clusterización o las redes neuronales.
Para realizar este proceso en SAS nos basamos en el procedimiento proc standard.
Partimos del siguiente dataset de entrada:

Nos interesa estandarizar las variables: edad, antiguedad y consumo_yyyymm. Para ello:
data clientes1; se…