Entradas

Mostrando entradas de mayo, 2015

Arboles de decisión en SAS

Imagen
Una de las técnicas más utilizadas dentro del análisis predictivo son los árboles de decisión. Esta técnica tiene múltiples aplicaciones en el campo de la estadística, pero nos vamos a centrar en su uso para realizar predicciones, concretamente obtener probabilidades de eventos.

Un arbol de decisión es una técnica de predicción utilizada en el ámbito del aprendizaje automático. Un árbol de decisión lleva a cabo un test a medida que este se recorre hacia las hojas para alcanzar así una decisión. El árbol de decisión suele contener nodos internos, nodos de probabilidad, nodos hojas y ramas. Un nodo interno contiene un test sobre algún valor de una de las propiedades. Un nodo de probabilidad indica que debe ocurrir un evento aleatorio de acuerdo a la naturaleza del problema. Un nodo hoja o nodo terminal te representa el valor que devolverá el árbol de decisión y finalmente las ramas brindan los posibles caminos que se tienen de acuerdo a la decisión tomada.



Existen diferentes formas de imp…

Data science tools: SAS vs R

Imagen
Unas de las disciplinas que más desarrollo han experimentado en los últimos años han sido todas las relacionadas con el data science. Las técnicas y herramientas utilizadas en esta disciplina adquieren cada vez más peso en el entorno empresarial. Si damos un ojo a las herramientas más utilizadas, vemos que también ha habido cambios en los últimos años.
El siguiente gráfico (www.datasciencecentral.com) muestra las herramientas más solicitadas en la actualidad puestos de trabajo de perfiles data scientist.


Están son las más solicitadas en la actualidad y representa la tendencia actual liderada de largo por R, si nos centramos en puestos ya existentes es posible que posición de cabeza la tenga SAS. Podríamos añadir a las listadas en el gráfico Phyton, que si bien es un lenguaje de propósito general, su uso en análisis de datos es cada vez más extendido. Igualmente podemos añadir a las anteriores herramientas como SCALA, Rapidminer, Weka o Knime.
En este post vamos a tratar de comparar dos d…