Conglomerados I

September 4, 2011
By

This post was kindly contributed by Political R Analysis - go there to comment and to read the full post.

Conglomerar puede entenderse como sinónimo de agrupar, recurrimos al análisis de Cluster/Conglomerados, cuando queremos agrupar a nuestros casos utilizando varios criterios

Title

Si tenemos más de un criterio para agrupar lo mejor es que recurramos a estas técnicas. Finalmente lo que buscamos obtener es que los grupos sean lo más homogeneos posible tomando en cuenta todos los criterios entregados

En este post empezaremos a mostrar como realizar conglomerados con R, será una serie de post sobre clusters ya que para conglomerar existen varias técnicas

En el software SPSS tenemos las opciónes de K-medias, Jerarquico y Bietapico

Empezaremos en esta primera entrega con la técnica K-Medias, en este caso solo permite trabajar con variables númericas, además se tiene que indicar el número de grupos/conglomerados que se necesita

Vamos al R

library(clusters) #con esto cargamos el paquete que necesitamos
data(ruspini) #vamos a utilizar la data Ruspini que es muy buena para ejemplicar el tema de clusters

Si quieres saber más sobre esta data puedes usar el comando ?ruspini.-Para saber como pedir ayuda puedes ver estepost

grupos<-kmeans(ruspini,3) #la función es Kmeans, el primer argumento es la data y el segundo el número de grupos que necesitamos.
aggregate(ruspini, by=list(grupos$cluster), FUN=mean)#para obtener el promedio de cada variable por grupo.
grupos$size#nos dice la cantidad de elementos del grupo.
variable<-grupos$cluster #obtenemos el vector que contiene los grupos.
variable<-data.frame(variable)#adecuamos el vector para poder agregarlo a la data.
datafinal<-data.frame(ruspini,variable)#agregamos la variable a la data "ruspini"
names(datafinal)#nos aseguramos que la data final tenga todas las variables, las originales y la creada con los grupos

veamos los grupos graficados

clusplot(data1,grupos$cluster, color=TRUE, shade =TRUE, labels=2, lines=0) #con esto pedimos un gráfico
Title
library(fpc) #utilizamos este paquete para generar otro tipo de gráfico, por lo
que entendemos utiliza coordenadas discriminantes.
 Aquí información de que es un paquete y como instalarlo, aquí información de fpc.
plotcluster(ruspini,grupos$cluster)#para obtener el nuevo gráfico
Gráfico1

Bueno con esto terminamos este post, luego subiremos más sobre Jerarquio, bietapico y otros.

Tags: ,

Comments are closed.