Professional Documents
Culture Documents
TÉCNICAS MULTIVARIANTES
ANÁLISIS DE CONGLOMERADOS
2019 – 01
5/20/19
ANÁLISIS DE CONGLOMERADOS
• La Idea principal del tipo de análisis es agrupar a los individuos o elementos
en grupos en función a sus similitudes o similaridades entre ellos.
• Por lo general, se agrupa las observaciones, pero en este tipo de análisis se
puede también agrupar variables.
• En este análisis se aplican métodos de clasificación automática o no
supervisada, y de reconocimiento de patrones sin supervisión.
• En esta técnica se estudia los siguientes tipos de problemas:
• Partición de los datos
• Construcción jerarquías
2
ANÁLISIS DE CONGLOMERADOS
CONSTRUCIÓN DE JERARQUÍAS
Cuando se desea estructurar los elementos de un conjunto de forma
jerárquica por su similitud. Es decir, que los datos se ordenen en
niveles, de modo que los niveles superiores contienen a los
inferiores.
En realidad no se definen grupos, sino la estructura de asociación en
cadena que pueda existir entre los elementos que, sin embargo,
permite obtener también una partición de los datos en grupos.
5/20/19 4
ANÁLISIS DE CONGLOMERADOS
5/20/19 5
Análisis de Conglomerados Jerárquico
• Este procedimiento permite aglomerar casos y variables y se tiene
disponible una gran variedad de métodos de aglomeración y
medidas de distancia. La diferencia fundamental con el
procedimiento anterior, está en que en éste último se trabaja de
forma jerárquica.
5/20/19 7
Análisis de Conglomerados Jerárquico
• El procedimiento Conglomerados jerárquicos del SPSS informa de todos
los pasos realizados en el análisis, por lo que resulta fácil apreciar qué
elementos o conglomerados se han aglomerando en cada paso y a qué
distancia se encontraban cuando se han unido.
8
Análisis de Conglomerados Jerárquico
5/20/19 9
Ejemplo 1: Análisis Conglomerados Jerárquico
• Haciendo que marque los casos según el conglomerado al que han sido
asignado al solicitar una solución de dos y tres conglomerados.
Ejemplo 1: Análisis Conglomerados Jerárquico
28
Partición de los Datos:
Método de k medias
29
Partición de los Datos:
Método de k medias
30
Partición de los Datos:
Método de k medias
31
Partición de los Datos:
Método de k medias
• En este caso se usa el Método de K Medias que permite
procesar un número ilimitado de casos, pero sólo permite
utilizar un método de aglomeración y requiere que se
proponga previamente el número de conglomerados que
se desea obtener.
• Es un método que se basa en las distancias existentes entre
ellos en un conjunto de variables (este método de
aglomeración no permite agrupar variables).
• Este procedimiento comienza seleccionado los K casos más
distantes entre sí.
Partición de los Datos:
Método de k medias
37
Ejemplo: Método de K Medias
Historial de iteraciones
Esta tabla resume el historial de las
iteraciones con la indicación del cambio
(desplazamiento) experimentado por
cada centro en cada iteración.
Puede observarse que, conforme
avanzan las iteraciones, el
desplazamiento de los centros se va
haciendo más y más pequeño, hasta
llegar a la quinta iteración, en la que ya
no existe desplazamiento alguno.
El proceso de iteración se detiene, por
defecto, cuando se alcanzan 10
iteraciones o cuando de una iteración a
otra no se produce ningún cambio en la
ubicación de los centroides (cambio = 0).
44
Ejemplo: Método de K Medias
46
Ejemplo: Método de K Medias
•Para ello solicitemos que IBM SPSS Statistics que nos genere un
diagrama dispersión donde se muestre ambos conglomerados,
indicándole que use la nueva variable de membresía de conglomerados
de cada caso.
47
Ejemplo: Método de K Medias