Análisis de componentes principales

Anuncio
• UNIVERSIDAD CATOLICA DE LA SANTÍSIMA CONCEPCIÓN
Facultad de Ingeniería
ANÁLISIS DE COMPONENTES
• PRINCIPALES
(ACP)
I. Objetivos del Análisis de Componentes Principales
I.1. La Tabla de Datos
El ACP permite analizar la información de una tabla de tipo «individuos x variables cuantitativas».
Tabla de Datos
• 2. Objetivos del ACP
• Evaluar la semejanza entre los individuos a través de los atributos considerados :
¿Existen grupos de individuos semejantes...?
1
¿Se observa una tipología de individuos...?
• Evaluar la relación existente entre las características consideradas :
¿Existen grupos de variables correlacionadas entre ellas...?
¿Se observa una tipología de variables...?
• Comparación de los individuos y relación entre las variables de la tabla en el ACP
II.1. Semejanza entre los individuos de la Tabla de Datos
• La comparación de dos individuos i y j es evaluada con la distancia euclidiana clásica entre i y j :
• Como las variables son consideradas con la misma importancia en la comparación, se les atribuye el
mismo peso, mk = 1,
II. 2. Relación entre las variables de la Tabla de Datos
♦ En el ACP, la relación entre las variables k y p es evaluada con el coeficiente de correlación
(excepcionalmente : la covarianza) :
♦ Como a los individuos se les atribuye, normalmente, la misma importancia (el mismo peso,
mi = 1/n)...
2
III. Transformación de la Matriz de Datos
Matriz de Datos : X
Matriz de Datos Centrada−Reducida : Z
♦ Efectos de esa transformación de la Matriz de Datos
3
◊ Centrando la Matriz de Datos...
♦ no se modifica la evaluación de la distancia entre dos individuos cualesquiera de la tabla.
♦ no se modifica la evaluación de la correlación entre dos variables cualesquiera de la tabla.
• La reducción de la Matriz de Datos...
♦ no modifica la evaluación de la relación entre dos variables cualesquiera de la tabla.
♦ hace que la evaluación de la semejanza entre dos individuos cualesquiera de la tabla sea
independiente de las escalas de medida de las variables.
IV . La nube de puntos−individuos en R3 y en Rk
• La base (e1,e2,e3) es una base ortonormal, centrada en G.
• A la variable le corresponde el eje engendrado por e1 = (1,0,0), y así siguiendo...
• En R3 el individuo i queda representado por :
♦ El punto i , de coordenadas :
4
• El extremo del vector wi , combinación lineal de los vectores de la base ortonormal,
5
• 1. Origen del espacio
• El origen del espacio representa el «individuo medio».
• El punto 0, en el espacio original, es el extremo del «vector de medias» de todas las variables.
• 2. Inercia total de la nube de puntos−individuos
• Considerando el individuo i en Rk
Dispersión de Inercia total de
• Si representamos al individuo i por un punto en el espacio R3
• Si representamos al individuo i como el extremo del vector wi
6
¿Como se define la matriz V...?
• 3. La matriz de inercia de la nube de puntos−individuos
• D : métrica de los pesos en Rn
• Z : matriz X centrada−reducida
• V : matriz de inercia, es la matriz de correlaciones
• 4. Contribución a la inercia del individuo i
7
Descargar