• UNIVERSIDAD CATOLICA DE LA SANTÍSIMA CONCEPCIÓN Facultad de Ingeniería ANÁLISIS DE COMPONENTES • PRINCIPALES (ACP) I. Objetivos del Análisis de Componentes Principales I.1. La Tabla de Datos El ACP permite analizar la información de una tabla de tipo «individuos x variables cuantitativas». Tabla de Datos • 2. Objetivos del ACP • Evaluar la semejanza entre los individuos a través de los atributos considerados : ¿Existen grupos de individuos semejantes...? 1 ¿Se observa una tipología de individuos...? • Evaluar la relación existente entre las características consideradas : ¿Existen grupos de variables correlacionadas entre ellas...? ¿Se observa una tipología de variables...? • Comparación de los individuos y relación entre las variables de la tabla en el ACP II.1. Semejanza entre los individuos de la Tabla de Datos • La comparación de dos individuos i y j es evaluada con la distancia euclidiana clásica entre i y j : • Como las variables son consideradas con la misma importancia en la comparación, se les atribuye el mismo peso, mk = 1, II. 2. Relación entre las variables de la Tabla de Datos ♦ En el ACP, la relación entre las variables k y p es evaluada con el coeficiente de correlación (excepcionalmente : la covarianza) : ♦ Como a los individuos se les atribuye, normalmente, la misma importancia (el mismo peso, mi = 1/n)... 2 III. Transformación de la Matriz de Datos Matriz de Datos : X Matriz de Datos Centrada−Reducida : Z ♦ Efectos de esa transformación de la Matriz de Datos 3 ◊ Centrando la Matriz de Datos... ♦ no se modifica la evaluación de la distancia entre dos individuos cualesquiera de la tabla. ♦ no se modifica la evaluación de la correlación entre dos variables cualesquiera de la tabla. • La reducción de la Matriz de Datos... ♦ no modifica la evaluación de la relación entre dos variables cualesquiera de la tabla. ♦ hace que la evaluación de la semejanza entre dos individuos cualesquiera de la tabla sea independiente de las escalas de medida de las variables. IV . La nube de puntos−individuos en R3 y en Rk • La base (e1,e2,e3) es una base ortonormal, centrada en G. • A la variable le corresponde el eje engendrado por e1 = (1,0,0), y así siguiendo... • En R3 el individuo i queda representado por : ♦ El punto i , de coordenadas : 4 • El extremo del vector wi , combinación lineal de los vectores de la base ortonormal, 5 • 1. Origen del espacio • El origen del espacio representa el «individuo medio». • El punto 0, en el espacio original, es el extremo del «vector de medias» de todas las variables. • 2. Inercia total de la nube de puntos−individuos • Considerando el individuo i en Rk Dispersión de Inercia total de • Si representamos al individuo i por un punto en el espacio R3 • Si representamos al individuo i como el extremo del vector wi 6 ¿Como se define la matriz V...? • 3. La matriz de inercia de la nube de puntos−individuos • D : métrica de los pesos en Rn • Z : matriz X centrada−reducida • V : matriz de inercia, es la matriz de correlaciones • 4. Contribución a la inercia del individuo i 7