F. REPRESENTACIÓN Y COMPARACIÓN DE PERFILES-PONDERADOS 1. Comparación de perfiles-ponderados Una diferencia entre dos perfiles-línea, para una modalidad j en columna, es tanto más contributiva a la comparación de las líneas cuanto más raro sea el atributo j. ✔ Ponderación de las contribuciones de cada modalidad j (o i) a la comparación de dos líneas (columnas) con el peso de la columna (línea). 2. Evaluación de la comparación de perfiles : distancia del Chi2 à Distancia del Chi2 entre dos perfiles-línea : J 1 d (i ,i' ) = ∑ j =1 f . j fij f i' j f − f i'. i. 2 ∀i,i' ∈ I à Distancia del Chi2 entre dos perfiles-columna : 1 f ij fij ' d ( j , j' ) = ∑ − f . j' i =1 f i . f . j K 2 ∀j,j' ∈ J La distancia del Chi2 neutraliza todas las distorsiones en la representación de la información de la Tabla de Contingencia. Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°31 3. Espacios de representación con la distancia del Chi2 Se asocia a las Tablas de Perfiles las Tablas de Perfiles Ponderados dividiendo: à C/ perfil-línea por pj = à C/ perfil-columna por pi = f. j fi. Se obtiene así las coordenadas de representación de los elementos. Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°32 TRANSFORMACIÓN DE LOS ESPACIOS DE REPRESENTACIÓN Puntos-perfiles en línea de la Tabla F Puntos-perfiles-ponderados en línea Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°33 ✔ ¿Qué deformación han sufrido los espacios de representación de los puntos-perfiles en la nueva metáfora de la información de la Tabla de Contingencia...? ✔ La información de la Tabla F se presenta ahora bajo la forma de la «posición relativa de los puntos, dotados de masa, en un espacio euclidiano». Construimos así una nueva metáfora analógica de la información de la Tabla F. La forma de la información aportada por esta nueva metáfora gráfica no puede ser interpretada en términos de posición relativa de puntos-perfiles puesto que están dotados de masa. Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°34 4. Propiedad de la distancia del Chi2: equivalencia distribucional ✔ Definición En espacios dotados de la distancia del Chi2, se puede remplazar dos líneas (columnas) por una línea (columna) igual a la suma de esas dos líneas (columnas) sin que ello modifique las distancias entre las columnas (líneas). ✔ Verificación con un ejemplo numérico : TABLA T TABLAS DE PERFILES ASOCIADA A LA TABLA T Perfiles en Línea Perfiles en Columna Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°35 REPRESENTACIÓN GRÁFICA TABLA T TABLA T' (3 X 2) Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI TABLA DE PERFILES EN LÍNEA DE T' Tr. N°36 5. Resumen Definimos así un modo analógico y digital apropiado para comunicar la información aportada por una Tabla de Contingencia, pero... ¿Cómo debemos «leer» en esos espacios de representación la forma de la información de la Tabla F...? otra pregunta... ¿Cómo evaluar globalmente la información aportada por una Tabla F...? Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°37 G. REPRESENTACIÓN DE LA INFORMACIÓN EN TÉRMINOS DE INERCIA DE UNA NUBE DE PUNTOS 1. Inercia de una nube de puntos-perfiles dotados de peso ✔ Inercia de una nube de puntos N(I) con respecto a un punto m cualquiera = dispersión de la nube de puntos en torno a ese punto. I I m = ∑ pi d (2i ,m ) ∀i ∈ I i =1 La inercia (dispersión) de la nube de puntos con respecto a m es igual a la suma, para todos los puntos, del producto del cuadrado de la distancia de cada punto a m por el peso asociado a cada punto. 2. Contribución a la inercia del punto i con respecto a m Contrib. I m (i ) = pi d (2i ,m ) ∀i ∈ I Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°38 3. Inercia con respecto a G de una nube de puntos-perfiles dotados de peso Los puntos de la nube N(I) están en equilibrio en torno a G si la rotación del sistema de puntos en torno a G es nula. ✔ Inercia de los puntos-perfiles línea ponderados con respecto a los puntos GL y GC I Ν (I ) GL = ∑ Contrib.GL (i ) I Ν (J ) GC = ∑ Contrib.GC ( j ) I i =1 J j =1 y se puede demostrar que: I GΝL( I ) = I GΝC( J ) ¿Qué significa esta dispersión común a esas dos nubes de puntos-perfiles...? Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°39 4. Desvío a la situación de independencia : asociación de dos variables cualitativas ✔ Tabla de independencia o tabla teórica : Término general : fij* = f i . × f . j con : I ∑ f = ∑ fi . = 1 i =1 J I * i. i =1 y J ∑ f = ∑ f. j = 1 j =1 * .j j =1 Las distribuciones de la tabla teórica son proporcionales a sus distribuciones marginales : I I ∑ f = f . j ∑ fi . = f . j ∀j ∈ J i =1 J * ij i =1 J ∑ f = fi . ∑ f . j = fi . ∀i ∈ I j =1 * ij j =1 Para medir la asociación entre dos variables cualitativas hay que evaluar la importancia con la cual lo observado se aleja de la situación de independencia. Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°40 ✔ Tabla de Desvíos a la situación de independencia : Término general : eij = f ij − f ij* ∀i ∈ I ; ∀j ∈ J Problemas de interpretación de esta tabla... ✔ Tabla de desvíos ponderados : Término general : * ij e [ f = ij −f fij* ] * 2 ij ∀i∈I ; ∀ j∈J ✔ Interés de esta Tabla : Suma de los valores de esta tabla = coeficiente del ϕ 2 I J I J ϕ = ∑ ∑ e =∑ ∑ 2 i =1 j =1 * ij [f i =1 j =1 ij −f fij* ] * 2 ij ∀i∈I ; ∀ j∈J El coeficiente del ϕ 2 puede ser expresado con los elementos de la Tabla F (I, J): I J I J ϕ 2 = ∑ ∑ eij* =∑ ∑ i =1 j =1 [f − f i. . f . j ] ∀i∈I ; ∀j∈J f i. . f . j 2 ij i =1 j =1 Pr ograma PREST do CRIVISQ A - 1999 - Eduar UI Programa Eduardo PRESTA RIVISQUI Tr. N°41