capitulo ii marco teorico

Anuncio
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
CAPITULO II
MARCO TEORICO
2.1.- ENFERMEDADES Y VIAS DE TRANSMISIÓN SEXUAL
El SIDA (Síndrome de Immuno Deficiencia Adquirida) es causado por el virus VIH (Virus de
Inmunodeficiencia Humana). El SIDA es la etapa final de un largo proceso de destrucción del
organismo humano por el lentivirus, mal llamado VIH. Este virus destruye el sistema
inmunológico del cuerpo humano porque tan pronto entra al cuerpo humano ataca al sistema
nervioso central, el cerebro y la médula espinal. Aún antes de inutilizar a las células T4, que
controlan el sistema de inmunidad y defensa que el cuerpo posee para luchar contra las
infecciones, convierte a las T4 en aliadas para diseminar la enfermedad a través de todo el
organismo. El virus del SIDA destruye las células del cerebro causando un deterioro mental
progresivo. Todos los órganos importantes son blancos de este virus mortal, el corazón, los
pulmones,
los
riñones,
el
hígado,
el
páncreas,
los
músculos,
la
piel,
etc.
La gran tragedia es que no hay forma de sacar al virus del SIDA una vez que el individuo es
infectado, ya que al formar parte de su DNA la persona queda genéticamente estampada para
siempre como un portador del virus. No hay droga que pueda separar al virus de los genes de
las células que ha penetrado. Para ello sería necesario matar todas las células infectada
matando al individuo. Otra terrible característica del virus de SIDA es que una vez dentro del
cuerpo nunca está en estado durmiente o inactivo, sino que se mantiene desde el principio
mutando y replicándose constantemente a través de todas las fases de la enfermedad. No se
trata simplemente de un proceso infeccioso, sino de una enfermedad infecciosa degenerativa
con una tasa de mortalidad del 100%.
El VIH se transmite por tres vías:
a) Vías de Transmisión Sexual: Por el intercambio de fluidos como el semen o el flujo
vaginal. Estas vías se produce durante las relaciones sexuales sin protección, sin el uso
de condones, el VIH puede entrar al cuerpo por relaciones sexuales a través del ano, la
vagina, el pene o la boca.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
En el sexo anal hay riesgo tanto para el que penetra (activo) como para el que es
penetrado (pasivo). El virus no puede cruzar la barrera del látex del condón, si este se
usa de vez en cuando, la seguridad no es 100%. El VIH se puede transmitir sin que no
haya eyaculación, por lo que es necesario usar el condón desde el inicio de la
penetración. La mayoría de los hombres gay infectados con VIH lo adquirieron por el
sexo penetrativo sin protección.
El sexo oral es menos riesgoso que el sexo anal. Existen formas de reducir el riesgo de
VIH por esta vía, lo más seguro es usar condón para esta práctica.
b) Vías de Transmisión Sanguínea: Se origina mediante las transfusiones de
sangre,
que pasa directamente al torrente sanguíneo. Al compartir agujas o jeringas para
medicamentos o drogas, es decir al entrar la aguja a la piel pasando directamente a la
vena de la persona. Las transfusiones de sangre son examinadas desde 1987, la sangre
que se encuentra contaminada es desechada.
c) Vías de Transmisión Vertical: La madre infecta al niño durante el embarazo, durante
el parto o al amamantarlo. Durante la lactancia, el bebé puede adquirir el virus.
A diferencia de otros virus como el de la gripe, resfriado, el VIH no se transmite por el aire, al
tocarse, o por el contacto diario.
En algunas ocasiones, no sabemos si la persona con la que mantenemos o vamos a tener
relaciones sexuales vive con el VIH, incluso puede que no lo sepa ni él ni ella. Por ello,
durante la penetración vaginal o anal es importante el uso correcto del preservativo ya que
éste evitará el contacto, a través de pequeñas heridas que se producen durante las relaciones
sexuales, con el semen o flujo vaginal infectados. Además, con el condón podemos evitar
otras enfermedades de transmisión sexual.
2.1.1.- ENFERMEDADES DE TRANSMISIÓN SEXUAL
Las enfermedades de transmisión sexual (ETS), son infecciones que pueden ser transmitidas
de una persona a otra ya sea por el contacto sexual oral, anal o vaginal; algunas de estas
enfermedades son curables si se tratan a tiempo. Este tipo de infecciones se dan en un
importante número de hombres con vida sexual activa. Entre la extensa lista se encuentran
aquellas que pueden ser tratadas
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
•
Como sífilis, gonorrea, clamidia y otras infecciones en la zona púbica
• Y otras ante las que no se conoce cura alguna (VIH, Hepatitis A, B o C, HPV, etc.).
No caben dudas en que la mejor forma de prevención ante estos virus consiste en la
protección en contactos sexuales que vayan desde la simple frotación de miembros, el sexo
oral hasta la penetración.
Las ETS se pueden prevenir:
a) Al abstenerse de todo tipo de contactos sexual: Oral, anal o vaginal
b) Usando condón cada vez que tenga relaciones sexuales.
Los síntomas de las ETS son:
a) Secreciones anormales del pene, ano o vagina.
b) Dolor o ardor al orinar o al defecar .
c) Llagas, protuberancias o ampollas en los genitales.
d) Comezón en el área genital.
Los tratamientos, varían dependiendo de la ETS, si se detecta alguna de las enfermedades de
transmisión sexual, es importante visitar el médico, para el tratamiento adecuado.
Las ETS son infecciones que pueden tener serias consecuencias para ambos sexos. Si no se
les trata a tiempo pueden causar: daños en los órganos sexuales, en el sistema nervioso o
producir ceguera.
2.1.2.- TIPOS DE SEXUALIDAD
•
BISEXUAL: Persona (hombre o mujer) que tiene potencialmente una atracción
sexual por individuos de ambos sexos.
•
HOMOSEXUAL: Persona (hombre o mujer) que tiene potencialmente una atracción
sexual por individuos del mismo sexo.
•
HETEROSEXUAL: Persona (hombre o mujer) que tiene potencialmente una
atracción sexual por individuos del sexo opuesto.
•
GAY: Hombre homosexual. Traducido al español: "Alegre", originalmente usaban
este término los homosexuales que se mostraban a la sociedad como tales, sintiéndose
orgullosos y alegres por su orientación sexual.
•
LESBIANA: Mujer homosexual.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
a) BISEXUALIDAD
Bisexualidad es el potencial de estar erótica o románticamente atraído por personas de
cualquier sexo. Así mismo, un bisexual es aquella persona que siente una atracción erótica por
individuos de ambos sexos. Sin embargo, definir la identidad sexual de cada individuo no es
tarea fácil. Definirla es algo muy personal, muchos individuos que mantienen relaciones
sexuales con miembros de ambos sexos pueden no considerarse o llamarse bisexuales; quizás
se consideren más como heterosexuales, o más como gays o lesbianas. Para entender esto
podemos ejemplificarlo de la siguiente manera: el hecho de que un hombre tenga contacto
sexual con una mujer, no significa necesariamente que ella en particular le atraiga
sexualmente; puede ser que él únicamente quiera guardar apariencias o demostrarse a sí
mismo algo.
Ahora bien, en el caso de la bisexualidad, se aplica lo mismo: una persona que se sienta ya sea
homosexual o heterosexual y tenga relaciones con ambos sexos no es necesariamente
bisexual. Esta persona tendrá la identidad que internamente mejor le venga, con la que se
sienta más a gusto. Sucede algo similar en el caso contrario. Puede ser que una persona se
considere así misma bisexual debido a sus sentimientos por ambos géneros, pero que
mantenga relaciones con persona(s) de un mismo género. Aquí se aplica nuevamente lo de la
identidad: esta persona se siente bisexual, y aunque tiene una predilección o interés por
involucrarse con un solo sexo, su sentir es para con ambos sexos a fin de cuentas. Aquí podría
entrar el caso de un bisexual monógamo, lo cual es perfectamente válido, siempre y cuando
así lo quiera y decida la persona.
Ahora bien, un bisexual no se siente forzosamente atraído por hombres y por mujeres de igual
manera. Una persona bisexual (hombre o mujer) puede preferir las relaciones con mujeres por
encima de las relaciones con hombres, o preferir las relaciones con hombres por sobre las
relaciones con mujeres, o bien, tener la misma preferencia por ambos sexos, concibiendo el
amor erótico en este último caso, como un estado donde no importa el sexo de la pareja, sino
su carácter.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
b) HOMOSEXUALIDAD
Una persona homosexual es aquella persona que siente una atracción erótica por individuos
del mismo sexo. Nuevamente aquí sucede lo mismo a la hora de que una persona se define
como persona homosexual. El hecho de que una persona mantenga contacto sexual o erótico
con personas de su mismo sexo, no significa forzosamente que sea homosexual. Muchos
hombres y mujeres auténticamente heterosexuales llegan a tener este tipo de relaciones con
individuos de su mismo sexo por el simple hecho de probar o demostrar algo, pero esto
únicamente pudiera representar para ellos una simple experiencia, sin que ello repercuta en su
orientación sexual básica.
c) HETEROSEXUALIDAD
Expertos de la universidad californiana de Berkley, Estados Unidos, concluyen que partiendo
de la longitud de los dedos del feto, se puede determinar su orientación sexual.
Según un estudio publicado en la revista Nature, la inclinación sexual de los seres humanos
puede tener su origen en la exposición a los andrógenos u hormonas masculinas en el útero
materno. Los autores del estudio, el doctor Marc Breelove y sus colaboradores, señalan que
las mujeres heterosexuales pueden haber estado sometidas a menor hormonas masculinas en
el útero, resultados similares en el caso de los hombres.
Según Los Dedos:
Los investigadores basan sus resultados en un patrón poco común: la longitud de los dedos
del feto. En su opinión, las mujeres tienen menor diferencia entre sus dedos índice y anular
que los hombres, quienes suelen tener el índice más corto que el anular debido a la mayor
exposición a andrógenos en el útero.
Por otra parte, los científicos han establecido otro patrón más a la hora de prever la
orientación sexual del bebé. Según el equipo investigador, cuantos menos hermanos tenga un
hombre, mayor tendencia a la heterosexualidad mostrará. La causa, en su opinión, es que el
útero ha estado expuesto menores veces a las hormonas masculinas en los embarazos previos.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
2.2.- CONCEPTOS BÁSICOS DE ANÁLISIS FACTORIAL DE
CORRESPONDENCIAS
2.2.1.- ANÁLISIS FACTORIAL DE CORRESPONDENCIAS SIMPLES
2.2.1.1.- INTRODUCCION
El Análisis Factorial de Correspondencia (AC), es una técnica exploratoria del Análisis
Multivariante especialmente para analizar tablas de contingencia. Técnica originaria de la
escuela estadística francesa.
El Análisis Factorial de Correspondencia permite estudiar las relaciones de interdependencia
entre variables categóricas (no métricas), por tanto guarda cierta analogía con la prueba Chicuadrado y el coeficiente de concordancia de Kendall. Es una técnica de composición, que se
ha ido haciendo mas popular para la reducción dimensional y la elaboración de mapas
perceptuales; debido a que el mapa perceptual se basa en la asociación entre objetos y un
conjunto de características descriptivas o atributos especificados por el investigador.
Esta técnica tiene la ventaja que para su uso no se
hace ninguna conjetura respecto a la
distribución de probabilidad de la población de la cual se extrajo la muestra multivariante.
Esta técnica va más allá de analizar la relación existente entre las variables, porque permite
determinar cómo está estructurada esta asociación, describiendo “proximidades” que permiten
identificar “categorías causa de asociación” .
Entre las técnicas de composición, el Análisis Factorial es el mas parecido; pero el Análisis de
Correspondencia va mas allá del Análisis Factorial. Su aplicación mas directa es la
representación de la “correspondencia” de categorías de variables, particularmente aquellas
medidas con escalas nominales. Esta Correspondencia es la base de desarrollo de mapas
perceptuales. Los beneficios del Análisis se basa en sus capacidades únicas para presentar
filas y columnas, por ejemplo etiquetas y atributos en un mismo espacio.
Los resultados se presentan gráficamente sobre ejes de coordenadas, el cual ayuda en la
interpretación de los resultados.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
2.2.1.2.- ANTECEDENTES HISTORICOS
Su origen y autoría es difícil de determinar, por que es una conjunción de métodos estadístico
matemáticos descubiertos y redescubiertos bajo ópticas distintas por diferentes autores. Entre
ellos,
podemos citar a Richardson y Kuder en 1933, Horst en 1935, Hirschfeld en 1935,
Fisher en 1940, Guttman en 1941 o Hayashi en 1952. Así, J. P. Benzécri en su libro Historia y
Prehistoria del Análisis de Datos dice en relación a los trabajos de Guttman, Fisher y Hayashi:
“La priorité de ces auteurs est certaine: la seule originalité que puissent revendiquer les
chercheurs français est d’avoir conjugué, avec une méthode découverte indépendamment
plusieurs auteurs, des idées et des problèmes multiples dont la synthèse n’était pas faite.”
Es en 1962 cuando aparece por primera vez el nombre de Análisis de Correspondencias en
los primeros trabajos de Benzécri, quien en 1965 dirige la tesis de B. Escofier en la Facultad
de Ciencias de Rennes (se muestran todas las propiedades algebraicas y geométricas).
El término “correspondencia” fue usado para denotar el sistema de asociaciones entre los
elementos de dos conjuntos, las filas y las columnas de una tabla de contingencia.
Actualmente, debido a la facilidad operacional
aportada por las computadoras, se aplica a
diversas tablas de grandes dimensiones.
El AC es muy empleado en todas las ciencias, en especial en las Ciencias Sociales.
En investigación de mercados (posicionamiento de productos, imagen de marca, eficacia
publicitaria, etc.)
2.2.1.3.-ANALISIS DE CORRESPONDENCIAS Y OTROS METODOS
Tradicionalmente, la asociación entre variables categóricas se realizaba con métodos
bivariantes. El Análisis de Correspondencia nos aportará información que de ningún modo
nos da la Chi-cuadrado (X2 ) u otra medida de asociación en términos de existencia o no de
relación entre las variables, de la intensidad de la misma.
El AC calculará perfiles, inercias, contribuciones, etc., de las filas y/o columnas de la tabla de
contingencia y permite analizar la posible relación entre las variables de modo gráfico en un
espacio multidimensional tal que, previo cálculo por filas y columnas de las puntuaciones de
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
la tabla, las diversas categorías de las variables estarán representadas gráficamente más
próximas o alejadas en las diversas dimensiones en función de su grado de similitud o
diferencias.
Los métodos multivariantes más conocidos para variables métricas son: Análisis de
Componentes Principales (ACP), Análisis Factorial (AF) y Análisis Canónico. Mientras que
cuando se trata de variables categóricas no métricas el Análisis de Correspondencia es el
idóneo y mas eficaz.
En una tabla de contingencia, la semejanza entre dos filas,
por una parte, y entre dos
columnas, por otra, se expresa de manera totalmente simétrica.
Dos filas se consideran próximas, si se asocian del mismo modo al conjunto de las columnas,
es decir, si ellas se asocian demasiado (o demasiado poco) a las mismas columnas;
considerando "demasiado" y "poco" con respecto a la situación de independencia.
Simétricamente, dos columnas están próximas si se asocian del mismo modo al conjunto de
las filas.
2.2.1.4.- OBJETIVOS
En el Análisis de Correspondencias Simples (ACS) se analizan dos variables categóricas.
•
Reducir la dimensión en el estudio de las relaciones de interdependencia entre
variables categóricas, presentadas en forma de tablas de contingencia.
•
Convertir las categorías de la tabla de frecuencias (filas y columnas) en un menor
número de dimensiones.
•
Analizar
cómo
está
estructurada
esta
asociación
(relación),
describiendo
“proximidades” que permitan identificar “categorías causas de asociación”.
•
Procesar datos de encuestas (variables o items categóricos) (Aplicación).
2.2.1.5.-TABLAS DE CONTINGENCIA Y DE FRECUENCIAS E INDEPENDENCIA
DESCRIPTIVA
EL Análisis Factorial de Correspondencia de una tabla de contingencia persigue cuatro
objetivos fundamentales los que son importantes detallar para justificar este método:
•
Analizar toda la información contenida en una tabla de contingencia.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
•
Representar gráficamente la estructura de una tabla de contingencia.
•
Producir estadísticas de control complementarias.
•
Analizar la estructura de una tabla de contingencia respetando el hecho que la misma
resume una relación simétrica entre los caracteres observados.
Una tabla de contingencia es una tabla estadística que resume la observación simultánea de
dos características dadas de dos conjuntos de unidades de observación (población observada).
Si el objetivo de lo observado es describir la manera en que esas características se asocian
entre ellas a través de las co-ocurrencias observadas, esa tabla estadísticas constituye un
resumen adecuado de la observación.
Consideremos una población o muestra con n.. unidades (respuestas) sobre los que se
pretende analizar simultáneamente dos variables categóricas, digamos X que tiene I categorías
y la variable Y que tiene J categorías; la tabla de frecuencias bidimensional que describe a
estas n.. unidades (respuestas) se llama tabla de contingencia (doble entrada):
TABLA DE CONTINGENCIA
TABLA T(I , J)
Categorías
1
1
n11
:
:
variable
i
ni1
x
:
:
I
nI1
total n.1
.....
.....
.....
.....
.....
variable y
j
.....
J
n1j ..... n1J
:
:
nij ..... niJ
:
:
nIj ..... nIJ
n.j ..... n.J
total
n1.
:
ni.
:
nI.
n..
NOTACIONES:
•
nij : Frecuencia Bidimensional
Corresponde
a
la
cantidad
de
individuos
observados
que
presentarán
simultáneamente la modalidad i de la variable X y la modalidad j de la variable Y.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
•
ni. : Es el i- esimo elemento del margen derecho de la tabla T (no depende de J),
corresponde a la cantidad de individuos observados que presenta la modalidad i de
la variable X, este elemento esta definido por la expresión:
ni . =
•
J
∑n
ij
j =1
n.j : Es el j-esimo elemento del margen inferior de la tabla T (no depende de I),
corresponde a la cantidad de individuos observados que presentan la modalidad j
de la variable Y, este elemento queda definido por la expresión:
I
= ∑ nij
.j
n
•
i =1
n.. : Es la suma de todas las celdillas de la tabla T, corresponde al total de
individuos observados. Este elemento es definido así:
I
J
I
J
i =1
j =1
n.. = ∑∑ nij = ∑ ni. = ∑ n. j
i =1 j =1
Frecuentemente se considera la tabla de frecuencias relativas, esta tabla indica el porcentaje
de elementos que simultáneamente tiene dos categorías, así:
TABLA DE FRECUENCIAS RELATIVAS
TABLA F(I , J)
Categorías
variable
X
1
:
i
:
I
total
1
f11
:
fi1
:
fI1
f.1
.....
.....
.....
.....
.....
variable Y
j
.....
f1j
.....
:
fij
.....
:
fIj
.....
f.j
.....
J
f1J
:
fiJ
:
fIJ
f.J
total
f1.
:
fi.
:
fI.
f..
NOTACIONES:
Definimos los elementos de una tabla (I , J):
•
Frecuencia Relativa Conjunta:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
f
ij
=
n
n
ij
..
En una tabla de frecuencias, cada celdilla es una proporción. El valor de cada
celdilla corresponde a la proporción de individuos observados en la población que
presentan simultáneamente el carácter Xi de la variable X y el carácter Yj de la
variable Y.
•
Frecuencias Marginales:
=
i.
f
f
.j
=
n
n
n
n
.j
..
•
i.
n
∑
n
J
=
j =1
..
I
=∑
i =1
n
n
ij
∑ f
j =1
..
=
ij
J
=
I
∑f
i =1
..
ij
∀ i ∈ i = ⟨1, 2 , ...... I ⟩
ij
∀j ∈ j = ⟨1, 2,......... J ⟩
La suma total o la suma de los márgenes es evidentemente igual a 1, puesto que la
tabla de frecuencias relativas se obtiene dividiendo la tabla de contingencia por n..
f
..
=
I
J
∑∑
i =1
j =1
n
n
ij
..
=
1
n
I
J
∑∑n
.. i =1
j =1
ij
=
n
n
..
=1
..
En el caso particular de la observación, sobre n unidades, de dos características (variables
cualitativas) compuestas de tres niveles o modalidades (atributos) cada una, se resume lo
observado mediante una tabla de tres líneas y tres columnas, cuya notación general
presentamos a continuación:
TABLA T(3 , 3)
Características
Variable X
X1
X2
X3
n.j
Y1
n11
n21
n31
n.1
Variable Y
Y2
Y3
n12
n13
n22
n23
n32
n33
n.2
n.3
ni.
n1.
n2.
n3 .
n..
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
En ese caso decimos que la tabla T es de dimensión (3 , 3). Dividiendo las celdillas de la tabla
T(3 , 3) entre n.. , obtenemos la tabla F(3 , 3), cuyos elementos se designan de la siguiente
manera:
TABLA F(3 , 3)
Características
Y1
f11
f21
f31
f.1
X1
X2
X3
f.j
Variable X
Variable Y
Y2
Y3
f12
f13
f22
n23
f32
n33
f.2
f.3
fi.
f1.
f2.
f3 .
f..
Las variables son independientes si se cumplen una de las siguientes condiciones:
1)
2)
f
f
ij
=
i/ j
f f
= f
i.
.j
∀ i, j
f
i.
j/i
=
f
.j
∀i, j
2.2.1.6.- DEFINICIÓN DE LOS PERFILES DE LOS ELEMENTOS DE LA TABLA F
Los perfiles en línea y en columna de dicha tabla se obtienen dividiendo los valores de cada
celdilla por el valor marginal correspondiente. Se puede analizar
perfiles filas o perfiles
columnas, ambos planteamientos producen los mismos resultados, filas y columnas juegan un
papel simétrico en el análisis.
Se denomina perfil de la fila i a la distribución de frecuencias de las categorías de la variable
Y condicionada a las categoría de la variable X:
H
H
i
i
 f
= 
 f

=  H
i1
i.
i1
f
f
,H
,
i2
i.
i2
f
f
,....., H
,.....,



i. 

iJ 
iJ
i = 1,2,....., I
i = 1,2,....., I
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
TABLA DE PERFILES FILA
Categorías
1
H11
:
Hi1
:
HI1
1
:
i
:
I
Variable
X
variable Y
j
.....
H1j .....
:
Hij .....
:
HIj .....
.....
.....
.....
.....
J total
H1J
1
:
:
HiJ
1
:
:
HIJ
1
Se denomina perfil de la columna j a la distribución de frecuencias de las categorías de la
variable X condicionadas a las categorías de la variable Y:
F
F
j
j
=
=
f
f
F
1 j
,
. j
1 j
,
f
f
F
2 j
, ....,
. j
2 j
, ....,
f
f
F
Ij
j = 1 , 2 , ....,
J
. j
Ij
j = 1, 2 , ...., J
TABLA DE PERFILES COLUMNA
Categorías
variable
X
1
1
F11
:
:
i
Fi1
:
:
I
FI1
total 1
variable Y
.....
j
.....
..... F1j .....
:
..... Fij .....
:
..... FIj .....
.....
1
.....
J
F1J
:
FiJ
:
FIJ
1
2.2.1.7.- ESPACIO DE REPRESENTACION
La representación analógica que hemos dado de una tabla de contingencia nos conduce a una
apreciación visual de la posición relativa de puntos en un espacio deformado por los efectos
de perspectivas. Esto puede producir proximidades o alejamientos ficticios entre los puntos,
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
es decir relaciones inexistentes. Podemos evitar esos errores de lectura completando esos
gráficos con una relación digital de la posición relativas de esos puntos en esos espacio.
Podemos también evaluar la posición relativa de una serie de puntos de esos espacios,
calculando la suma de esas distancias, dos a dos, de esos puntos.
Recordando el teorema de Pitágoras, podemos calcular fácilmente las distancias entre dos
puntos de un plano. Consideremos la figura I:
FIGURA I
Y
A”
A
D(A , B)
B”
C
B
A’
B’
X
La distancia entre A y B esta dada entonces por la expresión :
d ( A ,B ) =
( B '− A ') + ( B "− A")
2
2
Como veremos mas adelante esta relación se generaliza al caso de puntos representados en
espacios de tres o mas dimensiones. La distancia entre dos puntos A y B, en un espacio de tres
dimensiones, esta dada por la relación siguiente:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
d
2
( B '− A ') + ( B ''− A '') + ( B "'− A "')
=
( A ,B )
2
2
La expresión general de esta distancia entre dos elementos líneas de una tabla T(I , J) es la
siguiente:
d (i ,i ') =
∑ (nij − ni ' j )
J
2
∀i , i '
j =1
La distancia entre dos elementos columna de una tabla T(I, J) es la siguiente:
d ( j , j ') =
∑ (n ij− n ij ')
I
2
∀j , j '
i =1
Cuando comparamos dos elementos línea (o columna) de una tabla establecemos una relación
de similitud de diferencias entre ellos. En términos de distancias en un espacio euclidiano,
esas similitudes y diferencias se expresan por el hecho que los puntos-elementos del espacio
se superponen (distancia nula) o no (muestran una distancia entre ellos). La distancia entre
dos puntos de un espacio euclidiano no puede ser mas que nula o de valor positivo. Es decir
que para todo par de elementos de la tabla:
d
( i , i ')
≥ 0 ∀i , i '
d
( j , j ')
≥ 0 ∀j , j '
a) DISTANCIAS DE LA TABLA F(I , J)
La expresión general de la distancia en el caso de la comparación de dos elementos líneas de
una tabla F(I , J) es la siguiente:
d (i ,i ') =
 nij ni ' j 
∑ −

 n.. n.. 
J
j =1
2
=
(
∑ f ij − f i ' j
J
j =1
)
2
∀i , i '
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
De la misma manera, la distancia entre dos elementos columnas de una tabla F(I, J) es la
siguiente:
d
( j , j ')
 n ij n ij ' 
∑ − 
 n.. n.. 
I
=
2
=
i =1
(
∑ f ij− f ij '
J
j =1
)
2
∀j , j '
b) INDEPENDENCIA ENTRE DOS VARIABLES CATEGÓRICAS: LA DISTANCIA
Chi2
Tradicionalmente para determinar si dos variables categóricas son independientes, se usaba la
prueba Chi-cuadrado, cuya estadística evalúa globalmente la independencia. Contrasta cada
frecuencia relativa conjunta con el producto de sus respectivas marginales, no informa nada
respecto a los perfiles sea de fila o columna, de ahí la debilidad de esta prueba.
Dos variables categóricas son independientes si, por ejemplo, los perfiles líneas son iguales.
En este caso, todos los perfiles líneas son iguales al perfil línea mediano.
n
n
ij
=
i.
n (
=f
n
)
i = 1, 2, ....., I
j = 1, 2, ....., J
)
i = 1, 2, ....., I
j = 1, 2, ....., J
.j
.j
..
Además podemos decir:
n
n
=
ij
.j
n (= f
n
i.
i.
..
Es decir la igualdad de todos los perfiles columnas.
En resumen la independencia de las dos variables X e Y puede traducirse por:
n
ij
=
nn
n
i.
.j
i = 1, 2, ....., I
j = 1, 2, ....., J
..
O bien de manera equivalente, por:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
f
ij
=
f f
i.
.j
i = 1,2,....., I
j = 1,2,....., J
Se define el Chi2 de independencia por:

nn 
 n ij − i. . j 
n.. 

x = ∑∑
nn
n
2
2
I
J
i =1 j =1
i.
.j
..
Este coeficiente puede interpretarse como el cuadrado de la distancia de la tabla de
 ni . n. j 

contingencia observada (nij) y la tabla de independencia 
 n 
.. 

Este índice próximo de 0 traduce la independencia de las dos variables.
Se puede demostrar que:
x
2
=n
(
∑∑
I
J
i =1
j =1
f ij − f i . f
f f
i.
.j
. j
)
2

 I
= n∑
 i =1


( )
∑
J
j =1
f
2
ij
f f
i.
. j


− 1



2
Si planteamos que:
θ = xn
2
, el índice θ2 depende únicamente de las frecuencias relativas y
no del tamaño n de la población (o de la muestra).
2.2.1.8.- COMPARACION PONDERADA DE PERFILES
Cuando aplicamos la distancia entre dos perfiles-línea que hemos definido anteriormente,
establecemos la suma de los cuadrados de las diferencias de frecuencias condicionales de cada
una de las modalidades de la variable en columna. Llamamos “contribución del atributo j a la
comparación de dos perfiles-líneas” al valor de cada termino de esa suma. De la misma
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
manera, llamamos “contribución del atributo i a la comparación de dos perfiles columnas ” al
valor de cada termino de la suma de los cuadrados de las diferencias de frecuencias
condicionales de cada una de las modalidades de la variable en línea.
La importancia de cada elemento de la tabla F, expresada por su frecuencia marginal, la
llamaremos en adelante el peso de cada elemento.
Para neutralizar la distorsión de la información de la tabla F que persiste cuando comparamos
los perfiles de la misma, debemos considerar la “contribución del atributo j (atributo i) a la
distancia entre dos perfiles-líneas (columnas)” no ya en valor absoluto, sino en términos
relativos al peso del atributo j (atributo i). Procediendo así hacemos que una diferencias entre
perfiles sea tanto mas “contributiva” a la relación que queremos establecer entre dos perfiles
líneas (columna) cuanto mas raro, menos frecuente, sea el atributo (modalidad) en columna
(línea) considerado.
Para ello se pondera las contribuciones de cada atributo j (atributo i) a la comparación de dos
líneas (columnas) con el valor de la inversa del peso de la columna j (línea i).
a) COMPARACIÓN DE PERFILES CON LA DISTANCIA Chi2
Modificando la distancia definida anteriormente entre perfiles, definimos otra expresión de un
índice de evaluación de similitudes entre perfiles de una tabla F que respeta la exigencia de
comparación que hemos explicado.
Ante la desventaja de la prueba Chi-cuadrado se define la distancia Chi-cuadrado entre dos
filas (o entre dos columnas) como una distancia euclidiana, al cuadrado, entre sus perfiles,
ponderado con las inversas de las frecuencias marginales (MASA) de las columnas. Esta
ponderación evita que las columnas más frecuentes tengan más peso en la distancia.
En el caso de comparación de dos perfiles líneas i e i’ de F, la distancia entre esos elementos
es definida de la siguiente manera:
d
(i ,i ')
=
1  f ij f i ' j 
∑  −
f  f i. f i '. 
J
j =1
.j
2
=
1  f ij f i ' j 
∑  −
p  f i. f i '. 
J
j =1
2
∀i , i ' ∈ I
j
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
En el caso de la comparación de dos perfiles de dos perfiles columnas j e j’ esa distancia es
definida de la siguiente manera:
d ( j , j ') =
 f ij f ij ' 
1
∑  −

f  f . j f . j' 


I
i =1
i.
2
=
 f ij f ij ' 
1
∑  −

p  f . j f . j' 


I
i =1
2
∀j, j ' ∈ J
i
Esta distancia es llamada “distancia del Chi2 “ o “distancia de Benzecri “
Decimos entonces que la distancia del Chi2 es un índice de evaluación de la información de
las tablas de contingencia que neutraliza todas las distorsiones que presentan esa información
cuando tratamos de leerla sobre el resumen bruto de una observación: Las tablas T.
La menor o mayor distancia entre los puntos indica el grado de similitud o disimilitud entre
los perfiles.
El objetivo del AC es reducir la dimensión de estos espacios para facilitar la interpretación del
grado de similitud de las distintas categorías.
Importante: Se puede analizar los perfiles fila o los perfiles columna, ambos planteamientos
producen los mismos resultados, filas y columnas juegan un papel simétrico en el análisis.
b) PROPIEDAD DE EQUIVALENCIA DISTRIBUCIONAL
Estas distancias tienen la PROPIEDAD DE EQUIVALENCIA, Benzécri (1963).
Brevemente, este principio establece que: Si dos filas son idénticas (equivalencia
distribucional), entonces esas dos filas de la tabla de contingencia original pueden juntarse en
una sola fila, sin afectar la geometría de los perfiles columna.
Lo mismo ocurre con las columnas.
Podemos formular esta propiedad de la siguiente manera : Si dos líneas (o columnas) de una
tabla de contingencia son proporcionales (es decir que presentan el mismo perfil), se las puede
remplazar por una sola línea (o columna), suma de las dos líneas (o columnas) proporcionales,
sin que esto altere las distancias relativas de los puntos-columnas(o líneas) en el espacio de
representación correspondiente.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
2.2.1.9.- REPRESENTACIÓN EN TERMINOS DE INERCIA DE UNA NUBE DE
PUNTOS
Una tabla de contingencia puede ser leída sin distorsiones si expresamos esa información por
medio de:
•
Dos espacios euclidianos de representación de los perfiles asociados a la tabla,
dotado de sus respectivos pesos.
•
Un índice de evaluación de la similitud entre perfiles ponderados asociados a la
tabla F (o la tabla T), que llamamos distancia del Chi2 .
Ahora bien, puesto que la representación analógica de la información se presenta ahora bajo la
forma de una cierta distribución de masas en dos espacios euclidianos, no podemos “leer” en
ello la forma de la información de la tabla F, o la tabla T, en términos de la posición relativa
de punto-perfiles, puesto que el peso asociado a esos puntos modifica sus posiciones relativas.
Evocando el concepto físico de inercia veremos que la forma de la información de la tabla F
debe ser leída ahora en términos de dispersión de esos puntos masas con respecto a un punto
de referencia.
a)
INERCIA DE UNA NUBE DE PUNTOS CON REPECTO A UN PUNTO DE
REFERENCIA
Llamamos inercia de una nube puntos perfiles N(I) dotados de pesos con respecto a un punto
cualquiera m, a la dispersión de esa nube de puntos con respecto al punto m tomado como
referencia.
Sea un conjunto de puntos definido así: I = (1, 2, 3, ...........I), dotados de pesos, pI = (p1 , p2 ,
p3 , ............pI), que llamamos nube de puntos N(I).
En esta figura, esos puntos están ubicados en el espacio mediante sus coordenadas en los ejes
α y β.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
FIGURA II
β
p1
mβ
m
D(I , G)
1β
.1
.2
.I
.3
.i
p3
Pi
mα
p2
pI
α
1α
La dispersión de esa nube de puntos con respecto a un punto m cualquiera de ese espacio esta
evaluada por la expresión siguiente:
I
Im=∑
i =1
2
p d(
i
i, m)
∀i ∈ I
Decimos entonces que la inercia, con respecto a m, de una nube de puntos N(I) es igual a la
suma de los productos del cuadrado de la distancia a m de cada punto de la nube multiplicada
por el peso asociado a cada punto.
Llamamos contribución del punto i a la inercia con respecto a m de la nube de puntos N(I) al
termino correspondiente del punto i en esa suma. La contribución del punto i a la inercia con
respecto a m de la nube de puntos es definida así:
Contribucion I ( i ) = p d
m
i
2
( i ,m )
∀i ∈ I
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Consideremos ahora el mismo sistema de masas en un plano y veamos la dispersión de esos
puntos con respecto a un punto particular del plano: El punto en torno ala cual esas masas
están en equilibrio.
Decimos que esos puntos están en equilibrio en torno al punto G por que consideramos que la
rotación del sistema de masas en torno a G es nula.
Como vemos en el siguiente grafico:
FIGURA III
P2
β
1β
P1
D(i , G)
.2
.1
Gβ
G
.I
.3
.i
pI
P3
Pi
Gα
2α
α
Los tres puntos ubicados a la derecha del punto G imponen una cierta cantidad de movimiento
(en el sentido señalado por la flecha que parte del punto i) que se compensa, teniendo en
cuenta los pesos relativos de esos puntos con el movimiento (en el sentido señalado por la
flecha que parte del punto 3) impuesto por los dos puntos ubicados a la izquierda de G,
tomando en cuenta sus pesos relativos.
Definiendo así la condición de equilibrio de ese sistema de masas, diremos que el punto G es
el centro de gravedad del sistema, o bien el punto baricentro.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
S i G es el centro de gravedad del sistema, una fuerza impuesta en G (paralela a las fuerzas
que representan los pesos de cada punto del espacio pero de sentido contrario) y de magnitud
igual a la suma de los pesos de cada punto del espacio, mantiene el sistema de punto
“suspendido” en el espacio, sin alterar la forma del sistema de masas.
S i el punto G es el baricentro del sistema de masas, las coordenadas de G sobre cada eje del
referencial de ese espacio es igual a la media ponderada de las coordenadas de los puntosmasa en el mismo referencial.
Llamando “Inercia” esa dispersión, así evaluada, de los puntos de N(I) con respecto a un
punto m cualquiera “evocamos” el concepto físico de “cantidad de movimiento” de un
conjunto de masas en torno a un punto de referencia. Sin embargo no podemos considerar que
la dispersión de puntos dotados de masas en los espacios de representación que hemos creado,
cumplen con las mimas leyes, formuladas en física, que rigen los equilibrios de masas reales.
b) INERCIA DE LOS PUNTOS PERFILES PONDERADOS CON RESPECTO A LOS
CENTROS DE GRAVEDAD
b.1) INERCIA DE LOS PUNTOS PERFILES LINEAS PONDERADOS (N(I)):
La contribución de la fila i a la inercia de la nube de puntos N(I) con respecto a GI es definida
así:
2
(
i
)
=
p
ContribucionI
i d ( i ,G )
∀i ∈ I
I
GI
La inercia de las nubes N(I) con respecto a GI es entonces igual a la suma de las
contribuciones a esa inercia de todas las filas:
I
IG
I
(N ( I ) ) = ∑ p i d 2( i ,G
i =1
I
)
∀i ∈ I
Por otra parte, sabemos que las coordenadas del punto i en el espacio de representación de los
puntos perfiles fila dotados de pesos son las siguientes:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley




f
f
i1
f
1.
,
.1
f
f
i2
f
2.
, .......... ,
.2
f
f
iJ
f
i.
.J




Las coordenadas del punto GI en ese mismo espacio de representación son las siguientes:




f
f
.1
f
f
,
.1
.2
f
f
, ..........,
.2

=


.J
.J
[
f
.1
f
,
.2
f
, ...........,
.J
]
b.2) INERCIA DE LOS PUNTOS PERFILES COLUMNAS PONDERADOS (N(J)):
La contribución de la columna j a la inercia de la nube de puntos N(J) con respecto a GJ es
definida así:
2
(
j
)
=
p
Contribuci on I
j d ( j ,G
GJ
J
∀j ∈ J
)
La inercia de las nubes N(J) con respecto a GJ es entonces igual a la suma de las
contribuciones a esa inercia de todas las columnas:
J
I G (N ( J ) ) = ∑ p d
j =1
J
j
2
G)
( j,
∀j ∈ J
J
Por otra parte, sabemos que las coordenadas del punto j en el espacio de representación de los
puntos perfiles columna dotados de pesos son las siguientes:




f
f
.1
1j
f
,
1.
f
f
.2
2 j
f
, ..........
2.
f
f
.j
Ij
f



I. 

Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Las coordenadas del punto GJ en ese mismo espacio de representación son las siguientes:




f
f
1.
f
f
,
1.
2.
f
f
, ..........,
2.

=

I. 

I.
[
f
1.
f
,
2.
f
, ...........,
]
I.
b.3) LOS PUNTOS PERFILES MARGINALES G SON LOS BARICENTROS DE LAS
NUBES DE PUNTOS N(I) Y N(J)
Las coordenadas de los puntos perfiles columnas en el eje i del referencial de ese espacio son
las siguientes:




f
f
1.
i1
f
,
.1
f
f
i2
f
2.
f
, .......... ,
f
.2
iJ
f
i.
.J




De modo que la media ponderada por el peso de esos perfiles de esas coordenadas es la
siguiente:


X=
∑
n
. j
n.. j =1 
1
f
J
f
.j
ij

J
 1 J
=

∑ n. j ∑
f i.  n.. j=1 j =1
J
f
f
.j
=
ij
f
f
∑
f
f
J
1
j =1
i.
i.
ij
=
.j
∑f
1
j =1
ij
J
f ∑f
i.
j =1
.j
=
f
f
i.
=
i.
Vemos que la media ponderada de las coordenadas de los puntos-perfiles columnas sobre el
eje i es igual a la coordenada del perfil marginal en columna sobre ese mismo eje.
Las coordenadas de los puntos-perfiles línea en el eje j del referencial de ese espacio son las
siguientes:




f
f
.1
1j
f
,
1.
f
f
.2
2 j
f
, ..........
2.
f
f
.j
Ij
f



I. 

Siendo la media ponderada de esas coordenadas:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
f
i.
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley

1 I

X=
∑
n
i. 
n .. i=1 
f
f
i.
ij
f
.j

I
 1 I
=
∑
∑
ni. i=1

 n .. i =1

I
f
f
i.
f
f
∑f
f
I
1
=
ij
ij
i =1
.j
=
i.
.j
∑f
1
i =1
I
ij
i =1
i.
f ∑f
.j
=
f
f
.j
=
.j
Vemos también que la media ponderada de las coordenadas de los puntos perfiles línea sobre
el eje j es igual a la coordenada del perfil marginal en línea sobre ese mismo eje.
De modo entonces que el punto perfil marginal G de cada uno de esos espacios de
representación es el baricentro de esas nubes de puntos.
2.2.1.10.- REPRESENTACIÓN FACTORIAL DE LA INFORMACION DE UNA
TABLA DE CONTINGENCIA
a) LOS FACTORES DE UNA NUBE DE PUNTOS-PERFILES:
Las coordenadas de los puntos perfiles (en línea y en columna) en el nuevo referencial se
obtienen por simple proyección ortogonal de los puntos-perfiles (centrados en G) sobre las
rectas del nuevo referencial de cada espacio. Esas coordenadas están definidas así:
J
F α (i ) = ∑ Z j U α j
j =1
I
y
Gα ( j ) = ∑ K iW αi
i =1
Decimos entonces que: F1 (i) es la coordenada de la i- esima línea de la tabla T sobre el primer
eje factorial; F2 (i) es la coordenada de la -i esima línea de la tabla T sobre el segundo eje
factorial; etc... Por otra parte, G1 (j) es la coordenada de la j-esima columna de la tabla T sobre
el primer eje factorial; G2 (j) es la coordenada de la j- esima columna de la tabla T sobre el
segundo eje factorial; etc...
b) PROPIEDADES DE FACTORES DE LAS NUBES DE PUNTOS-PERFILES
(INDICES DE AYUDA A LA INTERPRETACION)
b.1) COORDENADAS DEL CENTRO DE GRAVEDAD
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
f
.j
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Los centros de gravedad de las nubes de puntos N(I) y N(J), respectivamente, están ubicados
por construcción, en el origen de esos nuevos sistemas de ejes de referencia que son los
factores de esas nubes de puntos-perfiles. En consecuencia sus coordenadas de sus espacios
factoriales de representación son nulas.
Es decir:
F (G ) = 0
α
L
∀α = 1, 2, ......, p
G (G ) = 0
y
α
C
∀α = 1, 2, ......, p
Sabemos que las coordenadas del centro de gravedad de una nube de puntos-perfiles se
obtienen haciendo la media (ponderada por el peso asociado a cada punto de la nube) de las
coordenadas de los puntos de la nube. Lo cual podemos expresar de la siguiente manera:
∀i ∈ I y ∀α ,
∑ f F (G ) = 0 = ∑ f G (G )
I
J
i.
i =1
α
L
j =1
.j
α
∀j ∈ J y ∀α
C
De modo entonces que los “factores” de las nubes de puntos-perfiles constituyen una serie de
p variables (cuantitativas, a valores de R) de media nula, es decir una serie de p variables
centradas.
b.2) VARIANZA DE LOS FACTORES DE UNA NUBE DE PUNTOS-PERFILES
Considerando las variables cuantitativas que llamamos “factores” de una nubes de puntosperfiles, podemos calcular la varianza de las mismas.
_
Tratándose de variables centradas, hemos visto que
S
2
α
I
=∑
i =1
X
α
=0
p (xαi − x α) = ∑ p (F α(i )− 0) = ∑ p (F α(i ))
2
i
I
i =1
2
i
I
i =1
2
i
∀α = 1, 2, ......, p
En esa expresión: Fα(i) es la coordenada del punto i sobre el eje α, es decir la distancia del
origen del eje (que corresponde al centro de gravedad GL) de la proyección ortogonal del
punto i sobre el eje α; y pi es peso asociado al punto perfil i.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
De modo que la varianza del factor α es igual a la inercia de la nube de puntos N(I) a lo largo
de ese eje.
Pero se puede verificar (y demostrar) que la inercia a lo largo de cada eje factorial de una
nube de puntos-perfiles esta dada por el valor propio asociada a cada eje. Podemos entonces
establecer la relación siguiente:
S
2
α
I
= λα = ∑
i =1
p (F α(i))
2
i
∀α = 1, 2, ......, p
b.3) VALORES PROPIOS PERTINENTES DE UN ANÁLISIS
Si un valor propio es muy pequeño (próximo a cero), concluimos que la parte de la asociación
observada entre las variables de la tabla de contingencia que es asumida por el eje
correspondiente es ínfima. El complemento de información que aporta ese eje a la in
formación de representación global de la tabla es insignificante o despreciable.
En la practica del empleo de este método de análisis, sobre tablas de contingencia de grandes
dimensiones, el valor propio limite puede ser fijado calculando el valor propio medio.
Es decir que:
λ=
I G ( N (I )) ;
L
p
I
o bien λ = G C
(N ( J ) )
p
No debemos utilizar esta regla de manera absoluta cuando procedemos a la interpretación de
los resultados de un análisis. Si se analiza, por ejemplo, una tabla de contingencia de grandes
dimensiones cuya inercia global no sea muy elevada, el valor propio medio será ya muy
próximo a cero. Los valores propios próximos precedentes pueden también ser casi nulo, es
decir que aportan una información complementaria que es ya despreciable.
La traza de la matriz inercia de una nube puntos-perfiles es la medida de la inercia global de
esa nube de puntos con respecto al centro de gravedad de la misma. La inercia global de esa
nube de puntos con respecto al centro de gravedad, es igual al índice ϕ2 de asociación de las
variables que componen la tabla de contingencia.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
p
De modo que:
I
G
= ∑ λα = ϕ
2
α =1
b.4) TAZA DE INERCIA DE UN FACTOR
Sabiendo que la inercia IG de la nube de puntos-perfiles N(I) (o N(J)) es igual a la suma de los
p valores propios λα no nulos, podemos expresar el aporte de cada eje a la inercia total de la
nube por medio del índice τα , que expresa la taza de inercia del factor y que definimos a
continuación:
τ
α
=
λ
∑λ
× 100 = λα × 100
α
p
I
α
α =1
G
Siendo, claro esta:
p
∑τ
α =1
α
= 100%
b.5) TAZA DE INERCIA DE UN PLANO FACTORIAL:
Si nos interesamos en la inercia de una nube de puntos perfiles proyectada sobre un plano
definido por dos ejes factoriales α i y α i+k , sabemos que la inercia de la nube sobre ese plano
esta medida por: λαi + λα(i+k) (puesto que el eje α i
al eje α i+k ), de modo que la taza de
inercia asociada al plano (i , i+k) es definida así:
τ
=
plano ( i , i+ k )
(λα λα ) ×100
i+ k
i
p
∑λ
α =1
α
La taza de inercia expresa la parte de inercia global que es representado a lo largo de un eje
factorial o sobre un plano factorial. Pero el índice ϕ2 de asociación entre las variables que
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
sirve de referencia al índice τα , no constituye una medida significativa de la información que
aporta la tabla de contingencia.
b.6) CONTRIBUCION DE LOS PUNTOS PERFILES A LA INERCIA A LO LARGO
DE UN EJE FACTORIAL
Contribución del punto i al eje α :
p (F α(i)) × 100
CTR (i) =
λ
i
α
∀i ∈ N ( I )
α
Contribución del punto j al eje α :
CTR ( j ) =
α
p (Gα( j))
× 100
λ
j
∀j ∈ N ( J )
α
La contribución de un punto-perfil a la inercia de un factor es un índice que juega un rol
determinante cuando se trata de interpretar los resultados del análisis de la información
aportada por una tabla de contingencia.
La contribución de un punto-perfil conjuga el peso y la coordenada ligados a cada punto.
Esto permite evitar los errores de interpretación que produciría una lectura “inocente” de los
gráficos de los ejes factoriales que tome en cuenta solamente las coordenadas de los puntosperfiles, olvidando que cada punto tiene asociado un peso (no representado) y que el objetivo
del grafico del eje factorial es rendir cuenta de una parte de la inercia global de la nube de
puntos-perfiles.
b.7) CALIDAD DE REPRESENTACIÓN DE LOS PUNTOS PERFILES
Podemos entonces expresar por medio de un índice de calidad de representación del punto en
cada eje, la parte de la distancia de un punto i (o del punto j) al centro de gravedad, que es
representada por la coordenada del punto i (o del punto j)sobre cada eje factorial.
Calidad de representación del punto i sobre el eje α :
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
( (i) )
(i ) = F α
2
COR
α
d
∀ α = 1, 2, ......, p
2
p
Siendo : ∑ COR α (i ) = 1 ∀i ∈ N ( I )
α =1
(i ,G )
Calidad de representación del punto j sobre el eje α :
( ( j) )
( j ) = Gα
2
COR
α
d
2
∀α = 1, 2, ......, p
( j, G)
p
Siendo : ∑ COR α ( j ) = 1 ∀j ∈ N ( J )
α =1
S i un punto-perfil i presentara un CORα(i) = 100% para un eje α dado, esto significa que el
eje α “representa” perfectamente el punto perfil i puesto que Fα(i) = d(i , 0) . Decimos
entonces que el punto perfil i esta completamente “explicado” por el eje α. Considerando
solamente ese eje, podemos explicar completamente la posición del punto i con respecto a
todos los otros puntos-perfiles de la nube N(I).
En cambio, si un punto-perfil i presentara un CORα(i) = 0% para un eje α, esto significa que
Fα(i) = 0, es decir que ese punto esta situado en un sub-espacio ortogonal al eje α. Ese eje no
esta asociado a ese punto.
De modo entonces que el coeficiente CORα(i) (CORα(j)) se interpreta como un coeficiente de
correlación múltiple entre cada variable de la tabla T y el conjunto de p variables factoriales
construidas por el Análisis Factorial de Correspondencias de la tabla T.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
2.2.2.- ANALISIS DE CORRESPONDENCIAS MÚLTIPLES
El análisis Factorial de Correspondencias Múltiples es un instrumento de investigación
interesante cuando se trata de analizar la información aportada por tablas de contingencia de
grandes dimensiones. Pero pocas son las áreas de investigación en ciencias humanas en las
cuales se hace uso de ese tipos de tablas.
En efecto muy a menudo los investigadores proponen estrategias de observación de una
población dada (conjuntos de unidades de observación), a fin de relevar sobre ese conjunto
numerosas características, cada una de ellas compuesta de un pequeño numero de
modalidades. Por medio
“Encuestas”, se elaboran tablas que resumen las p características
observadas sobre n unidades de observación.
El análisis Factorial de Correspondencias Múltiples es un instrumento particularmente
adaptado al tratamiento estadístico de los datos producidos por esos tipos de observaciones.
Este método de análisis estadístico responde a la doble exigencia de objetividad en ese
proceso de reducción y de exploración de lo observado y de tratamiento de la información con
el nivel de síntesis de lo adecuado al cuadro conceptual utilizado.
El análisis Factorial de Correspondencias Múltiples responde a esa exigencia metodológica de
analizar la información aportada por la observación de diferentes dimensiones cualitativas u
ordinales de una población, respetando el nivel de síntesis que impone el cuadro conceptual
con el cual el investigador concibe su problemática de estudio y diagrama el dispositivo de
observación.
Esta adecuación metodológica del Análisis Factorial de Correspondencias Múltiples explica
su rápida difusión en diferentes campos de investigación en ciencias humanas, como también
el hecho que el método del Análisis Factorial de Correspondencias Binarias es empleado
solamente en ciertos sectores de investigación que elaboran regularmente tablas de
contingencia de grandes dimensiones.
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
2.2.2.1.- TABLAS DE CONTINGENCIA MÚLTIPLE DE ESTADÍSTICAS DE
RESUMEN DE LO OBSERVADO
a) TABLA DE CODIGOS CONDENSADOS
Presentamos aquí el modelo general de una tabla de códigos condensados y las principales
características de las mismas:
TABLA DE CODIGOS CONDENSADOS
TCC(n , p)
Individuo
1
2
.
.
.
i
.
.
.
n
1o
1
2
.
.
.
ki1
.
.
.
kn1
Código de la característica
2o
(…) j-esima (…) p-esima
2
…
2
…
4
1
…
1
…
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ki2
…
kij
…
kip
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
kn2
…
knj
…
knp
En esta tabla cada línea contiene todos los códigos correspondientes a las modalidades
atribuidas a un individuo para cada una de las características observadas.
En una tabla TCC(n , p), en la intersección de la i- esima línea y de la j- esima columna figura
el valor kij , es decir el código numérico que fue dado a la modalidad “atribuida” al -i esimo
individuo a propósito de la j-esima característica observada. De modo que podemos leer lo
resumido en esa tabla de la siguiente manera: El i-esimo individuo presento la modalidad
codificada kij de la j-esima característica...
Tratándose de una tabla de códigos la tabla TCC(n , p) no posee propiedades numéricas. Las
sumas en líneas y en columnas de los valores de la misma (márgenes de tabla) no tienen
sentido.
b) TABLAS LOGICAS
A partir de una tabla de códigos condensados podemos generar una tabla numérica capaz de
resumir la misma información. Conoceremos la primera columna de la tabla TCC(n , p) que
presentamos anteriormente. Esa columna nos permite asociar a cada individuo de la muestra
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
(y solo una) una modalidad de la primera características observada. Podemos asociar a esa
columna una tabla que, para cada individuo de la muestra, indique cual es la modalidad de esa
característica que le fue atribuida.
Presentamos a continuación la tabla asociada a esa columna:
TABLA TCC(n , 1)
Correspondiente a la primera columna de la tabla TCC(n , p)
Individuos
1
2
.
.
.
i
.
.
.
n
Código de la Primera
Característica
Observada
1
2
.
.
.
ki1
.
.
.
kn1
TABLA TL(n , 3)
Asociada a la primera columna de tabla TCC(n , p)
Individuo
1
2
.
.
.
i
.
.
.
n
Modalidades de la
primera característica
observada
Codigo Codigo Codigo
1
2
3
1
0
0
0
1
0
.
.
.
.
.
.
.
.
.
0
xi1
0
.
.
.
.
.
.
.
.
.
0
0
xn1
1
1
.
.
.
1
.
.
.
1
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
En la tabla TL(n , 3) asociada a la primera columna de la tabla TCC(n , p):
xi1 = 0 , si y solo si ki1 = 2 ⇒ xi1 = 1
xn1 = 0 , si y solo si kn1 = 2 ⇒ xn1 = 1
De modo que, si al i- esimo individuo le corresponde, en la tabla TCC(n , p), el valor código
de modalidad “2” en la primera característica observada, la tabla asociada a esa columna
indica que el i-esimo individuo presentó esa modalidad para esa característica, dando el valor
1 al segundo elemento de la i-esima línea y dando el valor cero a los otros dos.
A la primera columna de la tabla TCC(n , p) le hemos asociado así una tabla TL(n , 3) por que
esa primera columna de la tabla TCC(n , p) comporta tres modalidades mutuamente
exclusivas.
La tabla TL(n , 3) contiene las tres “variables indicadoras” de las modalidades de la primera
característica observada. Esas variables afectan, a cada modalidad de la primera característica
observada: el valor 1 al i- esimo individuo si este presento esa modalidad; y el valor 0 si el iesimo individuo no presento esa modalidad.
Esas variables son llamadas también “variables de presencia-ausencia” de una modalidad
dada.
Notemos también, que el margen inferior de la tabla TL(n , 3) corresponde a la distribución de
frecuencias de la primera característica observada en la muestra de n individuos. El margen
derecho de esa tabla es constante e igual a 1.
Si repetimos esa operación para cada columna de la tabla TCC(n , p), podemos asociar a ella
una tabla TL(n , k), es decir una tabla de tantas variables indicadoras como modalidades
presenten las p características que configuran la tabla TCC(n , p).
Se construye así la tabla lógica correspondiente a la tabla TCC(n , p):
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
TABLA LOGICA TL(n , k)
Correspondiente a la tabla TCC(n , p)
Individuos
1
2
3
.
.
.
i
.
.
.
n
Margen
1 racaracteristica
Modalidades
1
(…)
0 …
1 …
0 …
.
.
.
0 …
.
.
.
1 …
n1
1 …
0 …
1 …
.
.
.
1 …
.
.
.
0 …
…
k1
0
0
0
.
.
.
0
.
.
.
0
n k1
…
j-esima característica
Modalidades
…
…
…
…
.
.
.
…
.
.
.
…
…
Kj-1 +1 (…) k j-1 +k j
1 … 0 …
0 … 0 …
0 … 1 …
.
.
.
.
.
.
0 … xij …
.
.
.
.
.
.
0 … xnj …
n ((Kj-1)+1) …
0
1
0
.
.
.
0
.
.
.
0
n Kj-1+Kj
…
…
…
…
…
.
.
.
…
.
.
.
…
…
p-esima
característica
Modalidades
Kp-1 +1 (…)
1 … 0
0 … 1
0 … 0
.
.
.
.
.
.
1 … 0
.
.
.
.
.
.
0 … 1
N((Kp-1)+1)
k
… 0
… 0
… 1
.
.
.
… 0
.
.
.
… 0
…
nK
Margen
P
P
P
.
.
.
p
.
.
.
p
np
Siendo K =ΣKm el total de modalidades de las p características observadas.
Las K columnas de la tabla T(n , k) son las variables indicadoras de las K modalidades de las
p características observadas. De modo entonces que la suma en línea de esa tabla define un
margen constante, igual a p.
Cada bloque de variables indicadoras correspondiente a una característica define, por suma en
columna, un margen que corresponde a la distribución de frecuencias brutas de la
características. De modo que el margen inferior de la tabla TL(n , k) expresa la distribución de
frecuencias brutas de todas las características observadas. La suma de sus márgenes es,
evidentemente, igual a np.
Una tabla TL(n , k) es una tabla de correspondencia de tipo particular que resulta de la
yuxtaposición de las tablas de presencia-ausencia correspondiente a cada característica
considerada en el estudio.
2.2.2.2.- ANÁLISIS FACTORIAL DE CORRESPONDENCIAS DE UNA TABLA
LOGICA TL(n , k):
a) OBJETIVOS DEL ANÁLISIS
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
•
El primer objetivo específico del Análisis Factorial de Correspondencias Múltiples es
de facilitar la construcción de esas tipologías de individuos permitiendo la
comparación de todas las unidades de observación a través de todas las modalidades
de las características observadas .
Para obtener una representación grafica de esas comparaciones, debemos de definir un
espacio de representación de los individuos cuyo referencial sean las K modalidades
consideradas en las p características observadas. Como un espacio de representación
esta definido por la distancia entre los elementos que lo caracterizan, debemos
dotarnos de una distancia euclidiana entre los individuos. La distancia propia ha ese
espacio debe corresponder con el siguiente criterio de comparación: Dos individuos
que presentaron un gran numero de modalidades en común deben ser incluidos en una
misma clase de la tipología de individuos.
•
El segundo objetivo específico del Análisis Factorial de Correspondencias Múltiples
es estudiar la relación existente entre las características observadas.
•
El tercer objetivo específico del Análisis Factorial de Correspondencias Múltiples es
resumir el conjunto de características observadas en un pequeño numero de variables
cuantitativas relacionadas con el conjunto de variables cualitativas estudiado.
•
El cuarto objetivo específico del Análisis Factorial de Correspondencias Múltiples es
permitir la comparación de modalidades de las características observadas.
b) DISTANCIA ENTRE INDIVIDUOS (LINEAS) DE UNA TABLA LOGICA
El cuadrado de l distancia del Chi2 entre los puntos de individuos i e i’ esta dada por la suma
de los cuadrados de las diferencias de coordenadas, es decir que:
d
2
( i ,i ' )
=


K 
x ij
x i' j
−
∑
j=1
nj
 p nj
p

np
np








2
=
 x ij x i ' j 

−

∑
j=1 n j 
p
p


K
np
2
=
1
p
K
n
j =1
nj
∑
(x ij − x i ' j )
2
La distancia entre los puntos i e i’ queda entonces definida de la siguiente manera:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
d (i ,i ') =
np  xij x i' j 
∑  − 
n  p p 
2
K
j =1
j
=
1 K n
∑
p j =1 n j
(x ij − x i' j )
2
Cuando se calculan todos los términos de la sumatoria que establece las distancias entre dos
individuos i e i’, es evidente que la distancia entre los mismos crece a medida que aumentan
las diferencias de modalidades presentadas por los individuos i e i’. Cuando dos individuos
divergen a propósito de modalidades raras (de bajo peso), la distancia entre los mismos será
mas grande que en el caso en que los mismos individuos presenten el mismo numero de
divergencias, pero a propósito de modalidades muy frecuentes (de gran peso).
De modo entonces que la distancia Chi2 entre individuos de una tabla lógica respeta el criterio
de comparación de individuos que hemos adoptado.
c) DISTANCIA ENTRE MODALIDADES (COLUMNAS) DE UNA TABLA LOGICA
Sean por ejemplo dos modalidades j y k de la tabla lógica TL(n , k), sus coordenadas en el
referencial de los individuos son los siguientes:
 x1 j
x2 j
xij
xnj 


np
np
np
np

Modalidad j : 
;
; .....;
;.....;
 nj p nj p
nj p
nj p 


np np
np np 
 np np np np
 x1k

x
x
x
2k
ik
nk


np
np
np
np 

Modalidadk :
;
; .....;
;.....;
 nk p nk p
nk p
nk p 


np np
np np 
 np np np np
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
De modo que el cuadrado de la distancia entre esas dos modalidades (tratándose de un espacio
euclidiano) esta definido así:
 xij


xik 





x
np
np
ij
x

ik  = n  xij x ik 

= ∑
=
−
−
∑  − 
 n j 1 nk 1  ∑ 
1
1
 n j nk 


nk
nj

n
n

 np n np n 
2
2
2
d
2
( j ,k )
n
n
n
i =1
i =1
i =1
La distancia Chi2 entre dos modalidades es entonces la siguiente:
d
2
( j, k )
=
 xij xik 
∑ n  − 
 n j nk 
2
n
i =1
Desarrollando esa expresión podemos mostrar claramente la significación de la distancia entre
dos columnas de la tabla lógica.
Podemos escribir esa expresión de la siguiente manera:
 x2ij
n 2 +
d ( j, k ) = ∑
n
i =1
 j
2
n
2
x
n
ik
2
k
−2
x x
n n
ij
j



k 
ik
d) INERCIA TOTAL CON RESPECTO AL CENTRO DE GRAVEDAD DE LA NUBE
DE PUNTOS N(J)
Calculemos en primer lugar la contribución de un modalidad a la inercia global de la nube de
puntos N(J):
En el caso de una tabla de contingencia, hemos visto que la contribución de la j-esima
modalidad a la inercia global con respecto al centro de gravedad GC esta definida de la
siguiente manera:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Contribuci on I ( j ) = p d
j
GC
∀j ∈ J
2
GJ)
( j,
Tratándose de una tabla lógica, la contribución de la j- esima modalidad a la inercia global con
respecto al centro de gravedad GC es definida así:
Contribuci on I ( j ) = p d
j
GC
∀j ∈ J
2
GC )
( j,
Calculemos el cuadrado de la distancia de la j-esima modalidad al centro de gravedad GC:
d
 x ij



1
np

= ∑
−
 nj 1
n


np
n


2
n
2
G
( j,
C
)
i =1




1
x
ij

= ∑
−

n
1
nj

n


n
i =1
2
 x ij 1 

= ∑ n
 n −n 
 j

2
n
i =1
Desarrollando el termino entre paréntesis obtenemos que:
 xij 1 
− 
nj n
2
n
d ( j ,G ) = ∑

i =1
n
2
C
La inercia global con respecto a GC de la nubes de puntos N(J) es definida así:
K
∑ Contribuci
j=1
on
I
( j) =
G C
K
∑
j=1
1
p

 1 −


 =
n 
n
j
K
∑
j=1
 1

− n j
np
 P

 =

K
∑
j=1
1
−
p
n
∑ np
K
j
j =1
Es decir que:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
IG
C
( N ( J )) =
K
−1
p
De modo entonces que la inercia global de la nube de puntos N(J) de una tabla lógica no
depende mas que del numero de características observadas (p) y del numero total de
modalidades que presentan esas características (K). decimos entonces que la inercia global de
una tabla lógica no depende mas que de su “forma”.
2.2.2.3.- TABLA DE BURT (ANEXO III)
La tabla de Burt TB(K , K) es una tabla simétrica que presenta el conjunto de las tablas de
contingencia que pueden ser construida cruzando dos a dos las p características observadas.
Si llamamos, como en el caso de la tabla lógica, K la suma de las modalidades de la p
características observadas sobre los n individuos, la tabla de Burt presenta:
•
A la intersección de la j-esima línea y la j-esima columna, el valor njj es decir el
numero de individuos
que presentaron la j-esima modalidad de una característica
dada.
•
A la intersección de la j- esima línea y de la k-esima columna, el valor njk = 0 si la jesima modalidad y la k-esima modalidad pertenecen a una misma característica
observada.
•
A la intersección de la p-esima línea y de la k-esima columna, el valor nqk , es decir el
numero de individuos que presentaron, simultáneamente, la p-esima modalidad de una
característica dada y la k-esima modalidad de otra característica observada.
Tratándose de una tabla simétrica, construida con la yuxtaposición de todas las tablas de
contingencia definidas por las p características observadas (tomadas dos a dos) de todas las
variables cualitativas contenidas en ella.
La diagonal de la tabla TB(K , K) esta constituida por la distribución de frecuencias brutas de
todas las modalidades, de todas las variables cualitativas que componen la tabla.
a) ANALISIS FACTORIAL DE CORRESPONDENCIAS DE UNA TABLA DE BURT
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Considerando la tabla TB(K , K) como una tabla de correspondencias, la información
aportada por esta tabla TB(K , K) resulta de la comparación de todas las modalidades que la
constituyen. Es necesario entonces, definir el criterio de comparación con el cual debemos
tratar la información de dicha tabla.
Cada variable cualitativa realiza una partición de los n individuos observados en tantas clases
como modalidades constituyan la variable. Dos clases dadas (dos modalidades) serán
consideradas cuando presenten distribuciones de frecuencia equivalentes de las variables
cualitativas consideradas. Dicho de otra manera, dos clases de individuos serán semejantes
cuado presenten perfiles equivalentes de distribución del conjunto de variables cualitativas
consideradas.
Podemos definir un espacio euclidiano de representación de la información aportada por una
tabla de Burt. Representamos los puntos-perfiles ponderados de las k modalidades de la tabla
en un referencial de k dimensiones. Dotando ese espacio de la distancia Chi2 entre
modalidades, se puede verificar que respeta el criterio de comparación de las mismas que
hemos adoptado.
Tratándose de una tabla simétrica, la representación de una sola de las dos las nubes de puntos
perfiles ponderados N(I) o N(J) es suficiente para representar toda la información contenida
en una tabla de Burt.
La distancia del Chi2 entre dos modalidades i e i’ esta definida entonces de la siguiente
manera:
 n n ij
n ni' j 

=∑
 p × n i.n. j − p × n i'.n. j 


2
d
2
(i ,i ' )
K
j =1
1 K n  n ij ni ' j 
= ∑ × 
− 
p j =1 n. j
n n
2

i.
i '.

Expresando esa distancia en términos de perfiles-ponderados, la distancia del Chi2 entre dos
líneas i e i’ de una tabla de Burt queda definida de la siguiente manera:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
 f ij f i' j 
1
1

×
∑
 f − f 
p p f
 i.
i '. 
2
K
d (i ,i ') =
2
j =1
.j
Centrando ese espacio de representación en el centro de gravedad de esa nube de puntosperfiles ponderados, y calculando la matriz de inercia de la nube centrada de puntosmodalidades, podemos determinar sus direcciones principales de alargamiento y definir un
nuevo referencial de representación: los ejes factoriales.
El análisis factorial de Correspondencias de una tabla de Burt produce una buena
representación grafica de la información aportada por dicha tabla.
b) COEFICIENTES DE AYUDA A LA SELECCION DE EJES FACTORIALES
b.1) VALORES PROPIOS
Estudiando la relación entre una variable cualitativa y un eje factorial, sabemos:
n
 k − k j − 1+ k j
(G α , j ) = p  K = ∑ + 1
k j −1

2
p G
k
2
α
( )
j
k



∀ j = 1, 2 , . . . . . , p
Entonces los valores propios de un Análisis Factorial de Correspondencias Múltiples,
están comprendidos en el intervalo [0 , 1] .
Si:
λ
α
1
=
p
p
∑ n (G
j =1
2
α
,j
, cuando
)
se v e r i f i c a q u e : λ
α
2
n (G
α
,j
)= 1
∀ j = 1,2,....., p
=1
b.2) TAZA DE INERCIA DE UN FACTOR
La taza de inercia de un factor no es mas que una proporción cuyo denominador carece de
significación en términos de “información total” aportada por la tabla:
τ
α
=
λ
∑λ
α
p
α =1
α
× 100 = λα
I
G
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Los valores propios y las tazas de inercia de los ejes factoriales que resulta del Análisis
Factorial de Correspondencias
Múltiples de una tabla de “individuos-variables cualitativas”
no son índices de naturaleza tal que permitan decidir la importancia relativas de los ejes
factoriales.
En cambio, el diagrama de la taza de la inercia de los valores propios no nulos pueden darnos
ciertas indicaciones generales que permiten hacer una primera selección indicativa del numero
de ejes factoriales “interesantes” que merecen ser considerados.
El diagrama de la taza de inercia de los primeros valores propios no nulos resultantes de la
descomposición de la inercia global de una tabla lógica (o de la tabla de Burt correspondiente)
presenta la forma de una curva en S, cuyo punto de inflexión se procesa en torno a la taza de
inercia correspondiente al valor propio “medio”, el cual es definido así:
p
−
λ=
∑λ I
=
i
i =1
p
G
p
En situación de independencia (nube de puntos-modalidades de forma esférica) la
descomposición de la inercia global de una tabla lógica produce una serie de valores propios
que presentan un decrecimiento regular. La forma del diagrama de la taza de inercia de dichos
valores propios es entonces una curva en S regular.
Vemos entonces que, aunque los valores propios y las tazas de inercia de los factores no son
índices aptos para seleccionar los ejes factoriales que deben ser interpretados, el diagrama de
las tazas de inercia de los factores nos permiten identificar las principales deformaciones de
las nubes de puntos-modalidades y en consecuencia hacer una primera selección indicativa de
los factores que merecen ser analizados en la etapa de interpretación de resultados de un
Análisis Factorial de Correspondencias Múltiples.
c) COEFICIENTES DE AYUDA A LA INTERPRETACION DE LOS EJES
FACTORIALES
c.1) ESTUDIO DE LOS EJES FACTORIALES EN RELACION CON LAS
VARIABLES:
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Aplicación del Análisis Factorial de Correspondencias a Mapas
Perceptuales de los pacientes Infectados por enfermedades de
Transmisión Sexual. Chumpitaz Ramos, Domingo
Derechos reservados conforme a Ley
Los programas de aplicación editan no solamente las contribuciones la inercia a lo largo de
cada eje factorial del conjunto de modalidades presentes en la tabla lógica (o en la tabla de
Burt) estudiada, si no también la suma de esas contribuciones para el conjunto de modalidades
de una misma variable cualitativa.
De modo entonces que los programas de aplicación aportan los elementos necesarios para el
calculo del índice de correlación n2 entre cada variable cualitativa de la tabla y cada eje
factorial .
c.2)
CONTRIBUCION DE LOS INDIVIDUOS Y DE LAS MODALIDADES A LA
INERCIA A LARGO DE UN EJE FACTORIAL: GRADO DE GENERALIDAD DE
UN EJE FACTORIAL
En el caso del Análisis Factorial de Correspondencias Múltiples de una tabla lógica, los
programas de aplicación calculan y editan las contribuciones de los puntos-individuos y de los
puntos-modalidades a la inercia proyectada a lo largo de los ejes factoriales.
Las contribuciones de esos elementos son definidas de la siguiente manera:
1
CRT α (i) = n
( Fα(i )) ×100
n
2
λ
α
.j
∀i ∈ N( I ) ;
CRT α ( j ) =
n
(Gα( j )) ×100
2
λ
∀j ∈ N(J )
α
Este índice nos permite definir el “grado de generalidad” de cada eje factorial. Decimos que
un eje factorial representa un alto grado de generalidad cuando la inercia proyectada a lo largo
del mismo resulta de la contribución de una gran cantidad de elementos (individuos o
modalidades).
Si un eje factorial esta asociado por un gran numero de modalidades, es decir si presenta un
alto grado de generalidad, el eje resume una información muy rica. Al contrario, un eje
factorial que presenta un grado de generalidad muy bajo aporta una información demasiado
especifica (se trata de un eje hecho, por una sola modalidad).
Elaboración y diseño en formato PDF, por la Oficina General del Sistema de Bibliotecas y Biblioteca
Central UNMSM
Descargar