Efecto y utilidad de la métrica en el análisis de encuestas

Anuncio
ESTADISTICA ESPAÑOLA
Vol. 31, Núm. 121, 1 989, págs. 2 53 a 280
Efecto y utilidad de la métrica en el análisis
de encuestas
por
M.a ENRIQUETA GARCIA MOUTON
Doctor I ngeniero Agrónomo.
Escuela Técnica Superior de Ingenieros Agrónomos de Madrid.
Departamento de Maternática Aplicada a !a Ingeniería Agronórn^ca.
Ciudad Universitaria. Madrid
Y
FRANCISCO JAVIER DIAZ-LLANOS Y SAI NZ-CALLEJA
Doctor I ngeniero Agrónomo.
Instituto nacional de Investigaciones Agrarias.
Sección de Proceso de Datos. Madrid
RESUMEN
Se propone un método cientifíco para analizar la estructura
interna de una encuesta. La principal variación de este método
con respecto a los conocidos (1 }, (2} para el análisis de encuestas es la introducción de una ponderación concreta, ya estudiada
desde el punto de vista teórico (1 3}, de las matrices de variables
indicadoras asociadas a las variables cualitativas en el supuesto
de que no tengan las mismas dímensiones.
EI efecto de esta variación sobre datos provenientes del sector
agrario conduce a resultados de utilidad y aúr7 má5 si s^e utilizan
conjuntamente los métodos tradicionales para el análísis de encuestas.
Palabras clave: A nálisis Factorial áe Correspondencias Múltiples
(AFCM), Coeficiente de correlación vectorial (RV), Clasificación
.4scendente jerárquica (CAH), Clasificación no jerárquica (Bolas
optimizadas), Comunídades de Regantes (CR).
Clasificación A MS.^ 6 2 H^2 5.
? 54
1.
ESTADISTIC',A ESP.Atinl_A
INTRODUCCION Y OBJETIVOS
EI objetivo de este trabajo se articula para su mayor simplicidad en dos
partes, la primera de las cuales expone una metodología para el análisis de
encuestas, mientras que en la segunda se aplica esta metodología a una
encuesta proveniente del sector agrario.
EI proceso metodológico que se ha seguido se esquematiza en el organigrama de la figura 1. Dicho proceso consta de una serie de fases fundamentales que son las siguientes:
I. Estudio preliminar de la encuesta:
1 ^ Construcción y depuración de la matriz de datos ( matriz X disyuntiva
completa ^ .
2j Cálculo de las distancias entre los perfiles de las modalidades y entre
los perfiles de los individuos.
31 Agrupación de modalidades si las distancias obtenidas indican que es
procedente.
4) Representacián de las variables cualitativas en los círculos de correlación, mediante un ACP sobre la matriz de Tschuprow.
5) Obtención de una matriz de distancias entre variables para proceder a la
Clasificación Ascendente Jerárquica de las variables cualitativas.
6) Primeras conclusiones sobre las variables cualitativas en función de los
resultados de los dos procesos anteriores.
II. AFCM usual y modificado y clasificación de los individuos:
1) AFC sobre la matriz disyuntiva completa.
2) Eliminación de las modalidades poco frecuentes. AFC de la matriz obtenida.
3y Transformación de la matriz disyuntiva completa mediante la ponderacián cuyo efecto se pretende estudiar. AFC de la matriz transformada.
4) Clasificación no jer^irquica de los individuos en función de sus coordenadas obtenidas sobre los ejes factoriales:
a) en el AFC de la matriz disyuntiva completa.
b) en el AFC de la matriz transformada.
A continuación pasamos a exponer más detalladamente algunas de estas
fases, y en particular lo que concierne a la ponderación del AFC, ponderación optimal que ha sido estudiada a nivel teórico É13f.
En lo que respecta a la aplicación, estudiaremos si ia estrategia de
cambio de métrica contenida en la parte metodológica conduce a resultados satisfactorios a nivel de interpretación de la encuesta. EI estudio com-
EFECTO Y UTILIDAD DE LA METRICA EN E^ ANALISIS DE ENCI,'ESTAS
ZSS
parativo de los resultados obtenidos en las distintas fases nos permitirá
evaluar la metodología en cuestión, además de Ilegar a resultados concretos sobre los datos de la encuesta real procesada (1).
2.
MATERIAL Y METODOS
2.1. Datos de partida
Los datos que hemos utilizado proceden de encuestas de campo realizadas por la Comunidad Autónoma de Castilla-León en las Comunidades de
Regantes de sus 9 provincias. Son datos reales, cuyas variabies (cuantitativas, cualitativas ordinales y cualitativas nominales) se han definido teniendo en cuenta el tipo de problemática que se desea estructurar.
En cuanto a las variables cuantitativas se han transformado en cualitativas ordinales primando el criterio agronómico sobre el estadistico.
Antes de la creación de la matri2 de datos definitiva, los programas de
depuración han eliminado las modalidades que no han sido elegidas por
ningún individuo, así como las variables que, como consecuencia de lo
anterior, sólo constaban de una modalidad.
Las variables retenidas finalmente son las siguientes:
1. a. va^íab/e: PR O
Variable cualitativa nominal que indica el origen de la formación de la
Comunidad de Regantes. Puede adoptar dos modalidades: pr1 (promoción
privada ^ , pr2 (promoción estatal).
2. a. variab/e: COM
Variable cuantitativa: número de comuneros asociados en cada Comunidad de Regantes. Codificada en 8 rnodalidades: co 1(hasta 10 comuneros),
co2 (de 1 1 a 30), co3 (de 31 a 50), co4 (de 51 a 100), co5 (de 101 a 300),
co6 (de 301 a 500), co7 (de 501 a 1000), co8 (más de 1000 camuneros).
3. a. variab/e: SUP
Variable cuantitativa que mide el número de Has. regables para las que
legalmente se tiene la concesión según la Comisaría de Aguas.
Se ha codificado en 8 modalidades que, igual que en la anterior, responden a la diversidad de su significado agronómico: su 1(hasta 10 Has.),
su2 (de 1 1 a 25), su3 (de 26 a 50), su4(de 51 a 100), su5 (de 101 a 300),
su6 (de 301 a 500), su7 (de 501 a 1000), su8 (más de 1000 Has.)
{ 11 Para procesar la encuesta se han utilizado programas de (8) y(91, con algunas modificaciones y programas añadidos.
F^STAUISTIC',4 ^SF'A^IOL.^^
4, a. variab/e: CMJ
Variable cualitativa nominal que valora la conveniencia de realizar mejoras en la infraestructura de los regadíos y su posible repercusión en la
rentabilidad de las mismos. Codificada en 5 modalidades: cm 1(buena posibilidad de uso si se Ilevan a cabo), cm2 (regulares posibilidades), cm3 (aunque se realicen rnejoras en la infraestructura es difícil que el regadío se
reactive), cm4 (no necesita mejoras), cm 5(las obras de mejora están ya en
ejecucián en el momento de reali2ar 1a encuesta).
5. a. variab/e: A GR
^
Variable cualitativa ordinal que mide la suficiencia del caudal concedido a
juicio del agricultor. Desglosada inicialmente en 3 modalidades: ag 1(caudal
insuficiente), ag2 (caudal suficientel, ag3 (caudal sobrante), hubo que eliminar la 3.a. modalidad, que, por no ser seleccionada en ningún caso por los
agricultores, daba lugar a una columna de ceros en la matriz disyuntiva
completa.
6, a. variab/e: TEC
Variable cualitativa ordinal que valora la suficiencia del caudal concedido
a juicio del técnico. Particionada en 3 modalidades: te 1(insuficiente),
te2 (suficientel, te3 {sobrante).
7, a. variab/e: REG
Variable cualitativa nominal, cuya división en modalidades, poco nítida en
función de los datos disponibles, se respeta en principio debido a las
distancias entre sus perfiles en I.
re 1= riego eventual por tomar agua de un cauce discontinuo.
re2 = riego estimado eventual en función de los cultivos implantados.
re3 = riego estimado permanente en función de los cultivos implantados.
re4 = permanente por tomar agua de un cauce continuo.
S. a. variab/e: CUL
Variable cualitativa nominal: tipo de cultivo predominante en la Comunidad de Regantes considerada. Desglosada en 4 modalidades: cu 1(prados y
pastizales), cu2 (cultivos extensivos}, cu3 (cultivos intensivos), cu4 (cultivos
de huerta).
9. a. variab/e: A L T
Variable cualitativa ordinal que clasifica el tipo de agricultura posible
según la altitud existente, codificada en 4 modalidades: al 1= agricultura de
meseta baja ( menos de 600 m.), al2 = de meseta media (de 601 a 800 m.),
al3 = de meseta alta (de 801 a 1000 m.}, al4 = de alta rnontaña (más de
1000 rn.).
EFEC'TO Y l1TILIDAD DE LA METRICA EN EL A^(ALISIS DE ENCI,ESTAS
?S7
10.a. variab/e: EXP
Variable cualitativa ordinal que clasifica los tipos de explotaciones predominantes entre las existentes en cada Com. de Regantes, en función de su
tamaño, en 4 modalidades: ex 1= huertos familiares (menor de 0,5 Ha.),
ex2 = pequeños agricultores {de 0,5 a 5 Has.), ex3 = medianos agricultores
(de 5 a 15 Has.), ex4 = grandes agricultores lmayor de 1 5 Has.).
2.2. Creación de la matriz de datos y análisis previos al AFC
Partimos de una tabla numérica que almacena el número de la respuesta
elegida para cada pregunta por las 607 Comunidades de Regantes lindividuos encuestados).
Dicha tabla carece de significado estadístico por lo que, a partir de ella y
tras un primer proceso de depuración, vamos a construir la rnatriz disyuntiva completa a la que posteriormente aplicaremos los métodos adecuados
de Análisis de Datos.
Puesto que las distintas preguntas sólo admiten respuestas rnutuamente
excluyentes, son asimilables a variables cualitativas con modalidades disjuntas. Por tanto, cada una de dichas variables induce una partición del
conjunto de los individuos encuestados en función de la modalidad de
respuesta elegida.
Si Ilamamos I={ 1, 2, ... i, ... n} al conjunto de los individuos,
Q={ 1, 2, ... q, .. . c } al conjunto de las variables,
Jq al conjunto finito de las modalidades de la variable
q-ésima, tendremos una serie de aplicaciones
q: I --^ J q
representadas por las matrices de variables indicadoras U^ asociadas a cada
variable cualitativa.
Q
i
variable 1
variable 2
J,
J2
JQ
J^
1 2... p,
1 2... p2
1 2... pq
1 2... p^
Xik 1
Xik2
Xikq
....
variable q
...
variable c
1
2
.
1
Xikc_
.
•
Í%
I
^
=..^ 1^
-'^ r-
U,
^
_^^^ =^.r
U2
....
_....^- -.,^.^
lJq
...
-
-^^--
1,^^
258
ESTADISTICA E5PAÑOLA
La yuxtaposición de dichas matrices da lugar a la tabla anterior, matriz
disyuntiva completa, X=1U, ^ U^ ^... ^ U^1 en la que:
x;kQ - 1 ^ EI individuo i ha elegido la modalidad k de la variable q-ésima.
x;kQ = 0^. Dicha modalidad ha sido rechatada.
Desde el punto de vista numérico, consideraremos una tabla IxJ =[x;^]
J
1 2 3 ..........j..........p
I
1
2
x;^
n
con X =[x;^], 1< i< n, 1< j<^ card JQ, siendo el subíndice
q
.
^
^ = k + ^ card J Q .
4= ^
Esta matriz es una tabla de números positivos para la que pueden generalizarse inmediatamente todos los tratamientos estadísticos aplicables a los
cuadros de contingencia. Sus filas siguen representando el conjunto de los
individuos, y las columnas representan el conjunto de las modalidades:
J= U [JQ ^ q E Q], con card J=^ card JQ = p.
4
Cada fila o individuo de la rnatriz constará de p elementos x;^ que valdrfin 1
si la modalidad j ha sido elegida y 0 si ha sido rechazada.
A continuación verificamos que las distancias entre los perfiles en I de
las modalidades no justifican agrupar distintas modaiidades de la misma
variable y pasamos a calcular la matriz T2 de Tschuprow.
EI análisis de datos sobre operadores: coeficiente RV y matriz de
Tschuprow
EI coeficiente RV es un coeficiente de correlacián vectorial entre operadores asociados a tablas de datos, que mide por tanto la proximidad entre
dos estudios.
EFECTO Y UTILlDAD DE LA METRICA EN EL ANALIStS DE ENCUESTAS
ZS9
Un estudio estadístico esté caracterizado por el triplete {X,, Q,, D) donde:
X, es una matriz p x n: observaciones de p variables sobre n individuos,
centradas respecto a los pesos que constituyen la diagonal de D.
Q, es una matriz p x p simétrica definida positiva. Esta rnatriz permite
el cálculo de las distancias entre individuos.
D es una matriz diagonal n x n que contiene los pesos asociados a los
n individuos del estudio.
V, = X, D X; es la matriz de varianzas - covarianzas de las p variables.
W, = X; Q, X, es la matriz de productos escalares entre individuos. EI
operador W, D= X; Q, X, D caracteriza un estudio.
Sea G el conjunto de los operadores D-simétricos, subespacio del espacio de los endomorfismos lL ( F, F). Entonces A^ G ssi A= W D con W
matriz simétrica.
La forma bilineal simétrica ^r definida sobre G por
^r : G x G ^. R / yr (A,B) = Tr (A.B), es decir, la traza del producto de
composición, es real y positiva y constituye por tanto un producto escalar
en G.
Por analogía con el vocabulario estadístico usual (2), se denominan:
Covarianza vectorial: covV {A,B) = Tr (A.g1
Varianza vectorial: varV IA) = Tr 1A)2
Correlación vectorial: RV (A,B) _
Tr ( A. B ) ^
^ Tr (A)2 • Tr ( B )2
Para todo par de estudios IX,, Q,, D) y(X2, Q2, D) se verifica:
1.°
0< RV {W, D, W2 D) < 1.
2.° RV (W, D, W2 D) = 1 ssi 3 k^ R+ / W, D= k.W2 D, es decir, cuando
las variables engendran productos escalares proporcionales sobre los individuos.
3.° RV (W, D, W2 D) = 0 ssi S,2 = X; D X2 = 0, es decir, cuando los dos
conjuntos de variables son mutuamente ortogonales.
(2)
Para una explicación más detallada, véase (41, (5) y(101.
?^O
ESTADISTI('A ESPA!VOLA
Cansideremos ahora la matriz disyuntiva completa X=(U, ^ U2 ^... ^ U^}
Sean:
Ut= (I„ - 1„1 ñ D1 U; : matriz de variables indicatrices centrada.
D= ^ I es
la matriz diagonal de orden n que contiene los pesos
n
asociádos a los n individuos del estudio.
m; = número de modalidades de la i-ésima variable cualitativa.
P= tabla de contingencia que cruza las modalidades de una variable I
con las de una variable J, cuyos elementos son p(i,j}.
D, = UTD U;, matriz diagonal de orden m; cuyos elementos son los
pesos marginales de las filas de P, p;+.
D^ = U; D U;, matriz . diagonal de orden rn^ cuyos elementos son los
pesos marginales de las columnas de P, p+^.
Asociamos a las variables cualitativas i y j los tripletes estadísticos:
( U;^, D;' , D}
l U; , D^' , D}
y a cada uno de ellos las operadores
W^D=U^D^' U^D.
W*D=U*D;'U;^D
Si calculamosTr(W;^.W;'D} = Tr(U*D;' U;^D U^ D^' U^D} _
mi m
U;^1 =^ ^
U*D^'
= Tr(D^'
^
i ^ U^D
i
i U^D
^- ^ ^= ^
.
^P (^, j } -pi+ ' p+i^
p;+ ' p+i
y, en particular Tr(W;*D}2 = Tr(Im^} - Tr(1 m ^ 1 m; D} = m; -1.
Por tanto en nuestro caso:
„D _
RV (W,^- W, )
^
*
Tr (W; D. W; D)
ti'Tr(W*D)^ ti Tr(W^ D)2
_
^?
,
,
ti'm;-1 ^(m^
= T?^, ^que se conoce en la literatura estadística con el nombre de coeficiente T2 de Tschuprow.
Puesto que la forma biiineal Tr(W*D.W! D) constituye un producto escalar en el subespacio de los operadores D-simétricos, podemos definir una
EFEC'TO Y U7CILIDAD DE LA METRICA EN EL ANALISIS DE ENCt^ESTAS
261
distancia euclidiana entre dichos operadores como:
d2(W*D, W; D) = y^(W;'D - W; D, W;'D - W; D) = Tr(W;'D - W; D)2 = Tr(W*D)^ +
+ Tr(W;`D)2 - 2 Tr(W;`D. W^ D) = m; -1 + m^ -1 - 2 ^? = m; + m^ - 21 ^i^ + 1 ^
Esta distancia, cuya fórmula es la misrna que aparece en Saporta (14j,
tiene el inconveniente de que al no tener en cuenta fa posible desigualdad
entre el número de modalidades de las distintas variables, el término
m; + m^ puede ser en ocasiones rnuy grande frente al resto, dándonos como
resultado grandes distancias para variables que pueden estar muy relacionadas simp^emente por tener ambas un número elevado de modalidades
definidas. Para evitar esto normamos !os operadores y consideramos como
producto escalar el de los operadores normados, siendo
II W;`D (I = 1^^ Tr (W*D12 , II W; ^ II =`^ Tr (W; p}^
y la distancia euclidiana asociada:
d^ ^
*
*'D
IIW;DII
,-
^
w'D
*
IIW;oII
(1 -T?-)
,,
,,
^ = 1 +1 -2T?^=2
[1 ^
A partir de esta distancia construimos un dendrograma mediante el
criterio de agregación de la distancia media. La interpretación conjunta de
los resultados obtenidos en esta clasificacián jerárquica y en el ACP sobre
la matriz de Tschuprow nos permite obtener una idea de las relaciones
globales entre variables previa a la realizacián del AFC.
Observamos que la utilización del coeficiente T2 de Tschuprow como
medida de la correlacián entre variables cualitativas conduce a resultados
muy pesimístas, particularmente cuando se trata de dos variables con
número de modalidades muy diferentes, ya que
0 < T? <
inf(m;-_1, m^- 1 l
^ (m;- 1) (m;- 1)
sólo puede Ilegar a ser igual a 1 para m; = m^ (m; = número de modalidades
de la variable i-ésima}.
Sin embargo nos permite definir la distancia [1 ], que sólo depende del
coseno entre los operadores asociados a las variables cualitativas y nos
proporciona una CAH completamente coherente con lo que cabría esperar
de la naturaleza agronómica de las variables consideradas.
262
ESTADISTICA E5PA^ULA
2.3. AFC de fa matriz disyuntiva completa (AFCM)
Una vez estudiadas las relaciones globales entre variables, pasamos a
efectuar e1 AFC sobre la matriz X=(U, ^ U2 ^....( U,o).
En la primera pasada de este sistema aparecen una serie de modalidades
e individuos que se separan mucho de los restantes, ya que absorben una
inercia relativa desorbitada. Producen por tanto un "efecto piña" sobre el
resto de los elementos, distorsionando el estudio.
Este problema tiene carácter general en este tipo de trabajos: si no se ha
planteado un cuestionario equilibrado, evitando definir modalídades de respuesta que pueden suponerse poco frecuentes, tendrernos que estudiar
aiguna forma de equilibrarlo a posteriori.
Separamos estas modalidades y los índividuos que las poseen del resto
del estudio, eliminando aqueilas modalidades cuya frecueneia (efectivo) es
menor del 2,5 % respecto a su variable, mediante un método adaptado del
que figura en 11) para cuadros de contingencia.
A continuación repetimos todos los procesos anteriores sobre esta matriz
depurada, obteniendo los resultados que se discutirán en el apartado siguiente.
2.4. AFC sobre la base de la matriz disyuntiva completa transformada
Dado que las matrices de variables indicadoras que tratamos en esta
encuesta mixta (variables cuantitativas, variables cualitativas ordinales, variables cualitativas nominales) tíenen dimensiones distintas, cabe esperar
que aquéllas cuyas dimensiones sean mayores tengan una mayor influencia
en el análisis.
Para estudiar esta cuestión procedemos a efectuar un AFC de la matriz
X'=1U;^U2^....^U^)
______-donde U; _^3; . U; con ^; = L; /^ m; - 1
L; = componente i-ésima del autovector asociado al mayor autovalor procedente de la diagonalización de la matriz de Tschuprow.
m; = n.° de modalidades de la i-ésima variable.
Esta ponderación de las matrices de variables indicadoras es optimal
respecto a la suma de los cuadrados de los autovalores (10} y vamos a
intentar comprobar su efecto en datos de tipo agronómico, tanto sobre los
resultados de^ AFC como en los de la posterior clasíficación de los individuos.
EFEt'TO 1^' l'TILID:^D DE l_A titETRlt.^ Eti EL :^^i:^LISIS [^E^: Eti('[_ EST ^^S
?b^
En principio perseguimos al aplicarla una doble finalidad:
disminuir el excesivo impacto de las variables con número de_ modalidades comparativamente elevado mediante el coeficiente 1/^ m,-1.
el coeficiente L; será menor para las variables con menor T2;^, luego las
variables menos correlacionadas quedarán prácticamente eli^minadas del
an^ilisis.
En efecto, Y. Escoufier (5) define el AFCM como el ACP del triplete (D^,'
XT Dñ', D`, D„), que corresponderia al siguiente esquema de dualidad:
^
Ejes principales:
vectores propios de V D^-
Cofactores principales:
vectores propios de D„ W
D^ -^ XT p^ ^
F*
E = Rp --
°^
11^
W
!
R n-F
E*
D;,'X D^-'
Vectores principales:
vectores propios de D^- V
Componentes principales:
vectores propios de W D„
siendo: p = ^m;
;
m; = n.° de modalidades de la variable i-ésima.
c= n. ° de variables cualitativas.
D^-=n.
es la matriz d^agonal formada por las sumas de cada columna de X(efectivo de cada modalidad).
D„ = c.l„ = c.n. D es la matriz diagonal cuyos elementos son las sumas de
cada fila de X, todas ellas iguales al n.° de variables cualitativas.
V= D^. ' X T D;,' X D^'
W= D ñ' X D;' X T D;,'
E:STAD[STlCA E:SP.AtiiUL.A
Por tanto, el operador W D„ asociado a este estudio será:
W D„ _( D ñ' X D^' ). D^.( D^' X T D;,' ) D" = D;,' ^( p^' X T=
É U, D^'UT=^
^ U^D^'UTD=^
^ A^
^
, , c ^_
, , ,
c ^^
^,
n . c ;- ^
donde A; es el proyector sobre el subespacio de R" engendrado por las
indicadoras de la i-ésima variable cualitativa considerada.
Si el rango de W D" es r, obtendremos la representación de los individuas calculando las r primeras componentes principales, que serán proporcianales a los vectares propios de la su ma de los proyectores A;. Por
tanto, el AFCM de !a matriz X=(U, ^ U2 ^.... ^ U^ ^ es equivalente a la diagonalización del operador ^ A;.
;
Cuando efectuamos sobre la matriz X la ponderación descrita, el AFC
que realizamos sobre la matriz transformada equivale a un ACP sobre el
triplete ( D^' X^' DÑ', D^, DN) y, Ilamando U; _^3; U; y S =^^; , las nuevas
métricas definidas son:
DN = S. I" - S.n. D
f3, D ,
D^-n .
^2 D 2
^^ D ^
_
EI operador de cuya diagonalización obtenemos las nuevas componentes
principales será:
W DN =(D^' X' D^' ). D^. .(D^' X'T DN') . DN =
= D- ^ X• D- r X•r = ^ E^ U D-' UTD = ^ ^ A.
N
^
^ F'^
^
^
^
^ N^
^
S
S
La representación que obtendremos ahora no será ya proporcional a la
suma de los proyectores A; sino a una combinación lineal de los mismos
cuyos coeficientes serán precisamente los ^^; que ponderan las matrices U;
de variables indicadoras asociadas a cada variable cualitativa.
EFEC'TO Y l,'TILID,AD DE l.,A METRIC^A E^I EL ,Ay,ALISIS DE Etit`l'EST:AS
^f^S
La diagonalización de este operador ^^, A, será pues equivalente al AFC
de (^3, U, ^/32 U2 ^. .. ^^3^ U^). AI efectuarlo maximizamos
c
L;
^
;=1
A;
2
•
con la restr^cc^on
^ L;2 = 1,
lo que equivale a optimizar el AFC de (Q, U, ^... ^^3^ U^) con la restricción
^ ( m; - 1) J^2- 1.
Así pues, teóricamente, esto debería conducirnos a una representación
de los individuos que sería función casi exclusivamente de las variables
más relacionadas, con independencia del número de modalidades de cada
una de ellas.
2.5. Utilización conjunta del Análisis Factorial (AFCM) y de la clasificación no jerárquica ( Bolas optirnizadas) para la formacibn de grupos
En las dos estrategias que mostramos en el cuadro adjunto observamos
el mismo orden de prioridad en cuanto concierne a estos dos métodos de
Análisis de Datos Multidimensionales que, aunque pertenecientes a dos
métodos de análisis distintos, están íntimamente relacionados entre sí (12).
ESTRATEG IAS
AFC sobre la matriz X(AFCM)
^
Clasificación no jerárquica
(Bolas optimizadas) sobre
la base de la matriz ^J551, 4J
AFC sobre la matriz X' (AFCM^)
1
Clasificación no jerárquica
( Bolas optimizadas) sobre
la base de la matriz^'J551, 4J
(3)
En ambas estrategias utilizamos como radio inicial una fracción del de la
nube de puntos (7),(1 5) y para acotar el número de clases nos guiamos por
los grupos que parecen tender a formarse en los gráficos del AFC en el
segundo caso.
^3)
^f551,aJ es la matri2 de coordenadas de las C. R. sobre los 4 primeros ejes factoriales.
^bb
ESTA[^lSTlt';> E:SP^tiOLR
3.
RESULTAD4S OBTENID(JS Y DISCUSION DE LOS MISMOS
.
3.1. Representación de las variabfes en los círculos de correlacián:
De la matriz de Tschuprow obtenida a partir de la primera matriz disyuntiva comp^eta (607 CR y 10 variables que totalizan 44 modalidades) y
teniendo en cuenta que los coeficientes de Tschuprow son siempre bajos
en una población grande y en nuestro caso el problema se agrava por el
desigual número de modalidades, destacamos los siguientes valores:
T;, 8= 0.325 IREG-CUL)
T2 3= 0.167 ( COM-SUP)
T^ 9- 0.1 1 1(CUL-ALT)
T; 3= 0.103 (PRO-SUP)
A la vista de la inercia explicada por los valores propios obtenidos retenemos ios cuatro primeros, efectuando las proyecciones correspondientes en
los p^anos 1-2, 1-3, 1-4, 2-3, 2-4, y 3-4.
En las distintas proyecciones aparecen próximas entre si y bastante lejos
del origen ios siguientes puntos-variables: CUL-REG (tipo de cultivo y de
riego), COM-SUP y en algunas COM-SUP-PRO Ín.° de comuneros, n.° de
Has. regables, promoción), AG R-TEC (opinión respectivamente del agricultor y del técnico sabre la suficiencia del caudal concedido).
Después de eliminar las modalidades de baja frecuencia, lo que supone la
desaparición de las Cornunidades de promoción estatal, rnejoras en curso,
mayores tamaños de COM, SUP y EXP, y 1a formación de una matriz de
551 CR por 9 variables con 35 modalidades, obtenemos una nueva matriz
T^ de Tschuprow de la que podemos destacar los siguientes coeficientes:
T^ ,,= 0.332 (REG-CUL),
T; 2= 0.109 (COM-SUP},
T; 8= 0.100 IALT-CUL)
IVuevamente retenemos los 4 primeros valores propios y proyectamos en
los planos correspondientes. Aparecen interpretables en las distintas
pr©yecciones las proximidades entre REG-CUL, COM-SUP, AGR-TEC.
A continuación calculamos las matrices de distancias asociadas a ambas,
obteniendo los dendrogramas de las fig. 2 y 3
mediante el criterio de
agregación de la distancia media.
EF^F:C'TO l' l'TI1✓ I[)A[) DE L.A METRIC'A Eti EL Ati,AI_ISIS f^f: Eti('t;f ST.^S
?f^^
De la consideración simultánea de ambos procesos Iproyección en los
círculos de correlación y CAH} podemos deducir las siguientes conclusiones provisionales:
Las variables R EG y C U L son las más correlacionadas y la relación es
más estrecha en la 2a. matriz de datos.
Las variables COM y SUP están también bastante relacionadas, lo que
indicaría que el tamaño de la parcela media cultivada sería bastante constante.
La altitud está también bastante relacionada con el tipo de cultivo y
de riego, aunque la correlación es baja para lo que cabría esperar de una
planificación racional de los cultivos.
l.a opinión sobre la cantidad de agua disponible del agricultor tiene
una cierta relación con la del técnico, si bien es en general más pesimista.
La conveniencia de realizar mejoras en la infraestructura de los regadíos parece haberse estimado en primer lugar en función de las características socioeconómicas de la explotación y del menor coste por Ha.
(priaritarias en C. R. de promoción estatal, fincas grandes, gran n.° de
comuneros} y en el resto de las explotaciones (2a. matriz} en función de las
características agrociimáticas de las C. R. que potenciarían su rentabilidad.
Este resultado, que se puede intuir a partir de los dendrogramas de las
figuras 2 y 3, se confirma posteriormente en los AFC.
3.2. AFC de la matriz disyuntiva completa X(607 x 44)
Efectuamos un AFC de la rnatriz inicial (607 C. R. por 44 rnodaiidades
procedentes de 10 variables}, reteniendo para el análisis los 4 primeros
ejes factoriales que absorben una inercia del 2^4,79 %. Proyectamos en los
ptanos factoriales 1-2, 1-3, 1-4, 2-3, 2-4 y 3-4 en gráficos separados y a
escala relativa las modalidades y las Comunidades de Regantes.
EI estudio de los gráficos y los listados obtenidos en este AFC y en otros
dos en los que se han eliminado sucesivamente las C. R. can perfiles más
excéntricos, y la ejecución del programa que detecta modalidades de baja
frecuencia nos proporcionan idéntica conclusión:
Hay una serie de C. R. atípicas que poseen simultáneamente varias modalidades poco frecuentes, y en general relacionadas entre sí, que son las
siguientes: pr2, cm5, su7, su8, co7, co8, ex3 y ex4.
Es decir, se trata de C. R. cuyas características, poco frecuentes en el
conjunto de la población encuestada, son las siguientes: la Comunidad de
Regantes es de promoción estatal, las obras de mejora de la infraestructura
?óK
t-^^r;^t^tsric^;1 t^^Pt^^c^t,.^
se estaban Ilevando ya a cabo en el momento de realizar la encuesta, la
superficie regable es muy grande (501-1000 Ha. o más de 1000 Ha.), lo
mísmo ocurre con el n.° de comuneros (501-1000 o más de 1000) y las
explotaciones predominantes en cada Comunidad son grandes (ex3) o muy
grandes (ex4i. Separamos estas C. R. del resto del estudio por dos motivos:
1.°) Porque, dada la excentricidad de sus perfiles, perturban gravemente
la estabilidad del AFC.
2.°) Porque el estudio de sus coordenadas iniciales en Rp nos confirma
que se trata de un grupo coherente y bien definido y no será por tanto
necesario clasificarlas junto con las de promoción privada, sobre las que
trabajaremos a continuación.
Generamos pues automáticarnente 1a matriz correspondiente a las 551
C. R. y a las 35 modalidades restantes y procedemos a su estudio.
3.3. AFC sobre la rnatriz disyuntiva completa X(551 x 35^
Retenemos para el análisis los 4 primeras ejes factoriales (ver cuadro n.°
1). Del estudio simultáneo de los planos formados por cada dos ejes
retenidos podemos destacar las siguientes conclusiones:
Las modalidades de las^ariables REG y CUL, que miden respectivamente
intensídades de riego y de cultivo, se ordenan en sentido creciente a lo
iargo del eje 1. De manera parecida se ordenan las modalidades de !a
variable ALT pero en sentido decreciente, lo que indica que fa correlación
de esta variable con las dos anteriores es negativa. Si bien las modalidades
de las tres variables antedichas no son completamente independientes del
resto de los ejes, algunas de ellas contribuyen muy fuertemente a la formación del eje 1, lo que nos permite interpretario como un eje de características agroc/imáticas.
EI eje factorial 2 resume claramente un carácter de tamaño, puesto que a
lo largo de éi (con la sola excepción de coó que precede a co5) se ordenan
en sentido creciente las modalidades de las variables que categorizan el n.°
de comuneros de cada C.R. (COM), el de Has. regables concedidas (SUP) y
el tamaño de las explotaciones individuales (EXP).
Para el eje factorial 3 no hemos podido encontrar ningún carácter general subyacente con significado agronómico.
EI eje factorial 4 está formado por !a oposición de dos modalidades de
C MJ : c m 3 ( aunque se realicen mejoras en la infraestructura es dífícil que el
regadív se reactive ^ y cm4 (el regadío no necesita mejoras en la infraestructura). Del lado de la 1.a se encuentran ag 1 y te 1(agua insuficiente según el
EFEC'TO ^' !.:'TILID.^D DE: L.A !^tETRICA E^ El_ .^^ti->LISIS DE E:ti( ! E-S^T ^ti
^Óy
agricultor y el técnico respectivamente) y del de la 2.a ag2-te2 (agua
suficiente según ambos). Podríamos por tanto interpretarlo como un eje de
opinión sobre el regadío.
También se aprecian en todos los planos factoriales proximidades entre
modalidades de distintas variables con una clara interpretación agronómica.
A continuación ponderamos las matrices de variables indicatrices de la
2.a matriz de datos con los coeficientes ^3; y realizamos un AFC sobre ta
matriz así obtenida, estudiando los resultados en los planos formados por
los 4 primeros ejes factoriales ( ver cuadro n,° 1).
Una observación superficial de los planos factoriales representados resulta suficiente para apreciar que, tanto las modalidades de las variables muy
particionadas como las que pertenecen a variables poco correlacionadas
con las restantes, se apiñan en torno al origen, formándose todos los ejes
factoriales por la oposición de distintas modalidades de las variables R EG y
C U L.
Un resultado que Ilama la atención, que se había insinuado ya en los AFC
anteriores y en éste se destaca claramente, es que re3 se encuentra, junto
con re 1 y re2, en el extremo negativo del eje 1, en absoluta oposición a
re4. Como quiera que en los datos de la encuesta se suponía que re 1, re2
eran modalidades de riego eventual y re3, re4 de riego permanente, consultamos con los técnicos que habían establecido y realizado la encuesta
sobre el verdadero proceso seguido para clasificar el tipo de riego, obteniendo la siguiente explicación:
AI intentar establecer la dicotomía rieg^o eventual - riego permanente no
obtenían respuestas claras, por lo que decidieron separar lo cierto de lo
dudoso estableciendo 4 categorías:
re1: Es riego eventual con toda seguridad, porque na hay posibilidad de
obtener más agua (procede de arroyo o garganta eventual).
re2: Los cultivos existentes indican riego eventual, pero no hay seguridad
de que no pudiera convertirse en permanente por falta de agua.
re3: Los cultivos establecidos parecen indicar que el riego es permanente.
Por ejemplo, un cultivo que ha dado lugar a esta estimación repetidas
veces es la alfalfa.
re4: Riego permanente seguro, pues se sabe que hay agua suficiente y que
se utiliza.
Sin embarga, en todos nuestros análisis re3 sale mucho más próxirno a
re1 y re2 que a re4. Esto podría indicar que esta modalidad ha sido mal
estimada al efectuar la encuesta. En el caso de la alfalfa, p.ej., los comune-
? 7 ()
E5T ^1I71ST1( .1 E:SP ^tiOL.^
ros interesados en obtener heno para su propio ganado (piariegos) pueden
cultivar alfalfa en riego eventual, aprovechando a1 máximo el agua y obteniendo sólo 2 ó 3 cortes, lo que no seria un cultivo rentable para venta
pero sí les compensa económicamente como autoabastecimiento. Por lo
tanto, en éste y otros caso^ similares, la apreciación de "regadío permanente" Ilevada a cabo de visu sobre los cultivos sería un error del encuestador que aparecería reflejado en nuestros análisis como incongruencia.
Por lo demáis, la interpretacián de las distintas modalidades en los planos
factoriales analizados es muy dificultosa, ya que el cambio de métrica que
hemos introducido Ileva en este caso a un apiñamiento de la mayoría de
ellas, por estar las variables de las que proceden muy poco correlacionadas
o por tener un elevado número de modalidades.
En cambio respecto a los individuos la transformación ha resultado ser
muy eficaz, puesto que se obtienen directamente en todos los planos
factoriales estudiados grupos claramente dispersos y en general alejados
del origen, que coinciden casi exactamente con los que obtenemos al hacer
una clasificación no jerárquica de los individuos expresados en función de
sus coordenadas respecto a los 4 primeros ejes factoriales. Estas representaciones ofrecen un gran contraste con las obtenidas en el AFC de la
matriz inicial, cuyos individuos forman una mancha amplia y difusa en
todos los planos factoriales considerados.
3.4. Clasificación de las Comunidades de Regantes
I) C/asificación no jerárquíca (Bo/as optímí,zadas) sobre /a base de /a
matriz ^^55, ^a^
Partiendo de un radio R=o,S y con un techo de 10 clases el algoritmo
converge para un radio final de 1,814fi 17. Se forman 2 grandes clases: la
primera contiene 488 C.R. de las 551 a clasificar y la segunda las 63
restantes. Ambas tienen un radio de 1,8 y es difícil apreciar características
que las diferencien, pues una partición tan poco fina de individuos tan
numerosos tiene necesariamente como consecuencia la formación de clases muy heterogéneas.
I I ^ C/asificación nv jerárquica (Bolas optimizadas^ sobre /a base de /a
matriz ^' j551,4J
Partiendo del mismo rad'ro inicial R=0,5 y fijando igualmente 10 como
número máximo de clases, el algoritmo converge para un radio máximo de
0,8295779 y obtenemos 8 clases bien diferenciadas que coinciden prácticamente con los grupos que podríamos haber establecido casi de visu
sobre los gráficos del AFC. Verificamos con un pequeño programa basic
EFECTO Y l.1TILIDAD DE LA METRICA EN EL AN.ALISIS DE E^ICUESTA5
Zi I
escrito al efecto qué tienen en común los individuos de cada clase, comprobando así que, con la única excepción de un individuo muy próximo al
origen, se agrupan exclusivamente en función de las modalidades de riego
(REG) y cultivo (CUL ^ .
La clasificación obtenida fue la siguiente:
Clase 1: (R=o,5}. 85 Comunidades de Regantes con re3 y cu 1.
Clase 2: (R=o,5). 135 Comunidades de Regantes con re2 y cu1.
Clase 3:
^ (R=o,8). 214 C. R. con re4 y cu3, excepto e! individuo B42 que
tiene re4 y cu 1.
Clase 4: ( R=0,3 }. 31 C. R. con re 1 y cu 1.
Clase 5: ( R=o,4}. 34 C. R. con re4 y cu4.
Clase 6: ( R=o,2 }. 31 C. R. con re2 y cu2.
Clase 7: ( R=0,2 ). 7 C. R. con re 1 y cu2.
Clase 8: (R=0,2}. 14 C. R. con re3 y cu2.
Las módalidades de las restantes variables no clasifican los individuos, si
bien algunas de ellas predominan en las clases que sería lógico esperar
según su significado agronómico ( p. ej. altitud elevada en las clases 1, 2, 4
Y ^}•
Puesto que la partición coincide exactamente con la que habríamos
obtenido clasificando las C. R. en función del tipo de cultivo y de riego
simultáneamente ( con la única excepción de la Comunidad de Regantes n.°
42 de la provincia de Burgos), corrobora los resultados obtenidos en todos
los demás análisis: es decir, las variables REG y CUL san las rnás correlacionadas_ y las que tienen un mayor significado en la clasificación de las
Comunidédes de Regantes.
Consideramos no obstante que la ponderación aplicada a las variables ha
"penaliza^lo" excesivamente a aquéllas cuyo n.° de madalidades era comparativamente muy elevado. Las variables COM y SUP, que superan en n.°
de modalidades a todas las demás, aparecen claramente relacionadas en el
AFC de la matriz disyuntiva cornpleta sin transformar, si nos atenemos a la
forma casi idéntica de las líneas que unen sus respectivas modalidades. Por
otra parte su coeficiente de Tschuprow es comparativamente elevado y en
todas los dendrogramas que hemos construído se unen a niveles de agregación relativamente bajos. Si bien la transformación efectuada resulta
eficaz en cuanto a la clasificación de las C. R. se refiere, pensamos que las
modalidades deben estudiarse conjuntamente en el AFC de la matriz transformada y en el de la matriz sin transformar, ya que éste último resulta
quizá más aclaratorio y más conforme con la realidad.
Otra cuestión a destacar en los resultados de la clasificación es la siguiente: Puesto que los grupos formados incluyen, naturalmente, la totalidad
,
ESTADISTICA ESPAtiIOLA
de las C. R. de la muestra y aparecen sólo 8 clases teniendo tanto CUL
como R EG 4 modalidades, es evidente que algunas modalidades de riego
no coinciden nunca can otras de cultivo. En efecto, observamos que, según
ios grupos hallados, se dan las siguientes combinaciones posibles: re 1 con
cu 1 y cu2, re2 con cu 1 y cu2, re3 con cu 1 y cu2, re4 con cu3 y cu4.
Esto carrobora la conclusión ya esbozada de que la 3.a modalidad de
riego, supuesto permanente en función de algunos cultivos implantados, es
en realidad eventual. La única modalidad que podemos estimar ciertamente
como permanente es la re4, puesto que se da en las explotaciones dedicadas a huertas Icu4^ y a cultivos intensivos ^cu3i.
Los resultados de la clasificación indican también que no existe ningún
tipo de similitud intraprovincial entre las C. R. de la población encuestada,
pues las distintas clases obtenidas incluyen individuos de todas las provincias.
4,
CONCLUSIONES
EI haber utilizado en este trabajo datos reales y variables cuyo significado
era en cierto modo conocido nos ha permitido valorar la metodología
utilizada.
La ponderación de las matrices de variables indicatrices cuando trabajamos con variables que tienen distinto número de modalidades ha resultado
ser muy eficaz como técnica previa a la clasificación de los individuos y
para identificar las variables más relacionadas entre las que tienen el
mismo número de modalidades. Sin embargo, por lo que respecta a las
variables particionadas en un número elevado de modalidades, parece que
disminuye su impacto en el análisis de manera demasiado drástica. Consideramos por lo tanto necesario praceder a la interpretación simultánea de
los AFC de la matriz disyuntiva completa y de la transformada en lo que
respecta al estudio de las variables y de sus modalidades.
La obtención de una matriz de distancias asociada al T2 de Tschuprow y
la posterior CAH de las variables mediante el criterio de agregación de la
distancia media, parece ser, para este tipo de datos, un proceso muy
orientativo si utilizarnos el ACP sobre la matriz de Tschuprow como ayuda
a la interpretación. A pesar de que la medida de la correlación entre
variables con diferente número de modalidades que nos suministra el coeficiente T2 es claramente pesimista, esta técnica proporciona orientaciones
bastante precisas sobre las relaciones globales entre las variables.
EFEC'TO li" L TILIDAD DE LA METRIC'A Eti EL AtiALISIS DE EtiC'l: ESTAS
273
La eliminación a priori de las modalidades de escasa frecuencia y de los
individuos que las poseen proporciona resultados coincidentes con los del
proceso, mucho más laborioso, de eliminación sucesiva de las modalidades
y/o individuos que absorben un porcentaje de inercia excesiva en los AFC
realizados sucesivamente.
Dichas modalidades e individuos deben estudiarse aparte, pues puede
suceder que, como en el caso que nos ocupa, tengan una serie de características comunes que les hagan constituir un grupo coherente con fines
descriptivos.
AGRADECIMIENTOS
Agradecemos a J. L. Chandon la utilización de su programa "Boules
optimisées", que hemos adaptado del Basic de Hewlett -Packard al del
intérprete de Basic que funciona en el microordenador I BM modelo AT.
THE EFFECT AND EFFICIENCY OF THE METRIC ON THE
SURVEY ANALYSIS
SUMMARY
A scientific method has been proposed in order to analyse the
internal structure of a survey-questionaire.
The principal variation of this method in relation to the known
methods 11), (2) to analyse a survey consists of the introduction
of a specific weighting, previously studied from the theoretical
point of view (13), on the indicative variables matrices asociated
to the qualitative variables supposing they" haven't the same
dimension.
This variation, when applied to data which arises from the
Agricultural sector, leads to useful results and even more if we
combine them with the traditional methods used to survey analysis.
Keywords: Multiple Correspondance Analysis, Vectorial Correlation Coefficient, Hierarchical Cluster Analysis, Disjoint Cluster Analysis, Irrigation Communities.
2^4
ESTADISTICA E^SPA^JOLA
BIBLIOGRAFIA
(1) BENALI, H., ESCOFiER, B. (1987): Stabilité de I'Analyse Factorielle des
Correspondances Multiples en cas de données manquantes et de modalités á faibles effectifs. Rév. Statistique Appliquée. XXXV(1). pp. 41, 52.
{2) DAnnBROIsE, E., EscouFlER, Y., MASSOTE, P. (1987): Application de
I'analyse de donées á I'élaboration de minisondages d'opinion. Rev. de
Statistique A^ ppliquée. pp. 9-23.
(3) ESCOFIER, B. (1979): Une representation des variables dans I'Analyse
des Correspondances Multiples. Rév. Statistique Appliquée, 1979, vol.
XXVII, n.° 4, pp. 37-47.
{4) ESCOUFIER, Y. (1979): Cours d'Analyse des Données. RT 7901.
C.R.I.G. Montpellier.
{5) ESCOUFIER, Y. (1981): L'Analyse des Tableaux de Contingence Simples
et Multiples. Comunicación al Congreso de Roma de Junio de 1981.
{6) FENELON, J. P., LEBART, L., MORINEAU, A. (1985): Tratamiento Estadístico de Datos. Marcombo. Boixareau Editores. Barcelona-México.
(7) FLAMENBAUM, G., THIERY, .1., BENZECRI, .J. P. (1979): Agrégation en
boules de rayon fixe et centres opti m isés. ( Bou les opti misées). R év.
Cahiers Analyse des Données, Vol. IV, pp. 357-364.
(8) FouCART, T. (1982): Analyse Factorielle - Programmation sur microordinateurs. Ed. Masson.
(91 FOUCART, T. 11984): Analyse
Masson.
Factorielle de tableaux multiples. Ed.
(1 C}) GARCIA MOUT(JN, M. E. (1988): Nuevos métodos evaluativos multidimensionales para el tratamiento de las encuestas en el sector agrario.
. Tesis doctoral. Departamento de Matemática Aplicada. ETSI Agrónomos. Universidad POlitécnica de Madrid.
{ 1 1) LEBART, L. 11987): Analyse des correspondances, classification et traitement des Données d'Enquéte. Journées Internationales sur Analyse
Statistique des Grands Tableaux et Données d'Enquéte. Formation et
réflexion autour du logiciel SPAD. Blanes, 6-7-8 Mai.
(12) RALAMBONDRAINY, H. (19861: Problemes d'optimisation rélatifs aux
tableaux multiples du point de vue de la classification automatique.
Rapports de Recherche I N R IA n.° 576. Octobre 1986.
(1 3) SAPORTA, G. (1979): Ponderation optimale de variables qualitatives en
Analyse des Données. Rév. Statistique et Analyse des Données, n.° 3,
1979. pp. 19-31.
27S
EFE('TO 1" l,'TILIDAD DE LA METRICA EN EL AyALISiS DE EN('LEST,^S
(1 4) SAPORTA, G. (197 5): Liaisons entre plusieurs ensembles de variables
et codage de données qualitatives. Thése de Doctorat de 3éme. Cycle.
Univ. Pierre et Marie Curie. Paris VI.
(1 5) VALETTE, N. (1987): Boules optimisées. Ecole Modulad. Méthodes de
classification pour I'Analyse des Données. 18-19-20 Novembre. Strasbourg.
AFC de la matriz disyuntiva completa
AFC de la matriz transformada
I nercia
Va1. propios
I nercia
^6 explicada 9^6 acumulada Val. propios
% explicada 9^6 acurnulada
0.2533
9.46
9.46
0.6550
22.43
22.43
0.21 1 7
7.33
16.79
0.3436
1 1.77
34.20
0.1662
5.75
22.54
0.3423
1 1.72
45.93
0.1595
5.52
28.06
0.31 53
10.80
5 6.5 3
0.1478
5.12
33.18
0.31 1 1
10.66
67.38
Cuadro n.° 1: Valores propios e inercia explicada en los AFC realizados sobre la matriz
disyuntiva completa y sobre la matriz transformada, una vez eliminados los individuos excéntricos.
27b
EST.ADISTIC'A ESPAÑOLA
0
t
t
^^g^^^_
s-^s^,^^
v
J
W W
V^ O
^
I
1
W
¢
d
a^ oc
U
ti*
Ñ ^
i
t
W W
H
W
^
^
^
Q
W
N
W
2
0
O
t
Y9
^
J
O
^
`
*
0
^
R.7 ^
0
W
^
Z
0
^
!
^
^
Z
J
d
^
W
Q
U
s^
H
O
^^^
,^
t
O
Z
4
^
m
O
:i
W
N
^{{[[ N
Q ^
^
O
Q
^r
W
0
^..^^
t
>
u
.^r
bi
^
O
Ci
N ^
O
O
N
^
< <
Q ^
>
W
a
:.1 ^
t
r.^r
F^I
<
^ ^^^
^W^^
zN^ ^°
^
mz ^ ^
^
c
z
Q z
"'^aa
<
Y
<
2
O
Ó
`
Q
d
.^.r
^
^^^
J
^ ^ ^
^ W ^
t
N ^ V
d
^
g
á^^ó_
N
„^.1WCi
W
z
^^^ O
z
z á W s
z
^
2
m
v
O
N
^
ó _
á
_N
^
Q
H
^
^
t
W
^
^
H
g=
W
W
2
W
E
j O ^M ^
í^ 4 w
N ^ - -
oQ
o^
^_
y
g^^^
ó.sgs
^^^
_^^=
<Ñ
4 V V V
V i i ^
C) ^
W
EFEC'TO Y IJTILIDAD DE LA METRICA EN EL ANALISIS DE ENCI`ESTAS
r.
.
.
.•
.rr
..
r.^
.... ^ ..r_..
^
..
.
..
.
r+^r
.
•..
.
r
.
..
.
.
r
r
.
:
:.
r
ir
.
r
.•
•
.
r.
•
r
.
r
.
.
•
•
.
i
r
r
•
r
•
i
•
•
:
r
i
:
:
.
• r r^ r r r r s r r r ^ r r r r r r r r r r^^^ ^ r r r^^ r r ^ r r r r r r r r r r r r r r r r r r r r r r r s r ^
r
r
^
y
W
^^
•
^
^
^
^^
^ `
_..^
\
\^
l^
^
^
^^^
^
_
^
r
^
•
^ •
Y
^^
•
•
•
•
•
^----
r
•
eu
r•_
r^
^..
^
^rr
•
^oF
^
,
^^
\
^
^
.,^^
\^^
,
_
'
s
I^
^^
.
.
•
6
^
^
rF
•
r
r
^
+
r
.
iE.
\
`
^
r
^
.^
^
•
•
.
•
r
•
r
^
•
•
r
r
r
r
^
•
r
r
rrr
r
• r
•
r
•
•
•
r•
•
•r•
rrrrrrrrrr•
r
•
á
U
^f0 W
H
^u1 l9
t
^1 ^
^N ^
U
O
r, Oc
a.
O LL
^k
W
^ ^
U
FO^ J
<
^^
^5^^^ ^ Ñ °^
^
i^ •.^i i 7 i-i-^z o
^
+^ ----T
?^x
ESTADIS^TIC'.A ESPAtiOLA
. _.
. ..
_....._.^......._
.. .
...
. -.
.,
.
. .' •+
^
^
••
._
^v c^
U E
^^^^^
^
^- ^-+ + ^
^ - ^- ^ ^ ;--a
^
^
EFECTO ti I^TE[_ID^D UE L.^ ^IETRIC^ 1^ Er^ E_^
^,y
^\ \LISIS UE E:^c l EST ^ti
N
^1
rl
^
^
i
u
•
r
•
r
r
^
•
r
r
r
r
r
r
•
r
•
♦
r
•
•
•
r
.O
J
u
Y7
7
M
-I
7
M
V7
O
bI
N
^
^
N
O
^
„^
nf
^
u
,r
♦
O
^
,^
^
u
V J
Yy
^
^
O
.
~ r
.
w
A
^
11
V
^
^
.^.
r+rrr
rrrr.^r^rrrrr r
N
h
^
•
^^
^
r rr a Mr M-^• r r.^r r
u ^í •
W
...
..s
.:
- -,^,r. ^.
^. ..
^..
.
^^
,.
r...r rr rr r rr r r r r
rr
rrr, r rr r• rr •rr w.
W
r,
^
^,
^
^_.
-
^%
nJ
V
^
A.
•
4_
U
U
---,
^.
.^.
.
^J
Y^
L^
W
♦
I
r
r
r
r
^^.^ ti^. :
^.
^.--
.a
O
^
^
•
cá
^
43
Q.
^
C
O
U
c^
>
.^
C
^
^
.^
^
N
rC
N
w
F.
w
^^,.^,
^
.^
^^
^^
r`
^^
cl
r.-.^
.cr^Q7
+2-b
LI-7
^
u'f
^
[T
C ^^
^li^
.=an -r
n
w
N
.o
n
r ri
.zo^.-^+.e^.
.-^ n. ^
s
tn
^^
^ /I
m .^
a1J
-T
uL 4T
T ^^1L
- ..^
m
t
(1.^
^
^G
.a
^.^
.L
.a^^.as
^.
l^ 7
s
n^
u^
s^a=
^^ ^
..^r s r . r r . r .. r . r . . . . r^ .
^
^
^.^^ ^,nis^ic ^z ^^sP^^tic^^^
0
^
r
t
In
•
+>^
N
Z
V
•
•
^^
a o
r u
•
^
N
w
^.
^r^
á rs í^ái
^
^
0
rr
II
^
11
N
^
N
ew^
'
á
u
M
^r+
rrlrr!lr ^ + ^^ r+l+ ^ s^r ^ sl^r ^ r^l ^ rr^rr+r^+ ^ r ^^ rre!l++r^ul^^ !rsl^o!!or!!r
♦ u •
o
f ^ ^^<I^
^ _^ a
y
^
i
A
y
^^^.i
r
!
^
•
^
^
^
•
♦
^
nJ!
^
ra
V ^. 1
M
r
V
r
a
^
.
en
O
^
N
^
N
m
m
Descargar