ESTADISTICA ESPAÑOLA Vol. 31, Núm. 121, 1 989, págs. 2 53 a 280 Efecto y utilidad de la métrica en el análisis de encuestas por M.a ENRIQUETA GARCIA MOUTON Doctor I ngeniero Agrónomo. Escuela Técnica Superior de Ingenieros Agrónomos de Madrid. Departamento de Maternática Aplicada a !a Ingeniería Agronórn^ca. Ciudad Universitaria. Madrid Y FRANCISCO JAVIER DIAZ-LLANOS Y SAI NZ-CALLEJA Doctor I ngeniero Agrónomo. Instituto nacional de Investigaciones Agrarias. Sección de Proceso de Datos. Madrid RESUMEN Se propone un método cientifíco para analizar la estructura interna de una encuesta. La principal variación de este método con respecto a los conocidos (1 }, (2} para el análisis de encuestas es la introducción de una ponderación concreta, ya estudiada desde el punto de vista teórico (1 3}, de las matrices de variables indicadoras asociadas a las variables cualitativas en el supuesto de que no tengan las mismas dímensiones. EI efecto de esta variación sobre datos provenientes del sector agrario conduce a resultados de utilidad y aúr7 má5 si s^e utilizan conjuntamente los métodos tradicionales para el análísis de encuestas. Palabras clave: A nálisis Factorial áe Correspondencias Múltiples (AFCM), Coeficiente de correlación vectorial (RV), Clasificación .4scendente jerárquica (CAH), Clasificación no jerárquica (Bolas optimizadas), Comunídades de Regantes (CR). Clasificación A MS.^ 6 2 H^2 5. ? 54 1. ESTADISTIC',A ESP.Atinl_A INTRODUCCION Y OBJETIVOS EI objetivo de este trabajo se articula para su mayor simplicidad en dos partes, la primera de las cuales expone una metodología para el análisis de encuestas, mientras que en la segunda se aplica esta metodología a una encuesta proveniente del sector agrario. EI proceso metodológico que se ha seguido se esquematiza en el organigrama de la figura 1. Dicho proceso consta de una serie de fases fundamentales que son las siguientes: I. Estudio preliminar de la encuesta: 1 ^ Construcción y depuración de la matriz de datos ( matriz X disyuntiva completa ^ . 2j Cálculo de las distancias entre los perfiles de las modalidades y entre los perfiles de los individuos. 31 Agrupación de modalidades si las distancias obtenidas indican que es procedente. 4) Representacián de las variables cualitativas en los círculos de correlación, mediante un ACP sobre la matriz de Tschuprow. 5) Obtención de una matriz de distancias entre variables para proceder a la Clasificación Ascendente Jerárquica de las variables cualitativas. 6) Primeras conclusiones sobre las variables cualitativas en función de los resultados de los dos procesos anteriores. II. AFCM usual y modificado y clasificación de los individuos: 1) AFC sobre la matriz disyuntiva completa. 2) Eliminación de las modalidades poco frecuentes. AFC de la matriz obtenida. 3y Transformación de la matriz disyuntiva completa mediante la ponderacián cuyo efecto se pretende estudiar. AFC de la matriz transformada. 4) Clasificación no jer^irquica de los individuos en función de sus coordenadas obtenidas sobre los ejes factoriales: a) en el AFC de la matriz disyuntiva completa. b) en el AFC de la matriz transformada. A continuación pasamos a exponer más detalladamente algunas de estas fases, y en particular lo que concierne a la ponderación del AFC, ponderación optimal que ha sido estudiada a nivel teórico É13f. En lo que respecta a la aplicación, estudiaremos si ia estrategia de cambio de métrica contenida en la parte metodológica conduce a resultados satisfactorios a nivel de interpretación de la encuesta. EI estudio com- EFECTO Y UTILIDAD DE LA METRICA EN E^ ANALISIS DE ENCI,'ESTAS ZSS parativo de los resultados obtenidos en las distintas fases nos permitirá evaluar la metodología en cuestión, además de Ilegar a resultados concretos sobre los datos de la encuesta real procesada (1). 2. MATERIAL Y METODOS 2.1. Datos de partida Los datos que hemos utilizado proceden de encuestas de campo realizadas por la Comunidad Autónoma de Castilla-León en las Comunidades de Regantes de sus 9 provincias. Son datos reales, cuyas variabies (cuantitativas, cualitativas ordinales y cualitativas nominales) se han definido teniendo en cuenta el tipo de problemática que se desea estructurar. En cuanto a las variables cuantitativas se han transformado en cualitativas ordinales primando el criterio agronómico sobre el estadistico. Antes de la creación de la matri2 de datos definitiva, los programas de depuración han eliminado las modalidades que no han sido elegidas por ningún individuo, así como las variables que, como consecuencia de lo anterior, sólo constaban de una modalidad. Las variables retenidas finalmente son las siguientes: 1. a. va^íab/e: PR O Variable cualitativa nominal que indica el origen de la formación de la Comunidad de Regantes. Puede adoptar dos modalidades: pr1 (promoción privada ^ , pr2 (promoción estatal). 2. a. variab/e: COM Variable cuantitativa: número de comuneros asociados en cada Comunidad de Regantes. Codificada en 8 rnodalidades: co 1(hasta 10 comuneros), co2 (de 1 1 a 30), co3 (de 31 a 50), co4 (de 51 a 100), co5 (de 101 a 300), co6 (de 301 a 500), co7 (de 501 a 1000), co8 (más de 1000 camuneros). 3. a. variab/e: SUP Variable cuantitativa que mide el número de Has. regables para las que legalmente se tiene la concesión según la Comisaría de Aguas. Se ha codificado en 8 modalidades que, igual que en la anterior, responden a la diversidad de su significado agronómico: su 1(hasta 10 Has.), su2 (de 1 1 a 25), su3 (de 26 a 50), su4(de 51 a 100), su5 (de 101 a 300), su6 (de 301 a 500), su7 (de 501 a 1000), su8 (más de 1000 Has.) { 11 Para procesar la encuesta se han utilizado programas de (8) y(91, con algunas modificaciones y programas añadidos. F^STAUISTIC',4 ^SF'A^IOL.^^ 4, a. variab/e: CMJ Variable cualitativa nominal que valora la conveniencia de realizar mejoras en la infraestructura de los regadíos y su posible repercusión en la rentabilidad de las mismos. Codificada en 5 modalidades: cm 1(buena posibilidad de uso si se Ilevan a cabo), cm2 (regulares posibilidades), cm3 (aunque se realicen rnejoras en la infraestructura es difícil que el regadío se reactive), cm4 (no necesita mejoras), cm 5(las obras de mejora están ya en ejecucián en el momento de reali2ar 1a encuesta). 5. a. variab/e: A GR ^ Variable cualitativa ordinal que mide la suficiencia del caudal concedido a juicio del agricultor. Desglosada inicialmente en 3 modalidades: ag 1(caudal insuficiente), ag2 (caudal suficientel, ag3 (caudal sobrante), hubo que eliminar la 3.a. modalidad, que, por no ser seleccionada en ningún caso por los agricultores, daba lugar a una columna de ceros en la matriz disyuntiva completa. 6, a. variab/e: TEC Variable cualitativa ordinal que valora la suficiencia del caudal concedido a juicio del técnico. Particionada en 3 modalidades: te 1(insuficiente), te2 (suficientel, te3 {sobrante). 7, a. variab/e: REG Variable cualitativa nominal, cuya división en modalidades, poco nítida en función de los datos disponibles, se respeta en principio debido a las distancias entre sus perfiles en I. re 1= riego eventual por tomar agua de un cauce discontinuo. re2 = riego estimado eventual en función de los cultivos implantados. re3 = riego estimado permanente en función de los cultivos implantados. re4 = permanente por tomar agua de un cauce continuo. S. a. variab/e: CUL Variable cualitativa nominal: tipo de cultivo predominante en la Comunidad de Regantes considerada. Desglosada en 4 modalidades: cu 1(prados y pastizales), cu2 (cultivos extensivos}, cu3 (cultivos intensivos), cu4 (cultivos de huerta). 9. a. variab/e: A L T Variable cualitativa ordinal que clasifica el tipo de agricultura posible según la altitud existente, codificada en 4 modalidades: al 1= agricultura de meseta baja ( menos de 600 m.), al2 = de meseta media (de 601 a 800 m.), al3 = de meseta alta (de 801 a 1000 m.}, al4 = de alta rnontaña (más de 1000 rn.). EFEC'TO Y l1TILIDAD DE LA METRICA EN EL A^(ALISIS DE ENCI,ESTAS ?S7 10.a. variab/e: EXP Variable cualitativa ordinal que clasifica los tipos de explotaciones predominantes entre las existentes en cada Com. de Regantes, en función de su tamaño, en 4 modalidades: ex 1= huertos familiares (menor de 0,5 Ha.), ex2 = pequeños agricultores {de 0,5 a 5 Has.), ex3 = medianos agricultores (de 5 a 15 Has.), ex4 = grandes agricultores lmayor de 1 5 Has.). 2.2. Creación de la matriz de datos y análisis previos al AFC Partimos de una tabla numérica que almacena el número de la respuesta elegida para cada pregunta por las 607 Comunidades de Regantes lindividuos encuestados). Dicha tabla carece de significado estadístico por lo que, a partir de ella y tras un primer proceso de depuración, vamos a construir la rnatriz disyuntiva completa a la que posteriormente aplicaremos los métodos adecuados de Análisis de Datos. Puesto que las distintas preguntas sólo admiten respuestas rnutuamente excluyentes, son asimilables a variables cualitativas con modalidades disjuntas. Por tanto, cada una de dichas variables induce una partición del conjunto de los individuos encuestados en función de la modalidad de respuesta elegida. Si Ilamamos I={ 1, 2, ... i, ... n} al conjunto de los individuos, Q={ 1, 2, ... q, .. . c } al conjunto de las variables, Jq al conjunto finito de las modalidades de la variable q-ésima, tendremos una serie de aplicaciones q: I --^ J q representadas por las matrices de variables indicadoras U^ asociadas a cada variable cualitativa. Q i variable 1 variable 2 J, J2 JQ J^ 1 2... p, 1 2... p2 1 2... pq 1 2... p^ Xik 1 Xik2 Xikq .... variable q ... variable c 1 2 . 1 Xikc_ . • Í% I ^ =..^ 1^ -'^ r- U, ^ _^^^ =^.r U2 .... _....^- -.,^.^ lJq ... - -^^-- 1,^^ 258 ESTADISTICA E5PAÑOLA La yuxtaposición de dichas matrices da lugar a la tabla anterior, matriz disyuntiva completa, X=1U, ^ U^ ^... ^ U^1 en la que: x;kQ - 1 ^ EI individuo i ha elegido la modalidad k de la variable q-ésima. x;kQ = 0^. Dicha modalidad ha sido rechatada. Desde el punto de vista numérico, consideraremos una tabla IxJ =[x;^] J 1 2 3 ..........j..........p I 1 2 x;^ n con X =[x;^], 1< i< n, 1< j<^ card JQ, siendo el subíndice q . ^ ^ = k + ^ card J Q . 4= ^ Esta matriz es una tabla de números positivos para la que pueden generalizarse inmediatamente todos los tratamientos estadísticos aplicables a los cuadros de contingencia. Sus filas siguen representando el conjunto de los individuos, y las columnas representan el conjunto de las modalidades: J= U [JQ ^ q E Q], con card J=^ card JQ = p. 4 Cada fila o individuo de la rnatriz constará de p elementos x;^ que valdrfin 1 si la modalidad j ha sido elegida y 0 si ha sido rechazada. A continuación verificamos que las distancias entre los perfiles en I de las modalidades no justifican agrupar distintas modaiidades de la misma variable y pasamos a calcular la matriz T2 de Tschuprow. EI análisis de datos sobre operadores: coeficiente RV y matriz de Tschuprow EI coeficiente RV es un coeficiente de correlacián vectorial entre operadores asociados a tablas de datos, que mide por tanto la proximidad entre dos estudios. EFECTO Y UTILlDAD DE LA METRICA EN EL ANALIStS DE ENCUESTAS ZS9 Un estudio estadístico esté caracterizado por el triplete {X,, Q,, D) donde: X, es una matriz p x n: observaciones de p variables sobre n individuos, centradas respecto a los pesos que constituyen la diagonal de D. Q, es una matriz p x p simétrica definida positiva. Esta rnatriz permite el cálculo de las distancias entre individuos. D es una matriz diagonal n x n que contiene los pesos asociados a los n individuos del estudio. V, = X, D X; es la matriz de varianzas - covarianzas de las p variables. W, = X; Q, X, es la matriz de productos escalares entre individuos. EI operador W, D= X; Q, X, D caracteriza un estudio. Sea G el conjunto de los operadores D-simétricos, subespacio del espacio de los endomorfismos lL ( F, F). Entonces A^ G ssi A= W D con W matriz simétrica. La forma bilineal simétrica ^r definida sobre G por ^r : G x G ^. R / yr (A,B) = Tr (A.B), es decir, la traza del producto de composición, es real y positiva y constituye por tanto un producto escalar en G. Por analogía con el vocabulario estadístico usual (2), se denominan: Covarianza vectorial: covV {A,B) = Tr (A.g1 Varianza vectorial: varV IA) = Tr 1A)2 Correlación vectorial: RV (A,B) _ Tr ( A. B ) ^ ^ Tr (A)2 • Tr ( B )2 Para todo par de estudios IX,, Q,, D) y(X2, Q2, D) se verifica: 1.° 0< RV {W, D, W2 D) < 1. 2.° RV (W, D, W2 D) = 1 ssi 3 k^ R+ / W, D= k.W2 D, es decir, cuando las variables engendran productos escalares proporcionales sobre los individuos. 3.° RV (W, D, W2 D) = 0 ssi S,2 = X; D X2 = 0, es decir, cuando los dos conjuntos de variables son mutuamente ortogonales. (2) Para una explicación más detallada, véase (41, (5) y(101. ?^O ESTADISTI('A ESPA!VOLA Cansideremos ahora la matriz disyuntiva completa X=(U, ^ U2 ^... ^ U^} Sean: Ut= (I„ - 1„1 ñ D1 U; : matriz de variables indicatrices centrada. D= ^ I es la matriz diagonal de orden n que contiene los pesos n asociádos a los n individuos del estudio. m; = número de modalidades de la i-ésima variable cualitativa. P= tabla de contingencia que cruza las modalidades de una variable I con las de una variable J, cuyos elementos son p(i,j}. D, = UTD U;, matriz diagonal de orden m; cuyos elementos son los pesos marginales de las filas de P, p;+. D^ = U; D U;, matriz . diagonal de orden rn^ cuyos elementos son los pesos marginales de las columnas de P, p+^. Asociamos a las variables cualitativas i y j los tripletes estadísticos: ( U;^, D;' , D} l U; , D^' , D} y a cada uno de ellos las operadores W^D=U^D^' U^D. W*D=U*D;'U;^D Si calculamosTr(W;^.W;'D} = Tr(U*D;' U;^D U^ D^' U^D} _ mi m U;^1 =^ ^ U*D^' = Tr(D^' ^ i ^ U^D i i U^D ^- ^ ^= ^ . ^P (^, j } -pi+ ' p+i^ p;+ ' p+i y, en particular Tr(W;*D}2 = Tr(Im^} - Tr(1 m ^ 1 m; D} = m; -1. Por tanto en nuestro caso: „D _ RV (W,^- W, ) ^ * Tr (W; D. W; D) ti'Tr(W*D)^ ti Tr(W^ D)2 _ ^? , , ti'm;-1 ^(m^ = T?^, ^que se conoce en la literatura estadística con el nombre de coeficiente T2 de Tschuprow. Puesto que la forma biiineal Tr(W*D.W! D) constituye un producto escalar en el subespacio de los operadores D-simétricos, podemos definir una EFEC'TO Y U7CILIDAD DE LA METRICA EN EL ANALISIS DE ENCt^ESTAS 261 distancia euclidiana entre dichos operadores como: d2(W*D, W; D) = y^(W;'D - W; D, W;'D - W; D) = Tr(W;'D - W; D)2 = Tr(W*D)^ + + Tr(W;`D)2 - 2 Tr(W;`D. W^ D) = m; -1 + m^ -1 - 2 ^? = m; + m^ - 21 ^i^ + 1 ^ Esta distancia, cuya fórmula es la misrna que aparece en Saporta (14j, tiene el inconveniente de que al no tener en cuenta fa posible desigualdad entre el número de modalidades de las distintas variables, el término m; + m^ puede ser en ocasiones rnuy grande frente al resto, dándonos como resultado grandes distancias para variables que pueden estar muy relacionadas simp^emente por tener ambas un número elevado de modalidades definidas. Para evitar esto normamos !os operadores y consideramos como producto escalar el de los operadores normados, siendo II W;`D (I = 1^^ Tr (W*D12 , II W; ^ II =`^ Tr (W; p}^ y la distancia euclidiana asociada: d^ ^ * *'D IIW;DII ,- ^ w'D * IIW;oII (1 -T?-) ,, ,, ^ = 1 +1 -2T?^=2 [1 ^ A partir de esta distancia construimos un dendrograma mediante el criterio de agregación de la distancia media. La interpretación conjunta de los resultados obtenidos en esta clasificacián jerárquica y en el ACP sobre la matriz de Tschuprow nos permite obtener una idea de las relaciones globales entre variables previa a la realizacián del AFC. Observamos que la utilización del coeficiente T2 de Tschuprow como medida de la correlacián entre variables cualitativas conduce a resultados muy pesimístas, particularmente cuando se trata de dos variables con número de modalidades muy diferentes, ya que 0 < T? < inf(m;-_1, m^- 1 l ^ (m;- 1) (m;- 1) sólo puede Ilegar a ser igual a 1 para m; = m^ (m; = número de modalidades de la variable i-ésima}. Sin embargo nos permite definir la distancia [1 ], que sólo depende del coseno entre los operadores asociados a las variables cualitativas y nos proporciona una CAH completamente coherente con lo que cabría esperar de la naturaleza agronómica de las variables consideradas. 262 ESTADISTICA E5PA^ULA 2.3. AFC de fa matriz disyuntiva completa (AFCM) Una vez estudiadas las relaciones globales entre variables, pasamos a efectuar e1 AFC sobre la matriz X=(U, ^ U2 ^....( U,o). En la primera pasada de este sistema aparecen una serie de modalidades e individuos que se separan mucho de los restantes, ya que absorben una inercia relativa desorbitada. Producen por tanto un "efecto piña" sobre el resto de los elementos, distorsionando el estudio. Este problema tiene carácter general en este tipo de trabajos: si no se ha planteado un cuestionario equilibrado, evitando definir modalídades de respuesta que pueden suponerse poco frecuentes, tendrernos que estudiar aiguna forma de equilibrarlo a posteriori. Separamos estas modalidades y los índividuos que las poseen del resto del estudio, eliminando aqueilas modalidades cuya frecueneia (efectivo) es menor del 2,5 % respecto a su variable, mediante un método adaptado del que figura en 11) para cuadros de contingencia. A continuación repetimos todos los procesos anteriores sobre esta matriz depurada, obteniendo los resultados que se discutirán en el apartado siguiente. 2.4. AFC sobre la base de la matriz disyuntiva completa transformada Dado que las matrices de variables indicadoras que tratamos en esta encuesta mixta (variables cuantitativas, variables cualitativas ordinales, variables cualitativas nominales) tíenen dimensiones distintas, cabe esperar que aquéllas cuyas dimensiones sean mayores tengan una mayor influencia en el análisis. Para estudiar esta cuestión procedemos a efectuar un AFC de la matriz X'=1U;^U2^....^U^) ______-donde U; _^3; . U; con ^; = L; /^ m; - 1 L; = componente i-ésima del autovector asociado al mayor autovalor procedente de la diagonalización de la matriz de Tschuprow. m; = n.° de modalidades de la i-ésima variable. Esta ponderación de las matrices de variables indicadoras es optimal respecto a la suma de los cuadrados de los autovalores (10} y vamos a intentar comprobar su efecto en datos de tipo agronómico, tanto sobre los resultados de^ AFC como en los de la posterior clasíficación de los individuos. EFEt'TO 1^' l'TILID:^D DE l_A titETRlt.^ Eti EL :^^i:^LISIS [^E^: Eti('[_ EST ^^S ?b^ En principio perseguimos al aplicarla una doble finalidad: disminuir el excesivo impacto de las variables con número de_ modalidades comparativamente elevado mediante el coeficiente 1/^ m,-1. el coeficiente L; será menor para las variables con menor T2;^, luego las variables menos correlacionadas quedarán prácticamente eli^minadas del an^ilisis. En efecto, Y. Escoufier (5) define el AFCM como el ACP del triplete (D^,' XT Dñ', D`, D„), que corresponderia al siguiente esquema de dualidad: ^ Ejes principales: vectores propios de V D^- Cofactores principales: vectores propios de D„ W D^ -^ XT p^ ^ F* E = Rp -- °^ 11^ W ! R n-F E* D;,'X D^-' Vectores principales: vectores propios de D^- V Componentes principales: vectores propios de W D„ siendo: p = ^m; ; m; = n.° de modalidades de la variable i-ésima. c= n. ° de variables cualitativas. D^-=n. es la matriz d^agonal formada por las sumas de cada columna de X(efectivo de cada modalidad). D„ = c.l„ = c.n. D es la matriz diagonal cuyos elementos son las sumas de cada fila de X, todas ellas iguales al n.° de variables cualitativas. V= D^. ' X T D;,' X D^' W= D ñ' X D;' X T D;,' E:STAD[STlCA E:SP.AtiiUL.A Por tanto, el operador W D„ asociado a este estudio será: W D„ _( D ñ' X D^' ). D^.( D^' X T D;,' ) D" = D;,' ^( p^' X T= É U, D^'UT=^ ^ U^D^'UTD=^ ^ A^ ^ , , c ^_ , , , c ^^ ^, n . c ;- ^ donde A; es el proyector sobre el subespacio de R" engendrado por las indicadoras de la i-ésima variable cualitativa considerada. Si el rango de W D" es r, obtendremos la representación de los individuas calculando las r primeras componentes principales, que serán proporcianales a los vectares propios de la su ma de los proyectores A;. Por tanto, el AFCM de !a matriz X=(U, ^ U2 ^.... ^ U^ ^ es equivalente a la diagonalización del operador ^ A;. ; Cuando efectuamos sobre la matriz X la ponderación descrita, el AFC que realizamos sobre la matriz transformada equivale a un ACP sobre el triplete ( D^' X^' DÑ', D^, DN) y, Ilamando U; _^3; U; y S =^^; , las nuevas métricas definidas son: DN = S. I" - S.n. D f3, D , D^-n . ^2 D 2 ^^ D ^ _ EI operador de cuya diagonalización obtenemos las nuevas componentes principales será: W DN =(D^' X' D^' ). D^. .(D^' X'T DN') . DN = = D- ^ X• D- r X•r = ^ E^ U D-' UTD = ^ ^ A. N ^ ^ F'^ ^ ^ ^ ^ N^ ^ S S La representación que obtendremos ahora no será ya proporcional a la suma de los proyectores A; sino a una combinación lineal de los mismos cuyos coeficientes serán precisamente los ^^; que ponderan las matrices U; de variables indicadoras asociadas a cada variable cualitativa. EFEC'TO Y l,'TILID,AD DE l.,A METRIC^A E^I EL ,Ay,ALISIS DE Etit`l'EST:AS ^f^S La diagonalización de este operador ^^, A, será pues equivalente al AFC de (^3, U, ^/32 U2 ^. .. ^^3^ U^). AI efectuarlo maximizamos c L; ^ ;=1 A; 2 • con la restr^cc^on ^ L;2 = 1, lo que equivale a optimizar el AFC de (Q, U, ^... ^^3^ U^) con la restricción ^ ( m; - 1) J^2- 1. Así pues, teóricamente, esto debería conducirnos a una representación de los individuos que sería función casi exclusivamente de las variables más relacionadas, con independencia del número de modalidades de cada una de ellas. 2.5. Utilización conjunta del Análisis Factorial (AFCM) y de la clasificación no jerárquica ( Bolas optirnizadas) para la formacibn de grupos En las dos estrategias que mostramos en el cuadro adjunto observamos el mismo orden de prioridad en cuanto concierne a estos dos métodos de Análisis de Datos Multidimensionales que, aunque pertenecientes a dos métodos de análisis distintos, están íntimamente relacionados entre sí (12). ESTRATEG IAS AFC sobre la matriz X(AFCM) ^ Clasificación no jerárquica (Bolas optimizadas) sobre la base de la matriz ^J551, 4J AFC sobre la matriz X' (AFCM^) 1 Clasificación no jerárquica ( Bolas optimizadas) sobre la base de la matriz^'J551, 4J (3) En ambas estrategias utilizamos como radio inicial una fracción del de la nube de puntos (7),(1 5) y para acotar el número de clases nos guiamos por los grupos que parecen tender a formarse en los gráficos del AFC en el segundo caso. ^3) ^f551,aJ es la matri2 de coordenadas de las C. R. sobre los 4 primeros ejes factoriales. ^bb ESTA[^lSTlt';> E:SP^tiOLR 3. RESULTAD4S OBTENID(JS Y DISCUSION DE LOS MISMOS . 3.1. Representación de las variabfes en los círculos de correlacián: De la matriz de Tschuprow obtenida a partir de la primera matriz disyuntiva comp^eta (607 CR y 10 variables que totalizan 44 modalidades) y teniendo en cuenta que los coeficientes de Tschuprow son siempre bajos en una población grande y en nuestro caso el problema se agrava por el desigual número de modalidades, destacamos los siguientes valores: T;, 8= 0.325 IREG-CUL) T2 3= 0.167 ( COM-SUP) T^ 9- 0.1 1 1(CUL-ALT) T; 3= 0.103 (PRO-SUP) A la vista de la inercia explicada por los valores propios obtenidos retenemos ios cuatro primeros, efectuando las proyecciones correspondientes en los p^anos 1-2, 1-3, 1-4, 2-3, 2-4, y 3-4. En las distintas proyecciones aparecen próximas entre si y bastante lejos del origen ios siguientes puntos-variables: CUL-REG (tipo de cultivo y de riego), COM-SUP y en algunas COM-SUP-PRO Ín.° de comuneros, n.° de Has. regables, promoción), AG R-TEC (opinión respectivamente del agricultor y del técnico sabre la suficiencia del caudal concedido). Después de eliminar las modalidades de baja frecuencia, lo que supone la desaparición de las Cornunidades de promoción estatal, rnejoras en curso, mayores tamaños de COM, SUP y EXP, y 1a formación de una matriz de 551 CR por 9 variables con 35 modalidades, obtenemos una nueva matriz T^ de Tschuprow de la que podemos destacar los siguientes coeficientes: T^ ,,= 0.332 (REG-CUL), T; 2= 0.109 (COM-SUP}, T; 8= 0.100 IALT-CUL) IVuevamente retenemos los 4 primeros valores propios y proyectamos en los planos correspondientes. Aparecen interpretables en las distintas pr©yecciones las proximidades entre REG-CUL, COM-SUP, AGR-TEC. A continuación calculamos las matrices de distancias asociadas a ambas, obteniendo los dendrogramas de las fig. 2 y 3 mediante el criterio de agregación de la distancia media. EF^F:C'TO l' l'TI1✓ I[)A[) DE L.A METRIC'A Eti EL Ati,AI_ISIS f^f: Eti('t;f ST.^S ?f^^ De la consideración simultánea de ambos procesos Iproyección en los círculos de correlación y CAH} podemos deducir las siguientes conclusiones provisionales: Las variables R EG y C U L son las más correlacionadas y la relación es más estrecha en la 2a. matriz de datos. Las variables COM y SUP están también bastante relacionadas, lo que indicaría que el tamaño de la parcela media cultivada sería bastante constante. La altitud está también bastante relacionada con el tipo de cultivo y de riego, aunque la correlación es baja para lo que cabría esperar de una planificación racional de los cultivos. l.a opinión sobre la cantidad de agua disponible del agricultor tiene una cierta relación con la del técnico, si bien es en general más pesimista. La conveniencia de realizar mejoras en la infraestructura de los regadíos parece haberse estimado en primer lugar en función de las características socioeconómicas de la explotación y del menor coste por Ha. (priaritarias en C. R. de promoción estatal, fincas grandes, gran n.° de comuneros} y en el resto de las explotaciones (2a. matriz} en función de las características agrociimáticas de las C. R. que potenciarían su rentabilidad. Este resultado, que se puede intuir a partir de los dendrogramas de las figuras 2 y 3, se confirma posteriormente en los AFC. 3.2. AFC de la matriz disyuntiva completa X(607 x 44) Efectuamos un AFC de la rnatriz inicial (607 C. R. por 44 rnodaiidades procedentes de 10 variables}, reteniendo para el análisis los 4 primeros ejes factoriales que absorben una inercia del 2^4,79 %. Proyectamos en los ptanos factoriales 1-2, 1-3, 1-4, 2-3, 2-4 y 3-4 en gráficos separados y a escala relativa las modalidades y las Comunidades de Regantes. EI estudio de los gráficos y los listados obtenidos en este AFC y en otros dos en los que se han eliminado sucesivamente las C. R. can perfiles más excéntricos, y la ejecución del programa que detecta modalidades de baja frecuencia nos proporcionan idéntica conclusión: Hay una serie de C. R. atípicas que poseen simultáneamente varias modalidades poco frecuentes, y en general relacionadas entre sí, que son las siguientes: pr2, cm5, su7, su8, co7, co8, ex3 y ex4. Es decir, se trata de C. R. cuyas características, poco frecuentes en el conjunto de la población encuestada, son las siguientes: la Comunidad de Regantes es de promoción estatal, las obras de mejora de la infraestructura ?óK t-^^r;^t^tsric^;1 t^^Pt^^c^t,.^ se estaban Ilevando ya a cabo en el momento de realizar la encuesta, la superficie regable es muy grande (501-1000 Ha. o más de 1000 Ha.), lo mísmo ocurre con el n.° de comuneros (501-1000 o más de 1000) y las explotaciones predominantes en cada Comunidad son grandes (ex3) o muy grandes (ex4i. Separamos estas C. R. del resto del estudio por dos motivos: 1.°) Porque, dada la excentricidad de sus perfiles, perturban gravemente la estabilidad del AFC. 2.°) Porque el estudio de sus coordenadas iniciales en Rp nos confirma que se trata de un grupo coherente y bien definido y no será por tanto necesario clasificarlas junto con las de promoción privada, sobre las que trabajaremos a continuación. Generamos pues automáticarnente 1a matriz correspondiente a las 551 C. R. y a las 35 modalidades restantes y procedemos a su estudio. 3.3. AFC sobre la rnatriz disyuntiva completa X(551 x 35^ Retenemos para el análisis los 4 primeras ejes factoriales (ver cuadro n.° 1). Del estudio simultáneo de los planos formados por cada dos ejes retenidos podemos destacar las siguientes conclusiones: Las modalidades de las^ariables REG y CUL, que miden respectivamente intensídades de riego y de cultivo, se ordenan en sentido creciente a lo iargo del eje 1. De manera parecida se ordenan las modalidades de !a variable ALT pero en sentido decreciente, lo que indica que fa correlación de esta variable con las dos anteriores es negativa. Si bien las modalidades de las tres variables antedichas no son completamente independientes del resto de los ejes, algunas de ellas contribuyen muy fuertemente a la formación del eje 1, lo que nos permite interpretario como un eje de características agroc/imáticas. EI eje factorial 2 resume claramente un carácter de tamaño, puesto que a lo largo de éi (con la sola excepción de coó que precede a co5) se ordenan en sentido creciente las modalidades de las variables que categorizan el n.° de comuneros de cada C.R. (COM), el de Has. regables concedidas (SUP) y el tamaño de las explotaciones individuales (EXP). Para el eje factorial 3 no hemos podido encontrar ningún carácter general subyacente con significado agronómico. EI eje factorial 4 está formado por !a oposición de dos modalidades de C MJ : c m 3 ( aunque se realicen mejoras en la infraestructura es dífícil que el regadív se reactive ^ y cm4 (el regadío no necesita mejoras en la infraestructura). Del lado de la 1.a se encuentran ag 1 y te 1(agua insuficiente según el EFEC'TO ^' !.:'TILID.^D DE: L.A !^tETRICA E^ El_ .^^ti->LISIS DE E:ti( ! E-S^T ^ti ^Óy agricultor y el técnico respectivamente) y del de la 2.a ag2-te2 (agua suficiente según ambos). Podríamos por tanto interpretarlo como un eje de opinión sobre el regadío. También se aprecian en todos los planos factoriales proximidades entre modalidades de distintas variables con una clara interpretación agronómica. A continuación ponderamos las matrices de variables indicatrices de la 2.a matriz de datos con los coeficientes ^3; y realizamos un AFC sobre ta matriz así obtenida, estudiando los resultados en los planos formados por los 4 primeros ejes factoriales ( ver cuadro n,° 1). Una observación superficial de los planos factoriales representados resulta suficiente para apreciar que, tanto las modalidades de las variables muy particionadas como las que pertenecen a variables poco correlacionadas con las restantes, se apiñan en torno al origen, formándose todos los ejes factoriales por la oposición de distintas modalidades de las variables R EG y C U L. Un resultado que Ilama la atención, que se había insinuado ya en los AFC anteriores y en éste se destaca claramente, es que re3 se encuentra, junto con re 1 y re2, en el extremo negativo del eje 1, en absoluta oposición a re4. Como quiera que en los datos de la encuesta se suponía que re 1, re2 eran modalidades de riego eventual y re3, re4 de riego permanente, consultamos con los técnicos que habían establecido y realizado la encuesta sobre el verdadero proceso seguido para clasificar el tipo de riego, obteniendo la siguiente explicación: AI intentar establecer la dicotomía rieg^o eventual - riego permanente no obtenían respuestas claras, por lo que decidieron separar lo cierto de lo dudoso estableciendo 4 categorías: re1: Es riego eventual con toda seguridad, porque na hay posibilidad de obtener más agua (procede de arroyo o garganta eventual). re2: Los cultivos existentes indican riego eventual, pero no hay seguridad de que no pudiera convertirse en permanente por falta de agua. re3: Los cultivos establecidos parecen indicar que el riego es permanente. Por ejemplo, un cultivo que ha dado lugar a esta estimación repetidas veces es la alfalfa. re4: Riego permanente seguro, pues se sabe que hay agua suficiente y que se utiliza. Sin embarga, en todos nuestros análisis re3 sale mucho más próxirno a re1 y re2 que a re4. Esto podría indicar que esta modalidad ha sido mal estimada al efectuar la encuesta. En el caso de la alfalfa, p.ej., los comune- ? 7 () E5T ^1I71ST1( .1 E:SP ^tiOL.^ ros interesados en obtener heno para su propio ganado (piariegos) pueden cultivar alfalfa en riego eventual, aprovechando a1 máximo el agua y obteniendo sólo 2 ó 3 cortes, lo que no seria un cultivo rentable para venta pero sí les compensa económicamente como autoabastecimiento. Por lo tanto, en éste y otros caso^ similares, la apreciación de "regadío permanente" Ilevada a cabo de visu sobre los cultivos sería un error del encuestador que aparecería reflejado en nuestros análisis como incongruencia. Por lo demáis, la interpretacián de las distintas modalidades en los planos factoriales analizados es muy dificultosa, ya que el cambio de métrica que hemos introducido Ileva en este caso a un apiñamiento de la mayoría de ellas, por estar las variables de las que proceden muy poco correlacionadas o por tener un elevado número de modalidades. En cambio respecto a los individuos la transformación ha resultado ser muy eficaz, puesto que se obtienen directamente en todos los planos factoriales estudiados grupos claramente dispersos y en general alejados del origen, que coinciden casi exactamente con los que obtenemos al hacer una clasificación no jerárquica de los individuos expresados en función de sus coordenadas respecto a los 4 primeros ejes factoriales. Estas representaciones ofrecen un gran contraste con las obtenidas en el AFC de la matriz inicial, cuyos individuos forman una mancha amplia y difusa en todos los planos factoriales considerados. 3.4. Clasificación de las Comunidades de Regantes I) C/asificación no jerárquíca (Bo/as optímí,zadas) sobre /a base de /a matriz ^^55, ^a^ Partiendo de un radio R=o,S y con un techo de 10 clases el algoritmo converge para un radio final de 1,814fi 17. Se forman 2 grandes clases: la primera contiene 488 C.R. de las 551 a clasificar y la segunda las 63 restantes. Ambas tienen un radio de 1,8 y es difícil apreciar características que las diferencien, pues una partición tan poco fina de individuos tan numerosos tiene necesariamente como consecuencia la formación de clases muy heterogéneas. I I ^ C/asificación nv jerárquica (Bolas optimizadas^ sobre /a base de /a matriz ^' j551,4J Partiendo del mismo rad'ro inicial R=0,5 y fijando igualmente 10 como número máximo de clases, el algoritmo converge para un radio máximo de 0,8295779 y obtenemos 8 clases bien diferenciadas que coinciden prácticamente con los grupos que podríamos haber establecido casi de visu sobre los gráficos del AFC. Verificamos con un pequeño programa basic EFECTO Y l.1TILIDAD DE LA METRICA EN EL AN.ALISIS DE E^ICUESTA5 Zi I escrito al efecto qué tienen en común los individuos de cada clase, comprobando así que, con la única excepción de un individuo muy próximo al origen, se agrupan exclusivamente en función de las modalidades de riego (REG) y cultivo (CUL ^ . La clasificación obtenida fue la siguiente: Clase 1: (R=o,5}. 85 Comunidades de Regantes con re3 y cu 1. Clase 2: (R=o,5). 135 Comunidades de Regantes con re2 y cu1. Clase 3: ^ (R=o,8). 214 C. R. con re4 y cu3, excepto e! individuo B42 que tiene re4 y cu 1. Clase 4: ( R=0,3 }. 31 C. R. con re 1 y cu 1. Clase 5: ( R=o,4}. 34 C. R. con re4 y cu4. Clase 6: ( R=o,2 }. 31 C. R. con re2 y cu2. Clase 7: ( R=0,2 ). 7 C. R. con re 1 y cu2. Clase 8: (R=0,2}. 14 C. R. con re3 y cu2. Las módalidades de las restantes variables no clasifican los individuos, si bien algunas de ellas predominan en las clases que sería lógico esperar según su significado agronómico ( p. ej. altitud elevada en las clases 1, 2, 4 Y ^}• Puesto que la partición coincide exactamente con la que habríamos obtenido clasificando las C. R. en función del tipo de cultivo y de riego simultáneamente ( con la única excepción de la Comunidad de Regantes n.° 42 de la provincia de Burgos), corrobora los resultados obtenidos en todos los demás análisis: es decir, las variables REG y CUL san las rnás correlacionadas_ y las que tienen un mayor significado en la clasificación de las Comunidédes de Regantes. Consideramos no obstante que la ponderación aplicada a las variables ha "penaliza^lo" excesivamente a aquéllas cuyo n.° de madalidades era comparativamente muy elevado. Las variables COM y SUP, que superan en n.° de modalidades a todas las demás, aparecen claramente relacionadas en el AFC de la matriz disyuntiva cornpleta sin transformar, si nos atenemos a la forma casi idéntica de las líneas que unen sus respectivas modalidades. Por otra parte su coeficiente de Tschuprow es comparativamente elevado y en todas los dendrogramas que hemos construído se unen a niveles de agregación relativamente bajos. Si bien la transformación efectuada resulta eficaz en cuanto a la clasificación de las C. R. se refiere, pensamos que las modalidades deben estudiarse conjuntamente en el AFC de la matriz transformada y en el de la matriz sin transformar, ya que éste último resulta quizá más aclaratorio y más conforme con la realidad. Otra cuestión a destacar en los resultados de la clasificación es la siguiente: Puesto que los grupos formados incluyen, naturalmente, la totalidad , ESTADISTICA ESPAtiIOLA de las C. R. de la muestra y aparecen sólo 8 clases teniendo tanto CUL como R EG 4 modalidades, es evidente que algunas modalidades de riego no coinciden nunca can otras de cultivo. En efecto, observamos que, según ios grupos hallados, se dan las siguientes combinaciones posibles: re 1 con cu 1 y cu2, re2 con cu 1 y cu2, re3 con cu 1 y cu2, re4 con cu3 y cu4. Esto carrobora la conclusión ya esbozada de que la 3.a modalidad de riego, supuesto permanente en función de algunos cultivos implantados, es en realidad eventual. La única modalidad que podemos estimar ciertamente como permanente es la re4, puesto que se da en las explotaciones dedicadas a huertas Icu4^ y a cultivos intensivos ^cu3i. Los resultados de la clasificación indican también que no existe ningún tipo de similitud intraprovincial entre las C. R. de la población encuestada, pues las distintas clases obtenidas incluyen individuos de todas las provincias. 4, CONCLUSIONES EI haber utilizado en este trabajo datos reales y variables cuyo significado era en cierto modo conocido nos ha permitido valorar la metodología utilizada. La ponderación de las matrices de variables indicatrices cuando trabajamos con variables que tienen distinto número de modalidades ha resultado ser muy eficaz como técnica previa a la clasificación de los individuos y para identificar las variables más relacionadas entre las que tienen el mismo número de modalidades. Sin embargo, por lo que respecta a las variables particionadas en un número elevado de modalidades, parece que disminuye su impacto en el análisis de manera demasiado drástica. Consideramos por lo tanto necesario praceder a la interpretación simultánea de los AFC de la matriz disyuntiva completa y de la transformada en lo que respecta al estudio de las variables y de sus modalidades. La obtención de una matriz de distancias asociada al T2 de Tschuprow y la posterior CAH de las variables mediante el criterio de agregación de la distancia media, parece ser, para este tipo de datos, un proceso muy orientativo si utilizarnos el ACP sobre la matriz de Tschuprow como ayuda a la interpretación. A pesar de que la medida de la correlación entre variables con diferente número de modalidades que nos suministra el coeficiente T2 es claramente pesimista, esta técnica proporciona orientaciones bastante precisas sobre las relaciones globales entre las variables. EFEC'TO li" L TILIDAD DE LA METRIC'A Eti EL AtiALISIS DE EtiC'l: ESTAS 273 La eliminación a priori de las modalidades de escasa frecuencia y de los individuos que las poseen proporciona resultados coincidentes con los del proceso, mucho más laborioso, de eliminación sucesiva de las modalidades y/o individuos que absorben un porcentaje de inercia excesiva en los AFC realizados sucesivamente. Dichas modalidades e individuos deben estudiarse aparte, pues puede suceder que, como en el caso que nos ocupa, tengan una serie de características comunes que les hagan constituir un grupo coherente con fines descriptivos. AGRADECIMIENTOS Agradecemos a J. L. Chandon la utilización de su programa "Boules optimisées", que hemos adaptado del Basic de Hewlett -Packard al del intérprete de Basic que funciona en el microordenador I BM modelo AT. THE EFFECT AND EFFICIENCY OF THE METRIC ON THE SURVEY ANALYSIS SUMMARY A scientific method has been proposed in order to analyse the internal structure of a survey-questionaire. The principal variation of this method in relation to the known methods 11), (2) to analyse a survey consists of the introduction of a specific weighting, previously studied from the theoretical point of view (13), on the indicative variables matrices asociated to the qualitative variables supposing they" haven't the same dimension. This variation, when applied to data which arises from the Agricultural sector, leads to useful results and even more if we combine them with the traditional methods used to survey analysis. Keywords: Multiple Correspondance Analysis, Vectorial Correlation Coefficient, Hierarchical Cluster Analysis, Disjoint Cluster Analysis, Irrigation Communities. 2^4 ESTADISTICA E^SPA^JOLA BIBLIOGRAFIA (1) BENALI, H., ESCOFiER, B. (1987): Stabilité de I'Analyse Factorielle des Correspondances Multiples en cas de données manquantes et de modalités á faibles effectifs. Rév. Statistique Appliquée. XXXV(1). pp. 41, 52. {2) DAnnBROIsE, E., EscouFlER, Y., MASSOTE, P. (1987): Application de I'analyse de donées á I'élaboration de minisondages d'opinion. Rev. de Statistique A^ ppliquée. pp. 9-23. (3) ESCOFIER, B. (1979): Une representation des variables dans I'Analyse des Correspondances Multiples. Rév. Statistique Appliquée, 1979, vol. XXVII, n.° 4, pp. 37-47. {4) ESCOUFIER, Y. (1979): Cours d'Analyse des Données. RT 7901. C.R.I.G. Montpellier. {5) ESCOUFIER, Y. (1981): L'Analyse des Tableaux de Contingence Simples et Multiples. Comunicación al Congreso de Roma de Junio de 1981. {6) FENELON, J. P., LEBART, L., MORINEAU, A. (1985): Tratamiento Estadístico de Datos. Marcombo. Boixareau Editores. Barcelona-México. (7) FLAMENBAUM, G., THIERY, .1., BENZECRI, .J. P. (1979): Agrégation en boules de rayon fixe et centres opti m isés. ( Bou les opti misées). R év. Cahiers Analyse des Données, Vol. IV, pp. 357-364. (8) FouCART, T. (1982): Analyse Factorielle - Programmation sur microordinateurs. Ed. Masson. (91 FOUCART, T. 11984): Analyse Masson. Factorielle de tableaux multiples. Ed. (1 C}) GARCIA MOUT(JN, M. E. (1988): Nuevos métodos evaluativos multidimensionales para el tratamiento de las encuestas en el sector agrario. . Tesis doctoral. Departamento de Matemática Aplicada. ETSI Agrónomos. Universidad POlitécnica de Madrid. { 1 1) LEBART, L. 11987): Analyse des correspondances, classification et traitement des Données d'Enquéte. Journées Internationales sur Analyse Statistique des Grands Tableaux et Données d'Enquéte. Formation et réflexion autour du logiciel SPAD. Blanes, 6-7-8 Mai. (12) RALAMBONDRAINY, H. (19861: Problemes d'optimisation rélatifs aux tableaux multiples du point de vue de la classification automatique. Rapports de Recherche I N R IA n.° 576. Octobre 1986. (1 3) SAPORTA, G. (1979): Ponderation optimale de variables qualitatives en Analyse des Données. Rév. Statistique et Analyse des Données, n.° 3, 1979. pp. 19-31. 27S EFE('TO 1" l,'TILIDAD DE LA METRICA EN EL AyALISiS DE EN('LEST,^S (1 4) SAPORTA, G. (197 5): Liaisons entre plusieurs ensembles de variables et codage de données qualitatives. Thése de Doctorat de 3éme. Cycle. Univ. Pierre et Marie Curie. Paris VI. (1 5) VALETTE, N. (1987): Boules optimisées. Ecole Modulad. Méthodes de classification pour I'Analyse des Données. 18-19-20 Novembre. Strasbourg. AFC de la matriz disyuntiva completa AFC de la matriz transformada I nercia Va1. propios I nercia ^6 explicada 9^6 acumulada Val. propios % explicada 9^6 acurnulada 0.2533 9.46 9.46 0.6550 22.43 22.43 0.21 1 7 7.33 16.79 0.3436 1 1.77 34.20 0.1662 5.75 22.54 0.3423 1 1.72 45.93 0.1595 5.52 28.06 0.31 53 10.80 5 6.5 3 0.1478 5.12 33.18 0.31 1 1 10.66 67.38 Cuadro n.° 1: Valores propios e inercia explicada en los AFC realizados sobre la matriz disyuntiva completa y sobre la matriz transformada, una vez eliminados los individuos excéntricos. 27b EST.ADISTIC'A ESPAÑOLA 0 t t ^^g^^^_ s-^s^,^^ v J W W V^ O ^ I 1 W ¢ d a^ oc U ti* Ñ ^ i t W W H W ^ ^ ^ Q W N W 2 0 O t Y9 ^ J O ^ ` * 0 ^ R.7 ^ 0 W ^ Z 0 ^ ! ^ ^ Z J d ^ W Q U s^ H O ^^^ ,^ t O Z 4 ^ m O :i W N ^{{[[ N Q ^ ^ O Q ^r W 0 ^..^^ t > u .^r bi ^ O Ci N ^ O O N ^ < < Q ^ > W a :.1 ^ t r.^r F^I < ^ ^^^ ^W^^ zN^ ^° ^ mz ^ ^ ^ c z Q z "'^aa < Y < 2 O Ó ` Q d .^.r ^ ^^^ J ^ ^ ^ ^ W ^ t N ^ V d ^ g á^^ó_ N „^.1WCi W z ^^^ O z z á W s z ^ 2 m v O N ^ ó _ á _N ^ Q H ^ ^ t W ^ ^ H g= W W 2 W E j O ^M ^ í^ 4 w N ^ - - oQ o^ ^_ y g^^^ ó.sgs ^^^ _^^= <Ñ 4 V V V V i i ^ C) ^ W EFEC'TO Y IJTILIDAD DE LA METRICA EN EL ANALISIS DE ENCI`ESTAS r. . . .• .rr .. r.^ .... ^ ..r_.. ^ .. . .. . r+^r . •.. . r . .. . . r r . : :. r ir . r .• • . r. • r . r . . • • . i r r • r • i • • : r i : : . • r r^ r r r r s r r r ^ r r r r r r r r r r^^^ ^ r r r^^ r r ^ r r r r r r r r r r r r r r r r r r r r r r r s r ^ r r ^ y W ^^ • ^ ^ ^ ^^ ^ ` _..^ \ \^ l^ ^ ^ ^^^ ^ _ ^ r ^ • ^ • Y ^^ • • • • • ^---- r • eu r•_ r^ ^.. ^ ^rr • ^oF ^ , ^^ \ ^ ^ .,^^ \^^ , _ ' s I^ ^^ . . • 6 ^ ^ rF • r r ^ + r . iE. \ ` ^ r ^ .^ ^ • • . • r • r ^ • • r r r r ^ • r r rrr r • r • r • • • r• • •r• rrrrrrrrrr• r • á U ^f0 W H ^u1 l9 t ^1 ^ ^N ^ U O r, Oc a. O LL ^k W ^ ^ U FO^ J < ^^ ^5^^^ ^ Ñ °^ ^ i^ •.^i i 7 i-i-^z o ^ +^ ----T ?^x ESTADIS^TIC'.A ESPAtiOLA . _. . .. _....._.^......._ .. . ... . -. ., . . .' •+ ^ ^ •• ._ ^v c^ U E ^^^^^ ^ ^- ^-+ + ^ ^ - ^- ^ ^ ;--a ^ ^ EFECTO ti I^TE[_ID^D UE L.^ ^IETRIC^ 1^ Er^ E_^ ^,y ^\ \LISIS UE E:^c l EST ^ti N ^1 rl ^ ^ i u • r • r r ^ • r r r r r r • r • ♦ r • • • r .O J u Y7 7 M -I 7 M V7 O bI N ^ ^ N O ^ „^ nf ^ u ,r ♦ O ^ ,^ ^ u V J Yy ^ ^ O . ~ r . w A ^ 11 V ^ ^ .^. r+rrr rrrr.^r^rrrrr r N h ^ • ^^ ^ r rr a Mr M-^• r r.^r r u ^í • W ... ..s .: - -,^,r. ^. ^. .. ^.. . ^^ ,. r...r rr rr r rr r r r r rr rrr, r rr r• rr •rr w. W r, ^ ^, ^ ^_. - ^% nJ V ^ A. • 4_ U U ---, ^. .^. . ^J Y^ L^ W ♦ I r r r r ^^.^ ti^. : ^. ^.-- .a O ^ ^ • cá ^ 43 Q. ^ C O U c^ > .^ C ^ ^ .^ ^ N rC N w F. w ^^,.^, ^ .^ ^^ ^^ r` ^^ cl r.-.^ .cr^Q7 +2-b LI-7 ^ u'f ^ [T C ^^ ^li^ .=an -r n w N .o n r ri .zo^.-^+.e^. .-^ n. ^ s tn ^^ ^ /I m .^ a1J -T uL 4T T ^^1L - ..^ m t (1.^ ^ ^G .a ^.^ .L .a^^.as ^. l^ 7 s n^ u^ s^a= ^^ ^ ..^r s r . r r . r .. r . r . . . . r^ . ^ ^ ^.^^ ^,nis^ic ^z ^^sP^^tic^^^ 0 ^ r t In • +>^ N Z V • • ^^ a o r u • ^ N w ^. ^r^ á rs í^ái ^ ^ 0 rr II ^ 11 N ^ N ew^ ' á u M ^r+ rrlrr!lr ^ + ^^ r+l+ ^ s^r ^ sl^r ^ r^l ^ rr^rr+r^+ ^ r ^^ rre!l++r^ul^^ !rsl^o!!or!!r ♦ u • o f ^ ^^<I^ ^ _^ a y ^ i A y ^^^.i r ! ^ • ^ ^ ^ • ♦ ^ nJ! ^ ra V ^. 1 M r V r a ^ . en O ^ N ^ N m m