informeA02 14/11/2015 A) ACP con SPAD/ problema 0.2 1 INFORME TÉCNICO Definición de estándares para la fabricación de máscaras antigás del ejército suizo. Objetivo. Se trata de fabricar unos pocos modelos de máscaras antigás de forma que se ajusten lo mejor posible a la mayor parte de los soldados en el ejército suizo. Datos. Sobre una muestra aleatoria de 259 soldados (200 hombres + 59 mujeres), se observan las 6 variables siguientes: MFB = minimal front breadth BAM = breadth of angulus mandibulae TFH = true facial height LGAN = length from glabella to apex nasi LTN = length from tragion to nasion LTG = length from tragion to gnathion +----------------------------------+----------------------+----------------------+ | VARIABLE OBSERVACIONES | MEDIA DESV.TÍPICA| MÍNIMO MÁXIMO | +----------------------------------+----------------------+----------------------+ | MFB frontal minima 259 | 111.94 7.82 | 80.70 130.50 | | BAM mandibula angu 259 | 115.83 5.39 | 100.60 134.60 | | TFH cejas-menton / 259 | 121.24 6.99 | 93.40 139.10 | | LGAN cejas-punta de 259 | 57.34 4.41 | 47.40 74.20 | | LTN cejas-oreja / 259 | 121.45 4.44 | 105.40 134.70 | | LTG menton-oreja / 259 | 136.82 6.82 | 115.70 153.30 | +----------------------------------+----------------------+----------------------+ Las medias de estas 6 variables se mueven en valores similares (entre 112 y 136), salvo LGAN que es menor (media 57). Las desviaciones típicas son del mismo orden y van desde 4.41 hasta 7.82. Los recorridos oscilan entre 3 y 5 centímetros. LGAN presenta con diferencia el mayor coeficiente de variación. Análisis de Componentes Principales sin normar Utilizaremos un ACP para estudiar estos datos. Disponemos de 6 variables cuantitativas x 259 individuos, más una variable categórica (sexo) con dos niveles. Como el objetivo consiste en definir modelos de máscara que se adapten bien a todos los soldados independientemente de su sexo, trataremos todos los individuos conjuntamente sin distinción de sexo y emplearemos esta variable sexo únicamente como ilustrativa. Para conseguir un buen ajuste de las máscaras parece aconsejable respetar la dispersión original de cada variable y de esta forma conceder menor importancia a las variables que presentan menos variabilidad. Realizaremos por tanto un ACP sin normar. No obstante, al ser las varianzas bastante similares, aparecerían pequeñas diferencias entre los resultados de un ACP Normado y uno sin normar. informeA02 14/11/2015 2 Valores propios +----+----------+-------+---------+----------------------------------------------------------------------------------+ | Nº | VALOR | % | % | | | | PROPIO | |ACUMULADO| | +----+----------+-------+---------+----------------------------------------------------------------------------------+ | 1 | 113.9672 | 50.72 | 50.72 | ******************************************************************************** | | 2 | 38.3987 | 17.09 | 67.81 | *************************** | | 3 | 28.0709 | 12.49 | 80.31 | ******************** | | 4 | 21.7623 | 9.69 | 89.99 | **************** | | 5 | 13.3769 | 5.95 | 95.95 | ********** | | 6 | 9.1093 | 4.05 | 100.00 | ******* | +----+----------+-------+---------+----------------------------------------------------------------------------------+ Cabe destacar que el primer eje factorial recoge más de la mitad de la información y el primer plano, el 67,81%. Con el tercer eje alcanzaríamos el 80.31%. Sólo los dos primeros ejes recogen más inercia que si hubieran sido elegidos al azar sin ningún otro criterio. No obstante, y dado que no nos resultará demasiado complicado manejar la información de un tercer factor, podemos no descartarlo de momento, especialmente si resulta tener una interpretación interesante. Correlaciones entre variables: | MFB BAM TFH LGAN LTN LTG -----+-----------------------------------------MFB | 1.00 BAM | 0.32 1.00 TFH | 0.41 0.07 1.00 LGAN | 0.14 0.06 0.43 1.00 LTN | 0.39 0.32 0.37 0.28 1.00 LTG | 0.53 0.29 0.41 0.30 0.64 1.00 -----+------------------------------------------ Las correlaciones entre las 6 variables originales son todas positivas. La más alta aparece entre LTN-LTG (0,64), que son las dos medidas de “profundidad” o “anchura del perfil”. Siguen MFB-LTG (0,53), LGAN-TFH (0,43), MFB-TFH y LTG-TFH (0,41). Las menores son BAM-TFH (0,07), casi incorreladas; MFB-LGAN (0,14). Visualizamos toda esta estructura de correlaciones de una manera global y más rápidamente mediante un gráfico de puntos variable en el plano 1-2 que se obtiene en un ACP Normado, pues las correlaciones entre variables normadas son las mismas que entre las variables originales: informeA02 14/11/2015 3 Interpretación de las CP (componentes principales) ---------------------+------------------------+--------------------+------------------VARIABLES | COORDONNEES |CORR.VARIABLE-FACTOR|ANCIENS AXES UNIT. ---------------------+------------------------+--------------------+------------------IDEN LIBELLE COURT | 1 2 3 | 1 2 3 | 1 2 3 --------------------------+------------------------+--------------------+-------------MFB frontal minima | 6.52 2.54 -3.36 | 0.83 0.33 -0.43 | 0.61 0.41 -0.63 BAM mandibula angu | 2.16 2.73 1.56 | 0.40 0.51 0.29 | 0.20 0.44 0.29 TFH cejas-menton | 4.88 -4.48 -1.08 | 0.70 -0.64 -0.15 | 0.46 -0.72 -0.20 LGAN cejas-punta nar| 1.76 -2.04 1.04 | 0.40 -0.46 0.24 | 0.16 -0.33 0.20 LTN cejas-oreja | 2.97 0.09 1.89 | 0.67 0.02 0.43 | 0.28 0.01 0.36 LTG menton-oreja | 5.58 0.48 2.93 | 0.82 0.07 0.43 | 0.52 0.08 0.55 ---------------------+------------------------+--------------------+------------------- Primer eje: 0.61 MFB + 0.20 BAM + 0.46 TFH + 0.16 LGAN + 0.28 LTN + 0.52 LTG La primera CP presenta correlaciones positivas medio-altas (entre 0.40 y 0.83) con todas las variables originales. Se trata pues de un factor “tamaño de la cabeza” y es la mayor fuente de variabilidad (50%). Valores altos de este primer factor van asociados con valores altos de todas las variables. Esta asociación es algo menos fuerte (0,40) con BAM (ancho de mandíbula) y LGAN (longitud de nariz) Segundo eje: 0.41 MFB + 0.44 BAM - 0.72 TFH - 0.33 LGAN + 0.01 LTN + 0.08 LTG La segunda CP está correlada positivamente con BAM (0,51) y MFB (0,33), que son las dos medidas de la anchura de la cara. Negativamente con TFH (-0,64) y LGAN (-0,46), que son las dos medidas de la altura de la cara. Es por lo tanto un factor “forma de la cara”. Constituye la segunda fuente de variabilidad (18%) y contrapone individuos de cara estrecha a los de cara ancha. informeA02 14/11/2015 4 Reunimos la interpretación de los dos primeros ejes y presentamos las características de las diferentes zonas del primer plano factorial que recoge el 68% de la información: Tercer eje: -0.63 MFB + 0.29 BAM - 0.20 TFH + 0.20 LGAN + 0.36 LTN + 0.55 LTG El tercer factor recoge un 12.5% de información y está pendiente de incluirse si encontramos para él una interpretación clara o interesante. Está correlado positivamente con LTN y LTG (0,43), que son las dos medidas de “profundidad” de la cabeza o “anchura del perfil”. Negativamente con MFB (-0,64) que mide el ancho de frente y en menor medida TFH (-0,15). Contrapone individuos de perfil ancho y frente estrecha a individuos de perfil estrecho y frente ancha. Vistos desde arriba, unos presentan cabeza más estrecha y alargada, mientras que otros tienen cabeza ancha y poco alargada. Podríamos decir por tanto que se trata de un factor de “forma de la vista cenital” o “forma del perímetro craneal” Tres primeros factores Factor Significado 1 Tamaño de la cabeza (tamaño global) 2 Forma de la cara (vista frontal) 3 Forma desde arriba (vista cenital) contrapone pequeña cabeza / grande estrecha-alargada cara / ancha-aplastada Perímetro craneal con forma estrecha-alargada / ancha-corta % % acu. 50.72 50.72 17.09 67.81 12.49 80.31 informeA02 14/11/2015 5 Proyecciones Individuos en los planos 1-2 y 1-3 por sexos, con tamaño proporcional a la c.r. Los puntos llenan de forma bastante suave todo el rango de medidas y no aparecen grupos nítidamente aislados. Curiosamente, aparece un pequeño vacío relativo en la zona central del plano 1-2, lo que significa que no existen individuos con valores medios de tamaño cabeza y de forma de cara simultáneamente. La calidad de la representación en los planos 1-2 y 1-3 es alta para la gran mayoría. Los hombres (en azul) forman una nube más compacta y tienen por lo general cabezas de tamaño mayor que las mujeres (en verde). Ambos grupos se solapan en la zona correspondiente a cabezas de tamaño medio-bajo y forma de cara intermedia. También se entremezclan en una amplia zona con individuos de ambos sexos que informeA02 14/11/2015 6 presentan valores intermedios de la forma del perímetro craneal, mientras que en las formas extremas de esta vista cenital hombres y mujeres se separan completamente: Los perímetros craneales con formas más estrechas y alargadas corresponden todos a hombres con menores cabezas, mientras que en el extremo contrario, las formas cenitales más anchas y cortas corresponden a mujeres de cabeza media-pequeña. Las medias de uno y otro sexo (en rojo) difieren enormemente en tamaño de cabeza, pero sólo en eso; presentan muy pequeñas diferencias tanto en la forma de la cara como en la forma del perímetro craneal. Existen también notables diferencias en cuanto a variabilidad en uno y otro sexo. El grupo de mujeres es mucho más variable que el de hombres en cuanto a forma de cara y también en las proporciones de la vista cenital, resultando especialmente llamativa la gran dispersión de formas de cara que presentan las mujeres con menor tamaño de cabeza: individuos de cabeza muy pequeña y cara muy ancha: 203, 205 individuos de cabeza muy pequeña y cara con forma media: 206, 236 individuos de cabeza muy pequeña y cara muy estrecha: 211 Curiosamente, con las cabezas más grandes no ocurre lo mismo. En el gráfico del plano 1-2 vemos cómo al aumentar el tamaño de la cabeza la forma de cara se va centrando y en el extremo, terminamos por encontrar tres hombres algo aislados del resto (140, 159 y 194) con cara de forma media. Dentro del grupo de hombres, también las cabezas más pequeñas tienen forma de cara intermedia y cráneo alargado, mientras que la mayor dispersión en la forma de cara se observa en tamaños medios de la cabeza. El 010 es un hombre de cabeza mucho menor que todos los demás, pero no originará problemas, pues sus medidas se parecen a las de otras muchas mujeres y ello, si prescindimos de la información de sexo, le hace perder su atipicidad. En situación similar se encuentran otros individuos como 239, 255, 256… que siendo atípicos dentro del grupo de mujeres, no lo son en el total. Los perímetros craneales de forma más ancha corresponden a mujeres con cabeza de tamaño algo menor que la media de las mujeres. Otros elementos que sí pueden ocasionar desajustes son los individuos de cabeza media y formas extremas de cara (96, 133 y 169), pues aparecen bastante separados del grupo. Otro tanto podemos decir de la mujer 201, que es de cara muy ancha. Finalmente, las mujeres 208, 210 y 212 tienen cabeza de tamaño algo menor que la media de las mujeres, pero resultan bastante atípicas, pues presentan las formas del perímetro craneal más estrechas; los hombres 57 y 160 son de cabeza pequeña dentro de los hombres y presentan formas extremadamente anchas de perímetro craneal. informeA02 14/11/2015 7 Elementos atípicos Ya hemos dicho que la nube presenta un aspecto bastante compacto. No obstante, unos pocos elementos, los más distantes del grupo, aparecen algo aislados y sus medidas afectarán sin duda a la calidad de los ajustes de las máscaras. Se trata de los individuos nº 159, 140, 194, 96, 201, 205, 203, 236, 206, 211, 133, 179, 208, 210 y 212. La lista incluye los 7 individuos más atípicos en términos de distancia euclídea: individuo dist02 individuo dist02 203 123,6 210 77,2 212 121,5 140 75,9 211 107,8 236 74,2 205 90,3 243 72,0 159 84,5 213 69,6 208 82,1 194 66,1 206 82,0 230 62,8 216 79,2 254 62,3 235 78,4 207 61,8 214 77,9 242 61,2 Estos individuos suponen del orden de sólo un 5% del total pero al presentar las medidas más atípicas, bastante alejadas de los otros, su inclusión provocará un empeoramiento en la calidad del ajuste de las máscaras para todos los demás (95%). Aconsejamos que se estudie la posibilidad de definir los estándares de máscara prescindiendo de estos individuos atípicos. De esta forma podrá mejorarse sensiblemente el ajuste para el 95% de los usuarios a costa de empeorarlo para este 5% de individuos más atípicos. Nuevo ACP con elementos ilustrativos Realizamos un nuevo ACP sin normar tratando los puntos extremos como ilustrativos. Individuos en los planos 1-2 por sexos, con tamaño proporcional a la c.a. Este 5% de elementos atípicos es responsable en buena medida de la aparición de los ejes (ver el gráfico anterior). Sin embargo, al eliminarlos del análisis el significado de las CP básicamente se mantiene (ver la tabla siguiente) y la variabilidad del grupo disminuye del orden del 15% (la inercia es ahora 190 en lugar de 224). informeA02 14/11/2015 8 --------------------------+------------------------+--------------------+-----------------VARIABLES | COORDONNEES |CORR.VARIABLE-FACTOR|ANCIENS AXES UNIT. --------------------------+------------------------+--------------------+-----------------IDEN LIBELLE COURT | 1 2 3 | 1 2 3 | 1 2 3 --------------------------+------------------------+--------------------+-----------------MFB frontal minima anchu | 6.52 2.54 -3.36 | 0.83 0.33 -0.43 | 0.61 0.41 -0.63 con ilustrativos | 5.87 -1.93 -1.46 | 0.84 -0.28 -0.21 | 0.60 -0.34 -0.31 BAM mandibula angulo anc | 2.16 2.73 1.56 | 0.40 0.51 0.29 | 0.20 0.44 0.29 con ilustrativos | 1.92 -2.49 -2.53 | 0.38 -0.49 -0.50 | 0.20 -0.44 -0.54 TFH cejas-menton / altur | 4.88 -4.48 -1.08 | 0.70 -0.64 -0.15 | 0.46 -0.72 -0.20 con ilustrativos | 4.07 4.29 -1.54 | 0.65 0.69 -0.25 | 0.42 0.77 -0.33 LGAN cejas-punta de nariz | 1.76 -2.04 1.04 | 0.40 -0.46 0.24 | 0.16 -0.33 0.20 con ilustrativos | 1.78 1.62 -0.14 | 0.42 0.38 -0.03 | 0.18 0.29 -0.03 LTN cejas-oreja / anchu | 2.97 0.09 1.89 | 0.67 0.02 0.43 | 0.28 0.01 0.36 con ilustrativos | 2.64 -0.38 1.10 | 0.65 -0.09 0.27 | 0.27 -0.07 0.24 LTG menton-oreja / anchu | 5.58 0.48 2.93 | 0.82 0.07 0.43 | 0.52 0.08 0.55 con ilustrativos | 5.47 -0.60 3.11 | 0.84 -0.09 0.48 | 0.56 -0.11 0.67 --------------------------+------------------------+--------------------+------------------ Nuevos coeficientes y correlaciones comparados con los valores anteriores. En la tabla siguiente comparamos las medias y desviaciones típicas del grupo completo con sus valores cuando se eliminan los elementos atípicos. Apenas cambian las medias (salvo MFB) y todas las varianzas disminuyen +----------------------------------+----------------------+----------------------+ | VARIABLE OBSERVACIONES | MEDIA DESV.TÍPICA| MÍNIMO MÁXIMO | +----------------------------------+----------------------+----------------------+ | MFB frontal minima 259 | 111.94 7.82 | 80.70 130.50 | | 241 | 115.87 5.05 | 100.60 127.80 | | BAM mandibula angu 259 | 115.83 5.39 | 100.60 134.60 | | 241 | 115.87 5.05 | 100.60 127.80 | | TFH cejas-menton 259 | 121.24 6.99 | 93.40 139.10 | | 241 | 121.66 6.26 | 103.30 139.10 | | LGAN cejas-punta de 259 | 57.34 4.41 | 47.40 74.20 | | 241 | 57.32 4.25 | 47.40 74.20 | | LTN cejas-oreja 259 | 121.45 4.44 | 105.40 134.70 | | 241 | 121.50 4.04 | 111.50 133.10 | | LTG menton-oreja 259 | 136.82 6.82 | 115.70 153.30 | | 241 | 136.95 6.52 | 115.70 152.60 | +----------------------------------+----------------------+----------------------+ Efecto en las medias y desviaciones típicas Individuos en los planos 1-2 por sexos, con tamaño proporcional a la c.a. Los individuos ilustrativos aparecen con su identificador. El gráfico es muy similar al del primer ACP (con todos los individuos activos) informeA02 A) ACP con SPAD/ problema 0.2 14/11/2015 9 INFORME FINAL Definición de estándares para la fabricación de máscaras antigás del ejército suizo. Objetivo. Se trata de fabricar unos pocos modelos de máscaras antigás de forma que se ajusten lo mejor posible a la mayor parte de los soldados en el ejército suizo. Datos. Sobre una muestra aleatoria de 259 soldados (200 hombres + 59 mujeres), se observan las 6 variables siguientes: MFB = minimal front breadth BAM = breadth of angulus mandibulae TFH = true facial height LGAN = length from glabella to apex nasi LTN = length from tragion to nasion LTG = length from tragion to gnathion Grupos No aparecen agrupaciones de individuos diferenciadas. Las observaciones llenan de forma bastante suave todo el rango de medidas y no aparecen agrupaciones de individuos diferenciadas nítidamente unas de otras. Hombres y mujeres Los hombres difieren de las mujeres en el tamaño de la cabeza pero no en las formas y proporciones. Las mujeres presentan mayor variabilidad de formas, tanto de la cara como del perfil craneal. Variabilidad de tamaños y formas La mayor fuente de variabilidad (50%) es el tamaño de la cabeza, que contrapone la existencia de individuos con todas las medidas de la cabeza más grandes con otros con todas las medidas más pequeñas. La segunda fuente de variación (17%) es la forma de la cara, que contrapone individuos con caras alargadas (más altas y estrechas) a otros de cara aplastada (más baja y ancha). La tercera fuente (13%) es la forma del perímetro craneal o forma de la cabeza vista desde arriba. Contrapone formas más alargadas longitudinalmente a formas más alargadas transversalmente. Curiosamente, las formas más extremas se presentan en los individuos de cabeza más pequeña, mientras que los de mayor cabeza tienen formas intermedias. Entre los individuos con cabeza más pequeña (mujeres) aparecen las proporciones de cara más extremas (las caras más alargadas y las más aplastadas) y las formas de perímetro craneal más anchas. Apenas existen individuos con valores medios de tamaño cabeza y de forma de cara simultáneamente. Elementos atípicos No existen elementos extraordinariamente atípicos, pero sí que aparecen unos cuantos individuos que presentan conjuntos de medidas medianamente extrañas. Este grupo supone del orden de un 5% del total pero su presencia provocará sin duda un empeoramiento en la calidad del ajuste de las máscaras para todos los demás (95%). Aconsejamos que se sondee la posibilidad de definir los estándares de máscara prescindiendo de estos individuos atípicos. De esta forma podrá mejorarse sensiblemente el ajuste para el 95% de los usuarios a costa de empeorarlo para este 5% de individuos más atípicos. Se trata de los individuos nº 159, 140, 194, 96, 201, 205, 203, 236, 206, 211, 133, 179, 208, 210 y 212, aunque podríamos incluir alguno menos o más.