Temas actuales en Etología La Medición de la Repetibilidad y el Error de Medida J.C. Senar Museu de Zoologia, Ap. Correus 593, 08080 Barcelona jcsenar@intercom.es Imaginemos a un macho de Pavo real desplegando su espectacular cola ante una hembra. Imaginemos que estamos estudiando cuales son las características que ha de presentar un macho para aumentar sus posibilidades de ser escogido por la hembra. Nuestra hipótesis es que los ocelos de la cola pueden ser un factor clave. En este estudio, como en cualquier otro, hemos de 1 medir diferentes variables , por ejemplo, contar el número de ocelos, medir su anchura y longitud, o el grado de saturación de su color. Cuando medimos una variable generalmente consideramos que lo hacemos con exactitud. Desgraciadamente, esto no es siempre así. Es difícil que nos equivoquemos al contar el número de ocelos, especialmente si lo hacemos sobre una foto. Sin embargo, al medir una longitud o las variables relacionadas con el color de un objeto, las posibilidades de error son ya mayores, especialmente cuando el grado de precisión en la medición del objeto depende de la experiencia del investigador. Conocer cual es el error de medida que cometemos, y por tanto, lo replicables que son nuestras medidas es de suma importancia; en primer lugar para saber si las mediciones obtenidas describen con facilidad la variable que estamos tomando; una de las condiciones imprescindibles de todo estudio es que sea repetible, y que si cualquier otro investigador realiza las mismas mediciones obtenga los mismos resultados. En segundo lugar, si queremos analizar qué diferencias existen entre individuos o entre sexos en una determinada variable, el error de medida debe ser más pequeño que la diferencia que queremos detectar. Medición de la Repetibilidad y el Error de Medida J.C. Senar Si machos y hembras difieren por ejemplo en unos tres milímetros en relación a la longitud de su cola, y el error que cometemos es en promedio de unos cinco milímetros, evidentemente nunca podremos detectar que los dos sexos difieren en el tamaño de la cola. Este problema ha sido especialmente discutido en estudios de asimetría fluctuante, en los que el grado de asimetría (e.g, en la longitud de los dos extremos de la cola) es muchas veces menor que el error de medida 16 . Repetibilidad V.S. Error de medida La repetibilidad (también conocida como coeficiente de correlación 27,33 intraclase ) es una medida estadística de la consistencia entre medidas repetidas de un mismo carácter en un mismo individuo. Generalmente se la denomina como ri y su valor se expresa como una proporción. Un valor de repetibilidad de uno indica que la medida es perfectamente consistente y repetible, y que el investigador no comete ningún error en la medición de ese carácter. Un valor de cero indica que las medidas repetidas obtenidas de ese carácter son tan distintas como si se hubieran tomado a partir de individuos 9 distintos tomados al azar . El Error de Medida (EM) se define como la proporción de variación fenotípica de un carácter atribuible al error que se pueda cometer en su medición. De hecho, este valor es el inverso que el de la repetibilidad. Medición de la Repetibilidad Para valorar el grado de repetibilidad de una determinada medición, el investigador debe medir el mismo carácter, en el mismo individuo, al menos dos veces. La segunda medición, evidentemente, debe realizarse sin recordar ni comprobar cual era el valor obtenido en la primera medición. Un buen método puede ser medir una primera vez a I0-20 individuos, marcarlos individualmente, colocarlos en una jaula o bolsa, y volverlos a medir extrayéndolos al azar, apuntando los nuevos valores de medición en otra hoja distinta. Temas actuales en Etología Cuadro 1. Ejemplo ilustrativo de como se debe calcular la repetibilidad y el error de medida de un carácter. El ejemplo se ilustra con datos sobre la variación en el tamaño del babero negro del Lúgano (Carduelis spinus) obtenidos a partir de pieles de Museo. El Lúgano utiliza ese babero como señal de estatus de dominancia: cuanto mayor es el babero, más dominante es ese individuo, y más lo evitan sus compañeros 25. Como puede observarse, este carácter es muy variable, de 0 a más de 70 mm z, lo que aumenta la repetibilidad del carácter. Medición de la Repetibilidad y el Error de Medida J.C. Senar Los distintos valores se introducen luego en una base de datos que conste de dos columnas: una donde aparezca cada individuo tantas veces como sea medido y otra donde aparezcan las medidas tomadas para cada uno de los individuos. En el caso más simple (y aconsejado), cada individuo aparecerá dos veces, con sus dos medidas (Cuadro 1). A continuación se realiza un Análisis de la Varianza de un solo factor (ANOVA), en el que el factor analizado es el individuo (la columna con los identificadores individuales). La repetibilidad se calcula a partir de los valores obtenidos en esa ANOVA (Cuadro 1). Si el número de medidas por individuo ha sido dos, la repetibilidad equivale a calcular: donde E es la varianza entre individuos y D la varianza dentro de los individuos. Para mayor claridad, ver el Cuadro 1. Si se toman más de dos medidas por individuo, o el número de medidas tomadas varia según individuos, consultar el trabajo de Harper 9. El Error de Medida (EM), como ya se ha comentado, es el inverso del valor de repetibilidad. En el Cuadro I se resume como puede computarse este valor. La forma de computar los límites de confianza de las medidas de 11 repetibilidad pueden consultarse en Krebs , Una aproximación no paramétrica para el análisis de la repetibilidad puede consultarse en Rothery 24 y en Harper 9. ¿Cuándo un valor de repetibilidad es satisfactorio? Se considera que un carácter que presenta un valor de ri mayor de 0,70 puede considerarse como repetible 9, aunque para poder tomar ese carácter como verdaderamente fiable deberíamos obtener repetibilidades mayores de 0,90 9,15,17. La experiencia del investigador aumenta el grado de repetibilidad de sus medidas. Mientras esta experiencia no llega, una buena forma de aumentar la repetibilidad es realizar varias mediciones del mismo carácter y considerar su media o mediana 32 Temas actuales en Etología . En algunos casos, sin embargo, existen algunas medidas muy poco repetibles, incluso aunque el investigador sea muy experimentado. Ello puede suceder por ejemplo al medir una mancha de color en el plumaje de un ave, debido a que la superficie de la mancha es irregular y además puede variar considerablemente según la posición de las plumas y lo "peinado" que esté el animal. La anchura de la corbata negra que el Carbonero común Parus major presenta en su pecho, medida por algunos investigadores en su punto de 8 máxima anchura, presenta repetibilidades de tan solo 0,66 . En este caso y otros similares esta claro que hemos de buscar otra forma más exacta de medir la mancha, como puede ser la anchura en su punto mínimo (ri= 0,91) o la superficie total de la mancha (ri= 0,98) a partir de fotografías digitales y su 8 posterior análisis en el ordenador . Factores que afectan a la repetibilidad Los valores de repetibilidad de los distintos caracteres pueden ser muy variables (tabla l). Los principales factores implicados en esta variabilidad son: 1). La facilidad en tomar la medida, 2). El tamaño del carácter, 3). El rango de variación de la medida, y 4). El grado de precisión del utillaje utilizado. Hay caracteres que son más fáciles de medir que otros. Por ejemplo, la presión ejercida al medir la longitud del ala de un ave puede hacer variar el resultado de este valor, es por ello que se aconseja que en lugar de la longitud del ala se mida la longitud de la primaria más larga, que proporciona una mayor fiabilidad 10,14 . La longitud del pico se puede medir desde la punta hasta el cráneo o hasta 31 el borde dista¡ de la narina , El agujero de la narina es muy fácil de acotar, mientras que encontrar donde termina el pico y empieza el cráneo es más difícil; como consecuencia de ello, el error de medida al medir el pico hasta el cráneo es mucho mayor que si se mide hasta la narina 4. El color amarillo que presenta el Verdecillo Serinus serinus en el pecho es mucho más homogéneo que el que aparece en el obispillo, zona en la que aparecen muchas listas de color pardo. Como consecuencia de ello, la repetibilidad del grado de saturación del amarillo 7 en el pecho es mucho mayor que si esta se mide en el obispillo . Medición de la Repetibilidad y el Error de Medida J.C. Senar El tamaño de un carácter es otro de los factores importantes que afectan al valor de repetibilidad. Cuanto mayor es el carácter a medir, menor será su error de medida, simplemente porque para un mismo valor absoluto de error, el error será proporcionalmente mayor en medidas pequeñas que en las grandes. La longitud de la cola del Verdecillo es de unos 48 mm, y pese a que el error medio en su medición es de 0,42 mm., el error de medida es del 13% 26. En cambio, la cola de la Golondrina, con una longitud media en los machos de 107 mm., tiene un 0% de error de medida 18 (Tabla I ). Ello quiere decir que cuando midamos animales pequeños la repetibilidad de nuestras medidas será menor que cuando midamos animales grandes. Otro factor importante es el rango de variación de la medida. Las medidas poco variables conllevan mayores errores de medida que las muy variables: un error de 1 mm en una medida que varia entre 25 y 27 mm es mucho más importante que el mismo error en otra medida que varíe entre 10 y 50 mm. Si queremos medir el tamaño de la corbata del Carbonero común, la anchura máxima varia de 14 a 26 mm, mientras que el área total varia de 304 a 1235 mm 2,8. A parte de otras consideraciones, el mayor rango de variación del área le dará una mayor repetibilidad. Temas actuales en Etología Si al medir la repetibilidad de una medida juntamos machos y hembras, aumentando así el rango de variación debido al factor sexo, aumentaremos artificialmente su repetibilidad, A la hora de tomar una submuestra de individuos para medir la repetibilidad de una medida hemos de procurar que esa submuestra sea representativa de la variabilidad de la población. La repetibilidad puede variar también según el método de medición utilizado. El peso de un animal es más repetible si se mide con una balanza digital a una precisión de 0,1 gr. que si se mide con un dinamómetro con precisión de 0,5 gr. La existencia de todos estos factores de variabilidad hace que dentro de las distintas medidas alternativas aquellas con mayor rango de variación y de mayor tamaño serán las más recomendables. Adicionalmente, y debido a que hay variables más fáciles de medir que otras, antes de escoger una medida hemos de comprobar su repetibilidad y comprobar si el método que utilizamos es el más adecuado. Errores más corrientes en la medición de la repetibilidad Cuando se dispone de dos mediciones repetidas de un carácter, un error corriente es computar la correlación entre esas dos mediciones como medida de repetibilidad. Esta aproximación es totalmente errónea 9 . Si resulta que la segunda medición siempre nos sale el doble que la primera, el valor de correlación será de uno, pero la repetibilidad será muy baja 9 . Otro error corriente es medir la repetibilidad aplicando en la fórmula antes explicada los valores de los cuadrados mínimos en vez de las componentes de 11,12 la varianza entre y dentro de los grupos . Esto siempre exagera falsamente la repetibilidad. Finalmente comentar que el hecho de que al medir un carácter seamos muy repetibles no quiere necesariamente decir que seamos muy precisos 32 . Un investigador con baja repetibilidad forzosamente ha de medir de forma imprecisa, pero un investigador con alta repetibilidad no debe asumir automáticamente que es preciso en sus mediciones 9 . Medición de la Repetibilidad y el Error de Medida J.C. Senar Se puede dar el caso de que dos investigadores con alto nivel de repetibilidad difieran en el valor exacto de sus medidas. En este caso los datos deben estandarizarse respecto a uno de ellos, haciéndolos así comparables 2,29,30 . En la mayoría de estudios, sin embargo, en los que un solo investigador analiza 1 relaciones o diferencias entre variables , es más importante ser consistente y 11 repetible en las medidas que se toman que no preciso . Otros usos de la repetibilidad Hasta aquí hemos hablado de la repetibilidad como un concepto equivalente al de exactitud de una medida. Esto es cierto cuando las dos medidas repetidas se toman una a continuación de otra o en periodos de tiempo muy breves. Si medimos la longitud del ala de varios individuos en dos años sucesivos, durante este espacio de tiempo el carácter puede haber variado 13,22,23,28, . En este caso la repetibilidad puede utilizare como medida de la consistencia de una variable entre años. Un carácter que varia mucho entre años por fuerza no puede tener una fuerte carga genética y por tanto no puede ser heredable, se dice que el grado de repetibilidad entre años de un mismo carácter nos da su límite superior de heredabilidad 6 . En este sentido, la repetibilidad entre años puede utilizare como una medida aproximada de la heredabilidad del carácter 3 . La longitud de la cola de la Golondrina Hirundo rustica tiene muy poco error de medida. La repetibilidad calculada en los machos capturados dentro de la misma primavera es de ri = 0.998 18 . Si esta misma repetibilidad de los machos se mide tomando valores de longitud en dos años distintos, sus valores son todavía altos y significativos, lo que sugiere la heredabilidad del carácter (ri = 0.83 [tomando valores corregidos para efecto 18 edad) . Análisis posteriores comparando la longitud de la cola de padres e hijos de Golondrina confirma que esta heredabilidad es significativa 18 . Una aproximación similar puede utilizare para comprobar la heredabilidad de otros caracteres como el tamaño de puesta o la resistencia a los parásitos. 19 Møller comprobó que la estimación del número de Malófagos que parasitaban a las Golondrinas era altamente repetible, tanto dentro del mismo año (ri = 0,99) como entre años (ri = 0,96), por lo que concluyó que el grado de resistencia a los parásitos de un individuo debe venir determinado genéticamente. Experimentos 20 posteriores han demostrado que esto es realmente así . Temas actuales en Etología Otra utilidad de la medida de repetibilidad es estudiar la consistencia de caracteres de tipo conductual o ecológico. En la Golondrina, los machos de cola larga están menos parasitados y presentan una mejor condición física general que los de cola más corta 20 . En consecuencia, no es de extrañar que los machos de cola larga sean preferidos por las hembras a la hora de buscar pareja 20 . Con esta aproximación Møller demostró que esta preferencia es consistente de un año a otro y que las hembras que escogen individuos de cola larga un año siguen al año siguiente mostrando la misma preferencia ( r,= 0,57, 21 p<0,00 I) . Valoración final Cuando medimos un carácter, sea morfológico, conductual o ecológico, no debemos asumir que lo medimos de forma consistente: el análisis de la bibliografía muestra que existen errores de medida. Por tanto, antes de cualquier estudio debe medirse la repetibilidad de medida del carácter seleccionado. Esta repetibilidad depende de varios factores: hay caracteres más fáciles de medir que otros; los caracteres de mayor tamaño o con mayor rango de variación, tienen mayor nivel de repetibilidad; el método de medición también puede afectar a la repetibilidad. Todo esto ha de ser tenido en cuenta a la hora de escoger la variable que vamos a estudiar. Agradecimientos A M' Luisa Arroyo y Jordi Doménech por la lectura crítica del manuscrito. Medición de la Repetibilidad y el Error de Medida J.C. Senar Bibliografía 1 .Barnard, C., Gilbert, F. & McGregor, P. (1993) Asking cuestiones in biology, Longman Scientifc & Technical, Essex, UK 2 Barrett, R.T., Peterz, M., Furness, R.W. & Durinck, J. (1989) The variability of biometric measurements. Ringing & Migration 10, 13-16 3. Boag, P.T. & van Noordwijk, A.J. (1987) in Avian genetics: A population and ecological approach (Cooke, F. & Buckley, P.A, eds.), pp. 45-78, Academic Press, London 4. Borras, A., Pascual, J. & Senar, J.C. (2000) What do different bill measures measure and what is the best method to use? J. Field Ornithol. 71 , (en prensa) 5. Carrascal, L.M., Senar, J.C., Mozetich, I., Unbe, F. & Domènech, J. (1998) Interactions among environmental stress, body condition, nutritional status, and dominance in Great Tits. Auk 1 15, 727-738 6. Falconer, D.S. (1983) Introduction to quantitative genetics, Longman, London 7. Figuerola, J., Pascual, J. & Senar, J.C. (1999) The use of a colorimeter in feld studies of Blue Tit Parus caeruleus coloration. Ardea (en prensa) 8. Figuerola, J. & Senar, J.C. (1999) The measurement of plumage badges: an example on the Great Tit. Ibis 141, (en prensa) 9. Harper, D.G.C. (1994) Some comments on the repeatability of measurements. Ringing & Migration 15, 84-90 10 Jenni, L. & Winkler, R. (1989) The feather-length of small passerines: a measurement for wing-length in live birds and museum skins. Bird Study 36, 1-15 11 . Krebs, C.J. (I 989) Ecological methodology, Harper Collins, New York Temas actuales en Etología 12. Lessells, C.M. & Boag, P.T. (I 987) Unrepeatable repeatabilities: a common mistake. Auk 104, I 16-121 13. Leverton, R. (I 989) Wing length changes in individually-marked Blackbirds Turdus merula following moult. Ringing& Migration 10, 17-25 14. Massi, A. & Spina, F. (1995) Accuratezza di due diversi metodi per la misurazione della lunghezza dell'ala utilizzati da operatori inesperti. Avocetta 19, 219-220 15. Merilä, J. (1996) Genetic and Quantitative trait variation in natural bird populations. PhD Thesis, Uppsala University 16. Merilä, J. & Björklund, M. (1995) Fluctuating asymmetry and measurement error. Syst.Biol. 44, 97-101 17. Merilä, J. & Gustafsson, L. (1993) inheritance of size and shape in a natural population of collared flycatchers Ficedula albicollis. J. evol. Biol. 6, 375-395 18. Møller, A.P. (1991) Sexual seletion in monogamous bam swallow (Hirundo rustica), I. Determinants of tail ornament size. Evolution 45, 1823- 1836 19. Møller, A.P. (1991) in Bird-parasite interactions. Ecology, evolution and behaviour (Loye, J.E. & Zuk, M. eds.), pp. 328-343, Oxford University Press, Oxford 20. Møller, A.P. (1994) Sexual selection and the Barn Swallow, Oxford Univ. Press, Oxford 21, Møller, A.P. (1994) Repeatability of female choice in a monogamous swallow. Anim. Behav. 47, 643-648 22. Nielsen, B. (1993) Age dependent variation in wing length of Bearded Tits Panurus biarmicus. Ornis Svecica 3. 117- 124 23. Nilsson, J.A. (1992) Variation in wing length in relation to sex and age of Marsh Tits Parus palustris. Ornis Svecica 2, 7-12 Medición de la Repetibilidad y el Error de Medida J.C. Senar 24. Rothery, P. (1979) A non-parametric measure of intraclass correlation. Biometrika 66, 629-639 25.Senar, J.C. & Camerino, M. (1998) Status signalling and the ability to recognize dominants: an experiment with siskins (Corduelis spinus). Proc. R. Soc. Lond. B 265, 1515-1520 26. Senar, J.C. & Pascual, J. ( 1997) Keel and tarsus length may provide a good predictor of avian body size. Ardea 85, 27. Sokal, R.R. & Rohlf, F.J. (1981) Biometry, W.H.Freeman, New York 28. Stewart, I.F. (1963) Variation of wing length with age. Bird Study 10, 1-9 29. Summers, R.W., Jardine, D.C., Marquiss, M. & Proctor, R. (1996) The biometrics of invading Common Crossbills Loxia curvirostra in Britain during 1990-1991. Ringing & Migration 17, 1-10 30. Summers, R.W., Nicoll, M., Underhill, L.G. & Petersen, A. (1988) Methods for estimating the proportions of Icelandic and British Redshanks Tringo totanus in mixed populations wintering on British coasts. Bird Study 35, 169-180 31 . Svensson, L. (1992) Identification guide to European Passennes, L.Svensson, Stockholm 32.Topping, J. (1955) Errores of observation and their treatment, Chapman & Hall, London 33.Zar, J.H. (1984) Biostatistical analysis, Prentice Hall, Englewood Cliffs, NJ