TEMA 5: TRANSFORMACIONES LINEALES ● En muchas ocasiones transformar el conjunto de datos de una variable facilita su estudio, ya que genera distribuciones más simples y con buenas propiedades (Ejemplo: simetría, media cero, desviación típica igual a uno…). ● En los temas anteriores ya hemos visto el efecto que tenían algunas transformaciones de los datos en las medidas de posición y dispersión estudiadas. ● En este tema nos vamos a centrar en las transformaciones lineales (repasando sus efectos sobre las principales medidas de descripción numérica de los datos) y especialmente en los datos tipificados. 1 Transformaciones lineales en las variables ● La transformación lineal en los datos consiste en multiplicarlos todos por un mismo número y luego sumarles una cantidad igual a todos. ● Es decir, si se dispone de los datos: x1 , x2 ,..., x N los nuevos datos: y1 ax1 b, y2 ax2 b, ..., y N ax N b son una transformación lineal de los iniciales. ● Ejemplo: y ax b x 1 2a b2 3 3 x1 6, x2 3, x3 0, x4 6, x5 9 x1 x x 2 0, y2 2 2 1, y3 3 2 2, 3 3 3 x x y4 4 2 4, y5 5 2 5 3 3 y1 2 ● Recordemos de los temas anteriores el efecto de las transformaciones lineales sobre las medidas de posición y dispersión: Si y ax b entonces: Medidas de posición: Media → y ax b Mediana → med y amed x b Medidas de dispersión: Desviación típica → S y a Sx MEDA → MEDAy a MEDAx Rango Intercuartílico → RI y a RI x 3 Datos tipificados ● La transformación lineal más importante desde el punto de vista estadístico consiste en tipificar las observaciones. ● Dado un conjunto de datos: x1 , x2 ,..., x N las observaciones tipificadas se construyen restando a cada dato la media x y dividiéndolo por la desviación típica S x . Así, los datos tipificados serán: z1 ● Al x1 x x x x x , z2 2 , ..., z N N Sx Sx Sx tipificar una variable estamos transformación lineal z ax b en la que: a 1 Sx b 4 x Sx haciendo una ● El conjunto de datos tipificado tiene media cero y desviación típica uno, es decir, z 0 y Sz 1. z ax b Sz a S x x x 0 Sx Sx Sx 1 Sx Ejemplo: Dado el conjunto de datos: x1 2 x2 4 x3 6 x4 8 con: 4 x x i i1 4 20 5 4 4 Sx x 2 i i1 4 x2 120 25 2,236 4 5 los datos tipificados serán: 25 45 1,342 z2 0,447 2,236 2,236 65 85 z3 0,447 z4 1,342 2,236 2,236 z1 con: 4 z z i i1 4 0 0 4 4 Sz z 2 i i1 4 z2 4,001 1 4 ● Una variable tipificada expresa el número de desviaciones típicas que cada observación dista de la media. Esto nos permite comparar la posición relativa de cada dato en diferentes distribuciones. 6 Ejemplo: Los estudiantes de una clase han realizado dos pruebas: A y B. Prueba A: Calificación media= x A 6,23 con Sx A 2,3 Prueba B: Calificación media= x B 5,2 con Sx B 1,3 Un estudiante ha obtenido 6,84 en la prueba A y 6,31 en la B, ¿qué resultado es mejor comparativamente? El 6,31 de la prueba B Si tipificamos ambos resultados con respecto a sus distribuciones tenemos: 6,84 6,23 0,26 2,3 6,31 5,2 zB 0,85 1,3 zA El resultado de 6,31 en B es comparativamente mejor que el 6,84 en A, aunque éste último sea mayor en términos absolutos. (Ver Figura 6.1 de Peña y Romo) 7 Ejercicio: Las notas finales de una clase han sido: Matemáticas: x M 4 Sx M 18 , Dibujo: xD 7 S x D 1 Un alumno obtuvo un 6,25 en matemáticas y un 8 en dibujo, ¿En qué asignatura tuvo mejor posición relativa? Si tipificamos cada valor respecto a su distribución: zM 6,25 4 1,25 1,8 zD 87 1 1 Comparado con el resto de la clase ha obtenido mejor calificación en Matemáticas. 8