UNED. ELCHE. TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (2º A.D.E.) e-mail: imozas@elx.uned.es http://telefonica.net/web/imm Cambio de origen y escala de una variable estadística x.Consideremos una variable x, cuya distribución venga dada por la tabla adjunta y sean xi 1 r 1 r la media x = ∑ x i n i y la varianza S 2x = ∑ (x i − x )2 n i . x N i =1 N i =1 1 x 2 Efectuemos un cambio de origen y de escala sobre la variable x, es decir, construyamos otra variable y = ax + b, siendo a>0 y b constantes (multiplicar x por una x3 constante es efectuar un cambio de escala y sumarle a x una constante es efectuar un x4 cambio de origen). Esto quiere decir que para cada xi hay un yi = axi + b con su misma …. xr frecuencia ni. La tabla de la variable y será: yi ni y1 n1 y2 n2 y3 n3 y4 n4 …. …. yr nr N Entonces, la media y= ni n1 n2 n3 n4 …. nr N 1 r 1 r 1 r 1 r y i n i = ∑ (ax i + b )n i = a· ∑ x i n i + b· ∑ n i = ax + b ∑ N i =1 N i =1 N i =1 N i =1 y la varianza S 2y = r r 1 r (y i − y )2 n i = 1 ∑ (ax i + b − ax − b )2 n i = a 2 1 ∑ (x i − x )2 n i = a 2S 2x ∑ N i =1 N i =1 N i =1 Es decir, la media se ve afectada por el mismo cambio de origen y de escala efectuado sobre la variable, mientras que la varianza no se ve afectada por el cambio de origen pero se ve afectada por el cuadrado del cambio de escala efectuado sobre la variable. Sy aS x Para el coeficiente de variación se tiene: CVy = . Por tanto, si sólo efectuamos un = y ax + b S y aS x S x cambio de escala (es decir, si b = 0), entonces CVy = = = = CVx , es decir, el cambio de y ax x escala no le afecta al coeficiente de variación. Si sólo efectuamos un cambio de origen (es decir, si a = 1) entonces Sy S CVy = = x ≠ CVx , es decir, sí que le afecta el cambio de origen. y x+b Cambios de origen y escala en una distribución bidimensional.Consideremos una distribución bidimensional (xi, yi), i = 1, 2, ...., N. Supóngase que hacemos un cambio de origen y de escala , es decir, introducimos otras variables x’i e y’i , relacionadas con las anteriores de la siguiente forma: x’i = mxi + n y’i = pyi + q sean: –1/2– Cambio de origen y escala UNED. ELCHE. TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (2º A.D.E.) e-mail: imozas@elx.uned.es http://telefonica.net/web/imm a10, a01, m11, m20 y m02 los momentos referidos a la variable (xi, yi) y a’10, a’01, m’11, m’20 y m’02 los referidos a la variable (x’i , y’i). Se tiene: 1 a’10 = N ∑ N i =1 1 x'i = N ∑ N i =1 (mx i + n ) = m· 1 N ∑ N i =1 1 xi + N ∑ n = ma N 10 +n i =1 Análogamente a’01 = pa01 + q. (es decir, las medias se ven afectadas por el mismo cambio de origen y de escala efectuado en la variable) Por lo tanto: m’11 1 = N ∑ N i =1 (x ' i −a '10 )(y' i −a ' 01 ) = 1 N ∑ N i =1 (mx i − ma 10 )(py i − pa 01 ) = mp 1 N ∑ (x − a N i 10 )(yi − a 01 ) = i =1 = mp·m11 (es decir, la covarianza es invariante ante un cambio de origen pero no ante un cambio de escala) 1 m’20 = N ∑ (x ' − a ' N i i =1 10 ) 2 2 1 = N ∑ (mx − ma N i 10 i =1 ) 2 1 =m N 2 ∑ (x − a N i 10 )2 = m2·m20. i =1 Análogamente m’02 = p ·m02. (es decir, las varianzas son invariantes ante un cambio de origen pero no ante un cambio de escala) Sean ahora bY/X y bX/Y los coeficientes de regresión de las rectas Y/X y X/Y respectivamente y correspondientemente b’Y’/X’ y b’X’/Y’ los coeficientes de regresión de las rectas Y’/X’ y X’/Y’ respectivamente. Se tendrá: m' mp·m p b’Y’/X’ = 11 = 2 11 = bY/X. m' 20 m ·m 20 m m Análogamente b’X/Y = bX/Y. p Es decir, los coeficientes de regresión son invariantes ante un cambio de origen pero no ante un cambio de escala. m'112 m 2 p 2 m 112 m 112 2 El coeficiente de determinación R’ = = 2 = = R 2 , es decir, es 2 m' 20 ·m' 02 m m 20 ·p m 02 m 20 ·m 02 invariante ante cambios de origen y de escala. En consecuencia el coeficiente de correlación es también invariante ante cambios de origen y de escala. –2/2– Cambio de origen y escala