Análisis Exploratorio de Datos 1. Grado en Estadı́stica y Empresa - 2012/2013 MANEJO DE SUMATORIOS. PROPIEDADES Y EJERCICIOS. El sumatorio (o sumatoria) es un operador matemático, representado por la letra griega sigma mayúscula (Σ) que permite representar de manera abreviada sumas con muchos sumandos, con un número indeterminado (representado por alguna letra) de ellos, o incluso con infinitos sumandos. Los sumandos de un sumatorio se expresan generalmente como una variable (habitualmente x, y, z, . . .) cuyos valores dependen de un ı́ndice (habitualmente i, j, k . . .) que toma valores enteros. El ı́ndice empieza tomando el valor que aparece en la parte inferior del sumatorio y se va incrementando en una unidad hasta llegar al valor que aparece en la parte superior del sumatorio. Ası́ por ejemplo, 3 X xi = x1 + x2 + x3 i=1 representa la suma de los valores de la variable x desde el primero hasta el tercero. En general, n X xi = x1 + x2 + . . . + xn−1 + xn i=1 representa la suma de los primeros n valores de la variable x. La expresión anterior se lee: “sumatorio de x sub-i desde i igual a 1 hasta n”. El ı́ndice del sumatorio puede tomar cualquier conjunto de números enteros, es decir, no tiene porqué empezar en 1, (aunque en las expresiones que aparecen a continuación casi siempre sea ası́ para simplificar la notación). La única condición que se tiene que cumplir es que el primer valor del ı́ndice, el que aparece P abajo, sea menor o igual que el último valor del ı́ndice, el que aparece arriba. Es decir, en la suma ni=k xi k tiene que ser menor o igual que n para que la suma tenga sentido. Si k fuera mayor que n, por ejemplo, k = 5 y n = 3, estarı́amos sumando los de x empezando en 5 hasta llegar a 3, es decir, no estarı́amos sumando nada, y la suma serı́a igual a cero.P Si queremos sumar los valores de x desde 3 hasta 5, deberemos tomar n = 5 y k = 3, es decir, hacer 5i=3 xi . 1.1. Propiedades. El sumatorio es simplemente una manera abreviada de representar una suma, y por lo tanto, cumple todas las propiedades de ésta: Propiedad conmutativa: n X (xi + yi ) = x1 + y1 + x2 + y2 + . . . + xn + yn i=1 n X (yi + xi ) = y 1 + x1 + y 2 + x2 + . . . + y n + xn = i=1 Propiedad asociativa: n n X X zi = x1 + y1 + x2 + y2 + . . . + xn + yn + z1 + z2 + . . . + zn (xi + yi ) + i=1 i=1 = x1 + x2 + . . . + xn + y1 + z1 + y2 + z2 + . . . + yn + zn = n X i=1 xi + n X i=1 (yi + zi ) = n X (xi + yi + zi ) i=1 1 Análisis Exploratorio de Datos Grado en Estadı́stica y Empresa - 2012/2013 Propiedad distributiva: a· n X i=1 xi = a · (x1 + x2 + . . . + xn ) = ax1 + ax2 + . . . + axn = n X (axi ), i=1 a∈R Otras propiedades: 1. El sumatorio de una constante (no depende de ningún ı́ndice) es igual a la constante multiplicada por el número de sumandos: n X n veces b =b + b + . . . + b= nb, i=1 b∈R 2. Propiedad asociativa + propiedad distributiva + (1): n X (axi + b) = n X axi + b=a n X xi + nb, i=1 i=1 i=1 i=1 n X a, b ∈ R P P Nota: ¡¡¡a · ni=1 xi + nb 6= a · ni=1 (xi + nb)!!! En un sumatorio, los sumandos vienen indicados por el primer sı́mbolo después de Σ. Si cada sumando involucra más de un término, tendremos que escribir la expresión del sumando entre paréntesis. Por ejemplo: 3 X i2 + 5 = 12 + 22 + 32 + 5 = 1 + 4 + 9 + 5 = 19, i=1 mientras que 3 X (i2 + 5) = 12 + 5 + 22 + 5 + 32 + 5 = 1 + 5 + 4 + 5 + 9 + 5 = 29. i=1 3. Los valores recorridos por el ı́ndice se pueden separar en varios sumatorios: n X xi = n0 X xi + i=1 i=1 n X xi , i=n0 +1 n0 ≤ n En efecto: x1 + x2 + ... + xn = (x1 + x2 + ... + xn0 ) + (xn0 +1 + . . . xn ) Por ejemplo: 4 X log(i) = log(1) + log(2) + log(3) + log(4) = (log(1) + log(2)) + (log(3) + log(4)) i=1 = 2 X i=1 log(i) + 4 X log(i) (aquı́ n = 4 y n0 = 2). i=3 Nota: Todas las propiedades descritas son válidas independientemente Pn Pndel conjunto de valores que tome el ı́ndice del sumatorio. Es decir, sin en vez de i=1 tenemos i=k , para cualquier valor de k ≤ n, las propiedades anteriores se aplican exactamente igual. 2 Análisis Exploratorio de Datos 1.1.1. Grado en Estadı́stica y Empresa - 2012/2013 Igualdades que NO cumplen los sumatorios. A continuación se enumeran algunas de las igualdades que NO son ciertas al operar con sumatorios (y que constituyen errores muy habituales): ! n ! n n X X X yi ya que en el lado izquierdo de la desigualdad estamos sumando xi xi yi 6= 1. i=1 i=1 i=1 los valores de x multiplicados por su correspondiente valor de y: x1 y 1 + x2 y 2 + . . . + xn y n , y en el lado derecho de la desigualdad estamos sumando todos los valores de x multiplicados por todos los valores de y: (x1 +x2 +. . .+xn )·(y1 +y2 +. . .+yn ) = x1 y1 +x1 y2+. . .+x1 yn +x2 y1 +x2 y2 +. . .+x2 yn +xn y1 +xn y2 +. . .+xn yn . !2 n n X X xi x2i 6= ya que en el lado izquierdo de la desigualdad estamos sumando los valores 2. i=1 i=1 de x elevados al cuadrado: x21 + x22 + . . . + x2n , mientras que en el lado derecho de la desigualdad estamos sumando todos los valores de x y luego estamos elevando toda la suma al cuadrado: (x1 +x2 +. . .+xn )2 = x21 +x22 +. . .+x2n +2x1 x2 +2x1 x3 +. . .+2x1 xn +2x2 x3 +. . .+2x2 xn +. . .+2xn−1 xn . 3. En general, si f : R −→ R es una función no lineal (es decir, no es una recta, involucra operaciones distintas de la suma y el producto por escalares), entonces ! n n X X xi . f (xi ) 6= f i=1 i=1 Por ejemplo: 5 X i=1 10 X n=1 3 i 6= 5 X i=1 ln(n) 6= ln !3 i 10 X n=1 n ! v u 7 7 X uX √ zk . zk 6= t k=1 1.2. k=1 Sumatorios dobles (o triples, cuádruples, etc.). Si la variable cuyos valores queremos sumar depende de dos (o tres, cuatro, etc.) ı́ndices utilizaremos un sumatorio doble (o triple, cuádruple, etc.). Por ejemplo, dada una matriz cuadrada n × n a11 a12 a13 ... a1,(n−2) a1,(n−1) a1n a21 a22 a23 ... a2,(n−2) a2,(n−1) a2n a31 a32 a33 ... a3,(n−2) a3,(n−1) a3n . . . . . . . . . . . . . . A = (aij )i,j=1,...,n = . . . . . . . a(n−2),1 a(n−2),2 a(n−2),3 . . . a(n−2),(n−2) a(n−2),(n−1) a(n−2),n a(n−1),1 a(n−1),2 a(n−1),3 . . . a(n−1),(n−2) a(n−1),(n−1) a(n−1),n an1 an2 an,3 ... an,(n−2) an,(n−1) ann 3 Análisis Exploratorio de Datos Grado en Estadı́stica y Empresa - 2012/2013 los elementos de A dependen de dos ı́ndices: el ı́ndice i que denota las filas y el ı́ndice j que representa las columnas. Ası́, si queremos sumar todos los elementos de A, tendremos que sumar primero los elementos de cada fila, yP luegoP sumar los n valores resultantes. Es decir, la suma de todos los elementos se puede escribir como: ni=1 nj=1 aij . En efecto, si desarrollamos primero el sumatorio en j y luego el sumatorio en i se obtiene lo siguiente: n X n X aij = n X (ai1 + ai2 + . . . ain ) i=1 i=1 j=1 = (a11 + ai2 + . . . a1n ) + (a21 + a22 + . . . a2n ) + . . . + (an1 + an2 + . . . ann ). Nota: los ı́ndices de los dos (o más) sumatorios no tienen porqué tomar los mismos valores. Por ejemplo, si sólo quiero sumar los elementos de la matriz A que están por encima de la diagonal (en negrita) a11 a12 a13 ... a1,(n−2) a1,(n−1) a1n a21 a22 a23 ... a2,(n−2) a2,(n−1) a2n a31 a a . . . a a a 32 33 3n 3,(n−2) 3,(n−1) . . . . . .. .. .. .. .. .. A = (aij )i,j=1,...,n = , . a(n−2),1 a(n−2),2 a(n−2),3 . . . a(n−2),(n−2) a(n−2),(n−1) a(n−2),n a(n−1),1 a(n−1),2 a(n−1),3 . . . a(n−1),(n−2) a(n−1),(n−1) a(n−1),n an1 an2 an3 ... an,(n−2) an,(n−1) ann en cada fila i tengo que considerar sólo los elementos aij con j > i (ó j ≥ i + 1). Por lo tanto escribiré: n n X X i=1 j=i+1 aij = n X (ai,i+1 + ai,i+2 + . . . ain ) i=1 = (a12 + ai3 + . . . a1n ) + (a23 + a24 + . . . a2n ) + . . . + +(a(n−2),(n−1) + a(n−2),n ) + a(n−1),n . P OJO: Cuando i es igual a n, la suma nj=i+1 aij no contiene ningún sumando puesto que el ı́ndice j tendrı́a que ir desde n + 1 hasta n, lo cual no es posible. Esto sólo quiere decir, que en la última fila, i = n, no tenemos ningún elemento por encima de la diagonal. P P Análogamente, la suma de los elementos por debajo de la diagonal se escribe: ni=1 i−1 j=1 aij . En este Pi−1 caso, para i = 1 la suma j=1 aij no contiene ningún sumando puesto que el ı́ndice j tendrı́a que ir desde 1 hasta 0, lo cual no tiene sentido. Es decir, en la primera fila, i = 1, no hay elementos por debajo de la diagonal. La traza P de A, P o lo que es lo mismo, la suma de los elementos de la diagonal de A, se podrı́a escribir como: ni=1 j=i aij , es decir, sumamos aquellos elementos para los cuales el número de su fila y su columna coinciden. En este sumatorio doble, para cada valor de i el segundo ı́ndice, j, toma un único valor: j = i. En este P caso, podemos prescindir de j y escribir la suma con un sumatorio simple de la siguiente manera: ni=1 aii . Nota: Si los ı́ndices de los dos sumatorios i y j toman losP mismos valores, se escribir los dos ı́ndices en un único sı́mbolo de sumatorio de la siguiente forma, ni,j=1 , indicando que tanto i como j van desde 1 hasta n. Ası́, podemos escribir el doble sumatorio en forma compacta: n X n X i=1 j=1 aij = n X aij . i,j=1 4 Análisis Exploratorio de Datos 1.2.1. Grado en Estadı́stica y Empresa - 2012/2013 Propiedades de los sumatorios dobles Propiedad conmutativa: n X n X n n X X (yij + xij ) (xij + yij ) = i=1 j=1 i=1 j=1 = n n X X (xij + yij ) (yij + xij ) = n n X X j=1 i=1 j=1 i=1 Propiedad asociativa: n X i=1 n n n X n X X X (xij + yij ) yij = xij + i=1 j=1 j=1 j=1 Propiedad distributiva: a· n X n X xij = a · i=1 j=1 n X (xi1 + xi2 + . . . + xin ) i=1 = a · [(x11 + x12 + . . . + x1n ) + . . . + (xn1 + xn2 + . . . + xnn )] = (ax11 + ax12 + . . . + ax1n ) + . . . + (axn1 + axn2 + . . . + axnn ) = n X n X axij , i=1 j=1 a∈R Otras propiedades: 1. El sumatorio doble de una constante (no depende de ningún ı́ndice) es igual a la constante multiplicada por el número de sumandos al cuadrado: n X n X i=1 j=1 n n X X n veces nb (b + b + . . . + b) = b= i=1 i=1 n veces = (nb + nb + . . . + nb) = n · nb = n2 b, b∈R 2. Propiedad asociativa + propiedad distributiva + (1): n n X n n X n n X X X X b axij + (axij + b) = =a n X n X xij + n2 b, i=1 j=1 3. Se verifica que n n X X xi y j = n X i=1 i=1 j=1 n n X X i=1 j=1 i=1 j=1 i=1 j=1 i=1 j=1 a, b ∈ R ! n X yj , ya que xi j=1 n X (xi y1 + xi y2 + . . . + xi yn ) xi y j = i=1 5 Análisis Exploratorio de Datos Grado en Estadı́stica y Empresa - 2012/2013 = (x1 y1 + x1 y2 + . . . + x1 yn ) + (x2 y1 + x2 y2 + . . . + x2 yn ) + . . . + (xn y1 + xn y2 + . . . + xn yn ) = (x1 + x2 + . . . + xn ) · (y1 + y2 + . . . + yn ). OJO: Esto se cumple porque x sólo depende de i e y sólo depende de j. Si ambas variables dependieran de ambos ı́ndices, esto no serı́a cierto (ver desigualdad 1 más abajo). Nota: Todas las propiedades descritas son válidas independientemente de los conjuntosPde valores P P n Pm que tomen los dos ı́ndices del sumatorio. Es decir, sin en vez de ni=1 nj=1 tenemos i=k j=ℓ , para cualquier valor de k ≤ n, y cualquier valor de m y ℓ ≤ m, las propiedades anteriores se aplican exactamente igual. 1.2.2. Igualdades que NO cumplen los sumatorios dobles. A continuación se enumeran algunas de las igualdades que NO son ciertas al operar con sumatorios dobles (y que constituyen errores muy habituales): n n n X n X n n X X X X yij ya que en el lado izquierdo de la desigualdad estaxij xij yij 6= 1. i=1 j=1 i=1 j=1 i=1 j=1 mos sumando los valores de x multiplicados por sus correspondientes valores de y: x11 y11 +x12 y12 +. . .+x1n y1n +x21 y21 +x21 y22 +. . .+x2n y2n +. . .+xn1 yn1 +xn2 yn2 +. . .+xnn ynn , pero en el lado derecho estamos sumando todos los valores de x multiplicados por todos los valores de y: (x11 +x12 +. . .+x1n +x21 +x22 +. . .+x2n +. . .+xn1 +xn2 +. . .+xnn )·(y11 +y12 +. . .+y1n +y21 +y22 +. . .+y2n +. . .+ 2. n X n X i=1 j=1 x2ij 6= n X n X i=1 j=1 2 xij ya que en el lado izquierdo de la desigualdad estamos sumando los valores de x elevados al cuadrado: x211 + x212 + . . . + x21n + . . . + x2n1 + x2n2 + . . . + x2nn , mientras que en el lado derecho de la desigualdad estamos sumando todos los valores de x y luego estamos elevando toda la suma al cuadrado: (x11 + x12 + . . . + x1n + . . . + xn1 + xn2 + . . . + xnn )2 , que involucra todos los términos de la suma anterior y muchos más. 3. En general, si f : R −→ R es una función no lineal (es decir, no es una recta, involucra operaciones distintas de la suma y el producto por escalares), entonces n n X n n X X X xij . f (xij ) 6= f i=1 j=1 i=1 j=1 Por ejemplo: 6 3 X X i=1 j=2 3 6 3 X X (i + j) (i + j)3 = 6 i=1 j=2 6 Análisis Exploratorio de Datos Grado en Estadı́stica y Empresa - 2012/2013 10 X 3 X n=1 k=1 ln(nk ) 6= ln 10 X 3 X nk n=1 k=1 ! 10 X ℓ X 1 1 . 6= P10 Pℓ zℓh ℓ=1 h=i zℓh ℓ=1 h=i 2. Ejemplos. Ejemplo 2.1 La suma de todos los números pares desde 1 hasta 100 se escribe: 50 X 2i. i=1 Ejemplo 2.2 La suma de todos los números impares desde 1 hasta 100 se escribe: 50 X (2i − 1). i=1 Ejemplo 2.3 La suma de los 1000 primeros números se escribe: 1000 X n, n=1 además, podemos calcular cuánto vale esta suma: 1000 X n=1 n= 1001 · 1000 = 500500. 2 En general, para cualquier número natural n ∈ N se cumple: n X i=1 i= (n + 1) · n . 2 Por ejemplo, para n = 1, i=1 i = 1 y (n+1)·n = 2·1 2 2 = 1. P2 (n+1)·n 3·2 = 2 = 3. Para n = 2, i=1 i = 1 + 2 = 3 y 2 Comprueba la fórmula para el resto de números naturales menores o iguales que 10. P1 3. Ejercicios. Ejercicio 3.1 Calcula las siguientes sumas: a) 5 X i(i + 1) i=1 b) 3 X 2n n=0 c) 100 X 4r r=1 7 Análisis Exploratorio de Datos d) 10 X Grado en Estadı́stica y Empresa - 2012/2013 (6h − 1) h=−3 e) 4 X log(z 4 ) z=2 Ejercicio 3.2 Expresa con una frase el significado de las siguientes sumas: 5 X 3p es la suma de todos los múltiplos de 3 desde el 3 hasta el 15. Ejemplo: p=1 a) 10 X s2 s=1 b) n X xq n q=1 c) 49 X (2ñ + 1) ñ=0 Ejercicio 3.3 Expresa con un sumatorio las siguientes frases: a) La suma de los 10 primeros números pares. b) La suma de todos los múltiplos de 4 desde 36 hasta 80. c) La suma de la raı́z cuadrada de los 20 primeros números impares. d) La suma de los cuadrados de todos los números naturales del 1 al 30. e) El producto escalar de los vectores (t1 , t2 , . . . , tm ) y (w1 , w2 , . . . , wm ). Ejercicio 3.4 La siguiente tabla recoge los valores de una variable f , indexada por dos ı́ndices e y d: e\d 1 2 3 4 5 1 -4 1 6 0 -2 2 4 9 -3 6 7 3 -8 12 5 2 0 Calcula: a) 5 X 3 X fed 5 X X fed 5 X 3 X fed e=1 d=1 b) e=1 d<e c) e=1 d=e 8 Análisis Exploratorio de Datos d) 5 X 3 X Grado en Estadı́stica y Empresa - 2012/2013 2 fed e=1 d=1 e) 3 X 3 X 2 (3fed − 28) 3 X 3 X (2fed − 1)2 e=1 d=1 f) e=1 d=1 Ejercicio 3.5 La siguiente tabla recoge los valores de dos variables u y v medidas sobre 6 individuos: Individuo 1 2 3 4 5 6 u -4 -1 5 0 -2 1 v 2 6 3 1 -4 1 Calcula: a) 6 X 6 X ua vb 6 X 3 X (ua + vb ) 3 X 6 X (ua + vb ) 6 X 6 X ua va a=1 b=1 b) a=1 b=1 c) a=1 b=a d) a=1 b=1 e) 6 X 6 X (2u2a + vb ) a=1 b=1 f) 6 X a X a=1 b=1 (ua − vb ) 9