UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Capítulo 6: DESVIACIÓN ESTÁNDAR INTRODUCCIÓN Como podemos observar, en el mundo de hoy necesitamos conocer con detalle un conjunto de datos, no basta con conocer solo las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones de la empresa 229 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 6.1 CONCEPTO: La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable. Se caracteriza por ser el estadígrafo de mayor uso en la actualidad. Se obtiene mediante la aplicación de la siguiente fórmula: ni (Yi - X )² S= N SERIES UNIVERSOS SIMPLES S( yi x)2 S2 = N S(Yi) (Syi) S = N 2 2 MUESTRAS T2 2 S(Yi) x) N 1 S{Yi (SYI)2} T2 N = N1 230 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS AGRUPADA O S (Yi x) 2 S2 = N SniYi 2 (SniYi)2 CLASIFICADA S2 = N N T2 T2 = Sni (Yi x) 2 N 1 niYi 2 ( SniYi ) 2 = N N 1 Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que su media es: La varianza sería: Por lo tanto la desviación estándar sería: 231 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado. Ejercicio 1: Determinar la Desviación Estándar del siguiente cuadro de distribución: L1 - L2 YI nI Yi ² NiYi² niYi (Yi – X)² /Yi –x/ ni(Yi-x)² 45 - 55 50 4 2500 10000 200 384.16 -196 1536.64 55 - 65 60 12 3600 43200 720 92.16 -9.6 1105.92 65 - 75 70 20 4900 98000 1400 0.16 0.4 3.2 75 - 85 80 10 6400 64000 800 108.16 10.4 108.16 85 - 95 90 4 8100 32400 360 416.16 20.4 416.16 niYi²= niYi= 247600 3480 N =50 S= ni(Yi-x)² = 5392 ni (Yi - X )² N 232 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS S= 5392 50 S= S = 10.38460399 niYi² - (niYi )² N S= 247 600 – (3480/50)² S = 10.38460399 50 Nota: La desviación Standard o desviación típica se aplica solo para datos agrupados. 233 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Ejercicio 2 : Calcular la desviación standard del siguiente cuadro de distribución de frecuencia donde son desconocidas las 3ª y la 5ª clase y la media aritmética es 66.3 L1 - L2 YI nI NiYi (Yi -x)² Yi - x 45 - 55 61 5 305 28.09 -5.3 140.45 55 - 65 64 7 448 5.29 -2.3 37.03 65 - 75 67 10 670 0.49 0.7 4.9 75 - 85 70 6 420 13.69 3.7 82.14 85 - 95 73 2 146 44.89 6.7 89.78 N = niYi= 30 1989 x = 66,3 x = niYi/N ni(Yi-x)² ni(Yi-x)²= 354.3 305 + 448 + 67X + 420 + 73Y = 1989 67x + 73y = 1989 - 1173 67.x + 73y = 816 …….(a) 234 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 66.3 x 30 = niYi = 5 + 7 + x + 6 + y = 30 x + y = 30 -18 x + y = 12 ……. (b) x + 12 - y x = 12 - 2 N -10 (a) en (b) 67 (12 - 4) + 73y = 816 804 - 67 + 73y = 816 6y = 616 - 804 6y = 12 y =12/6 y = 2 235 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 6.2 CORRECCIÓN SHEPPARD PARA LA DESVIACIÓN ESTÁNDAR (Sc) Cuando en una serie clasificada los límites de clase comprenden varias unidades se introducen un error al agrupar los datos en clase (llamado error de agrupamiento) , debido a que los puntos medios o marcas no coinciden con los respectivos promedios de los datos agrupados en cada clase . Los puntos medios o marcas de clase tienen mayor dispersión que los promedios lo que da lugar a un error en la varianza en exceso , este error se corrige mediante la corrección Sheppard con lo cual se obtiene la varianza ajustada o corregida para lo cual a la varianza calculada se le resta la constante i² / 12 Se determina mediante la aplicación de la siguiente fórmula: Sc = S2 - i² 12 Ejercicio 1: Calcular la varianza ajustada estándar corregida del ejercicio anterior . Sc = S² - i² / 12 Sc = 107.84 - 10² /12 Sc = 99.50666 Sc = 9.975302 236 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Ejercicio 2: Calcular la corrección sheppard del siguiente cuadro de distribución L1 - L2 YI nI Yi ² NiYi² niYi (Yi – X)² /Yi –x/ ni(Yi-x)² 45 - 55 50 4 2500 10000 200 384.16 -196 1536.64 55 - 65 60 12 3600 43200 720 92.16 -9.6 1105.92 65 - 75 70 20 4900 98000 1400 0.16 0.4 3.2 75 - 85 80 10 6400 64000 800 108.16 10.4 108.16 85 - 95 90 4 8100 32400 360 416.16 20.4 416.16 niYi²= niYi= ni(Yi-x)² = 247600 3480 5392 N =50 Sc = Sc= 107.84 - 10 /12 S² - i² 12 Sc= 99.50666 Sc = 9.975302 237 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 6.3 SIGNIFICADO E INTERPRETACION DE LA DESVIACION ESTANDAR Y LA CURVA NORMAL La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicación central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio). 34.13% 34.13% 13.59% 13.59% 2.15% -3S 2.15% - 2S -1S X 1S 2S 3S 68.26% 95.45% 99.74% 238 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS La desviación estándar ayuda a describir la curva de la distribución normal o campana de Gauss mediante la siguiente manera: 1.- Una desviación estándar a cada lado de la media incluye un área del 68.26% del área total es decir aproximadamente los 2/3 de los casos. X = 1S = 68.26% 2.- El área comprendida entre una y dos desviaciones estándar a ambos lados de la media representa el 13.59% del área total. El área comprendida entre 2 desviaciones estándar a ambos lados de la media es igual a 95.45% del área total. X = 2S = 94.75 % 3.- Entre la 2º y 3º desviación standard (o 2 y 3 desviaciones standard) resulta otra porción del área igual a 2.15% del área total. El área comprendida entre 3 desviaciones standard a cada lado de la media es igual al 99.74% del área total. X = 3S = 99.74 % 239 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Capítulo 7: MEDIDAS CONJUNTAS INTRODUCCIÓN: En estadística el coeficiente de variación (de Pearson), es una medida de dispersión útil para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Sirve para comparar variables que están a distintas escalas pero que están correlacionadas estadísticamente y sustantivamente con un factor en común. También estamos desarrollando, para el incremento de conocimientos, el tema de kurtosis el cual se ha usado en el monitoreo de máquinas , especialmente en compresores recíprocos,pero no se ha hecho muy común. 240 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.1 CONCEPTO Es la relación que se puede establecer entre las medidas de centralización (RMS, G, X, H, Mo, Md, Q, D.P.) y las medidas de dispersión (R, DQ, D.M., S2, S) para obtener coeficientes que nos permite medir: el coeficiente de variación, la variable normalizada, el sesgo, la Kurtosis y los momentos. 7.2 COEFICIENTE DE VARIACIÓN (V) En estadística el coeficiente de variación (de Pearson), es una medida de dispersión útil para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Sirve para comparar variables que están a distintas escalas pero que están correlacionadas estadísticamente y sustantivamente con un factor en común. Es decir, ambas variables tienen una relación causal con ese factor. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. PROPIEDADES Y APLICACIONES: El coeficiente de variación es típicamente menor que uno. Para su mejor interpretación se lo expresa como porcentaje. Depende de la desviación típica y en mayor medida de la media aritmética, dado que cuando esta es 0 o muy próxima a este valor C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de datos. El coeficiente de variación es común en varios campos de la probabilidad aplicada. 241 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Cuando es preciso comparar las distribuciones de varias series de datos estadísticos es necesario recurrir, el coeficiente de dispersión relativa que se define como el cociente que hay entre la dispersión absoluta y el promedio. Coef. Disp. Relativa = Dispersión absoluta = V Promedio Si consideramos que la dispersión absoluta es la desviación standard y el promedio es la media aritmética, a la dispersión relativa resultante se le conoce con el nombre de coeficiente de variación. V = S * 100% X El coeficiente de variación (v); se expresa en términos de porcentaje y representa un número de abstracto y depende de las unidades que se utilicen. Ventaja: La ventaja que ofrece este coeficiente es que permite comparar 2 distribuciones que no están expresadas en las mismas unidades. Desventaja: Deja de ser útil cuando la media tiende a cero. 242 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Ejemplo: Determinar el coeficiente de variación del siguiente cuadro de distribución: L1 - L2 YI nI Yi ² NiYi² niYi (Yi – X)² /Yi –x/ ni(Yi-x)² 45 - 55 50 4 2500 10000 200 384.16 -196 1536.64 55 - 65 60 12 3600 43200 720 92.16 -9.6 1105.92 65 - 75 70 20 4900 98000 1400 0.16 0.4 3.2 75 - 85 80 10 6400 64000 800 108.16 10.4 108.16 85 - 95 90 4 8100 32400 360 416.16 20.4 416.16 niYi²= niYi= ni(Yi-x)² = 247600 3480 5392 N =50 V = S * 100% X V = 10.38460399 * 100% V = 14.92040803% 69.6 243 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.3 VARIABLE NORMALIZADA O REFERENCIA TIPIFICADAS (Z) Las variables normalizada es aquella variable que mide las desvías de los puntos medios con respecto a su medio aritmético en unidades de desviación standard. _ _ Z = Yi – X Z = | Yi – X | S S S Las desviaciones de la medida vienen dadas en unidades de la desviación standard por lo que se dice también que están expresadas en unidades tipificadas o referencias tipificadas, variables que son de gran utilidad para la comparación de distribución. Ejercicio 1: 1.-En un examen final de Matemática Finanaciera la media aritmética fue 15 y la desviación standard fue 5 y en el examen de Estadística fue 13 y la desviación standard fue 4. La alumna Samuel León obtuvo 17 y 16 respectivamente de notas finales en ambas asignaturas ¿En qué asignatura obtuvo un puesto relativamente más alto? _ Matemática X =15 Nota: 17 Financiera S=5 Yi = 17 _ Z= Yi - X S Z = 17-15 Z = 0.40 5 244 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Nota:16 Yi = 16 Estadística X = 13 S=4 Z = Yi - X = 16 - 13 Z = 0.75 S 4 Luego ha obtenido una desviación standard de 0.40 y 0.75 por encima de la media , siendo por lo tanto su puntuación superior en estadística . Ejercicio 2: Hallar el área bajo la curva normal de los siguientes casos: a) Z = 0; Z = 1.2 0.3849 Área bajo la curva normal 0 . 3 8 4 9 -3 -2 -1 0 1 2 3 245 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS b) Z = -0.68; Z = 0 Por simetría -0.68 = 0.68 0.2518 Área bajo la curva normal 0 . 2 5 1 8 -3 -2 -1 0 1 2 3 c) Z = -0.46 ; Z = 2.21 Por simetría Z = -0.46 = Z = 2.21 = 0.4 Z = 0.46 Z = 0.46 = 0.1772 0.1772 + 0.4864 = 0.6636 Área bajo la curva normal 0 . 1 7 7 2 -3 -2 -1 0 0. 4 8 6 4 1 2 3 246 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS d) Z = 0.81 ; Z = 1.94 Z = 1.94 - Z = 0.91 Z = 0.81 = 0.2910 Z = 1.94 = 0.4738 0.4738 - 0.2910 0.1828 Área bajo la curva normal 0 . 2 9 1 0 -3 -2 -1 0 0. 1 8 2 8 1 2 3 e) Suponiendo que el ingreso mensual promedio de 10000 trabajadores es $ 500 y la desviación Standard es $ 100 : Si la distribución es normal. ¿Cuál es el número de trabajadores que tienen un ingresos mensual : 1.-Superior a $ 500 2.-Superior a $ 500 pero inferior a $ 600 3.- Inferior a $ 600 1.- Inferior a $ 500 _ Z = Yi – X = 500 – 500 = 0 = 0 S 100 100 10000(0.5) = 5000 2.- Superior a $ 500 pero inferior a $600 10000 (0.3413) =3413 3.- Superior a $ 600 _ Z = Yi – X = 600 – 500 = 100 = 1 S 100 100 10000 (0.1587) =1587 247 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 0.5 -3 200 0. 3 4 1 3 0.5 -0.3413 0.5 -0.3413 0.1587 -2 -1 0 1 2 3 300 400 500 600 700 800 f) Suponiendo que el ingreso mensual promedio de 10000 trabajadores es $ 400 y la desviación Standard es $ 100 : Si la distribución es normal. ¿Cuál es el número de trabajadores que tienen un ingresos mensual : 1.-Superior a $ 250 pero inferior a $ 500 2.- Inferior a $ 250 _ Z = Yi – X = 250 – 400 =-150 = -1.5 S 100 100 A (-1.5) = 0.4332 _ Z = Yi – X = 500 – 400 = 100 = 1 S 100 100 A (1) =0.3413 248 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS AREA ENTRE $250 Y $500 = A (-1.5) + A (1) 0.4332 + 0.3413 = 0.7745 AREA INFERIOR A $250 = A (1) - A(1.5) 0.5 – 0.4332 = 0.668 1.- Inferior a $ 250 10000(0.7745) Inferior a $ 250 = 5000 2.- Superior a $ 500 pero inferior a $600 10000 (0.6668) =6668 0.6668 -3 100 0 . 7 7 4 5 -2 -1 0 1 2 3 200 300 400 500 600 700 249 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.5 COVARIANZA (SXY) Esta medida conjunta es utilizada para determinar la relación que existe entre variables que han sido medidas en diferentes unidades. Ejercicio 1: La relación que existe la inversión de publicidad de la inversión del medicamento y la venta del mismo, la producción de papa por hectáreas (arrobas) y la lluvia (milímetros). Ingreso per cápita y la tabla de analfabetismo. Sxy = (Yi y")(Xix") " N1 250 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.6 RELACIONES EMPÍRICAS ENTRE LAS MEDIDAS DE DISPERSIÓN Para distribuciones moderadamente aritméticas se pueden obtener las siguientes relaciones empíricas entre las medidas de dispersión. 1. La desviación quartil es aproximadamente iguala 2/3 de la desviación estándar. D.Q = 2 (S) 3 2. La desviación media es igual a las 4/5 de la desviación estándar. D.M. D.M. =4 = (S) 4 (S) 5 5 251 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 3. La desviación quartil es aproximadamente iguala 2/3 de la desviación estándar. D.Q = 2 (S) 3 4. La desviación media es igual a las 4/5 de la desviación estándar. D.M. = 4 (S) 5 252 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.7 SESGO U OBLICUIDAD, KURTOSIS Y MOMENTOS 7.7.1.- SESGO U OBLICUIDAD Una distribución se considera sesgada si la media, la mediana y la moda no tienen el mismo valor. 1. X > Md > Mo = Sesgo positivo 2. X < Md < Mo = Sesgo negativo X = Md = Mo X Md Mo a) Sesgo Positivo o Sesgado a la derecha + X >Md > Mo Mo Md X 253 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS b) Sesgo Negativo o Sesgado a la izquierda - X < Md < Mo X Md Mo + - SESGO 254 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.7.2.- MEDIDAS DE SESGO a.- LOS COEFICIENTES DE SESGO DE KARL PEARSON.- Ha logrado relacionar medidas de dispersión y centralización y ha obtenido: - PRIMER COEFICIENTE DE SESGO DE KARL PEARSON : _ 1º CS kp = X – Mo S -SEGUNDO COEFICIENTE DE SESGO DE KARL PEARTSON : _ 2° CSkp = 3 ( X- Md ) S b. - COEFICIENTE DE SESGO CUARTILICO Y PERCENTÍLICO - COEFICIENTE DE SESGO CUARTÍLICO: CSq = (Q3 - Q2) - (Q2 - Q1) = Q3 - Q 1 Q3 - 2 Q2 + Q1 Q3 - Q1 255 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS - COEFICIENTE DE SESGO PERCENTÍLICO CSp = (P90 - P50) - (P50 - P10) = P90 - P10 7.7.3 P90 - 2P50 + P10 P90 - P10 COEFICIENTES DE SESGO EN FUNCIÓN A LOS MOMENTOS: Otra medida de sesgo viene dado por el momento del 3er orden con respecto a la x denominado también medida relativa de 3 órdenes: Csm a 3 m3 m3 m3 m3 3/ 2 2 2 3 S3 ( S ) m2 ( m2 ) 256 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.8 KURTOSIS Es el grado de apuntamiento o echamiento de una distribución relacionado comúnmente con la curva normal, campana de Gauss o distribución normal. 7.8.1 CLASES DE KURTOSIS 1. LEPTOCÚRTICA: Es aquello que presenta un apuntamiento relativamente alto literalmente Leptocúrtica significa curvatura puntiagudo. 2. MESOCÚRTICA: Es aquello que no es ni puntiagudo ni achatado y coincide generalmente con la curva normal. 3. PLATICÚRTICA: Es aquello que se presenta un achatamiento en la parte superior . LEPTOCÚRTICA MESOCÚRTICA PLATICÚRTICA 257 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.8.2 MEDIDAS DE KURTOSIS 1. COEFICIENTE DE KURTOSIS PERCENTÍLICO: Este coeficiente relaciona la desviación quartil con el espacio interpercentílico obteniéndose el siguiente coeficiente. CKp = D. Q. = 1/2 Q 3 - Q 1 = Q3 - Q1 P 90 - P 10 2(P 90 - P 10 ) P 90 - P 10 2. COEFICIENTE DE KURTOSIS EN FUNCIÓN DE LOS MOMENTOS: Está dado por una medida relativa de cuarto orden con respecto a la media y se determina mediante la siguiente relación. CKm = a 4 = m4 S4 = m4 ( S2 )4 = m4 ( m2)4 = m4 m22 m4 m4 CS m O4 2 4 m3 ( m2 ) 258 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.9 MOMENTOS (Mo) Tanto el sesgo como la Kurtasis se miden mejor utilizando los momentos que emplea el valor exacto de cada observación. Los momentos son 4 y a su vez pueden ser con respecto al origen y con respecto a la media. Se considera que los momentos son una síntesis de 4 capítulos anteriores al establecer las siguientes relaciones. _ m1 = X Medidas de centralización o promedio m2 =S² Medida de dispersión. m3 = Sesgo m4 = Kurtosis Fórmula General para los momentos: niur r Mr i N 259 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS _ m1 = ( ni u/n) i = m2 = ( ni n2 /N) i2 = S2 m3 = ( ni n3 /N) i3 = Sesgo m4 = ( ni n4 /N) i4 = Kurtosis niu M1 i N niu 3 3 M3 i N X niu 2 2 M2 i N niu 4 4 M4 i N COEFICIENTE DE KURTOSIS EN FUNCIÓN DE LOS MOMENTOS: Esta dado por una medida relativa de cuarto orden . CKm = A4 = m4 / 54 = m4 / ( 5² )4 = m4 / ( m² )4 = m4 /m²2 260 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.9.1 COMPROBACIÓN CHARLIER La comprobación Charlier en el cálculo de los momentos por el método clave hace uso de las propiedades de las identidades para la comprobación para el cálculo de medidas. ni ( u + 1) = niu + N ni ( u + 1)² = niu 2+ 3 niu 2 + niu + N ni ( u + 1)3 = niu 2+ 3 niu 2 + niu + N ni ( u + 1)4 = niu 4+ 4 niu 3 + 6 niu + 4 niu + N 7.9.2 RELACIÓN ENTRE LOS MOMENTOS. Entre momentos con respecto a la media y momentos con respecto a un punto cualquier se dan las siguientes relaciones: m2 = m2 - m1 2 m3 = m3 - 3m1 m2 + 2m13z m4 = m4 - 4m1 m3 + 6m12 m2 - 3m14 La relación entre los momentos es el paso previo a la corrección Sheppard para los momentos. 261 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.9.3 CORRECCIÓN SHEPPARD PARA LOS MOMENTOS Los momentos que necesitan corregirse son los momentos de 2 y 4 orden, esto implica que los momentos de 1 y 3 orden ya no necesitan corregirse. M2c = m2 – i 2 12 m4c = m4 - 1 i2 m2 + 7 i4 2 240 262 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS Ejercicio : Del siguiente cuadro de distribución de frecuencia determinar : 1. Las 4 primeros momentos. 2. La comprobación Charlier 3. La relación entre los momentos 4. La corrección Sheppard para los momentos L1 – L2 Yi ni µ µ² ni µ3 µ3 ni µ3 µ4 45 -55 50 4 -2 4 16 -8 -32 16 55- 65 60 12 -1 1 12 -1 -12 1 65 -75 70 20 0 0 0 0 0 0 75 -85 80 10 10 1 10 1 1 1 85 - 95 90 4 4 4 16 8 8 16 n = 50 niµ²=54 niµ3=-2 263 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 1. m1 = ( niu/N)i m1 = (-2 /50) 10 m1 = -0/4 m2 = ( niu2/N)i² m2 = (54 /50) 1002 m2 = 108 m3 = ( niu3/N)i3 m3 = (-2 /50) 1000 m3 = -40 m4 = ( niu4/N)i4 m4 = (150/50) 1000 m4 = 30000 2. ni(u + 1) = ni (u+N) 48 = -2 + 50 48 = 48 ni(u + 1) 2 = niu 2 + 2 niu + N 100 = 54 + 2(2) + N 100 = 58 + N N = 42 ni(u + 1) 3 = niu 3 + 3 niu² + 3 ni + u + N 204 = -2 + 3(54) + 3( -2) + N 204 = -2 + 162 - 6 + N 204 = 154 + N N = 48 ni(u + 1) 3 = niu 4 + 3 niu 3 + 6 ni² + 4ni + u + N 508 = 150 + 4(-2) + 6(54) + 4(-2) + N 508 = 150 - (-8) + 324 - 8 + N 508 = 458 + N N = 48 264 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 3.m2r m2r m2r m2r = = = = m2 - m12 108 - (-0.4)2 108 + 0.16 108.16 m3r m3r m3r m3r m3r = = = = = m 3 - 3m 1 m 2 + 2m 1 3 -40 -3(-0.4)(108) + 2(-0.4)3 -40 + 129.6 - 0.128 129.6 - 40.128 89.472 m4r m4r m4r m4r m4r = = = = = m 4 - 4m 1 m 2 + 6m 1 3 m 2 - 3m 1 4 30000 - 4(-0.4)(-40) + 6(-0.4)²(108) - 3(-0.4) 30000 - 64 + 103.68 - 0.0768 30103.68 - 64.0768 30039.6032 m2C m2C m2C m2C = = = = m² - i 2 107.84 -(100) 107.84 – 100/12 99.50666667 m4C m4C m4C m4C m4C = = = = = m 4 r - ½ i²m 2 r + 7/240 i 4 30039.6032 - ½(100)107.84 + 7/240(10 4 ) 30039.6032 -5392 + 0.029166666 x 10 4 30039.6032 -5392 + 291.666666 24939.26986 4.- 265 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS EJERCICIO: Del siguiente determinar lo siguiente. cuadro de distribu distribución ción de frecuencias, 1. La Varianza 2. La Desviación Standard 3. Variable Normalizada 4. Relación Empírica entre las medidas de dispersión 5. Los momentos 6. La Comprobación Charlier 7. Las relaciones entre los momentos 8. Corrección Sheppard 266 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 267 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 268 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 1.- Varianza S² = ni (Yi - x)² /N S² = 24724563.89 = 94573 S² = 261.4336427 2.- Desviación Estándar S = S = (Yi - x)² /N 261.4336427 S = 16.16890976 3.- Variable Normalizada Z = ni |Yi - x | S Z = 1507460.49 16.16890976 Z = 93232.043 269 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 4.- Relación Empírica entre las Medidas de Dispersión D.Q. = 2/3 (S) = 2/3 (16.16890976) = 10.77927317 D.M. = 4/5 (S) = 4/5 (16.16890976) = 12.93512781 5.- Relación entre los Momentos m 1 = (niu / N)i = (-30647 / 94573) 10 = -3.240565489 m 2 = (niu² / N)i² = (257177 / 94573) 100 = 271.9349074 m 3 = (niu 3 / N)i 3 = (-314645 / 94573) 1000 = -3327.006651 m 4 = (niu 4 / N)i 4 = (496525 / 94573) 10000 = 158240.1954 6.- Comprobación Charlier ni(u + 1) = ni (u+N) = -30467 + 94573 = 64106 ni(u + 1) 2 = niu 2 + 2niu + N= 211634 + (-60934) + 94573 = 245273 ni(u + 1) 3 = niu 3 + 3niu² + 3niu + N = (-314645) + 3(211634) + 3(-30467) + 94573 = 323249 270 UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ADMINISTRATIVAS 7.- Corrección Shepard para los Momentos m2r = m2 - m12 m 2 r = 223.7784569 - (-3.240565489)² m 2 r = 213.2771922 m 3 r = m 3 - 3m 1 m 2 + 2m 1 3 m 3 r = -3327.006651 -(-2715.506234) + (-68.06007188) 3 m 3 r = -1219.560489 m 4 r = m 4 - 4m 1 m 2 + 6m 1 3 m 2 - 3m 1 4 m 4 r =158240 - 1954 - 43125.53174 + 14099.74084 - 330.8296802 m 4 r = 128883.5748 271