UNIVERSIDAD NACIONAL DEL ALTIPLANO FACULTAD DE INGENIERÍA AGRÍCOLA ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN PROBLEMAS RESUELTOS POR: EDUARDO FLORES CONDORI EDUARDO LUIS FLORES QUISPE PUNO – PERÚ 2011 SUMATORIA Al presentarse la suma de una secuencia numérica, en donde destaquemos cierta secuencia u orden en los sumandos que se van a sumar, podemos esa suma abreviarla bajo un signo, el que denominaremos sumatoria. n Tenemos por lo tanto que la sumatoria, ∑ak k m es una forma de expresar la = suma de los términos de una sucesión, términos que se obtienen dando a la variable k valores enteros comprendidos entre dos límites escritos en la parte superior del símbolo ∑ de sumatoria Identificación, Valor donde termina la sumatoria n Signo sumatoria ∑x i =1 Exprese las siguientes sumas mediante el símbolo sumatoria. a) S=12 + 22 + 32 + 42 + .... + n2 b) S= 1.2 + 2.3 + 3.4 + ..... + n(n+1) c) d) d) 1 2 3 n + 2 + 3 + ... + n 2 2 2 2 1 2 3 n S = + 2 + 3 + ... + n 2 2 2 2 3 2 4 S = 1 + 2 + 3 + .... + n +1 n S= Término a sumar i Valor por el cual comienza la suma Ejemplos: 5 ∑ xi i =1 n ∑ xi i =1 = x1 + x 2 + x3 + x 4 + x5 =x1 + x 2 + x3 + x 4 + ..... + x n SUMATORIA-PROPIEDADES 1. La sumatoria de la suma de dos o más términos, es igual a la suma de las sumatorias separadas de los términos. n n n i =1 i =1 i =1 ∑ ( xi + y i ) = ∑ x i + ∑ y i 2. La sumatoria de la diferencia de dos o más términos es igual a la diferencia de las sumatorias separadas de los términos. n n n i =1 i =1 i =1 ∑ ( xi − y i ) = ∑ xi − ∑ y i 3. La sumatoria de una constante multiplicada por una variable es igual a la constante multiplicada por la sumatoria de la variable. n n i =1 i =1 ∑ a.xi = a.∑ xi 4. La sumatoria de una constante es igual a la constante multiplicada por el número que indique los límites de la sumatoria. n ∑ a = n.a x =1 En la práctica frecuentemente se comenten algunos errores, los cuales los cuales mencionaremos para que no se incurra en ellos. n x = ∑ x ∑ i =1 i =1 n 2 2 Es falso el tomar a Otro error se comete es decir que ya que son valores completamente diferentes n n n i =1 i =1 i =1 ∑ xi yi = ∑ xi .∑ yi ya que son términos diferentes. EJERCICIOS. 1.—Escribe los términos de cada una de las siguientes sumatorias. 4 n 5 a )∑ ( X i + 2) c )∑ U i (U i + 6 ) b )∑ f i X i2 i =1 i =1 d ) ∑ (YK2 − 4 ) N i =1 4 e )∑ 4 X iYi K =1 i =1 2.-- Dadas dos variables X e Y toman los valores X1= 2, X2= -5, X3= 4, X4= -8 y Y1= -3, Y2=-8, Y3=10, Y4= 6. Calcula : 4 4 a )∑ X i i =1 4 b)∑Y i i =1 4 4 i =1 i =1 n 4 h)∑ ( X i + Y i ) ( X i −Yi ) g)∑ X i .Y i 2 i =1 i =1 6 ∑ X i = −4 y Xi ∑ i i =1 6 e)∑Y i 2 i =1 6 3.—Si 4 d)∑ X i2 i =1 f ) ∑ X i . ∑Yi i =1 4 c)∑ X iYi 2 6 a )∑ (2X i + 3) Halle: 6 b)∑ X i ( X i − 1) i =1 = 10 , =1 c)∑ (X i − 5)2 i =1 i =1 4.—Dos variables U y V toman los valores U1= 3, U2= -2, U3= 5 y V1= -4, V2= -1, V3= 6, respectivamente. Calcule: 3 3 b)∑ ( Ui +3 )(V i − 4 ) a )∑ U iV i i =1 e )∑ U iV i 2 i =1 n f)∑ (U i2 − 2V i 2 + 2) i =1 4 ∑Xi = 7 i =1 4 4 4 ∑Yi = −3 2 2 i =1 3 5.—Dado 3 n c)∑V i d) ∑ U i ∑V i i =1 i =1 i =1 n U g)∑ i Vi i=1 3 y i =1 X iY i ∑ i = 5 Halle: =1 4 b)∑ ( X i − 3)( 2Y i + 1) a )∑ (2 X i + 5Y i ) i =1 i =1 6.-- Desarrolle las siguientes sumatorias. 4 a )∑ xi = i =1 3 5 b) ∑ f i .xi = c )∑ x 2 = i =1 x =1 3 d )∑ 3i = i =1 3 e ) ∑ m( x − y ) = m =1 f )∑ (x j + y j ) = 3 j j =1 g )∑ f i ( xi − 20 ) = h)∑ (2 xi + 4 ) = i )∑ 5 x i = j )∑ (2 xi + y i − 6 z i ) = k )∑ (Ay j + j ) = 3 i =1 2 7 4 2 2 i =1 i =0 i =1 j =1 SUMATORIA----EJERCICIOS Desarrolle las siguientes sumatorias a) ∑ k 12 b) ∑ K =1 k n) ∑ k (− 1) i ) ∑ (k + 4 )(k − 1) ñ) ∑ (20 − 2k )(− 1) 5 k =3 k =0 4 h) ∑ (k − 1)(k + 2 ) 8 5 k −1 k k =0 9 5 k k =0 k = −1 4 c) ∑ (2k − 4 ) j ) ∑ (k + 3)(k − 4 ) o) ∑ (k + 3)(− 1) d ) ∑ (2k + 1) k ) ∑ (k 3 − k ) p ) ∑ (k + 5) e) ∑ (5 − k ) l ) ∑ (k + 3k − 7 ) q )∑ (k + 1) ll ) ∑ (3k 3 + 5k 2 + k − 3) r ) ∑ (k 2 − 7 ) 6 7 k =0 k = −3 k = −3 4 k n 2 n +3 2 3k + 1 f )∑ 2 k =0 6 k =4 k = −3 n −1 3k − 5k + 9 m) ∑ 2k − 1 k = −2 g ) ∑ (k + 3) k = −3 s ) ∑ (2k + 3) 2 3 2 3 k =1 k = −1 k =2 4 4 5 3 5 k = −2 k = −2 k =3 k 2 k = −2 Desarrolle las siguientes sumatorias a ) ∑ (K + 1) N 2 K =0 n b) ∑ e − kx Senkx = k =2 (−1) k −1 e kx = e) ∑ 1+ k 4 k =0 n m i )∑ k k 4 + Sen k =1 c) ∑ (2 − 3k ) = 5 k =0 f ) ∑ Lg (k + 1) = kπ = 2 2 2 k = −2 3 kπ j ) ∑ Sen 2 = k =0 4 2 d )∑ (2 + 3k ) k ( − 1) = g )∑ k =1 k (k + 1) n n k )∑ k 3 = k =1 6 k −4 k =1 k ( − 1) (k + 2 ) = h) ∑ k k =1 k (k + 1)2 n +1 (k + 3)(k + 4 ) l) ∑ 1+ k 2 n k = −2 1 = k =3 (2k + 1)(2k − 1) m ll ) ∑ HOJA DE EJERCICIOS Nº 1 1. El valor de dos (2) variables X e Y, de una población es de 50 y 70 respectivamente. i. ¿Cuál es la razón entre X e Y? ii. ¿Cuál es la proporción de cada variable? iii. ¿Cuál es el porcentaje de cada variable? 2. En una población de 240 datos y de dos variables X e Y el porcentaje de X [P(X) ] es de 35%. i. ¿Cuál es valor de cada variable? ii. ¿Cuál es la proporción de cada variable? iii. ¿Cuál es la razón entre X e Y? 3. En una población de tres (3) variables X, Y y Z el valor de cada una de ellas es: 40 y 80 respectivamente. i. Halle la razón entre X e Y; entre Z y X y entre Y y Z. ii. Halle la proporción de cada variable. iii. Halle el porcentaje de cada variable. 60, 4. En una población de cinco (5) variables el valor de cada una de ellas es: X1 = 150; X2 = 200; X3 = 180; X4 = 160 y X5 = 300. i. Calcule la razón entre: X3 y X1; X4 y X2 y X5 y X1 ii. Verificar que la suma de las proporciones es igual a uno (1) iii. Calcule el porcentaje de cada variable. 5. En una población de dos (2) variables X e Y la razón entre X e Y es de 5 a 3 y el total de ellas es 240. i. Halle el valor de cada variable. ii. Calcule la proporción de cada variable. iii. Calcule el porcentaje de cada variable. 6. En una población de tres (3) variables X, Y y Z, la razón entre X y Z es de 5 a 9 y la proporción de Y es 0,3, sí el total de la población es de 720. i. ¿Cuál es el valor de cada variable? ii. Halle la razón entre X e Y, entre Z e Y. iii. ¿Cuál es la proporción de cada variable? iv. ¿Cuál es el porcentaje de cada variable? 7. Dada la siguiente tabla i 1 2 3 4 5 6 7 8 Xi 3 5 7 8 0 9 1 4 Yi 5 7 2 9 3 0 6 3 8. Hallar el valor de las siguientes sumatorias: 8 ∑( X b) 4 ∑( 3X a) i ∑ ( 2. X e) i − Yi ) 6 ∑ f ) ∑( X j) 2 6 ∑ i =3 ( 2. X i + 4 ) 5 c ) X i .Yi i =2 ∑ ∑X i +1 − Yi −1 ) i +1 7 ∑( X k) i =4 i =2 9. Expresar en forma de sumatoria las siguientes expresiones: ∑( X d) i −1 − Yi+1 )2 2 i − Yi 2 ) i =3 4 7 g) 7 2 i =2 7 i =2 ∑ ( X i2 + Y3 )2 i =2 +4) 8 i ) ( X i + Yi 2 ) i =2 − Yi ) i =1 i =1 6 i ∑X h) i =1 2 i +3 a ) x1 + x2 + x3 + x3 b )x1 + x2 + x3 + x4 + x5 2 c )(cx3 + y0 ) + (cx4 + y0 ) + (cx5 + y0 ) X = 10. Sabiendo que: 2 n i Y= y n ∑Y i i =1 . Demostrar que: n n n ∑( X A) i − X ),( Yi − Y ) = i =1 n ∑ X .Y − i 2 i i =1 n Yi n = Yi − i =1 n i =1 i =1 ( ) ) =∑ − X =0 ∑ (X i − X 0 ) − n. X − X 0 = 0 2 n 2 ) ∑ (Y − Y ) n i F) i =1 n−1 1 n 2 1 = Yi − n − 1 i =1 n ∑ ∑ Yi 2 i i =1 n ∑ i i =1 E) i n Xi X i − i =1 n ∑ (X D) i =1 ∑ i −X i =1 n i 2 ∑ (X n C) n ∑ X .∑ Y i =1 ∑ (Y − Y ) ∑ n B) 2 2 f )( x2 + x2 + x2 + x2 + x2 ) + 6 n i =i 2 d )x2 + x3 + x4 + x5 + x6 + 5 e )(4 x3 + 7 ) + (4 x3 + 7 ) + (4 x3 + 7 ) + (4 x3 + 7 ) ∑X 2 PROBLEMAS DE APLICACIÓN (APLICACIONES: EXCEL SAS Y MINITAB) 1. Dada la serie histórica de descargas medias (m3/s) del rio Huancané, para el periodo 19592008. Calcule las frecuencias absolutas, relativa, acumulada, función de densidad y función acumulada. año Q=m3/s año Q=m3/s año Q=m3/s año Q=m3/s año Q=m3/s 1959 1960 1961 1962 1963 1964 1965 1966 1967 25.00 20,00 13,00 26,00 29,00 22,00 29,00 20,00 19,00 1969 1970 1971 1972 1973 1974 1975 1976 1977 17,00 11,00 14,00 28,00 28,00 21,00 16,00 7,00 28,00 1979 1980 1981 1982 1983 1984 1985 1986 1987 24,00 21,00 18,00 20,00 19,00 17,00 21,00 17,00 21,00 1989 1990 1991 1992 1993 1994 1995 1996 1997 19,00 29,00 24,00 23,00 24,00 15,00 27,00 19,00 26,00 1999 2000 2001 2002 2003 2004 2005 2006 2007 23,00 10,00 14,00 23,00 21,00 27,00 27,00 28,00 26,00 9,00 1988 8,00 1998 23,00 2008 19,00 o 4 2 4 12 10 8 10 50 frec. Relat. 0.08 0.04 0.08 0.24 0.2 0.16 0.2 1 1968 26,00 1978 Solución problema 1 Número de intervalos de clase m= 7 min = 7 max = 29 Ancho = 3 m xi <=xi+1 1 7 10 2 10 13 3 13 16 4 16 20 5 20 23 6 23 26 7 26 29 Total = frec. Re. Acu. 0.08 0.12 0.2 0.44 0.64 0.8 1 Histograma de frecuencia absoluta 14 12 12 Frecuencia absoluta 10 10 10 8 8 6 4 4 4 2 2 0 1 2 3 4 5 6 7 Intervalo de clase Histograma de frecuencia relativa 0.3 0.24 Frecuencia relativa 0.25 0.2 0.2 0.2 0.16 0.15 0.1 0.08 0.08 0.04 0.05 0 1 2 3 4 5 6 7 Intervalo de clase Histograma de frecuencia relativa acumulada 1.2 Frecuencia relativa acumulada 1 1 0.8 0.8 0.64 0.6 0.44 0.4 0.2 0.2 0.08 0.12 0 1 2 3 4 Intervalo de clase 5 6 7 2. Dado los datos de precipitación anual, en mm. De la Estación Ayaviri, para el periodo 19592008. Calcular su media, varianza, desviación estándar, coeficiente de variación, coeficiente de sesgo y coeficiente de curtosis. año 1959 1960 1961 1962 1963 1964 1965 1966 1967 pp (mm) 650.00 752,00 536,00 777,00 127,00 505,00 499,00 552,00 701,00 año 1969 1970 1971 1972 1973 1974 1975 1976 1977 pp (mm) 158,00 81,00 793,00 635,00 279,00 251,00 354,00 494,00 770,00 año 1979 1980 1981 1982 1983 1984 1985 1986 1987 pp (mm) 139,00 686,00 531,00 105,00 369,00 519,00 515,00 316,00 79,00 año 1989 1990 1991 1992 1993 1994 1995 1996 1997 pp (mm) 155,00 601,00 149,00 485,00 193,00 724,00 404,00 514,00 608,00 1968 156,00 1978 726,00 1988 211,00 1998 75,00 año 1999 2000 2001 2002 2003 2004 2005 2006 2007 pp (mm) 239,00 512,00 97,00 370,00 545,00 751,00 460,00 798,00 124,00 2008 416,00 Solución problema 2 Media Varianza Desvest CV Coef Sesgo Curtosis 429.72 54181.88 232.77 54.17 -0.06 -1.29 3. Los gastos máximos anuales registrados en la estación hidrométrica Las Perlas en el Coatzacoalas se muestran en la tabla siguiente: a) ¿Cuál es la probabilidad de que, en un año cualquiera, el gasto sea mayor o igual a 7500 m3/s? b) Se planea construir cerca de este sitio un bordo para protección contra inundaciones. ¿Cual debe ser el gasto de diseño si se desea que el periodo de retorno sea de 60 años? Supóngase que los datos de la tabla siguen una distribución normal. Resolver usando las funciones de distribución: Distribución Lognormal Distribución Pearson III o Gamma de tres parámetros, y Distribución Gumbel año 1954 1955 1956 1957 1958 m3/s 2500 3220 2246 1804 2737 año 1959 1960 1961 1962 1963 m3/s 2070 3682 4240 2367 7061 año 1964 1965 1966 1967 1968 m3/s 2489 2350 3706 2675 6267 año 1969 1970 1971 1972 1973 m3/s 5971 4744 6000 4060 6900 año 1974 1975 1976 1977 1978 m3/s 5565 3130 2414 1796 7430 Solución a) Distribución Normal Media Desvest x Z F(x)=P(X<7500)= P(X>7500) P(X>x) P(X<x) F(z) z= x (gasto de diseño m3/s) = 3886.16 1825.91 7500 1.9792 0.9761 0.0239 0.0167 0.9833 0.9833 2.1280 7771.7717 b) Distribución Lognormal P(X>x) P(X<x) F(z) z= ln(x) = x= 0.0167 0.9833 0.9833 2.1280 9.1221 9155.0451 Gamma bheta1 alpha1 delta1 P(X>x) gl 2y y x 0.6778 8.7057 618.8364 -1501.2647 0.0167 17 31.6415 15.8208 8289.2060 alpha beta T x 0.00059773 2997.96706 60 9833.7448 Distribución Pearson III Distribución Gumbel 4. Dada la serie histórica de descargas medias (m3/s) del rio Huancané, para el periodo 19592008. Realizar las pruebas de bondad de ajustes de Chi-cuadrado (X2 ) y SmirnovKolmogorov, para ver si se ajustan a una distribución normal. AÑO Q=m3/s AÑO Q=m3/s AÑO Q=m3/s AÑO Q=m3/s AÑO Q=m3/s 1959 1960 1961 1962 1963 1964 1965 1966 1967 28.00 21,00 13,00 28,00 29,00 23,00 29,00 20,00 19,00 1968 26,00 1969 1970 1971 1972 1973 1974 1975 1976 1977 17,00 11,00 14,00 28,00 28,00 21,00 16,00 7,00 28,00 1978 9,00 1979 1980 1981 1982 1983 1984 1985 1986 1987 24,00 21,00 18,00 20,00 19,00 16,00 21,00 7,00 21,00 1988 8,00 1989 1990 1991 1992 1993 1994 1995 1996 1997 14,00 29,00 24,00 23,00 24,00 15,00 27,00 19,00 26,00 1998 23,00 1999 2000 2001 2002 2003 2004 2005 2006 2007 23,00 10,00 14,00 23,00 25,00 27,00 17,00 28,00 26,00 2008 16,00 5. Se desea saber si en una cierta región el gasto máximo medio anual, el área de la cuenca y la altura media de precipitación máxima en 24 horas se pueden correlacionar linealmente, y que tan bueno es el ajuste. Los datos se presentan en la tabla siguiente: Estación Meteorológic a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y=gasto máx. medio anual 102 m3/s 45.2 9.1 48.3 35.8 74.9 26.7 12.1 6.8 69.7 57.0 33.7 71.4 88.2 26.6 16.0 X1=área de la cuenca, 103 km2 1.23 5.25 8.55 7.99 7.36 5.78 5.98 8.11 2.23 6.77 7.02 3.04 6.78 1.23 2.22 Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones X2=altura media de pp. máx. En 24 h. cm 2.9 1.8 2.2 1.1 3.9 2.7 2.5 2.3 2.8 1.1 2.1 3.9 3.2 3.3 2.7 0.4618 0.2132 0.0821 25.0735 15.0000 F. de V. Regresión Residuos Total Intercepción Variable X 1 Variable X 2 GL 2 12 14 SC 2044.4866 7544.1667 9588.6533 Coeficientes -11.5288 2.2847 15.9144 CM 1022.243 628.6806 Error típico 32.9915 2.8637 8.8250 Fc 1.6260 Estadístico t -0.3494 0.7978 1.8033 Y = - 11.5288 + 2.2847 X1 + 15.9144 X2 PROGRAMA DE SAS 9.2 data regresion; input X1 X2 Y; CARDS; 1.23 2.9 45.2 5.25 1.8 9.1 8.55 2.2 48.3 7.99 1.1 35.8 7.36 3.9 74.9 5.78 2.7 26.7 5.98 2.5 12.1 8.11 2.3 6.8 2.23 2.8 69.7 6.77 1.1 57 7.02 2.1 33.7 3.04 3.9 71.4 6.78 3.2 88.2 1.23 3.3 26.6 2.22 2.7 16 PROC PRINT; PROC REG; MODEL Y=X1 X2; PROC GLM; PROC PLOT; RUN; Obs 1 2 3 4 5 6 7 X1 1.23 5.25 8.55 7.99 7.36 5.78 5.98 X2 2.9 1.8 2.2 1.1 3.9 2.7 2.5 Y 45.2 9.1 48.3 35.8 74.9 26.7 12.1 Valor crít de F 0.2372 Probabilidad 0.7328 0.4405 0.0965 8 9 10 11 12 13 14 15 8.11 2.3 6.8 2.23 2.8 69.7 6.77 1.1 57.0 7.02 2.1 33.7 3.04 3.9 71.4 6.78 3.2 88.2 1.23 3.3 26.6 2.22 2.7 16.0 The REG Procedure Model: MODEL1 Dependent Variable: Y Analysis of Variance Source Model Error Corrected Total Sum of Squares 2044.48663 7544.16670 9588.65333 DF 2 12 14 Mean Square 1022.24332 628.68056 F Value 1.63 Root MSE Dependent Mean Coeff Var 25.07350 R-Square 41.43333 Adj R-Sq 60.51529 Parameter Estimates Parameter Standard Variable Intercept X1 X2 DF 1 1 1 Estimate -11.52882 2.28473 15.91441 Error 32.99154 2.86373 8.82500 t Value -0.35 0.80 1.80 Pr > F 0.2372 0.2132 0.0821 Pr > |t| 0.7328 0.4405 0.0965 Y = - 11.5288 + 2.2847 X1 + 15.9144 X2 6. Se realizaron siete (07) pruebas de la resistencia a la compresión en cuatro muestras de concreto. La fuerza que fractura cada muestra de forma cilíndrica, medida en kilogramos, está dada en la siguiente tabla: Muestras Pruebas m1 m2 m3 m4 Prueba 1 45 42 43 48 Prueba 2 90 100 102 104 Prueba 3 40 45 56 58 Prueba 4 89 25 98 25 Prueba 5 105 125 87 103 Prueba 6 111 121 120 109 Prueba 7 80 85 86 88 Pruebe con un nivel de significancia de 0.01 si estas muestras son diferentes en su resistencia a la compresión, y efectuar la prueba de rango múltiple de Duncan a la probabilidad de 0.01. SOLUCIONARIO MANUAL 1) Hipótesis H0: µ i=0 Ha:µ i≠ 0 2) Nivel de significación α = 0.05 y 0.01 3) Estadística de Prueba Fc=(CMtratam/CMerror) 4) Regla de decisión Si Fc ≤ F0.05, no se rechaza la Ho. Se representa (NS) Si F0.05< Fc < F0.01, se rechaza la H0, representando con un asterisco (*) Si Fc > F0.01; se rechaza la H0, representándose por dos asteriscos (**) 5) Cálculos .. = = × a) "..# × = × 177603.571 b) = ∑ ∑ − = $45' + ⋯ + $88' −177603.571 = 202998.000 − 177603.571 = 25394.42857 c) . = ∑ 23 . .. − × = $34' 5⋯5$6' − = 36. 47 . d) = ∑ 3 ∑83 8 − = 76. 47 −19424.42857 =5970.0000 6) Análisis de varianza Cuadro 44. Análisis de varianza de los resultados F.de V. Pruebas Error Total GL SC CM Fc 19424.42857 3237.40476 11.3878559 5970.00000 284.285714 25394.42857 6 21 27 Ft 2.57 Pr>F 1.109E-05 Niv. Sig. ** C.V. = 21.1705 % SOLUCIONARIO CON EL PAQUETE DEL SISTEMA PARA EL ANALISIS ESTADISTICO data trabajo; input x$ y@@; datalines; p1 45 p1 42 p1 43 p148 p2 p2 p2 p2 90 100 102 104 p3 p3 p3 p3 40 45 56 58 p4 p4 p4 p4 89 25 98 25 p5 p5 p5 p5 105 125 87 103 p6 p6 p6 p6 proc print; proc anova; class x; model y=x; means x/duncan alpha=0.01; run; RESULTADOS UTILIZANDO EL SAS Obs 1 2 3 4 x p1 p2 p3 p4 y 45 90 40 89 111 121 120 109 p7 p7 p7 p7 80 85 86 88 Class x 5 p5 105 6 p6 111 7 p7 80 8 p1 42 9 p2 100 10 p3 45 11 p4 25 12 p5 125 13 p6 121 14 p7 85 15 p1 43 16 p2 102 17 p3 56 18 p4 98 19 p5 87 20 p6 120 21 p7 86 22 p1 48 23 p2 104 24 p3 58 25 p4 25 26 p5 103 27 p6 109 28 p7 88 The ANOVA Procedure Class Level Information Levels Values 7 p1 p2 p3 p4 p5 p6 p7 Number of observations 28 The ANOVA Procedure Dependent Variable: y Source Model Error Corrected Total DF 6 21 27 Sum of Squares Mean Square 19424.42857 3237.40476 5970.00000 284.28571 25394.42857 F Value 11.39 Pr > F <.0001 R-Square 0.764909 DF 6 Coeff Var Root MSE y Mean 21.17048 16.86077 79.64286 Source Anova SS Mean Square F Value Pr > F x 19424.42857 3237.40476 11.39 <.0001 The ANOVA Procedure Duncan's Multiple Range Test for y NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 284.2857 Number of Means 2 3 4 5 6 Critical Range 33.76 35.21 36.17 36.87 37.41 Means with the same letter are not significantly different. Duncan Grouping Mean N x A 115.25 4 p6 A 105.00 4 p5 A 99.00 4 p2 B A 84.75 4 p7 B C 59.25 4 p4 B C 49.75 4 p3 C 44.50 4 p1 7 37.85 7. Se diseñó un experimento para estudiar el rendimiento de seis (06) detergentes diferentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especialmente diseñado para 24 cargas de lavado distribuidas en cuatro (04) modelos de lavadoras: Detergente Lavad 1 Lavad 2 Lavad 3 Lavad 4 Detergente A 100 102 101 104 Detergente B 25 46 52 55 Detergente C 45 58 62 66 Detergente D 47 50 63 65 Detergente E 49 54 68 67 Detergente F 99 95 98 99 Considerando los detergentes como tratamientos y las lavadoras como bloques, efectuar el análisis de variancia y su prueba con un nivel de significación de 0.05 si existen diferencias entre los detergentes y entre las lavadoras. Además, efectuar la prueba de Rango Múltiple de Tukey a la probabilidad de 0.05. Cuadro 45. Análisis de varianza F. de V. bloque tratamiento error total GL 3 5 15 23 SC CM Fc 849.5000 283.166667 8.78490176 11506.8333 2301.36667 71.3971044 483.5000 32.2333333 12839.8333 Ft Sig SOLUCIONARIO UTILIZANDO EL SISTEMA PARA ANALISIS ESTADISTICO (SAS) RESULTADO UTILIZANDO EL SAS data detergente; input lavadoras detergente rdto; cards; 1 1 100 1 2 25 1 3 45 1 4 47 1 5 49 1 6 99 2 1 102 2 2 46 2 3 58 2 4 50 2 5 54 2 6 95 3 1 101 3 2 52 3 3 62 3 4 63 3 5 68 3 6 98 4 1 104 4 2 55 4 3 66 4 4 65 4 5 67 4 6 99 proc print; proc anova; class lavadoras detergente; model rdto= lavadoras detergente; means detergente/tukey alpha =0.05; run; Obs lavadoras detergente rdto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 1 1 100 1 2 25 1 3 45 1 4 47 1 5 49 1 6 99 2 1 102 2 2 46 2 3 58 2 4 50 2 5 54 2 6 95 3 1 101 3 2 52 3 3 62 3 4 63 3 5 68 3 6 98 4 1 104 4 2 55 4 3 66 4 4 65 4 5 67 4 6 99 The ANOVA Procedure Class Level Information Class Levels Values lavadoras 4 1 2 3 4 detergente 6 1 2 3 4 5 6 Number of observations 24 The ANOVA Procedure Dependent Variable: rdto Source Model Error Corrected Total Source lavadoras detergente DF 8 15 23 R-Square 0.962344 DF 3 5 Sum of Squares Mean Square F Value 12356.33333 1544.54167 47.92 483.50000 32.23333 12839.83333 Coeff Var Root MSE rdto Mean 8.159196 5.677441 69.58333 Anova SS Mean Square F Value 849.50000 283.16667 8.78 11506.83333 2301.36667 71.40 Pr > F <.0001 Pr > F 0.0013 <.0001 Tukey's Studentized Range (HSD) Test for rdto NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 32.23333 Critical Value of Studentized Range 4.59474 Minimum Significant Difference 13.043 Means with the same letter are not significantly different. Tukey Grouping Mean N detergente A 101.750 4 1 A 97.750 4 6 B 59.500 4 5 B 57.750 4 3 C B 56.250 4 4 C 44.500 4 2 8. Evaluar el sistema de riego por exudación utilizando cuatro variedades de melón, bajo modalidad de siembra, SIMPLE HILERA. Se desea probar el comportamiento de tres variedades híbridas de melón y uno estándar: V1 : Híbrido Mission V3 : Híbrido Topfligth. V2 : Híbrido Mark. V4 : Híbrido Hales Best Jumbo. Hipótesis : Ho : Efecto de variedades de melón en estudio es nulo. H1 : Al menos dos variedades tienen efectos distintos. Datos: Rendimiento en Kg. por parcela. C1 C2 C3 C4 F1 36V1 50 V2 43 V3 35 V4 F2 29 V4 53 V3 41 V2 63 V1 F3 37 V2 41 V4 41 V1 63 V3 F4 38 V3 40 V1 35 V4 41 V2 F. de V. Hilera Columna Tratamiento Error Total GL 3 3 3 6 15 SC CM 170.75 56.92 552.75 184.25 430.25 143.417 254.0000 42.3333 1407.7500 Fc 1.3445 4.3524 3.3878 Ft sig. SOLUCIONARIO APLICANDO EL SAS DISEÑO DE CUADRADO LATINO DATA OCHO; INPUT FILA COLUMNA TRAT $ RDTO; CARDS; 1 1 V1 36 1 2 V2 50 1 3 V3 43 1 4 V4 35 2 1 V4 29 2 2 V3 53 2 3 V2 41 2 4 V1 63 3 1 V2 37 3 2 V4 41 3 3 V1 41 3 4 V3 63 4 1 V3 38 4 2 V1 40 4 3 V4 35 4 4 V2 41 PROC PRINT; PROC ANOVA; CLASS FILA COLUMNA TRAT; MODEL RDTO= FILA COLUMNA TRAT; MEANS FILA COLUMNA TRAT/DUNCAN; RUN; RESULTADOS UTILIZANDO EL SAS Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 FILA COLUMNA TRAT RDTO 1 1 V1 36 1 2 V2 50 1 3 V3 43 1 4 V4 35 2 1 V4 29 2 2 V3 53 2 3 V2 41 2 4 V1 63 3 1 V2 37 3 2 V4 41 3 3 V1 41 3 4 V3 63 4 1 V3 38 4 2 V1 40 4 3 V4 35 4 4 V2 41 The ANOVA Procedure Class Level Information Class Levels Values FILA 4 1 2 3 4 COLUMNA 4 1 2 3 4 TRAT 4 V1 V2 V3 V4 Number of observations 16 The ANOVA Procedure Dependent Variable: RDTO Source Model Error Corrected Total DF 9 6 15 Sum of Squares Mean Square 1153.750000 128.194444 254.000000 42.333333 1407.750000 F Value 3.03 Pr > F 0.0954 R-Square 0.819570 Source FILA COLUMNA TRAT DF 3 3 3 Coeff Var 15.17529 Anova SS 170.7500000 552.7500000 430.2500000 Root MSE 6.506407 Mean Square 56.9166667 184.2500000 143.4166667 RDTO Mean 42.87500 F Value 1.34 4.35 3.39 Pr > F 0.3456 0.0596 0.0949 Duncan's Multiple Range Test for RDTO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 42.33333 Number of Means 2 3 4 Critical Range 11.26 11.67 11.87 Means with the same letter are not significantly different. Duncan Grouping Mean N FILA A 46.500 4 2 A 45.500 4 3 A 41.000 4 1 A 38.500 4 4 The ANOVA Procedure Duncan's Multiple Range Test for RDTO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 42.33333 Number of Means 2 3 4 Critical Range 11.26 11.67 11.87 Means with the same letter are not significantly different. Duncan Grouping Mean N COLUMNA A 50.500 4 4 B A 46.000 4 2 B A 40.000 4 3 B 35.000 4 1 The ANOVA Procedure Duncan's Multiple Range Test for RDTO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 42.33333 Number of Means 2 3 4 Critical Range 11.26 11.67 11.87 Means with the same letter are not significantly different. Duncan Grouping Mean N TRAT A 49.250 4 V3 B A 45.000 4 V1 B A 42.250 4 V2 B 35.000 4 V4 9. Supóngase que se efectúan dos repeticiones del experimento de soldadura, empleando el cuadrado latino, los resultados que señalan el número de libras fuerza de tensión requerida para separar los puntos soldados, fueron como se indica a continuación: REPETICIÓN I Fundentes F1 F2 F3 F4 A 20.0 B 17.5 C 14.0 D 14.0 D 24.0 A 21.0 B 18.0 C 14.1 C 12.0 D 18.0 A 23.0 B 19.0 B 20.0 C 15.0 D 13.0 A 22.0 REPETICIÓN II Fundentes F1 F2 F3 F4 C 12.0 D 10.0 A 24.2 B 22.1 B 19.5 C 13.0 D 10.5 A 22.3 A 23.5 B 17.2 C 20.4 D 14.0 D 11.0 A 22.2 B 20.5 C 14.5 Analice el experimento como un cuadrado latino y pruébese con un nivel de significancia de 0.05 si existen diferencias en los métodos (A, B, C y D), en los operadores (filas), los fundentes (columnas) y, entre las producciones. Utilizar la prueba de rango múltiple de Tukey α = 0.01, si es que es significativo. F. de V. Pr > F GL SC CM Fc Sig repetición 1 1.8528125 1.8528 0.181683 NS 0.6742 hilera 3 12.1609375 4.0536 0.3974922 NS 0.7562 columna 3 7.2009375 2.4003 0.2353697 NS 0.8707 tratamiento error Total 3 21 31 365.545937 214.159062 600.919688 121.85 10.198 11.948229 ** SOLUCIONARIO MEDIANTE EL SAS data fundente; input repet hilera columna trat$ cards; 1 1 1 1 1 1 1 1 1 2 1 2 1 2 1 2 1 2 3 4 1 2 3 4 A B C D D A B C 20 17.5 14 14 24 21 18 14.1 rdto; 0.0001 1 3 1 C 12 1 3 2 D 18 1 3 3 A 23 1 3 4 B 19 1 4 1 B 20 1 4 2 C 15 1 4 3 D 13 1 4 4 A 22 2 1 1 C 12 2 1 2 D 10 2 1 3 A 24.2 2 1 4 B 22.1 2 2 1 B 19.5 2 2 2 C 13 2 2 3 D 10.5 2 2 4 A 22.3 2 3 1 A 23.5 2 3 2 B 17.2 2 3 3 C 20.4 2 3 4 D 14 2 4 1 D 11 2 4 2 A 22.2 2 4 3 B 20.5 2 4 4 C 14.5 PROC PRINT; PROC ANOVA; CLASS REPET HILERA COLUMNA TRAT; MODEL RDTO= REPET HILERA COLUMNA TRAT; MEANS HILERA COLUMNA TRAT/TUKEY ALPHA=0.01; RUN; RESULTADOS DEL PROGRAMA DE SAS Obs repet hilera columna trat rdto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 1 1 1 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 A B C D D A B C C D A B B C D A C D A 20.0 17.5 14.0 14.0 24.0 21.0 18.0 14.1 12.0 18.0 23.0 19.0 20.0 15.0 13.0 22.0 12.0 10.0 24.2 20 21 22 23 24 25 26 27 28 29 30 31 32 2 2 2 2 2 2 2 2 2 2 2 2 2 1 4 B 22.1 2 1 B 19.5 2 2 C 13.0 2 3 D 10.5 2 4 A 22.3 3 1 A 23.5 3 2 B 17.2 3 3 C 20.4 3 4 D 14.0 4 1 D 11.0 4 2 A 22.2 4 3 B 20.5 4 4 C 14.5 The ANOVA Procedure Class Level Information Class Levels Values repet 2 1 2 hilera 4 1 2 3 4 columna 4 1 2 3 4 trat 4 A B C D Number of observations 32 Dependent Variable: rdto Sum of Source DF Squares Mean Square F Value Pr > F Model 10 386.7606250 38.6760625 3.79 0.0048 Error 21 214.1590625 10.1980506 Corrected Total 31 600.9196875 R-Square Coeff Var Root MSE rdto Mean 0.643615 18.19947 3.193439 17.54688 Source DF Anova SS Mean Square F Value Pr > F repet 1 1.8528125 1.8528125 0.18 0.6743 hilera 3 12.1609375 4.0536458 0.40 0.7562 columna 3 7.2009375 2.4003125 0.24 0.8707 trat 3 365.5459375 121.8486458 11.95 <.0001 Tukey's Studentized Range (HSD) Test for rdto NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 10.19805 Critical Value of Studentized Range 4.98557 Minimum Significant Difference 5.629 Means with the same letter are not significantly different. Tukey Grouping Mean N hilera A 18.388 8 3 A 17.800 8 2 A 17.275 8 4 A 16.725 8 1 Tukey's Studentized Range (HSD) Test for rdto NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 10.19805 Critical Value of Studentized Range 4.98557 Minimum Significant Difference 5.629 Means with the same letter are not significantly different. Tukey Grouping Mean N columna A 17.950 8 3 A 17.750 8 4 A 17.750 8 1 A 16.738 8 2 Tukey's Studentized Range (HSD) Test for rdto NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 10.19805 Critical Value of Studentized Range 4.98557 Minimum Significant Difference 5.629 Means with the same letter are not significantly different. Tukey Grouping Mean N trat A 22.275 8 A B A 19.225 8 B B 14.375 8 C B 14.313 8 D 10. Se desea determinar los efectos de la temperatura de la caldera (1600 y 1900 °F) y del ancho del horno (4, 8 y 12 pulgadas) para el experimento; supóngase que cinco repeticiones de ese experimento dan los siguientes tiempos requeridos para la producción del coque (en horas): A A(4) Pulgadas A(8) Pulgadas A(12) Pulgadas T T1=1600 T2=1900 T1=1600 T2=1900 T1=1600 T2=1900 I 12.5 8.2 17.1 5.2 17.8 7.6 II 14.0 9.3 16.9 4.6 15.6 9.1 III 12.7 6.4 17.5 8.8 17.8 7.9 IV 13.5 7.8 17.3 5.9 16.8 8.1 V 14.4 10.7 20.2 8.3 22.4 10.2 Explíquese un análisis de variancia basado en este experimento con dos factores y pruébese la significancia de los efectos factoriales, empleando un nivel de significancia de 0.05. Aplicar la prueba de Duncan α = 0.05, si es que es significativo al nivel de ANOVA. RESULTADO UTILIZANDO EL PAQUETE DE SISTEMA DE ANALISIS ESTADISTICO data flores; input ancho temp hr; cards; 1 1 12.5 1 1 14 1 1 12.7 1 1 13.5 1 1 14.4 1 2 8.2 1 2 9.3 1 2 6.4 1 2 7.8 1 2 10.7 2 1 17.1 2 1 16.9 2 1 17.5 2 1 17.3 2 1 20.2 2 2 5.2 2 2 4.6 2 2 8.8 2 2 5.9 2 2 8.3 3 1 17.8 3 1 15.6 3 1 17.8 3 1 16.8 3 1 22.4 3 2 7.6 3 2 9.1 3 2 7.9 3 2 8.1 3 2 10.2 proc print; proc anova; class ancho temp; model hr=ancho temp ancho*temp; means ancho temp ancho*temp/duncan; run; RESULTADO Obs ancho 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 temp hr 1 1 12.5 1 1 14.0 1 1 12.7 1 1 13.5 1 1 14.4 1 2 8.2 1 2 9.3 1 2 6.4 1 2 7.8 1 2 10.7 2 1 17.1 2 1 16.9 2 1 17.5 2 1 17.3 2 1 20.2 2 2 5.2 2 2 4.6 2 2 8.8 2 2 5.9 2 2 8.3 3 1 17.8 3 1 15.6 3 1 17.8 3 1 16.8 3 1 22.4 3 2 7.6 3 2 9.1 3 2 7.9 3 2 8.1 3 2 10.2 The ANOVA Procedure Class Level Information Class Levels Values ancho 3 1 2 3 temp 2 1 2 Source Model Error Corrected Total Source ancho temp ancho*temp Number of observations 30 The ANOVA Procedure Dependent Variable: hr Sum of DF Squares Mean Square 5 630.8106667 126.1621333 24 65.8640000 2.7443333 29 696.6746667 R-Square Coeff Var Root MSE 0.905459 13.63085 1.656603 DF Anova SS Mean Square 2 28.3326667 14.1663333 1 549.5520000 549.5520000 2 52.9260000 26.4630000 F Value 45.97 Pr > F <.0001 hr Mean 12.15333 F Value 5.16 200.25 9.64 Pr > F 0.0137 <.0001 0.0008 The ANOVA Procedure Duncan's Multiple Range Test for hr NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 2.744333 Number of Means 2 3 Critical Range 1.529 1.606 Means with the same letter are not significantly different. Duncan Grouping Mean N ancho A 13.3300 10 3 B A 12.1800 10 2 B 10.9500 10 1 Duncan's Multiple Range Test for hr NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 2.744333 Number of Means 2 Critical Range 1.248 Means with the same letter are not significantly different. Duncan Grouping Mean N temp A 16.4333 15 1 B 7.8733 15 2 The ANOVA Procedure Level of Level of --------------hr------------ancho temp N Mean Std Dev 1 1 5 13.4200000 0.81670068 1 2 5 8.4800000 1.61771444 2 1 5 17.8000000 1.36014705 2 2 5 6.5600000 1.88228584 3 1 5 18.0800000 2.57914715 3 2 5 8.5800000 1.06630202 11. En un centro de investigación en trigo, se llevó a cabo un experimento para estudiar 06 variedades (A, B, C, D, E y F), y debido a la conformación del terreno, se utilizó el diseño de cuadrado latino, el rendimiento del trigo expresado en Kg/parcela. A 21 B 20 C 12 D 23 E 16 F 30 B 22 C 16 D 21 E 18 F 29 A 14 C 16 D 20 E 20 F 31 A 13 B 24 D 28 E 21 F 32 A 12 B 26 C 18 E 20 F 33 A 13 B 28 C 15 D 27 F 31 A 16 B 27 C 14 D 25 E 23 Efectuar el análisis de variancia correspondiente y efectuar la prueba de significancia de Tukey a la probabilidad de 0.05 SOLUCIONARIO CON EL SISTEMA DE ANALISIS ESTADISTICO DATA LATINO; INPUT HILERA COLUMNA TRATAM$ RDTO; CARDS; 1 1 A 21 1 2 B 20 1 3 C 12 1 4 D 23 1 5 E 16 1 6 F 30 2 1 B 22 2 2 C 16 2 3 D 21 2 4 E 18 2 5 F 29 2 6 A 14 3 1 C 16 3 2 D 20 3 3 E 20 3 4 F 31 3 5 A 13 3 6 B 24 4 1 D 28 4 2 E 21 4 3 F 32 4 4 A 12 4 5 B 26 4 6 C 18 5 1 E 20 5 2 F 33 5 3 A 13 5 4 B 28 5 5 C 15 5 6 D 27 6 1 F 31 6 2 A 16 6 3 B 27 6 4 C 14 6 5 D 25 6 6 E 23 PROC PRINT; PROC ANOVA; CLASS HILERA COLUMNA TRATAM; MODEL RDTO=HILERA COLUMNA TRATAM; MEANS HILERA COLUMNA TRATAM/TUKEY; RUN; RESULTADO MEDIANTE EL ANALISIS ESTADISTICO Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 HILERA COLUMNA TRATAM RDTO 1 1 A 21 1 2 B 20 1 3 C 12 1 4 D 23 1 5 E 16 1 6 F 30 2 1 B 22 2 2 C 16 2 3 D 21 2 4 E 18 2 5 F 29 2 6 A 14 3 1 C 16 3 2 D 20 3 3 E 20 3 4 F 31 3 5 A 13 3 6 B 24 4 1 D 28 4 2 E 21 4 3 F 32 4 4 A 12 4 5 B 26 4 6 C 18 5 1 E 20 5 2 F 33 5 3 A 13 5 4 B 28 5 5 C 15 5 6 D 27 6 1 F 31 6 2 A 16 6 3 B 27 6 4 C 14 6 5 D 25 6 6 E 23 The ANOVA Procedure Class Level Information Class Levels Values HILERA 6 1 2 3 4 5 6 COLUMNA 6 1 2 3 4 5 6 TRATAM 6 A B C D E F Number of observations 36 The ANOVA Procedure Dependent Variable: RDTO Sum of Source DF Squares Mean Square F Value Pr > F Model 15 1244.750000 82.983333 12.74 <.0001 Error 20 130.222222 6.511111 Corrected Total 35 1374.972222 R-Square Coeff Var Root MSE RDTO Mean 0.905291 11.85300 2.551688 21.52778 Source DF Anova SS Mean Square F Value Pr > F HILERA 5 52.805556 10.561111 1.62 0.1999 COLUMNA 5 31.472222 6.294444 0.97 0.4615 TRATAM 5 1160.472222 232.094444 35.65 <.0001 Tukey's Studentized Range (HSD) Test for RDTO NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 20.00 Error Mean Square 6.51 Critical Value of Studentized Range 4.44 Minimum Significant Difference 4.63 Means with the same letter are not significantly different. Tukey Grouping Mean N HILERA A 22.833 6 4 A 22.667 6 5 A 22.667 6 6 A 20.667 6 3 A 20.333 6 1 A 20.000 6 2 Tukey's Studentized Range (HSD) Test for RDTO NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 20.00 Error Mean Square 6.51 Critical Value of Studentized Range 4.44 Minimum Significant Difference 4.6307 Means with the same letter are not significantly different. Tukey Grouping Mean N COLUMNA A 23.000 6 1 A 22.667 6 6 A 21.000 6 4 A 21.000 6 2 A 20.833 6 3 A 20.667 6 5 Tukey's Studentized Range (HSD) Test for RDTO NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 20.00 Error Mean Square 6.51 Critical Value of Studentized Range 4.44 Minimum Significant Difference 4.63 Means with the same letter are not significantly different. Tukey Grouping Mean N TRATAM A 31.000 6 F B 24.500 6 B C B 24.000 6 D C D 19.667 6 E E D 15.167 6 C E 14.833 6 A 12. Aplicando la regresión lineal múltiple, se desea saber si en una cierta región el gasto máximo medio anual, el área de la cuenca y la altura media de la precipitación máxima en 24 horas se pueden correlacionar linealmente, y que tan bueno es el ajuste. Los datos se presentan en la tabla siguiente: Estación Y = gasto máximo medio anual, 102m3/s X1 = área de la cuenca, 103km2 X2 = altura media de precipitación máximo. en 24 h. cm 1 20.5 1.25 1.7 2 8.5 0.87 2.1 3 85.5 5.69 1.9 4 105.0 8.27 1.9 5 24.8 1.62 2.1 6 3.8 0.18 2.4 7 1.8 0.15 3.2 8 18.0 1.40 2.7 9 85.5 8.27 2.1 10 105.0 1.62 2.4 data regresion; input X1 X2 Y; CARDS; 20.5 1.25 1.7 8.5 0.87 2.1 85.5 5.69 1.9 105 8.27 1.9 24.8 1.62 2.1 3.8 0.18 2.4 1.8 0.15 3.2 18 1.4 2.7 85.5 8.27 2.1 105 1.62 2.4 PROC PRINT; PROC REG; MODEL Y= X1 X2; RUN; Obs 1 2 3 4 5 6 7 8 9 10 Source Model Error Corrected Total DF 2 7 9 X1 X2 Y 20.5 1.25 1.7 8.5 0.87 2.1 85.5 5.69 1.9 105.0 8.27 1.9 24.8 1.62 2.1 3.8 0.18 2.4 1.8 0.15 3.2 18.0 1.40 2.7 85.5 8.27 2.1 105.0 1.62 2.4 The REG Procedure Model: MODEL1 Dependent Variable: Y Analysis of Variance Sum of Mean Squares Square F Value 0.40973 0.20487 1.06 1.35527 0.19361 1.76500 Pr > F 0.3967 Root MSE Dependent Mean Coeff Var Variable Intercept X1 X2 0.44001 R Square R-Square 0.2321 2.25000 Adj R-Sq R Sq 0.0128 19.55605 Parameter Estimates Parameter Standard Estimate Error t Value Pr > |t| 2.45361 0.20877 11.75 <.0001 -0.00064324 0.00542 -0.12 0.12 0.9088 -0.05939 0.07355 -0. DF 1 1 1 13. Se desea estimar los gastos en alimentación de una familia en base a la información que proporcionan las variables regresoras X1 =“ingresos “ingresos mensuales” y X2 =“número de miembros de la familia”. Para ello se recoge una muestra aleatoria simple de 15 familias cuyos resultados son los de la tabla adjunta (El gasto e ingreso está dado en miles de soles). Efectuar el análisis de regresión múltiple. Gasto (Y) Ingreso (X1) Tamaño (X2) 35 21 3 31 11 4 32 9 5 46 16 4 125 62 4 44 23 3 52 18 6 29 10 5 129 89 3 35 24 2 35 12 4 78 47 3 43 35 2 47 29 3 38 14 4 Regression Analysis: Y versus X1, X2 The regression equation is Y = - 18.6 + 1.50 X1 + 8.12 X2 Predictor Constant X1 X2 S = 7.64694 Coef -18.601 1.50326 8.121 SE Coef 8.917 0.09837 1.984 R R-Sq = 95.2% T -2.09 15.28 4.09 P 0.059 0.000 0.001 VIF 1.2 1.2 R-Sq(adj) Sq(adj) = 94.4% Analysis of Variance Source Regresión Residual Error Total DF 2 12 14 SS 13847.2 701.7 14548.9 MS 6923.6 58.5 F 118.40 SOLUCIONARIO CON SAS Obs X1 X2 Y P 0.000 1 21 3 35 2 11 4 31 3 9 5 32 4 16 4 46 5 62 4 125 6 23 3 44 7 18 6 52 8 10 5 29 9 89 3 129 10 24 2 35 11 12 4 35 12 47 3 78 13 35 2 43 14 29 3 47 15 14 4 38 The REG Procedure Model: MODEL1 Dependent Variable: Y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 2 13847 6923.61222 118.40 <.0001 Error 12 701.70890 58.47574 Corrected Total 14 14549 Root MSE 7.64694 R-Square 0.9518 Dependent Mean 53.26667 Adj R-Sq 0.9437 Coeff Var 14.35596 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 -18.60147 8.91730 -2.09 0.0590 X1 1 1.50326 0.09837 15.28 <.0001 X2 1 8.12097 1.98364 4.09 .. 0.0015 Y = - 18.60147 + 1.50326 X1 + 8.12097 X2 NOTA LOS AUTORES DEL TEXTO DE: METODOS ESTADISTICOS PARA LA INVESTIGACION ESTAN TRABAJANDO PARA EDITAR UN TEXTO QUE SERA DE MUCHA UTILIDAD PARA LOS ESTUDIANTES DE PREGRADO Y POST GRADO DE LA UNIVERSIDAD NACIONAL DEL ALTIPLANO DE PUNO. Dr. Eduardo Flores Condori Dr.(c) M.SC. Eduardo Luis Flores Quispe