UNIVERSIDAD CATÓLICA BOLIVIANA “SAN PABLO” UNIDAD ACADÉMICA CAMPESINA – CARMEN PAMPA INTRODUCCIÓN AL MANEJO DEL SAS (SISTEMA DE ANÁLISIS ESTADÍSTICO) ING. RAMIRO RAÚL OCHOA TORREZ LA PAZ – BOLIVIA OCTUBRE DE 2003 Introducción al manejo del SAS (Sistema de Análisis Estadístico) Ramiro Raúl OCHOA TORREZ Ramiro Raúl OCHOA TORREZ Celular 71980140 E – mail: ochoatr@yahoo.com La Paz - Bolivia CONTENIDO CONTENIDO 1. 2. 3. 4. 5. 6. 7. INTRODUCCIÓN ...........................................................................................................................1 1.1. Introducción ...........................................................................................................................1 1.2. Comenzando con el SAS..........................................................................................................1 1.2. Menú y herramientas ...............................................................................................................2 1.2.1. Menús ...........................................................................................................................2 1.2.2. Iconos del menú ..............................................................................................................7 1.3. Ventanas del SAS ...................................................................................................................8 PROGRAMACIÓN EN EL SAS .........................................................................................................9 2.1. Introducción ...........................................................................................................................9 2.2. Programa ..............................................................................................................................9 2.3. Estructura de un programa SAS.................................................................................................9 2.3.1. Sentencia DATA ..............................................................................................................9 2.3.1.1. Formas de asignar el nombre .........................................................................................9 2.3.1.2. Opciones asociados a la sentencia DATA .......................................................................10 2.3.2. Sentencia input .............................................................................................................10 2.3.2.1. Tipos de variables..........................................................................................................10 2.3.2.2. Formas del INPUT .........................................................................................................11 2.3.2.3. Tipos de variables ......................................................................................................12 2.3.3. Sentencia CARDS .........................................................................................................12 2.3.4. Sentencia PROC ...........................................................................................................12 2.3.4.1. Proc ANOVA .............................................................................................................12 2.3.4.2. Proc CHART .............................................................................................................13 2.3.4.3. Proc CORR ..............................................................................................................13 2.3.4.4. Proc FREQ ...............................................................................................................13 2.3.4.5. Proc GLM .................................................................................................................14 2.3.4.6. Proc REG ................................................................................................................14 2.3.4.7. Proc LATTICE ...........................................................................................................15 2.3.4.8. Proc MEANS.............................................................................................................15 2.3.4.9. Proc PLOT ...............................................................................................................15 2.3.4.10. Proc PRINT...........................................................................................................15 2.3.4.11. Proc PRINCOMP ...................................................................................................16 2.3.4.12. Proc SORT ...........................................................................................................16 2.3.4.13. Proc TTEST ..........................................................................................................16 2.3.4.14. Proc UNIVARIATE..................................................................................................16 2.4. Interpretación de resultados ....................................................................................................17 ESTADÍSTICA BÁSICA .................................................................................................................18 3.1. Estadísticos básicos ..............................................................................................................18 3.2. Distribución de frecuencias .....................................................................................................19 SUPUESTOS DEL ANÁLISIS DE VARIANZA ....................................................................................22 4.1. Normalidad ..........................................................................................................................22 4.2. Homogeneidad de varianzas ...................................................................................................26 DISEÑO COMPLETAMENTE AL AZAR (DCA)...................................................................................31 5.1. DCA con igual número de repeticiones ......................................................................................31 5.2. DCA con diferente número de repeticiones ................................................................................37 5.3. DCA con muestreo ................................................................................................................44 DISEÑO BLOQUE AL AZAR (DBA) .................................................................................................52 6.1. DBA con igual número de repeticiones ......................................................................................52 6.2. DBA con muestreo ................................................................................................................56 DISEÑO CUADRADO LATINO (DCL) ..............................................................................................64 7.1. DCL con igual número de repeticiones ......................................................................................64 Ing. Ramiro Raúl OCHOA TORREZ i 8. COMPARACIONES ORTOGONALES ..............................................................................................72 8.1. Comparaciones ortogonales de experimentos simples..................................................................72 9. EXPERIMENTOS FACTORIALES ...................................................................................................76 9.1. DCA con arreglo factorial........................................................................................................76 9.1.1. DCA con arreglo factorial – dos factores ...................................................................................76 9.1.2. DCA con arreglo factorial – tres factores ............................................................................84 9.2. DBA con arreglo factorial ........................................................................................................92 9.2.1. DBA con arreglo factorial – dos factores .............................................................................92 9.2.2. DBA con arreglo factorial – tres factores.............................................................................95 9.3. DCL con arreglo factorial ........................................................................................................99 9.3.1. DCL con arreglo factorial – dos factores .............................................................................99 10. PARCELAS DIVIDIDAS ...........................................................................................................103 10.1. DCA con arreglo en parcelas divididas ....................................................................................103 10.2. DBA con arreglo en parcelas divididas ....................................................................................107 10.3. DCL con arreglo en parcelas divididas ....................................................................................111 11. PARCELAS SUBDIVIDIDAS .....................................................................................................117 11.1. DBA con arreglo en parcelas subdivididas ...............................................................................117 12. ARREGLO EN FRANJAS.........................................................................................................122 12.1. Arreglo en franjas................................................................................................................122 13. DISEÑOS JERÁRQUICOS O ANIDADOS ...................................................................................126 13.1. Jerarquicos o anidados ........................................................................................................126 14. EXPERIMENTOS EN SERIE O REPETIDOS ...............................................................................131 14.1. Serie de experimentos .........................................................................................................131 15. BIBLIOGRAFIA ......................................................................................................................135 ii Ing. Ramiro Raúl OCHOA TORREZ INTRODUCCION 1. INTRODUCCIÓN 1.1. Introducción El sistema SAS (Statistical Analisys System) es un software que abarca múltiples campos de trabajo, entre los más destacados se tiene: • • • • • • • • • Entrada, recuperación y manejo de datos simples y mediante programación. Gráficos. Análisis estadístico y matemático. Investigación operativa y gestión de proyectos. Control de calidad. Diseño de experimentos. Desarrollo de aplicaciones Planificación de negocios, predicción y soporte a la decisión. Gestión financiera. El sistema SAS consta de una serie de módulos, cada uno de ellos orientado a una tarea especifica. El estudio del SAS comienza básicamente por aprender el manejo de un lenguaje de programación para manejar los datos, procedimientos sencillos para el análisis de datos. 1.2. Comenzando con el SAS Para empezar a trabajar con el programa, basta con elegir de la opción programas del menú inicio de Windows y seleccionar la opción The SAS System en programas, seguidamente seleccionamos The SAS System For Windows V8, dependiendo de la versión del programa SAS, puede ser versión 6.11, versión 6.12, versión 8.0, versión 8.0 e, versión 9.0, se obtiene la pantalla temporal, con información de la versión. La pantalla del entorno SAS, la que nos permitirá a trabajar con el SAS. Ing. Ramiro Raúl OCHOA TORREZ 1 INTRODUCCION AL MANEJO DEL SAS 1.2. Menú y herramientas En la línea superior de la pantalla vemos el icono de SAS. En la línea siguiente se presenta la Barra de menú, que contiene el menú general de SAS con todas sus opciones (File, Edit, View, Tools, Run, Solutions, Windows y Help). La tercera línea presenta la Barra de herramientas, cuyo contenido son diferentes iconos que permiten acceder rápidamente a tareas más comunes en el trabajo con la aplicación sin necesidad de acudir al menú general. 1.2.1. Menús A continuación se explica la finalidad de las distintas opciones que aparecen en la barra de menú del programa, presentando diversos tipos de menús desplegables, facilitando la tarea con el programa: File. Si nos situamos en el menú File, de la barra del menú principal, se presentan las siguientes opciones: 2 Ing. Ramiro Raúl OCHOA TORREZ INTRODUCCION Definiendo cada una, tendremos: New, abre un archivo vació para editar una nueva sintaxis. Open, abre archivos ya existentes. Close, cierra el archivo actual. Append, añadir un archivo existente al contenido actual del editor. Open Object, abre un objeto seleccionando en el explorador. Save, guarda el archivo actual. Save as, guarda el archivo actual con otro nombre o tipo. Save as Object, guarda el archivo actual con otro nombre o tipo de objeto. Import Data, nos permite importar Datos ASCII, para el editor Export Data, permite exportar Datos del editor a ASCII. Page Setup, nos permite configurar la página. Print Setup, configuración de la impresión. Print Preview, vista previa de la ventana actual. Print, imprime el contenido del editor. Send Mail, envía por correo electrónico el contenido del editor. Datos usados recientemente, muestra los archivos editados recientemente. Exit, sale del SAS Edit. desglosando este menú tendremos: Ing. Ramiro Raúl OCHOA TORREZ 3 INTRODUCCION AL MANEJO DEL SAS Definiendo cada una, tendremos: Undo, deshace la última acción. Redo, rehace la última acción desecha. Cut, corta la selección para almacenar en el portapapeles. Copy, copia la selección para almacenar en el portapapeles. Paste, pega el contenido del portapapeles en la ubicación actual del cursor. Clear, borra la selección. Clear All, borra todo el contenido. Select All, selecciona todo el contenido Collapse All, compacta todo el contenido. Expand All, expande todo el contenido. Find, busca los datos que se especifiquen. Replace, remplazar un contenido por otro. View. Desglosando su opciones tenemos: Definiendo tenemos: Enhanced Editor, editor avanzado. Program Editor, editor de programas. Log, nos presenta la ventana Log. Output, ventana de salida. Graph, ventana de gráficos. 4 Ing. Ramiro Raúl OCHOA TORREZ INTRODUCCION Results, ventana de resultados. Explorer, ventana del explorador. Contents Only, nos presenta los contenidos del SAS. My Favorite Folders, nos permite realizar una exploración en búsqueda de nuestros archivos. Tools. Desglosando su opciones tenemos: Query, realiza preguntas SQL con los ficheros de Datos especificados. Table Editor, edita ficheros de Datos nuevos o ya existentes mediante filas y columnas. Graphics Editor, edita gráficos. Report Editor, genera informes con las variables de los conjuntos de Datos. Image Editor, abre el editor de imágenes. Text Editor, abre el editor de texto. Customize, configura menús y barras de herramientas. Options, configura opciones del sistema, del editor, etc. Run. Desglosando el menú tenemos: Donde tenemos: Submit, ejecuta el programa escrito en el editor. Recall Last Submit, recupera el texto del último programa ejecutado. Signon. Remote Submit, ejecución remota de programa. Remote Get, búsqueda de remoto. Remote Display, despliegue remoto. Signoff Solutions, desglosando sus opciones tenemos: Ing. Ramiro Raúl OCHOA TORREZ 5 INTRODUCCION AL MANEJO DEL SAS Donde tenemos: Analysis, despliega todas las materias que se pueden trabajar en el SAS. Development and programming, trabajo en desarrollo y programación. Reporting, trabajo en informes. Accessories, accesorios gráficos de edición, juegos, etc. ASSIST, nos presenta el asistente del SAS. Desktop, nos presenta el escritorio del SAS. EIS / OLAP Aplication Builder, trabajo en aplicaciones OLAP. Windows. Sus opciones son: Nos presenta: Minimize all windows, minimiza todas las ventanas abiertas. Cascade, presenta las ventanas como cascada. Tile vertically, presenta todas las ventanas abiertas en el monitor en forma vertical. Tile horizontally, presenta todas las ventanas abiertas en el monitor en forma horizontal. Resize, nos presenta la ventana de resultados Output. Docked. Las siguientes opciones, nos sirve para seleccionar a las diferentes ventanas: Editor, Log, Result, Outup y Explorer. Help. Sus opciones son: 6 Ing. Ramiro Raúl OCHOA TORREZ INTRODUCCION Definiendo tenemos: 1.2.2. SAS System help, nos presenta los temas de ayuda del SAS. Using This Windows, referencias del uso de las ventanas. Books and Training, referencias para la práctica del SAS. Getting Started whit SAS Software, guía del manejo del SAS. SAS on the Web, ayuda del SAS en la Web. About SAS System, nos presenta las referencias del el SAS y el equipo. Iconos del menú Los iconos que nos presenta el menú principal son: Por orden de colocación se izquierda a derecha, los iconos de la barra de herramientas significan lo siguientes: Introducción de comandos Nuevo archivo, también Empleado para borrar el contenido de una ventana Abrir archivo Guardar archivo Imprimir archivo Vista preliminar Cortar Copiar Pegar Deshacer Nueva librería Explorador del SAS Ejecución del programa Borrar todo Interrupción Ayuda del SAS Ing. Ramiro Raúl OCHOA TORREZ 7 INTRODUCCION AL MANEJO DEL SAS 1.3. Ventanas del SAS El modo de trabajo del SAS es el empleo de una serie de ventanas (la presentación siguiente fue realizada con la opción Tile vertically de Windows, del menú del SAS): Las cuales las principales son: PROGRAM EDITOR. Se utiliza para escribir programas, esta ventana corresponde a la ventana de sintaxis, por lo tanto es editable. LOG. Se utiliza para hacer un seguimiento de la ejecución. En esta ventana se consulta y revisa todo lo que se ha ejecutado, aparecen mensajes de advertencia y de error en caso necesario y se informa sobre la velocidad de ejecución y recursos. OUTPUT. Para presentar la salida textual y numérica. Cuando se ejecutan procedimientos de SAS, en esta ventana se muestran los listados, tablas y/o resultados. GRAPH. Para representar la salida de graficas. EXPLORER. Nos presenta el explorador del SAS en la parte izquierda, similar este al explorador de Windows, principalmente cuando se hace correr los datos. 8 Ing. Ramiro Raúl OCHOA TORREZ PROGRAMACIÓN EN EL SAS 2. PROGRAMACIÓN EN EL SAS 2.1. Introducción Para utilizar de una forma optima la extraordinaria flexibilidad y potencia del SAS es necesario trabajar con los procedimientos SAS, lo que exige un mínimo de conocimiento básico del lenguaje de programación SAS y en concreto de la estructura de cada uno de los procedimientos que se ilustrara con ejemplos. 2.2. Programa Un programa en el SAS es una serie de sentencias y procedimientos colocadas en orden definido, bajo un lenguaje o sintaxis determinada, con el cual se puede ejecutar una determinada tarea. 2.3. Estructura de un programa SAS Se debe tomar en cuenta las siguientes reglas para escribir enunciados: Los enunciados o sentencias SAS pueden comenzar o terminar en cualquier posición de la línea. Los enunciados SAS terminan con un punto y coma (;) al final de la sentencia. Pueden aparecer más de un enunciado SAS en la misma línea. Los enunciados SAS pueden empezar en una línea y terminar en otra. Los elementos de una sentencia SAS deben separarse de los elementos vecinos por uno o más espacios en blanco. Si los elementos de un enunciado SAS están conectados por caracteres especiales, los espacios en blanco son innecesarios. Por ejemplo, en el enunciado X=Y, los espacios en blanco son innecesarios, puesto que el signo igual es un carácter especial. 2.3.1. Sentencia DATA Las sentencias de tipo DATA permiten crear un archivo de datos SAS, siendo un grupo de instrucciones generalmente ubicada al inicio de cada trabajo, la instrucción DATA consiste de la palabra clave DATA que señala el comienzo del paso DATA, seguido de un nombre que identifique al archivo SAS. 2.3.1.1. Formas de asignar el nombre Existen diferentes formas de asignar el nombre a la sentencia DATA, el nombre puede consistir de: NOMBRE DE UNA SOLA PALABRA. Se le asigna un solo nombre, una palabra de máximo 8 caracteres (de preferencia se maneja solo siete caracteres), para crear un archivo temporáneo, que desaparecerá en el momento de terminar la sesión SAS, por ejemplo: DATA var; DATA altura; DATA peso_1; (se crea un archivo temporario llamado var) (se crea un archivo temporario llamado altura) (se crea un archivo temporario llamado peso_1) DOS NOMBRES SEPARADOS POR UN PUNTO. Se puede crear un archivo de datos en forma permanente asignando a la sentencia DATA dos nombres separados por un punto, la primera palabra corresponde al nombre de la LIBRERÍA SAS en el cual reside el archivo de datos SAS cuyo nombre es la palabra que sigue al punto. La librería SAS se puede crear mediante la sentencia LIBNAME, por ejemplo: Ing. Ramiro Raúl OCHOA TORREZ 9 DATA millb.var; (se crea un archivo permanente llamado var, que se almacena en la librería SAS denominado millb) MÁS DE UN NOMBRE. Se puede crear cualquier número de datos SAS con una sola sentencia DATA, esto se puede hacer asignando un nombre para cada uno de los archivos con la instrucción DATA, por ejemplo: DATA var1 var2; 2.3.1.2. (esta instrucción me indica que se crea dos archivos de datos SAS con los nombres var1 y var2) Opciones asociados a la sentencia DATA Algunas sentencias del formato de salida de los resultados, se pueden indicar mediante la sentencia OPTIONS, seguida de los comandos deseados: LINESIZE (LS). Indica el número de columnas por pagina (ancho): OPTIONS LS=76; OPTIONS LS=47; PAGESIZE (PS). Indica el número de líneas por pagina (alto de pagina): OPTIONS PS=54; OPTIONS PS=24; NODATE. No incluirá la fecha a la salida de los resultados: OPTIONS LS=76 PS=56 NODATE; NONUMBER. No incluirá el número de pagina a la salida de los resultados: OPTIONS LS=76 PS=56 NODATE NONUMBER; 2.3.2. Sentencia input La instrucción INPUT, describe al SAS el arreglo de las líneas de datos, indicando la forma en la que se introduce los datos a la computadora y los tipos de datos. Describiendo al SAS el arreglo de las líneas de datos, SAS emplea la información que encuentra en estas líneas para producir las observaciones de un conjunto de datos, teniendo las siguientes características: • • • La instrucción INPUT lee las líneas de datos. Asigna nombres a las variables SAS que corresponden a los campos de datos Indica si una variable es numérica o de caracteres (alfanuméricos). Para esto se hace uso del signo $ para indicar si una variable es alfanumérica 2.3.2.1. Tipos de variables En el SAS se distinguen dos tipos de variables: NUMÉRICAS. Cuando los valores que toma la variable son numéricas: 154 256 12 10 Ing. Ramiro Raúl OCHOA TORREZ PROGRAMACIÓN EN EL SAS 144 0.2 ALFANUMÉRICAS. Cuando los valores que toman las variables contienen al menos un carácter alfabético: a, b, c, etc.: Local Var1 Var2 IBTA_80 2.3.2.2. Formas del INPUT El INPUT tiene dos formas: FORMA DE COLUMNA. Se especifica donde encontrar las variables en el registro de entrada por medio de la posición de la columna: DATA ejemplo; INPUT nombre $ 1-8 sexo $ 11 edad 13–14; Sus restricciones son: • (indica que se han creado las variables alfanuméricas nombre que ocupa las columnas 1 a 8, la variable alfanumérica sexo que ocupa la columna 11 y la variable numérica edad que ocupa las columnas 13 a 14) Las posiciones para las variables son fijas. FORMA DE LISTA. Se listan las variables en el orden en el cual aparecen en el registro de entradas, por ejemplo: DATA ejemplo; INPUT bloque tratam rend; (indica que se han creado las variables bloque, tratam y rend) Cuando el SAS lea los datos el valor entre un espacio y otro corresponde a una variable diferente. Bloque tratam rend 1 1 125 1 2 258 1 3 254 Sus restricciones son: • • • • Las variables deben estar en el orden especificado. Los campos deben estar separados por uno o más espacios blancos. En los valores para las variables alfanuméricas, no se permiten espacios en blanco intermedios, la longitud máxima es de 8 caracteres. Los campos en blanco causan que los nombres de las variables y sus valores se desfasen. Hay que indicar un valor faltante por un punto (.). FORMA DE LINEAS. Para leer un conjunto de datos con más de una observación por línea, se usa el puntero de dirección @@, por ejemplo: Ing. Ramiro Raúl OCHOA TORREZ 11 INPUT bloque trat rend @@; 1 1 548 1 2 478 1 3 789 2.3.2.3. 2 2 2 1 2 3 874 741 598 Tipos de variables Existen dos tipos principales de variables que se emplean con la instrucción INPUT: VARIABLES ESTUDIO. Son denominada así, porque ayudan a identificar a los valores que se introducen, como ser: Factores de estudio (variedades, densidades, raciones, etc.). Tratamientos. Variables independientes. VARIABLES DE RESPUESTA. Son todas las variables que representan a las mediciones efectuadas del material de estudio, como ser: 2.3.3. Altura. Peso. Rendimiento. Largo. Variables dependientes. Sentencia CARDS Cuando los datos forman parte del programa, se hace uso de la sentencia CARDS, la cual le indica al SAS que las líneas que siguen a continuación son los datos de las diferentes variables sean estas variables de estudio y/o variables de respuesta. Esta sentencia viene después de la sentencias INPUT, por ejemplo: DATA ejemplo; INPUT bloque trat rend @@; CARDS; 1 1 548 1 2 478 1 3 789 2.3.4. 2 2 2 1 2 3 874 741 598 Sentencia PROC Las sentencias PROC se ejecutan después de INPUT, transformación de datos, CARDS y/o después de los datos, cuando los datos forman parte del programa. Para mostrar que las sentencias introducidas son programas y hay que ejecutarlos, al final de todas las sentencias se coloca la sentencia RUN. Lo que nos permitirá ejecutar la sentencia PROC. Algunas de las sentencias usuales son: 2.3.4.1. Proc ANOVA Es uno de los procedimientos más empleados en el análisis de los diseños experimentales, realizando el análisis de la varianza de datos balanceados, que tienen la misma cantidad de datos y repeticiones. Siendo su enunciado: 12 Ing. Ramiro Raúl OCHOA TORREZ PROGRAMACIÓN EN EL SAS PROC ANOVA; CLASS TRAT BLOQ; MODEL REND=TRAT BLOQ; RUN; (1) (2) (3) (4) 2.3.4.2. (1) 1 (2) (3) (4) Nos indica que el PROC (procedimiento) a emplear es ANOVA (análisis de varianza). El comando CLASS señala las variables a estudiar en este caso TRAT (tratamiento) y BLOQ (bloques). El comando MODEL nos señala el modelo a emplear en el análisis de varianza, señalando en la primera parte la variable de respuesta REND (rendimiento) y en la segunda parte las variables en estudio TRAT BLOQ (tratamientos y bloques). El comando RUN, señala la ejecución del procedimiento antes señalado. Proc CHART Se emplea para la obtención de un diagrama de barras. Siendo su instrucción: PROC CHART; HBAR SEXO; RUN; (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es CHART (diagrama de barras). El comando HBAR, se emplea para la realización de barras horizontales de la variable SEXO. RUN, ejecuta el procedimiento. PROC CHART; VBAR SEXO; RUN; (1) (2) (3) 2.3.4.3. (1) (2) (3) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es CHART (diagrama de barras). El comando VBAR, se emplea para la realización de barras verticales de la variable SEXO. RUN, ejecuta el procedimiento. Proc CORR Realiza el análisis de correlación, obteniéndose el coeficiente de correlación entre dos variables. Siendo su enunciado: PROC CORR; (1) VAR REND ALTURA; (2) RUN; (3) (1) (2) (3) 2.3.4.4. Nos indica que el PROC (procedimiento) a emplear es CORR (análisis de correlación). El comando VAR, se emplea para la selección de las variables a ser analizadas mediante el análisis de correlación, en este caso REN (rendimiento) y ALTURA (altura) RUN, ejecuta el procedimiento. Proc FREQ Se emplea para la obtención de tablas de frecuencias para todas las variables en el archivo de datos de más reciente creación, empleándose para ello la declaración: 1 Para cada comando se indica el número correspondiente entre paréntesis y el significado de este con el respectivo valor p.e. PROC ANOVA (1), más abajo se aprecia el significado de este comando (1) Nos indica que el PROC (procedimiento a emplear es ANOVA (analisis de varianza). Esto no se coloca en el Editor solo es explicativo. Ing. Ramiro Raúl OCHOA TORREZ 13 PROC FREQ; RUN; (1) (2) (1) (2) Nos indica que el PROC (procedimiento) a emplear es FREQ (distribución de frecuencias). RUN, ejecuta el procedimiento. Para obtener una tabla de tabulacion cruzada, se emplea la declaración: PROC FREQ; TABLES EDAD*SEXO; RUN; (1) (2) (3) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es FREQ (distribución de frecuencias). TABLES, señala que realizara una tabla de tabulacion cruzada de las variables EDAD*SEXO (edad x sexo). RUN, ejecuta el procedimiento. 2.3.4.5. Proc GLM Al igual que la sentencia ANOVA, la opción GLM (General Linear Models) es una de las más empleadas, usa el principio de mínimos cuadrados para ajustar un modelo de efectos fijos, a cualquier tipo de datos, el procedimiento realiza análisis univariados como multivariados, así como los datos no son balanceados o sea cuando se tiene diferente número de repeticiones por tratamiento o factor, o diferentes niveles por factor. Cuando se especifica dos o más variables dependientes, GLM automáticamente agrupa aquellas variables dependientes con la misma estructura de los valores perdidos. Su forma es: PROC GLM; CLASS TRAT BLOQ; MODEL REND=TRAT BLOQ; RUN; (1) (2) (3) (4) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es GLM (General Linear Models). El comando CLASS señala las variables a estudiar en este caso TRAT (tratamiento) y BLOQ (bloques). El comando MODEL nos señala el modelo a emplear en el análisis de varianza, señalando en la primera parte la variable de respuesta REND (rendimiento) y en la segunda parte las variables en estudio TRAT BLOQ (tratamientos y bloques). (4) El comando RUN, señala la ejecución del procedimiento antes señalado. 2.3.4.6. Proc REG Realiza el análisis de regresión simple y múltiple, con la siguiente sentencia: PROC REG; MODEL Y=X; RUN; (1) (2) (3) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es REG (análisis de regresión). MODEL, señala que el análisis de regresión múltiple empleara el siguiente modelo, teniendo como variable dependiente Y y como variable independiente X. RUN, ejecuta el procedimiento. Para un análisis de regresión múltiple tendremos la siguiente sentencia: PROC REG; 14 (1) Ing. Ramiro Raúl OCHOA TORREZ PROGRAMACIÓN EN EL SAS MODEL Y=X1 X2 X3 X4; RUN; (1) (2) (2) (3) Nos indica que el PROC (procedimiento) a emplear es REG (análisis de regresión). MODEL, señala que el análisis de regresión múltiple empleara el siguiente modelo, teniendo como variable dependiente Y y como variables independientes X1, X2, X3 y X4. RUN, ejecuta el procedimiento. (3) 2.3.4.7. Proc LATTICE Este procedimiento es el encargado de realizar el análisis de varianza para un diseño en latices. Su enunciado es: PROC LATTICE DATA=EJEM; (1) VAR REND; (2) RUN; (3) (1) Nos indica que el PROC (procedimiento) a emplear es LATTICE (latice) de DATA=EJEM (del archivo llamado ejem). VAR REND, señala que la variable de respuesta a ser analizadas mediante latices será REND (rendimiento). RUN, ejecuta el procedimiento. (2) (3) 2.3.4.8. Proc MEANS Esta sentencia le pide al SAS que realice los estadísticos descriptivos univariados de variables numéricas. Esta sentencia tiene muchos parámetros, siendo su enunciado: PROC MEANS MEAN SUM MIN MAX; BY TRAT; VAR REND; RUN; (1) (2) (3) (4) (1) (2) (3) (4) Nos indica que el PROC (procedimiento) a emplear es MEANS, que presentara la media (MEAN), la suma total (SUM), el valor máximo (MIN) y el valor máximo (MAX). BY TRAT, los análisis antes solicitados serán realizados de la variable de estudio TRAT (tratamiento). VAR REND, señala que los análisis serán realizados de la variable de respuesta REND (rendimiento). RUN, ejecuta el procedimiento. 2.3.4.9. Proc PLOT El procedimiento PLOT grafica los valores de una variable entera contra los valores de otra variable, produciendo un diagrama bidimensional de puntos dispersos. Siendo su enunciado: PROC PLOT; PLOT X*Y; RUN; (1) (2) (3) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es PLOT (grafico). PLOT X*Y, el grafico deberá ser realizado de las variables X y Y. RUN, ejecuta el procedimiento. 2.3.4.10. Proc PRINT Ing. Ramiro Raúl OCHOA TORREZ 15 Produce un listado de las variables de un archivo de datos SAS. Se puede especificar el archivo a usar, si no se especifica, SAS usa el último que fue creado. PROC PRINT; (1) BY ESPEC; (2) VAR TRAT; (3) RUN; (4) Nos indica que el PROC (procedimiento) a emplear es PRINT. BY ESPEC, se obtiene el listado por valores de la (s) variable (s) que sigue al enunciado BY. VAR, se indica cuales variables se deben presentar, por defecto se presentan todas. RUN, ejecuta el procedimiento. (1) (2) (3) (4) 2.3.4.11. Proc PRINCOMP Realiza un el análisis en componentes principales. Su enunciado es de la forma: PROC PRINCOMP COV OUT=PRIN; VAR JULY JANUARY; RUN; (1) (2) (3) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es PRINCOMP COV OUT=PRIN, componentes principales y salida de las covarianzas. VAR JULY JANUARY, se indica cuales variables deberán ser analizadas. RUN, ejecuta el procedimiento. 2.3.4.12. Proc SORT Clasifica los datos, indicándole las variables por la cual se realizara la clasificación. Su enunciado esta dado por: PROC SORT; BY TRAT; RUN; (1) (2) (3) (1) (2) (3) Nos indica que el PROC (procedimiento) a emplear es SORT. BY TRAT, indica que la clasificación será hecha de la variable TRAT (tratamiento). RUN, ejecuta el procedimiento. 2.3.4.13. Proc TTEST Realiza la prueba de t de Student para probar la hipótesis que las medias de dos grupos de muestras (muestras no pareadas) son iguales. Su enunciado es: PROC TTEST; CLASS TRAT; VAR REND; RUN; (1) (2) (3) (4) (1) (2) (3) (4) Nos indica que el PROC (procedimiento) a emplear es TTEST. CLASS TRAT, señala que la variable en estudio es TRAT (tratamiento). VAR REND, indica que la variable de respuesta a ser empelada en la prueba de T es REND (rendimiento) RUN, ejecuta el procedimiento. 2.3.4.14. 16 Proc UNIVARIATE Ing. Ramiro Raúl OCHOA TORREZ PROGRAMACIÓN EN EL SAS Realiza la prueba de normalidad de datos, Su enunciado es: (3) PROC UNIVARIATE NORMAL PLOT; (1) VAR REND; (2) RUN; (3) Nos indica que el PROC (procedimiento) a emplear es UNIVARIATE, más la realización del grafico de distribución normal de los datos (NORMAL PLOT). VAR REND, indica que la variable de respuesta a ser empelada en la prueba de normalidad será REND (rendimiento) RUN, ejecuta el procedimiento. 2.4. Interpretación de resultados (1) (2) En el caso de los programas estadísticos, muchos de los mismos no presentan el valor tabular, como el de Ft, siendo este valor remplazado por la Probabilidad (Pr), en cuyo caso la interpretación se lleva a cabo realizando una comparación del valor Probabilidad y el nivel de significancia, siendo la toma de decisión de la siguiente forma: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Como por ejemplo si se tiene un valor de Probabilidad de 0.0380, asumimos como valor de significancia el 0.05 y el 0.01, teniendo: 0.01 (1%) 0.05 (5%) 0.038 0.038 Se puede apreciar que la conclusión se la realiza tomando en cuenta la superficie que ocupa el nivel de significancia, comparado con la probabilidad encontrada, como en el ejemplo, en la figura de la izquierda se aprecia que la superficie del 5% (0.05) es mayor al valor que ocupa la probabilidad encontrada (0.038), por lo que se rechaza la hipótesis nula, esto aun nivel de significancia del 5%. En el caso de la figura de la izquierda, el valor de la superficie encontrada (0.038), es mayor al valor de la significancia propuesta (0.01), por lo que se acepta la hipótesis nula. Ing. Ramiro Raúl OCHOA TORREZ 17 3. ESTADÍSTICA BÁSICA 3.1. Estadísticos básicos Para el cálculo de los estadísticos más habituales se hace uso del procedimiento MEANS, con el cual se puede calcular: N NMISS MEAN STD MIN MAX RANGE SUM VAR USS CSS STDERR CV SKEWNESS KURTOSIS T PRT SUMWGT Número de observaciones sobre el cual se basan los cálculos El número de valores perdidos La media La desviación estándar El valor mínimo El valor máximo El rango La suma La varianza La suma de cuadrados no corregida La suma de cuadrados corregida El error estándar de la media El coeficiente de variación Una medida de asimetría Una medida de kurtosis El valor de la t de Student para probar la hipótesis que la media de la población es cero La probabilidad de un valor absoluto mayor para la t de Student anterior Suma de los valores de WEIGTH Ejercicio Los datos corresponden a valores del extracto de malta de cebada Kindred cultivada en 14 localidades, en los viveros de cebada del Valle del Mississippi durante 1948. La población para la cual se ha de hacer alguna inferencia, puede considerarse como valores de extracto de malta de cebada Kindred cultivada durante 1948 en la región que abarcan los viveros del Valle del Mississippi. (Steel & Torrie 1992) 77.7 75.4 76.0 76.0 76.9 76.0 74.6 73.9 74.7 77.4 76.5 76.6 74.2 77.3 Introduciendo los datos en el SAS tendremos: OPTIONS NODATE NONUMBER; DATA ESTBAS; LABEL EXTRAC='EXTRACTO DE MALTA'; INPUT EXTRAC @@; CARDS; 77.7 76.0 76.9 74.6 74.7 76.5 74.2 75.4 76.0 76.0 73.9 77.4 76.6 77.3 ; PROC MEANS N MEAN STD MIN MAX RANGE VAR USS STDERR CV; RUN; (1) (2) (3) (4) (5) (6) (7) (8) Revisando las sentencias tenemos: 18 Ing. Ramiro Raúl OCHOA TORREZ ESTADISTICA BASICA (1) (2) (3) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA ESTBAS, le indicamos que genere un archivo con el nombre ESTBAS. Con LABEL EXTRAC=’EXTRACTO DE MALTA’; le indicamos que nombre a la variable EXTRAC, con el nombre de Extracto de Malta. Con INPUT EXTRAC @@; le indicamos que ingrese la variable EXTRAC en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Como se menciono anteriormente con el PROC MEANS, le pedimos que nos presente: N (Número de observaciones sobre el cual se basan los cálculos), MEAN (La media), STD (La desviación estándar), MIN (El valor mínimo), MAX (El valor máximo), RANGE (El rango), SUM (La suma), VAR (La varianza), USS (La suma de cuadrados no corregida), CSS (La suma de cuadrados corregida), STDERR (El error estándar de la media), CV (El coeficiente de variación). Con RUN; le señalamos que es ejecutable. (4) (5) (6) (7) (8) La salida de los resultados que nos presenta el SAS será: The SAS System The MEANS Procedure Analysis Variable : EXTRAC EXTRACTO DE MALTA (1) (2) (3) (4) (5) (6) (7) N Mean Std Dev Minimum Maximum Range Variance ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 14 75.9428571 1.2270755 73.9000000 77.7000000 3.8000000 1.5057143 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Analysis Variable : EXTRAC EXTRACTO DE MALTA (8) (9) (10) Coeff of USS Std Error Variation ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 80762.02 0.3279497 1.6157879 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ De la salida de resultados apreciamos que: (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) N. El número de observaciones sobre el cual se basan los cálculos es 14 Mean. La Media es 75.9428571 Std Dev. El desvió estándar es 1.2270755 Minimun. El valor mínimo es 73.90 Maximun. El Valor máximo es 77.70 Range. El rango es 3.80 Variance. La varianza es 1.5057143 USS. La suma de cuadrados sin corregir es 80762.02 Std Error. El error estándar de la media es 0.3279497 Coeff of Variation. El coeficiente de variación es 1.6157879 % 3.2. Distribución de frecuencias Otra de las funciones que se emplean frecuentemente es la realización del cálculo de la distribución de frecuencias. Ejercicio Ing. Ramiro Raúl OCHOA TORREZ 19 Se tienen los datos de edades (en años cumplidos) de doce personas (Eduardo 2003). 16 15 17 14 16 17 16 15 14 16 18 15 Introduciendo los datos en el SAS tendremos: OPTIONS NODATE NONUMBER; DATA FREQ; LABEL EDAD='EDAD DE PERSONAS'; INPUT EDAD @@; CARDS; 16 15 17 14 16 16 15 14 16 18 ; PROC FREQ DATA=FREQ; RUN; (1) (2) (3) (4) (5) (6) 17 15 (7) (8) Revisando las sentencias tenemos: (1) (2) (3) (4) (5) (6) (7) (8) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA FREQ, le indicamos que genere un archivo con el nombre FREQ. Con LABEL EDAD=’EDAD DE PERSONAS’; le indicamos que el nombre de la variable EXTRAC, tendra una etiqueta de Edad de Personas. Con INPUT EDAD @@; le indicamos que ingrese la variable EDAD en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Con la opción PROC FREQ DATA=FREQ, indicamos que se va ha realizar una distribución de frecuencias del archivo Freq. Con RUN; le señalamos que es ejecutable. Los resultados que obtendremos será: The SAS System The FREQ Procedure EXTRACTO DE MALTA (3) (4) (5) Cumulative Cumulative EDAD Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 14 2 16.67 2 16.67 15 3 25.00 5 41.67 16 4 33.33 9 75.00 17 2 16.67 11 91.67 18 1 8.33 12 100.00 (1) (2) Los resultados presentados nos muestran 5 columnas, definiendo cada una de ellas tenemos: (1) (2) (3) EDAD. Los valores de la edad de las personas. Frequency. La frecuencia o presencia de cada uno de los valores. Percent. El porcentaje correspondiente a cada una de las frecuencias. 20 Ing. Ramiro Raúl OCHOA TORREZ ESTADISTICA BASICA (4) (5) Cumulative Frequency. La frecuencia acumulada. Cumulative Percent. El porcentaje acumulado. Ing. Ramiro Raúl OCHOA TORREZ 21 4. SUPUESTOS DEL ANÁLISIS DE VARIANZA 4.1. Normalidad Ejercicio En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella, se tomaron cuatro macetas por tratamiento. Obteniéndose los siguientes rendimientos (Padrón 1996): Maceta 1 2 3 4 T1 101 93 93 96 T2 51 61 59 58 T3 83 68 72 75 T4 67 40 46 52 T5 29 45 51 42 En este caso no se considera los tratamientos, solo los datos: 101 93 93 96 51 61 59 58 83 68 72 75 67 40 46 52 29 45 51 42 Para la introducción se datos se puede realizar estos, tomando en cuenta si se va tratar de una manera columnar o en filas, en el caso de filas se tendrá: OPTIONS NODATE NONUMBER; DATA NORMAL; INPUT REND @@; CARDS; 101 51 83 67 29 93 59 72 46 51 ; PROC UNIVARIATE NORMAL PLOT; VAR REND; RUN; 93 96 61 58 68 75 40 52 45 42 (1) (2) (3) (4) (5) (6) (7) (8) Revisando las sentencias tenemos: (1) (2) (3) (4) (5) (6) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA NORMAL, le indicamos que genere un archivo con el nombre NORMAL. Con INPUT REND @@; le indicamos que ingrese la variable REND (rendimiento) en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Con la opción PROC UNIVARIATE NORMAL PLOT, le pedimos que realice le procedimiento de normalidad y el grafico de normalidad. (7) VAR REND, con esta sentencia se pide la realización del análisis de la variable REND (rendimiento). (8) Con RUN; le señalamos que ejecute los comandos mencionados. Los resultados que obtendremos será: 22 Ing. Ramiro Raúl OCHOA TORREZ SUPUESTOS DEL ANALISIS DE VARIANZA RENDIMIENTO The UNIVARIATE Procedure Variable: REND Moments (1) (2) (3) (4) (5) (6) N Mean Std Deviation Skewness Uncorrected SS Coeff Variation 20 64.1 20.7336492 0.34126669 90344 32.3457866 Sum Weights Sum Observations Variance Kurtosis Corrected SS Std Error Mean 20 1282 429.884211 -0.8626058 8167.8 4.63618491 (7) (8) (9) (10) (11) (12) Basic Statistical Measures Location (13) (14) (15) Mean Median Mode Variability 64.10000 60.00000 51.00000 Std Deviation Variance Range Interquartile Range 20.73365 429.88421 72.00000 30.50000 (16) (17) (18) (19) NOTE: The mode displayed is the smallest of 2 modes with a count of 2. Tests for Location: Mu0=0 Test -Statistic- -----p Value------ Student's t Sign Signed Rank t M S Pr > |t| Pr >= |M| Pr >= |S| 13.82602 10 105 <.0001 <.0001 <.0001 (20) Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk Kolmogorov-Smirnov Cramer-von Mises Anderson-Darling W D W-Sq A-Sq Pr Pr Pr Pr 0.9538 0.120253 0.05233 0.357493 < > > > W D W-Sq A-Sq 0.4285 >0.1500 >0.2500 >0.2500 (21) (22) (23) (24) Quantiles (Definition 5) Quantile Estimate 100% Max 99% 95% 90% 101.0 101.0 98.5 94.5 En el procedimiento se debe tomar en cuenta no incluir los tratamientos, porque en el análisis de los datos se toma a todos de una manera general para determinar si la totalidad de los datos tienen o no una distribución normal, para nuestro caso de los resultados del SAS rescatamos: (1) (2) N. Total de datos 20 Mean. Media 64.1 Ing. Ramiro Raúl OCHOA TORREZ 23 (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) Std Deviation. Desvió estándar 20.7336492 Skewness. Medida de asimetría 0.34126669 Uncorrected SS. Suma de cuadrados sin corregir 90344 Coeff Variation. Coeficiente de variación 32.34579 Sum Weights. Suma de valores ponderados 20 Sum Observations. Suma de la totalidad de observaciones 1282 Variance. Varianza 429.884211 Kurtosis. Medida de Kurtosis – 0.8626058 Corrected SS. Suma de cuadrados corregida 8167.8 Std Error Mean. Error estándar de la media 4.63618491 Más abajo nos presenta las medidas de estadística básica (Basic Statistical Measures): (13) (14) (15) (16) (17) (18) (19) Mean. Media 64.10000 Median. Mediana 60.00000 Mode. Moda 51.00000 Std Deviation. Desvió estándar 20.73365 Variance. Varianza 429.88421 Range. Rango 72.00000 Intercuartile Range. Rango intercuartil 30.50000 Seguidamente nos presenta la prueba de situación de que la media es igual a cero (Test for Location: MuO=0), esta nos presenta en tres columnas Test (Prueba), Statistic (Estadístico) y p Value (Valor de la probabilidad): (20) Student’s t. Prueba de T con el valor de T 13.82602, el valor de la probabilidad (Pr > | t |) <.0001 nos indica la probalidad de que la media sea igual a cero, siendo en este caso significativa. Seguidamente nos presenta varias pruebas de normalidad (Test’s for Normality) al igual que el anterior caso nos proporciona en tres columnas (Prueba, Estadistico y Valor de Probabilidad): (21) (22) (23) (24) Shapiro-Wilk. Prueba de Shapiro-Wilk, valor de la prueba de la prueba W 0.9538, el valor de probabilidad (Pr < W) 0.4285 Kolmogorov-Smirnov. Prueba de Kolmogorov-Smirnov, valor de la prueba D 0.120253, el valor de probabilidad (Pr > D) >0.1500 Cramer-von Mises. Prueba de Cramer, valor de la prueba W-Sq 0.05233, el valor de la probabilidad (Pr > W-Sq) >0.2500 Anderson-Darling. Prueba de Anderson y Darling, valor de la prueba A-Sq 0.357493, el valor de la probabilidad (Pr > A.Sq) 0.2500 Más abajo nos presenta la definición de cuantiles, en dos columnas el quantil (Quantile) y valor estimado (Estimate). Presenta la división de los datos en cuartas partes. 24 Ing. Ramiro Raúl OCHOA TORREZ SUPUESTOS DEL ANALISIS DE VARIANZA RENDIMIENTO The UNIVARIATE Procedure Variable: REND Quantiles (Definition 5) (26) (25) Quantile 75% Q3 50% Median 25% Q1 10% 5% 1% 0% Min Estimate 79.0 60.0 48.5 41.0 34.5 29.0 29.0 Extreme Observations ----Lowest-------Highest--Value Obs Value Obs 29 40 42 45 46 Stem 10 9 8 7 6 5 4 3 2 5 9 20 10 14 Leaf 1 336 3 25 178 11289 0256 83 93 93 96 101 3 6 11 16 1 # 1 3 1 2 3 5 4 9 1 ----+----+----+----+ Multiply Stem.Leaf by 10**+1 Boxplot | | | +-----+ *--+--* | | +-----+ | | RENDIMIENTO The UNIVARIATE Procedure Variable: REND Normal Probability Plot 105+ +*+++ | * * +*+++ | *+++++ | +*+*+ 65+ ++*** | *+**** | * *+*+* | +++++ 25+ ++*++ +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 Continuando con la interpretación de los Cuarteles, tenemos: Ing. Ramiro Raúl OCHOA TORREZ 25 (25) (26) 25% Q1. El primer cuartil Q1, es el valor que tiene una cuarta parte, o 25% 75% Q3. Tercer cuartil Q3, es el valor que tiene tres terceras partes, o 75% Más abajo nos presenta las observaciones extremas en dos columnas Lowest (valores bajos) y Highest (valores altos), estos divididos a su vez en dos columnas donde tenemos el valor (Value) y el número de la observación (Obs). Seguidamente tenemos dos figuras, el primero de la izquierda la figura de ramas y hojas (Stem Leaf) y el de la derecha la figura de cajas (Boxplot). En la figura de ramas y hojas la interpretación se la hace multiplicando los valores por 10, o sea para el primer dato Stem 10, Leaf 1 siendo el valor 101, este esta consignado como un solo dato. El siguiente valor de Stem 9 y Leaf 336, me indica que tengo 3 valores: 93, 93 y 96. En el caso de la figura de cajas, que se basa en la media, los cuartiles y los valores extremos. La caja representa el rango intercuartil que encierra el 50% de los valores y tiene la mediana dibujada dentro, el rango intercuartil tiene como extremos el cuartil superior Q3 y el cuartil inferior Q1. Además se incluye la extensión de los datos mediante segmentos que se extienden de la caja hacia el valor máximo y hacia el valor mínimo. En vez de visualizar los valores individuales, se representa estadísticos básicos de la distribución: la mediana, el centil 25, el centil 75 y los valores extremos de la distribución, para su interpretación se consideran dos categorías de casos extremos, en función a cuanto se alejan con respecto del 50% central de la distribución. Aquellos casos con valores alejados más de tres veces el rango intercuartil desde el extremo superior o inferior de la caja (casos más extremos) y aquellos valores que están alejados entre 1.5 y tres veces de dicho rango. Los valores más pequeños y más grandes que estén dentro de los limites primer cuartil –1.5 y tercer cuartil +1.5, veces el rango intercualtil (IQR) constituyen los wiskers del grafico y aparecen representados mediante líneas horizontales dibujadas a ambos extremos de la caja central. Para nuestro ejemplo de la posición de la mediana (Med = 60) podemos determinar la tendencia central. El ancho de la caja nos da una idea de la variabilidad de las observaciones. Si la mediana no esta en el centro de la caja, podemos deducir que la distribución es asimétrica (si esta próxima al limite inferior de la caja, asimétrica positiva y, si esta próxima al limite superior, asimétrica negativa). La mediana (Med) es 60, el Cuartil 1 (Q1) es 48.5, el Cuartil 3 (Q3) es 79. Posteriormente tenemos la figura de probabilidad normal (Normal Probability Plot), donde se aprecia la distribución de los datos, observando si estos están dispersos o no. Conclusión De todos estos valores para determinar si los datos tienen una distribución normal son los de las pruebas de normalidad las que se deben considerar como es el caso de Shapiro-Wilk (21), donde si el valor de probabilidad es mayor a 0.05 se concluye que los datos presentan una distribución normal, si el valor de Pr < W es inferior a 0.05 se concluye que los datos no tienen una distribución normal a un nivel de significancia del 5% (α = 0.05), si el valor de Pr< W es inferior al 0.01 se concluirá que los datos no presentan una distribución normal al nivel de significancia del 1%. De similar forma se interpreta las otras pruebas (22), (23) y (24). Para nuestro ejemplo, el valor de Pr < W es 0.4285 (superior a 0.05 y 0.01) por lo que se concluye que los valores tienen una distribución normal. 4.2. Homogeneidad de varianzas 26 Ing. Ramiro Raúl OCHOA TORREZ SUPUESTOS DEL ANALISIS DE VARIANZA Cuando se requiere realizar una prueba de homogeneidad de varianzas de mas de dos muestras, se puede hacer uso de la prueba de Bartlett, que se emplea para determinar si hay o no homogeneidad de varianzas. Otro método de determinación de la homogeneidad de varianzas es la prueba de F MÁXIMA. Ejercicio En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella, se tomaron cuatro macetas por tratamiento. Obteniéndose los siguientes rendimientos (Padrón 1996): Maceta 1 2 3 4 T1 101 93 93 96 T2 51 61 59 58 T3 83 68 72 75 T4 67 40 46 52 T5 29 45 51 42 La hipótesis a probar será: Ho: σ2T1 = σ2T2 = σ2T3 = σ2T4 = σ2T5 Ha: σ2T1 ≠ σ2T2 ≠ σ2T3 ≠ σ2T4 ≠ σ2T5 4.2.1. Prueba de Bartlett Los datos que se deben colocar en el Editor de programas (PROGRAM EDITOR) del SAS con los comandos respectivos será: OPTIONS NODATE NONUMBER; DATA BARTLETT; INPUT TRAT $ REND @@; CARDS; T1 101 T2 51 T1 93 T2 61 T1 93 T2 59 T1 96 T2 58 ; PROC ANOVA; TITLE'RENDIMIENTO'; CLASS TRAT; MODEL REND=TRAT; MEANS TRAT/HOVTEST=BARTLETT; RUN; T3 T3 T3 T3 83 68 72 75 T4 T4 T4 T4 67 40 46 52 T5 T5 T5 T5 29 45 51 42 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) La descripción de cada una de las sentencias empleada (1) (2) (3) (4) (5) (6) (7) (8) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA BARTLETT, le indicamos que genere un archivo con el nombre BARTLETT. Con INPUT TRAT $ REND @@; le indicamos que ingrese la variable TRAT $ (tratamiento variable alfanumérica) y REND (rendimiento) en forma de fila. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. Con la opción PROC ANOVA, le pedimos que realice le procedimiento de análisis de varianza. CLASS TRAT, señalamos la variable en estudio. MODEL REND=TRAT, agregamos el modelo con la variable de respuesta y la variable de estudio. Ing. Ramiro Raúl OCHOA TORREZ 27 (9) (10) MEANS TRAT /HOVTEST=BARTLETT, sentencia que indica que de los promedios de los tratamientos realice la prueba de Barltlett. Con RUN; le señalamos que es ejecute. Dándonos como resultado: RENDIMIENTO The ANOVA Procedure Class Level Information Class TRAT Levels 5 Values T1 T2 T3 T4 T5 Number of observations RENDIMIENTO 20 The ANOVA Procedure Dependent Variable: REND Source Model Error Corrected Total DF 4 15 19 R-Square 0.892015 Source TRAT Sum of Squares 7285.800000 882.000000 8167.800000 Coeff Var 11.96274 DF 4 Mean Square 1821.450000 58.800000 Root MSE 7.668116 Anova SS 7285.800000 Level of TRAT T1 T2 T3 T4 T5 DF 4 N 4 4 4 4 4 Chi-Square 4.5524 RENDIMIENTO Pr > F <.0001 F Value 30.98 Pr > F <.0001 REND Mean 64.10000 Mean Square 1821.450000 RENDIMIENTO The ANOVA Procedure Bartlett's Test for Homogeneity of REND Variance Source TRAT F Value 30.98 (1) Pr > ChiSq 0.3364 The ANOVA Procedure -------------REND-----------Mean Std Dev 95.7500000 3.7749172 57.2500000 4.3493295 74.5000000 6.3508530 51.2500000 11.5866302 41.7500000 9.2870878 La salida de resultados nos presenta varias etapas, la primera el análisis de varianza (más adelante analizaremos más profundamente). (1) Más abajo la prueba de Bartlett para la homogeneidad de varianzas (Bartlett’s Test for Homogeneity), presentada en tres columnas Source (Fuentes de variación), DF (Grados de libertad), Chi-Square (Valor calculado de Chi-cuadrado) y Pr > ChiSq (Valor de la probabilidad de Chi-cuadrado). Conclusión 28 Ing. Ramiro Raúl OCHOA TORREZ SUPUESTOS DEL ANALISIS DE VARIANZA La prueba de Bartlett nos presenta una probabilidad (Pr > ChiSq) 0.3364 superior al valor de 0.05, por lo que aceptamos la hipótesis nula de que las varianzas son homogéneas. Si se quiere determinar de otra forma la homogeneidad o no de las varianzas, se debe determinar el valor de Chi– cuadrado tabular para poder compararlo con el valor calculado, determinado este valor se aprecia que, el valor de Chi–cuadrado calculado (X2C= 4.5524) es menor al valor de Chi–cuadrado tabular para 3 GL (X20.05 = 7.82), así que se acepta la hipótesis nula de que las varianzas son homogéneas. 4.2.2. Prueba de FMÁXIMA Para la prueba de MÁXIMA se debe calcular los valores de suma de cuadrados (CSS) de los diferentes tratamientos, para posteriormente poder realizar el cálculo de la MÁXIMA, mediante las siguientes sentencias y procedimientos: OPTIONS NODATE NONUMBER; DATA FMAXIMA; INPUT TRAT $ REND; CARDS; T1 101 T1 93 T1 93 T1 96 T2 51 T2 61 T2 59 T2 58 T3 83 T3 68 T3 72 T3 75 T4 67 T4 40 T4 46 T4 52 T5 29 T5 45 T5 51 T5 42 ; PROC MEANS N MEAN CSS; BY TRAT; VAR REND; RUN; (1) (2) (3) (4) (5) (6) (7) (8) (9) Revisando las sentencias introducidas tenemos: (1) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. (2) Con DATA MÁXIMA, le indicamos que genere un archivo con el nombre MÁXIMA. (3) Con INPUT TRAT $ REND; le indicamos que ingrese la variable TRAT $ (tratamiento variable alfanumérica) y REND (rendimiento) en forma de columnas. (4) CARDS; le señala que los datos vienen a continuación. (5) Seguidamente se ubican todos los datos. (6) Con la opción PROC MEANS N MEAN CSS, indicamos al SAS que nos presente el número total de valores de cada tratamiento (N), el promedio de cada tratamiento (MEAN) y realice el calculo de la suma de cuadrados corregida (CSS). (7) BY TRAT, indicamos que realice el análisis de la variable de estudio tratamiento (TRAT). (8) VAR REND, indicamos que la variable de respuesta a ser analizada será rendimiento (REND). Ing. Ramiro Raúl OCHOA TORREZ 29 (9) Con RUN; le señalamos que ejecute todos los comandos. Dándonos como resultados en tres columnas para cada uno de los tramientos: el número de datos (N), el promedio de cada tratamiento (Means) y la suma de cuadrados de cada tratamiento (Corrected CSS): The SAS System ------------------------------------------- TRAT=T1 ----------------------------------------The MEANS Procedure Analysis Variable : REND N Mean Corrected SS ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 4 95.7500000 42.7500000 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ------------------------------------------- TRAT=T2 ----------------------------------------Analysis Variable : REND N Mean Corrected SS ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 4 57.2500000 56.7500000 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ------------------------------------------- TRAT=T3 ----------------------------------------Analysis Variable : REND N Mean Corrected SS ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 4 74.5000000 121.0000000 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ------------------------------------------- TRAT=T4 ----------------------------------------Analysis Variable : REND N Mean Corrected SS ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 4 51.2500000 402.7500000 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ------------------------------------------- TRAT=T5 ----------------------------------------The MEANS Procedure Analysis Variable : REND N Mean Corrected SS ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 4 41.7500000 258.7500000 ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ De las sumas de cuadrados (Corrected CSS) de los diferentes tratamientos se seleccionan el valor más bajo y el valor más alto, para determinar el valor de MÁXIMA, para luego comparar con el valor de F tabular, los valores determinados para nuestro ejemplo serán: FMAXIMA = 402.75 = 9.42 42.75 Conclusión El valor de MÁXIMA tabular, para la prueba a un α=0.01, se la busca en la tabla de F, tomando el total de tratamientos y (r – 1) grados de libertad, para nuestro ejemplo tendremos 5 y 3, luego será F0.01 (5 y 3) = 28.24; Como el valor de MÁXIMA calculado es menor al valor de MÁXIMA tabular, se acepta la hipótesis nula de igualdad de varianzas. 30 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR 5. DISEÑO COMPLETAMENTE AL AZAR (DCA) 5.1. DCA con igual número de repeticiones Ejercicio Una persona que realiza plantaciones quiso comparar los efectos de cinco tratamientos de preparación en el sitio sobre el crecimiento inicial en altura de plántulas de pino en el terreno. Dispuso de 25 plantines y aplico cada tratamiento a 5 plantines escogidas al azar. Entonces, los plantines se plantaron a mano y, al final de 5 años, se midió la altura de todos los pinos y se calculo la altura media de cada plantin. Las medidas de los plantines (en pies) fueron como sigue (Freese 1970). A 15 14 12 13 13 B 16 14 13 15 14 Modelo lineal aditivo C 13 12 11 12 10 D 11 13 10 12 11 E 14 12 12 10 11 Yij = μ + τi + εij Donde: Yij μ τi εij = Una observación cualquiera = Media poblacional = Efecto del i – ésimo tratamiento = Error experimental Tratamiento Repetición i… j… t… r… 1… 1… 5 5 Las Hipótesis a probar serán: Ho: τ A = τB = τC = τD = τE Ha: τ A ≠ τB ≠ τC ≠ τD ≠ τE Introduciendo los datos a la el PROGRAM EDITOR del SAS tendremos: Ing. Ramiro Raúl OCHOA TORREZ 31 OPTIONS NODATE NONUMBER; DATA DCA; INPUT TRAT $ ALTURA @@; CARDS; A 15 B 16 C A 14 B 14 C A 12 B 13 C A 13 B 15 C A 13 B 14 C ; PROC ANOVA; TITLE'DISEÑO COMPLETAMENTE AL AZAR'; CLASS TRAT; MODEL ALTURA=TRAT; MEANS TRAT/DUNCAN TUKEY; MEANS TRAT/HOVTEST=BARTLETT; RUN; 13 12 11 12 10 D D D D D 11 13 10 12 11 E E E E E (1) (2) (3) (4) (5) 14 12 12 10 11 (6) (7) (8) (9) (10) (11) (12) Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7) (8) (9) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCA, le indicamos que genere un archivo con el nombre DCA. Con INPUT TRAT $ ALTURA @@; le indicamos que ingrese la variable TRAT $ (tratamiento variable alfanumérica) y ALTURA (rendimiento) en forma de filas. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos los datos. PROC ANOVA; le indica que realice el calculo de análisis de varianza; TITLE’DISEÑO COMPLETAMENTE AL AZAR’; le señala que el titulo para la salida de los resultados será ‘Diseño completamente al azar’, CLASS TRAT; le señala cual variable es la de estudio o de clasificación para nuestro caso la variable tratamiento. MODEL ALTURA=TRAT; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar (Yij = μ + τi + εij) de donde se coloca como: Yij = μ + τi + εij Variable de respuesta = Tratamiento o variable de estudio Altura = Tratamiento (10) (11) (12) No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. MEANS TRAT/DUNCAN TUKEY; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los procese con las pruebas de Duncan y Tukey. MEANS TRAT/HOVTEST=BARTLETT; con esta sentencia le solicitamos al SAS que realice la prueba de homogeneidad de varianzas de Bartlett. Con RUN; le señalamos que las sentencias anteriores son ejecutables. La salida de los resultados que el SAS nos presentara será: 32 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR DISEÑO COMPLETAMENTE AL AZAR (1) The ANOVA Procedure Class Level Information (4) (5) (6) Class Levels Values TRAT 5 A B C D E Number of observations 25 Dependent Variable: ALTURA (11) Source Model Error Corrected Total (21) Source TRAT (7) DISEÑO COMPLETAMENTE AL AZAR (8) The ANOVA Procedure (9) (10) (12) (17) R-Square 0.539228 (2) (3) (13) (14) (15) Sum of DF Squares Mean Square F Value 4 34.64000000 8.66000000 5.85 20 29.60000000 1.48000000 24 64.24000000 (18) (19) (20) Coeff Var Root MSE ALTURA Mean 9.716873 1.216553 12.52000 DF 4 Anova SS 34.64000000 Mean Square 8.66000000 F Value 5.85 (16) Pr > F 0.0028 Pr > F 0.0028 De los resultados resaltamos: (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) Titulo del trabajo DISEÑO COMPLETAMENTE AL AZAR El procedimiento empleado (Análisis of Variante Procedure) Información de la variable analizada así como sus niveles (Class Level Information) El nombre de la variable analizada (Class TRAT) en nuestro ejemplo TRAT representa tratamientos Los niveles de la variable analizada (Levels) para nuestro caso 5 Los valores que toman los niveles de la variable analizada (Values) en nuestro ejemplo: A, B, C, D y E El número de observaciones en el juego de datos (Number of observations in data set = 25) El titulo del trabajo (DISEÑO COMPLETAMENTE AL AZAR) El procedimiento empleado (Análisis of Variante Procedure) La variable de respuesta analizada (Dependent Variable : ALTURA) Las fuentes de variación (Source) Grados de libertad (DF) Suma de cuadrados (Sum of Squares) Cuadrados medios (Mean Square) F calculado (F value) El valor de probabilidad mayor a F (Pr > F) Coeficiente de determinación (R-Square) Coeficiente de variación (CV) Raíz cuadrada del Cuadrado medio del error (Root MSE) Promedio general de la variable de respuesta (ALTURA Mean) Valores correspondientes de FV, SC, CM, Fc y Prob de nuestra variable de estudio (TRAT) La salida que presenta el SAS es en dos partes, una considerando al modelo (Model) como fuente de variación única junto con el error experimental (Error) y total (Corrected total) y una segunda parte donde se presenta la variable de clasificación o estudio (TRAT). En este caso se debe ordenar la salida del SAS, donde se reemplaza los valores de Ing. Ramiro Raúl OCHOA TORREZ 33 la fuente de variación Model de la primera parte por los valores de nuestra(s) variable(s) de estudio(s) de la segunda parte para nuestro ejemplo tratamiento, es decir: Source Model Error Corrected Total DF 4 20 24 R-Square 0.539228 Source TRAT Sum of Squares 34.64000000 29.60000000 64.24000000 Coeff Var 9.716873 Mean Square 8.66000000 1.48000000 Root MSE 1.216553 F Value 5.85 Pr > F 0.0028 ALTURA Mean 12.52000 DF 4 Anova SS 34.64000000 Mean Square 8.66000000 F Value 5.85 Pr > F 0.0028 DF 4 20 24 Sum of Squares 34.64000000 29.60000000 64.24000000 Mean Square 8.66000000 1.48000000 F Value 5.85 Pr > F 0.0028 Quedando nuestros resultados: Source TRAT Error Corrected Total R-Square 0.539228 Coeff Var 9.716873 Root MSE 1.216553 ALTURA Mean 12.52000 Mediante las reglas de decisión, decidimos si se tienen no significancia, significancia o alta significancia: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source TRAT Error Corrected Total DF 4 20 24 R-Square 0.539228 Sum of Squares 34.64000000 29.60000000 64.24000000 Coeff Var 9.716873 Mean Square 8.66000000 1.48000000 Root MSE 1.216553 F Value 5.85 Pr > F 0.0028** ALTURA Mean 12.52000 Conclusión La conclusión de los resultados como ya se indico en el acápite 2.4, se la realiza tomando en cuenta el valor de probabilidad presentado, Pr > F = 0.028, siendo este valor inferior al 0.05 (5%) e inferior al 0.01 (1%) por lo que las diferencias entre tratamientos serán altamente significativas (**). Podemos indicar entonces que se tienen diferencias en el crecimiento en altura de las plántulas entre los tratamientos de preparación de sustratos, siendo esta diferencia altamente significativa. El coeficiente de variación de 9.716873% nos indica que los valores analizados son buenos, estando dentro del margen de aceptación. La siguiente salida es de la prueba de Duncan: 34 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR DISEÑO COMPLETAMENTE AL AZAR The ANOVA Procedure Duncan's Multiple Range Test for ALTURA (1) (2) NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 (3) Error Degrees of Freedom 20 (4) Error Mean Square 1.48 (5) Number of Means Critical Range 5 1.771 (6) (7) Means with the same letter are not significantly different. (8) Duncan Grouping A A B A B B C C C C C 2 1.605 3 1.685 4 1.735 Mean 14.4000 N 5 TRAT B 13.4000 5 A 11.8000 5 E 11.6000 5 C 11.4000 5 D (9) Revisando los resultados tenemos: (1) (2) (3) (4) (5) (6) (7) (8) (9) Nombre de la prueba Duncan Señala que controla el error de tipo I y no así la proporción de los experimentos (This test controls the type I comparisonwise error rate, not the experimenwise error rate) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 20) El cuadrado medio del error (Error Mean Square = 1.48) Al ser una prueba de comparación múltiple presenta el número de medias (tratamientos) empleados en el análisis (Number of Means), para nuestro caso al tener solo 5 tratamientos nos presentara: 2, 3, 4, 5. El rango critico para cada promedio consistente en los valores referenciales de Duncan (Critical Range) Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly different), que nos indica que los promedios con la misma letra no son significativamente diferentes. Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada promedio. Conclusión Como conclusión de la prueba de Duncan, se aprecia que se formulan tres grupos representados por las letras de la agrupación de Duncan (Duncan Grouping), de estos se observa que un primer grupo esta formado por los tratamientos B y A, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los tratamientos A y E, representados por la letra B y el tercer grupo formado por los tratamientos E, C y D representados por la letra C. En conclusión indicamos que el tratamiento B posee un promedio de altura significativamente superior a los tratamientos E, C y D, siendo este ultimo, el tratamiento D el que registra el promedio más bajo de altura de planta. La siguiente salida es de la prueba de Tukey: Ing. Ramiro Raúl OCHOA TORREZ 35 DISEÑO COMPLETAMENTE AL AZAR The ANOVA Procedure Tukey's Studentized Range (HSD) Test for ALTURA (1) NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha Error Degrees of Freedom Error Mean Square Critical Value of Studentized Range Minimum Significant Difference 0.05 20 1.48 4.23186 2.3024 (2) (3) (4) (5) (6) Means with the same letter are not significantly different. Tukey Grouping Mean N TRAT A A A 14.4000 5 B 13.4000 5 A 11.8000 5 E 11.6000 5 C 11.4000 5 D B B B B B B B (7) (8) Analizando la salida de resultados tenemos: (1) (2) (3) (4) (5) (6) (7) (8) Controla el error de tipo I y la proporción de los experimentos, pero tiene un alto valor del error de tipo II (This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REWQ) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 20) El cuadrado medio del error (Error Mean Square = 1.48) El valor critico del rango studentizado (Critical Value of Studentized Range = 4.232) La diferencia mínima significativa (Minimun Significant Difference = 2.3024) Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly different), que nos indica que los promedios con la misma letra no son significativamente diferentes. Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada promedio. Conclusión Como conclusión se aprecia que se formulan a diferencia de la prueba de Duncan dos grupos representados por las letras de la agrupación de Tukey (Tukey Grouping), de estos se aprecia que un primer grupo esta formado por los tratamientos B y A, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los tratamientos A, E, C y D representados por la letra B. En síntesis concluimos que el tratamiento B posee un promedio de altura significativamente superior a los tratamientos E, C y D, siendo este ultimo, el tratamiento D el que registra el promedio más bajo de altura de planta. El tratamiento A queda en un punto intermedio entre los dos grupos. 36 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR La última salida es de la prueba de Bartlett, para la homogeneidad de varianzas: DISEÑO COMPLETAMENTE AL AZAR The ANOVA Procedure Bartlett's Test for Homogeneity of ALTURA Variance (1) (2) (3) (4) Source DF Chi-Square Pr > ChiSq TRAT 4 0.4447 0.9787 DISEÑO COMPLETAMENTE AL AZAR The ANOVA Procedure Level of TRAT N A B C D E 5 5 5 5 5 ------------ALTURA----------Mean Std Dev 13.4000000 14.4000000 11.6000000 11.4000000 11.8000000 1.14017543 1.14017543 1.14017543 1.14017543 1.48323970 En la última parte se presenta la prueba de Bartlett para las varianza de los tratamientos: (1) (2) (3) (4) Source, variable analizada en la prueba de Bartlett TRAT (Tratamiento) DF, grados de libertad (DF = 4) Chi – Square, valor de Chi – cuadrado (Chi – Square = 0.4447) Pr > ChiSq, valor de la probabilidad mayor a ChiSq (Pr > ChiSq = 0.9787) Conclusión Apreciando el valor de probabilidad de la prueba de Bartlett este nos presenta una probabilidad Pr > ChiSq = 0.9787 superior al valor de 0.05, por lo tenemos no significancia, al no ser significativo aceptamos la hipótesis nula de que las varianzas son homogéneas por lo que tenemos Ho: σ2A = σ2B = σ2C = σ2D = σ2E. 5.2. DCA con diferente número de repeticiones Ejercicio Los datos siguientes se refieren a los pesos finales de corderos alimentados durante 90 días con una ración que contenía 14 % de proteína. Los tratamientos fueron definidos de la siguiente manera (Rodríguez, 1991): Tratamiento 1 2 3 4 T1 T2 T3 Ing. Ramiro Raúl OCHOA TORREZ I 47 50 57 Corderos Castrados Enteros Implantados con Sinovex S Implantados con Estil Bestrol II 52 54 53 III 56 54 IV 51 57 37 T4 62 Modelo lineal aditivo Donde: Yij μ τi εij Tratamiento Repetición 65 74 50 Yij = μ + τi + εij = Una observación cualquiera = Media poblacional = Efecto del i – ésimo tratamiento = Error experimental i… j… t… r… 1… 1… 4 4 Las Hipótesis a probar serán: Ho: Ha: τ1 = τ2 = τ3 = τ4 τ1 ≠ τ2 ≠ τ3 ≠ τ4 Introduciendo los datos al PROGRAM EDITOR del SAS, con el cuidado de que los tratamientos que no tienen igual número de repeticiones, tenemos: OPTIONS NODATE NONUMBER; DATA DCA_UF; LABEL PESFIN='PESO FINAL'; INPUT TRAT $ PESFIN; CARDS; T1 47 T2 50 T3 57 T4 62 T1 52 T2 54 T3 53 T4 65 T2 56 T3 54 T4 74 T1 51 T3 57 T4 50 ; PROC GLM; CLASS TRAT; MODEL PESFIN=TRAT; MEANS TRAT/DUNCAN; MEANS TRAT/TUKEY; RUN; (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) Revisando las sentencias introducidas tenemos: (1) (2) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCA_UF; le indicamos que genere un archivo con el nombre DCA_UF. 38 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR (3) (4) (5) (6) (7) (8) (9) Con LABEL PESFIN=’PESO FINAL’; le indicamos al SAS que la variable PESFIN, tendrá como etiqueta o nombre ‘Peso final’. Con INPUT TRAT $ PESFIN; le indicamos que ingrese las variables TRAT (tratamiento) y con el comando $ indicamos que es del tipo alfanumérico y PESFIN como variable de respuesta en forma en forma columnar. CARDS; le señala que los datos vienen a continuación. Seguidamente se observan los datos ordenados en forma columnar. PROC GLM; le indica que realice el calculo de análisis de varianza en base del modelo lineal general; considerando que se tiene diferente número de repeticiones por tratamiento. CLASS TRAT; le señala cual variable es la de estudio o de clasificación para nuestro caso la variable tratamiento (TRAT). MODEL PESFIN=TRAT; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar (Yij = μ + τi + εij) de donde se coloca como: Yij = μ + τi + εij Variable de respuesta = Tratamientos o Variables de estudio Peso final = tratamientos (10) (11) (12) No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del modelo. MEANS TRAT/DUNCAN; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los procese con la pruebas de Duncan. MEANS TRAT/DUNCAN; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los procese con la pruebas de Tukey. Con RUN; le señalamos que las sentencias anteriores son ejecutables. La salida de los resultados que el SAS nos presentara será: Ing. Ramiro Raúl OCHOA TORREZ 39 The SAS System The GLM Procedure (3) Class TRAT (1) Class Level Information (4) (5) Levels Values 4 T1 T2 T3 T4 Number of observations (2) 14 (6) The SAS System The GLM Procedure Dependent Variable: PESFIN PESO FINAL (8) (18) (9) Source Model Error Corrected Total DF 3 10 13 (14) R-Square 0.479640 (7) (10) Sum of Squares 313.5476190 340.1666667 653.7142857 (15) Coeff Var 10.44160 (11) Mean Square 104.5158730 34.0166667 (16) Root MSE 5.832381 (12) (13) F Value 3.07 Pr > F 0.0776 (17) PESFIN Mean 55.85714 (19) Source TRAT DF 3 Type I SS 313.5476190 Mean Square 104.5158730 F Value 3.07 Pr > F 0.0776 (20) Source TRAT DF 3 Type III SS 313.5476190 Mean Square 104.5158730 F Value 3.07 Pr > F 0.0776 (1) (2) (3) (4) (5) (6) El procedimiento empleado (General Linear Models Procedure) Información de la variable analizada así como sus niveles (Class Level Information) El nombre de la variable analizada (Class TRAT) en nuestro ejemplo TRAT representa tratamientos Los niveles de la variable analizada (Levels) para nuestro caso 4 Los valores que toman los niveles de la variable analizada (Values) en nuestro ejemplo: T1, T2, T3 y T4 El número de observaciones en el juego de datos (Number of observations in data set = 14) Avanzando para apreciar la siguiente salida de resultados tendremos el análisis de varianza propiamente dicho: (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) (17) La variable de respuesta analizada y su etiqueta (Dependent Variable: PESFIN PESO FINAL). Las fuentes de variación (Source) Grados de libertad (DF) Suma de cuadrados (Sum of Squares) Cuadrados medios (Mean Square) F calculado (F value) El valor de probabilidad mayor a F (Pr > F) Coeficiente de determinación (R-Square) Coeficiente de variación (CV) Raíz cuadrada del Cuadrado medio del error (Root MSE) Promedio general de la variable de respuesta (ALTURA Mean) 40 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR Como se puede apreciar, la salida del análisis de varianza, nos presenta en este caso tres partes: (18) (19) (20) La primera constituida por las fuentes de variación Model, Error y Corrected Total; La segunda esta nuestra variable de clasificación o estudio TRAT, con la Suma de Cuadrados (SS) con el tipo I, La tercera también esta nuestra variable de clasificación o estudio TRAT, con la Suma de Cuadrados (SS) con el tipo III, Siendo los valores de las tres iguales, esto se debe a que tenemos una única variable de estudio que son los tratamientos. (18) Source Model Error Corrected Total DF 3 10 13 R-Square 0.479640 Sum of Squares 313.5476190 340.1666667 653.7142857 Coeff Var 10.44160 Mean Square 104.5158730 34.0166667 Root MSE 5.832381 F Value 3.07 Pr > F 0.0776 PESFIN Mean 55.85714 (19) Source TRAT DF 3 Type I SS 313.5476190 Mean Square 104.5158730 F Value 3.07 Pr > F 0.0776 (20) Source TRAT DF 3 Type III SS 313.5476190 Mean Square 104.5158730 F Value 3.07 Pr > F 0.0776 Al igual que en el anterior ejercicio debemos organizar la salida del SAS, para tener un ANVA, para tal caso en la primera parte (18) los valores que corresponden a Model son remplazados por los valores de TRAT de la segunda (19) o la tercera parte (20), siendo en este caso indistinto al ser los mismos valores, pero en caso de que se tengan diferentes valores lo más recomendable es tomar los valores de la Suma de Cuadrados con el Tipo III (20), por ser el más ajustado a los efectos del modelo. Quedando nuestro ANVA de la siguiente forma: Source TRAT Error Corrected Total R-Square 0.479640 Sum of DF Squares Mean Square F Value 3 313.5476190 104.5158730 3.07 10 340.1666667 34.0166667 13 653.7142857 Coeff Var Root MSE PESFIN Mean 10.44160 5.832381 55.85714 Pr > F 0.0776ns Conclusión La conclusión de los resultados como ya se indico anteriormente, se la realiza tomando en cuenta el valor de probabilidad presentado, Pr > F = 0.0776, siendo este valor superior al 0.05 (5%) por lo que no se encuentran diferencias entre tratamientos. Por lo que podemos afirmar que no se tienen diferencias en los pesos finales de corderos alimentados durante 90 días con una ración que contenía 14 % de proteína. La segunda parte de la salida del SAS de la ventana OUTPUT, nos presenta la prueba de medias de Duncan: Ing. Ramiro Raúl OCHOA TORREZ 41 The SAS System The GLM Procedure Duncan's Multiple Range Test for PESFIN (1) NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 10 Error Mean Square 34.01667 Harmonic Mean of Cell Sizes 3.428571 (2) (3) (4) NOTE: Cell sizes are not equal. Number of Means Critical Range 2 9.93 3 10.37 4 10.63 Means with the same letter are not significantly different. (8) Duncan Grouping Mean N TRAT A 62.750 4 T4 A B A 55.250 4 T3 B A B A 53.333 3 T2 B B 50.000 3 T1 (5) (6) (7) La siguiente salida del SAS será la prueba de Duncan: (1) (2) (3) (4) (5) (6) (7) (8) Señala que controla el error de tipo I y no así la proporción de los experimentos (This test controls the type I comparisonwise error rate, not the experimenwise error rate) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 10) El cuadrado medio del error (Error Mean Square = 34.01667) Al ser una prueba de comparación múltiple presenta el número de medias (tratamientos) empleados en el análisis (Number of Means), para nuestro caso al tener solo 5 tratamientos nos presentara: 2, 3, 4 y 5. El rango critico para cada promedio o valor referencial de Duncan (Critical Range) Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly different), que nos indica que los promedios con la misma letra no son significativamente diferentes. Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada promedio. Conclusión Con relación a la prueba de Duncan, se aprecia que se formulan dos grupos representados por las letras de la agrupación de Duncan (Duncan Grouping), de estos se aprecia que un primer grupo esta formado por los tratamientos T4, T3 y T2, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los tratamientos T3, T2 y T1 representados por la letra B. Concluyendo que el tratamiento T4 posee un promedio de peso final significativamente superior, siendo el tratamiento T1, el tratamiento el que registra el promedio más bajo de peso final. 42 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR Más abajo nos presenta la prueba de medias de Tukey, siendo su salida: The SAS System The GLM Procedure Tukey's Studentized Range (HSD) Test for PESFIN NOTE: This test controls the Type I experimentwise error rate. (1) Alpha 0.05 Error Degrees of Freedom 10 Error Mean Square 34.01667 Critical Value of Studentized Range 4.32658 (2) (3) (4) (5) Comparisons significant at the 0.05 level are indicated by ***. (6) TRAT Comparison T4 - T3 T4 - T2 T4 - T1 T3 - T4 T3 - T2 T3 - T1 T2 - T4 T2 - T3 T2 - T1 T1 - T4 T1 - T3 T1 - T2 Difference Between Means 7.500 9.417 12.750 -7.500 1.917 5.250 -9.417 -1.917 3.333 -12.750 -5.250 -3.333 Simultaneous 95% Confidence Limits -5.117 20.117 -4.211 23.045 -0.878 26.378 -20.117 5.117 -11.711 15.545 -8.378 18.878 -23.045 4.211 -15.545 11.711 -11.236 17.902 -26.378 0.878 -18.878 8.378 -17.902 11.236 Siguiendo con la presentación de resultados del SAS, tenemos la prueba de Tukey: (1) (2) (3) (4) (5) (6) (7) Controla el error de tipo I y la proporción de los experimentos (This test controls the type I experimentwise error rate) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 10) El cuadrado medio del error (Error Mean Square = 34.01667) El valor critico del rango studentizado (Critical Value of Studentized Range = 4.32658) Más abajo una indicación de que significa la salida de Tukey (Comparisons significant at the 0.05 level are indicated by ***), las comparaciones significantivas a un nivel del 0. 05 se indican por * * *. Por ultimo nos presenta las diferentes comparaciones realizadas entre tratamientos (TRAT comparison), la diferencia entre medias (Difference Between Means) y el limite de confianza simultaneo al 95% (Simultaneous 95% Confidence Limit). Conclusión Se aprecia que ninguna de las comparaciones resulto significativa. Por lo que se concluye que ninguno de los tratamientos presenta una superioridad en el peso final con relación a otro tratamiento. Ing. Ramiro Raúl OCHOA TORREZ 43 La particularidad de la salida de los resultados de la prueba de Duncan se debe a que los datos no están balanceados, es decir no están en la misma proporción. 5.3. DCA con muestreo Ejercicio Los datos que se muestran a continuación se refieren a producciones parciales de forraje de maíz verde, tomadas como muestras ante la imposibilidad de medir la producción total de cada unidad experimental. Los tratamientos consisten en cantidades diferentes de estiércol incorporado al suelo como mejorador (Ibáñez, 2000). Dosis 0 t / ha 4 t / ha 6 t / ha 2 t / ha Modelo lineal aditivo Donde: Yijk μ τi εij εijk Tratamiento Repetición Muestra Muestra 1 2 3 1 2 3 1 2 3 1 2 3 I 24 23 21 25 28 30 56 65 58 24 19 23 II 19 21 24 31 24 32 62 60 59 21 22 24 III 18 19 22 28 32 36 61 60 64 23 18 22 IV 23 22 20 34 33 29 62 60 61 19 21 23 Yijk = μ + τi + εij + εijk = Una observación cualquiera = Media poblacional = Efecto del i – ésimo tratamiento (dosis) = Error experimental de la unidad experimental = Error de la muestra (sub unidad experimental) i… j… k… t… r… m… 1… 1… 1… 4 4 3 Las hipótesis a probar serán: Ho: Ha: 0 t/ha = 2 t/ha = 4 t/ha = 6 t/ha m1 = m2 = m3 0 t/ha ≠ 2 t/ha ≠ 4 t/ha ≠ 6 t/ha m1 ≠ m2 ≠ m3 Introduciendo los datos al PROGRAM EDITOR del SAS tendremos: 44 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR OPTIONS NODATE NONUMBER; DATA DCAMUE; LABEL RENFOR='RENDIMIENTO DE FORRAJE'; INPUT DOSIS $ MUESTRA RENFOR @@; CARDS; 0_t_ha 1 24 0_t_ha 1 0_t_ha 2 23 0_t_ha 2 0_t_ha 3 21 0_t_ha 3 4_t_ha 1 25 4_t_ha 1 4_t_ha 2 28 4_t_ha 2 4_t_ha 3 30 4_t_ha 3 6_t_ha 1 56 6_t_ha 1 6_t_ha 2 65 6_t_ha 2 6_t_ha 3 58 6_t_ha 3 2_t_ha 1 24 2_t_ha 1 2_t_ha 2 19 2_t_ha 2 2_t_ha 3 23 2_t_ha 3 0_t_ha 1 19 0_t_ha 1 0_t_ha 2 21 0_t_ha 2 0_t_ha 3 24 0_t_ha 3 4_t_ha 1 31 4_t_ha 1 4_t_ha 2 24 4_t_ha 2 4_t_ha 3 32 4_t_ha 3 6_t_ha 1 62 6_t_ha 1 6_t_ha 2 60 6_t_ha 2 6_t_ha 3 59 6_t_ha 3 2_t_ha 1 21 2_t_ha 1 2_t_ha 2 22 2_t_ha 2 2_t_ha 3 24 2_t_ha 3 ; PROC GLM; CLASS DOSIS MUESTRA; MODEL RENFOR=DOSIS MUESTRA(DOSIS); TEST H=DOSIS E=MUESTRA(DOSIS); LSMEANS DOSIS/PDIFF; MEANS DOSIS/DUNNETT('0_t_ha'); RUN; 18 19 22 28 32 36 61 60 64 23 18 22 23 22 20 34 33 29 62 60 61 19 21 23 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7) (8) (9) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCAMUE; le indicamos que genere un archivo con el nombre DCAMUE. Con LABEL RENFOR=’RENDIMIENTO DE FORRAJE’; le indicamos al SAS que la variable RENFOR, tendrá como etiqueta o nombre ‘Rendimiento de forraje’. Con INPUT DOSIS $ MUESTRA RENCOR @@; le indicamos que ingrese las variables dosis (alfanumérico), muestra (numérico) y rendimiento de forraje en forma de filas. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos nuestros datos ordenados en forma de filas. PROC GLM; le indica que realice el calculo de análisis de varianza se base en el modelo lineal general; CLASS DOSIS MUESTRA; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables será dosis (DOSIS) y muestra (MUESTRA). MODEL RENFOR=DOSIS MUESTRA(DOSIS); este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con muestreo (Yijk = μ + τi + εij + εijkj), donde se coloca como: Yijk = μ + τi + εij + εijk Variable de respuesta = Tratamientos o Variables de estudio Ing. Ramiro Raúl OCHOA TORREZ 45 Producción de forraje verde = Dosis Muestra No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. (10) TEST H=DOSIS E=MUESTRA(DOSIS); con esta sentencia le indicamos al SAS que para el caso de la variable Dosis, la obtención de su valor calculado de F (F value) tomara como cuadrado medio del error al cuadrado medio de la Muestra(Dosis). Para esto se debe recordar la forma de obtención de los valores al realizar el calculo del ANVA: FV τi Trat εij EE εijk EM Total GL t–1 t(r – 1) rt(m – 1) trm – 1 SC SCt SCE SCEM SCT CM SCt / GLt SCE / GLE SCEM / GLEM Fc CMt / CME CME / CMEM Ft f(GLt, GLE) f(GLE, GLEM) Podemos observar que para el calculo del Fc de los Tratamientos se lo obtiene dividiendo los Cuadrados medios de los tratamientos entre los Cuadrados medios del Error Experimental (CMt / CME) y que para la obtención del valor de Fc de Error experimental este se obtiene dividiendo los Cuadrados medios del error experimental entre los Cuadrados medios del error de Muestreo (CME / CMEM). En este caso para el análisis con el SAS se debe indicar cual valor va ha ser considerado como dividendo, toda vez que el SAS considera un solo error experimental (en este caso el error de muestreo) como divisor para todas las fuentes de variación en estudio. (11) (12) (13) LSMEANS DOSIS/PDIFF; con esta sentencia le solicitamos al SAS que realice la comparación de medias de la prueba de DMS, realizando todas las comparaciones posibles entre las dosis (PDIFF) MEANS TRAT/DUNNETT(‘0_t_ha); con esta sentencia le solicitamos al SAS que realice la prueba de Dunnett, tomando como testigo al tratamiento 0_t_ha. Con RUN; le señalamos que las sentencias anteriores son ejecutables. La salida de los resultados que el SAS nos presentara será: The SAS System The GLM Procedure (3) Class DOSIS MUESTRA (1) Class Level Information (4) (5) Levels Values 4 0_t_ha 2_t_ha 4_t_ha 6_t_ha 3 1 2 3 Number of observations (2) 48 Donde apreciamos: (1) (2) (3) (4) (5) (6) El procedimiento empleado General Linear Models Procedure (GLM) Información de la variable analizada así como sus niveles (Class Level Information) El nombre de las variables analizadas (Class DOSIS MUESTRA) Los niveles de las variables analizada (Levels) Dosis 4 y Muestra 3 Los valores que toman los niveles de la variable analizada (Values), en este caso para DOSIS 0_t_ha, 2_t_ha, 4_t_ha y 6_t_ha; para MUESTRA 1, 2 y 3. El número de observaciones en el juego de datos (Number of observations in data set = 48) 46 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR La siguiente salida es del ANVA: The SAS System The GLM Procedure Dependent Variable: RENFOR RENDIMIENTO DE FORRAJE (3) (13) Source Model Error Corrected Total (1) (2) (4) (9) R-Square 0.979692 (5) (6) (7) Sum of DF Squares Mean Square F Value 11 12506.56250 1136.96023 157.88 36 259.25000 7.20139 47 12765.81250 (10) (11) (12) Coeff Var Root MSE RENFOR Mean 8.025541 2.683540 33.43750 (8) Pr > F <.0001 (14) Source DOSIS MUESTRA(DOSIS) DF 3 8 Type I SS 12469.89583 36.66667 Mean Square 4156.63194 4.58333 F Value 577.20 0.64 Pr > F <.0001 0.7418 (15) Source DOSIS MUESTRA(DOSIS) DF 3 8 Type III SS 12469.89583 36.66667 Mean Square 4156.63194 4.58333 F Value 577.20 0.64 Pr > F <.0001 0.7418 Tests of Hypotheses Using the Type III MS for MUESTRA(DOSIS) as an Error Term (16) Source DOSIS DF 3 Type III SS 12469.89583 Mean Square 4156.63194 F Value 906.90 Pr > F <.0001 Avanzando para apreciar la siguiente salida de resultados tendremos el análisis de varianza propiamente dicho: (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) El procedimiento empleado (GLM Procedure) La variable de respuesta analizada con su respectiva etiqueta (Dependent Variable : RENFOR RENDIMIENTO DE FORRAJE) Las fuentes de variación (Source) Grados de libertad (DF) Suma de cuadrados (Sum of Squares) Cuadrados medios (Mean Square) F calculado (F value) El valor de probabilidad mayor a F (Pr > F) Coeficiente de determinación (R-Square) Coeficiente de variación (CV) Raíz cuadrada del Cuadrado medio del error (Root MSE) Promedio general de la variable de respuesta (ALTURA Mean) Como se puede apreciar, la salida del análisis de varianza, nos presenta en este caso cuatro partes: (13) (14) (15) La primera constituida por las fuentes de variación Model, Error y Corrected Total; La segunda y tercera presenta nuestras variables de clasificación o estudio DOSIS y MUESTRA(DOSIS), con la Suma de Cuadrados (SS) con el tipo I. La tercera presenta nuestras variables de clasificación o estudio DOSIS y MUESTRA(DOSIS), con la Suma de Cuadrados (SS) con el tipo III Ing. Ramiro Raúl OCHOA TORREZ 47 (16) La cuarta parte donde se menciona que para el calculo de los valores de F value (Fc) para DOSIS se tomo como cuadrado medio del error a MUESTRA(DOSIS). El ordenamiento se lo realizara en dos partes: 1° Parte Estos valores deben ser organizados para su mejor interpretación, primeramente se considera el punto (16) donde se considero como termino de Error a MUESTRA*DOSIS, los valores correspondientes a Dosis lo remplazamos en el punto (15) correspondientes el análisis de nuestras fuentes de variación considerando el error de tipo III. (15) Source DOSIS MUESTRA(DOSIS) DF 3 8 Type III SS 12469.89583 36.66667 Mean Square 4156.63194 4.58333 F Value 577.20 0.64 Pr > F <.0001 0.7418 Tests of Hypotheses Using the Type III MS for MUESTRA(DOSIS) as an Error Term (16) Source DOSIS DF 3 Type III SS 12469.89583 Mean Square 4156.63194 F Value 906.90 Pr > F <.0001 DF 3 8 Type III SS 12469.89583 36.66667 Mean Square 4156.63194 4.58333 F Value 906.90 0.64 Pr > F <.0001 0.7418 Quedandonos (16’): Source (16’) DOSIS MUESTRA(DOSIS) 2° Parte Por ultimo los valores del punto (16’) correspondientes a las fuentes de variación DOSIS y MUESTRA(DOSIS), lo remplazamos en el lugar donde se ubica el término Model del punto (13): (13) Source Model Error Corrected Total DF 11 36 47 R-Square 0.979692 Source (16’) DOSIS MUESTRA(DOSIS) Coeff Var 8.025541 R-Square 0.979692 48 Mean Square 1136.96023 7.20139 Root MSE 2.683540 F Value 157.88 Pr > F <.0001 RENFOR Mean 33.43750 DF 3 8 Type III SS 12469.89583 36.66667 Mean Square 4156.63194 4.58333 F Value 906.90 0.64 Pr > F <.0001 0.7418 DF 3 8 36 47 Sum of Squares 12469.89583 36.66667 259.25000 12765.81250 Mean Square 4156.63194 4.58333 7.20139 F Value 906.90 0.64 Pr > F <.0001** 0.7418ns Lo que nos dará como resultado final: Source DOSIS MUESTRA(DOSIS) Error Corrected Total Sum of Squares 12506.56250 259.25000 12765.81250 Coeff Var 8.025541 Root MSE 2.683540 RENFOR Mean 33.43750 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR Ahora como paso final indicamos que la fuente de variación MUESTRA(DOSIS) corresponde al error experimental de nuestro modelo línea y el termino que se indica como Error dentro del ANVA corresponde la Error de Muestreo, finalmente comenzamos a indicar si es significativo, altamente o no significativo, mediante la regla de decisión: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Conclusión La conclusión de los resultados como ya se indico, se la realiza tomando en cuenta el valor de probabilidad presentada, en el caso de Dosis el valor de Pr > F = 0.0001, siendo este valor inferior al 0.05 e inferior al 0.01, por lo que se acepta la Hipótesis alterna (Ha: 0 t/ha ≠ 2 t/ha ≠ 4 t/ha ≠ 6 t/ha), por lo que podemos indicar que entre dosis se encuentran diferencias altamente significativas en el rendimiento de forraje. En el caso de las muestras su valor de Pr > F es igual a 0.7418, valor superior a 0.05, por lo se acepta la Hipótesis nula (Ho: m1 = m2 = m3), por lo que señalamos que entre muestras no se tienen diferencias estadísticas o significativas, siendo las muestras de cada tratamiento similares en el rendimiento de forrajes. Por otra parte se tuvo un coeficiente de variación de 8.025541%, debajo de 30%, por lo que los datos se encuentran dentro de los márgenes de aceptabilidad, con un promedio general de 33.43750 de rendimiento de forraje. Otro valor que se puede considerar para la interpretación de resultados es el R-Square (R2) que es el coeficiente de determinación con un valor de 0.979692, valor que multiplicando por 100 será 97.9692%, es decir que el 97.9692% del rendimiento de forraje esta influenciado por las dosis y las muestras, el restante porcentaje se algo más del 2% se debe a otros factores. Más abajo nos presenta la salida de la prueba de la DMS, de donde analizando su salida tenemos: The SAS System The GLM Procedure Least Squares Means DOSIS 0_t_ha 2_t_ha 4_t_ha 6_t_ha RENFOR LSMEAN LSMEAN Number 21.3333333 21.5833333 30.1666667 60.6666667 1 2 3 4 Least Squares Means for effect DOSIS Pr > |t| for H0: LSMean(i)=LSMean(j) (1) Dependent Variable: RENFOR i/j 1 2 3 4 1 0.8208 <.0001 <.0001 2 0.8208 <.0001 <.0001 3 <.0001 <.0001 4 <.0001 <.0001 <.0001 (2) <.0001 (3) NOTE: To ensure overall protection level, only probabilities associated with pre-planned comparisons should be used. Ing. Ramiro Raúl OCHOA TORREZ 49 La prueba de DMS del SAS se presenta en forma de matriz de probabilidades de cada par de comparcion donde: (1) (2) (3) Nos señala la hipótesis que se esta probando en función de la probabilidad: Pr > [T] for Ho: LSMeans (i) = LSMeans (j) ; en este caso se indica que la Hipótesis nula a ser probada será: X i = X j . Nos presenta en forma de matriz las probabilidades de las diferencias realizadas entre pares de tratamientos. Nos presenta una Nota (NOTE: To ensure overall protection level, only probabilities associated with preplanned comparisons should be used), que nos indica que: Para asegurar el nivel de protección global, deben usarse sólo las probabilidades asociadas con comparaciones pre-planeadas. Conclusión Apreciando la matriz de prueba de DMS se observa que la comparación 1 y 2 (0_t_ha con 2_t_ha) no presenta significancia alguna, siendo su valor de probabilidad mayor a 0.05 por lo que estadísticamente ambos promedios de rendimiento de forraje son similares, en tanto que las comparaciones 1 y 3 (0_t_ha con 4_t_ha), 1 y 4 (0_t_ha y 6_t_ha), 2 y 3 (2_t_ha con 4_t_ha), 2 y 4 (2_t_ha y 6_t_ha), 3 y 4 (4_t_ha y 6_t_ha) son las que presentan diferencias estadísticas altamente significativas por tener un valor de Pr > [T] inferior a 0.01, por lo que se puede afirmar que los promedios de dichas comparaciones son diferentes. Más abajo nos presenta la salida de la prueba de la Dunnett The SAS System The GLM Procedure Dunnett's t Tests for RENFOR (1) NOTE: This test controls the Type I experimentwise error for comparisons of all treatments against a control. Alpha 0.05 Error Degrees of Freedom 36 Error Mean Square 7.201389 Critical Value of Dunnett's t 2.45216 Minimum Significant Difference 2.6865 (2) (3) (4) (5) (6) Comparisons significant at the 0.05 level are indicated by ***. (7) DOSIS Comparison 6_t_ha - 0_t_ha 4_t_ha - 0_t_ha 2_t_ha - 0_t_ha Difference Between Means 39.333 8.833 0.250 Simultaneous 95% Confidence Limits 36.647 42.020 6.147 11.520 -2.436 2.936 *** *** (8) La salida de los resultados de la prueba de Dunnett son: (1) (2) (3) (4) (5) Una Nota que nos indica que: Controla el error de tipo I del experimento para las comparaciones de todos los tratamientos contra el testigo (NOTE: This tests controls the type I experimentwise error for comparisons of all treatments against a control) El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale lo contrario. Los grados de libertad del error (Error Degrees of Freedom = 36) El cuadrado medio del error (Error Mean Square = 7.201389) El valor referencial de Dunnett (Critical Value of Dunnett’s = 2.45216) 50 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO COMPLETAMENTE AL AZAR (6) (7) (8) La diferencia mínima significativa (Minimun Significant Difference = 2.6865) Más abajo una indicación de que significa la salida de Dunnett (Comparisons significant at the 0.05 level are indicated by ***), que señala que las comparaciones significantivas a un nivel del 0. 05 se indican por * * *. Por ultimo nos presenta las diferentes comparaciones realizadas entre tratamientos contra el testigo, la diferencia entre promedios (Difference Between Means) y el limite de confianza simultaneo de 95% (Simultaneous 95% Confidence Limits). Conclusión En el caso de la prueba de Dunnett, se aprecia primeramente que todas las comparaciones fueron realizadas contra el testigo, todas las diferencias son favorables a los tratamientos 2_t_ha, 4_t_ha y 6_t_ha, y no así al testigo ya que los valores encontrados son positivos (Difference Between Means). De estas comparaciones, la comparación correspondiente a la dosis de 6_t:_ha, 0_t:_ha y 4_t_ha contra el testigo, presentan diferencias significativas entre los valores de producciones parciales de forraje de maíz verde. En tanto que la comparación del tratamiento de 2_t_ha contra el testigo no presentan diferencias significativas entre los promedios de producciones parciales de forraje de maíz verde siendo estadísticamente similares ambos tratamientos. Por lo que los tratamientos de 6_t_ha y 4_t_ha de estiércol aplicados resultaron presentar mejores producciones de forraje verde que el testigo y no asi el tratamiento de 2_t_ha, que su producción es superior al testigo en 0.250 pero no suficiente para presentar una diferencia estadistica. Ing. Ramiro Raúl OCHOA TORREZ 51 6. DISEÑO BLOQUE AL AZAR (DBA) 6.1. DBA con igual número de repeticiones Ejercicio Se realizo un ensayo donde se evaluó seis variedades de fríjol, en el que se usaron 4 bloques por tratamiento (variedad), teniéndose resultados del rendimiento en kg/parcela, siendo los siguientes (Padrón, 1996): Variedades Bayo Gastelum Mantequilla Testigo Cuyo Zirate Modelo lineal aditivo Tratamiento Bloque II 46 38 32 20 42 25 III 38 31 28 26 46 22 IV 41 30 26 24 40 26 Yij = μ + βj + αi + εij Donde: Yij μ βj αi εij I 42 32 25 18 35 36 = Una observación cualquiera = Media poblacional = Efecto del j – ésimo bloque = Efecto del i – ésimo tratamiento (variedad) = Error experimental i… j… t… r… 1… 1… 6 4 Las Hipótesis a probar serán: Ho: β1 = β2 =β3 = β4 = β5 = β6 α1 = α2 = α3 = α4 = α5 = α6 Bloques Tratamientos Ha: β1 ≠ β2 ≠ β3 ≠ β4 ≠ β5 ≠ β6 α1 ≠ α2 ≠ α3 ≠ α4 ≠ α5 ≠ α6 Bloques Tratamientos Codificando los nombres de las variedades que son muy extensas (Tomar en cuenta que los nombres de las variables no deben exceder 7 dígitos) para introducir como texto en el SAS tendremos: Variedades Bayo Gastelum Mantequilla Testigo Cuyo Zirate Introduciendo los datos en el SAS tendremos: 52 Código Bayo Gastelu Mantequ Testigo Cuyo Zirate Ing. Ramiro Raúl OCHOA TORREZ DISEÑO BLOQUES AL AZAR OPTIONS NODATE NONUMBER; DATA DBA; INPUT BLOQ $ VAR $ REND @@; CARDS; I Bayo 42 III I Gastelu 32 III I Mantequ 25 III I Testigo 18 III I Cuyo 35 III I Zirate 36 III II Bayo 46 IV II Gastelu 38 IV II Mantequ 32 IV II Testigo 20 IV II Cuyo 42 IV II Zirate 25 IV ; PROC ANOVA; TITLE'DISEÑO BLOQUES AL AZAR'; CLASS BLOQ VAR; MODEL REND=BLOQ VAR; MEANS VAR/TUKEY; RUN; Bayo Gastelu Mantequ Testigo Cuyo Zirate Bayo Gastelu Mantequ Testigo Cuyo Zirate 38 31 28 26 46 22 41 30 26 24 40 26 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7) (8) (9) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DBA; le indicamos que genere un archivo con el nombre DBA. Con INPUT BLOQ $ VAR $ REND @@; le indicamos que ingrese las variables BLOQ (Bloque), VAR (Variedades) y REND (Rendimiento) siendo las dos primeras del tipo alfanumérico y la ultima rendimiento del tipo numérico; introducidas todas en forma de fila (@@). CARDS; le señala que los datos vienen a continuación. Seguidamente se observan los datos ordenados en forma de fila. PROC ANOVA; le indica que realice el calculo de análisis de varianza en base del procedimiento ANOVA (análisis de varianza). Con la sentencia TITLE’DISEÑO BLOQUES AL AZAR’; indicamos que coloque el titulo a cada hoja de la salida del OUTPUT. CLASS BLOQ VAR; le señala las variable de estudio o de clasificación para nuestro caso son Bloque (BLOQ) y Variedades (VAR). MODEL REND=BLOQ VAR; este punto esta en directa relación con el modelo lineal de un diseño bloques la azar (Yij = μ + βj + αi + εij) de donde se coloca como: Yij = μ + βj + αi + εij Variable de respuesta = Variables de estudio Rendimiento = Bloques Variedades (10) (11) No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del modelo. MEANS VAR/TUKEY; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los procese con la pruebas de Tukey. Con RUN; le señalamos que las sentencias anteriores son ejecutables. La salida de los resultados que el SAS nos presentara será: Ing. Ramiro Raúl OCHOA TORREZ 53 Class BLOQ VAR DISEÑO BLOQUES AL AZAR The ANOVA Procedure Class Level Information Levels Values 4 I II III IV 6 Bayo Cuyo Gastelu Mantequ Testigo Zirate Number of observations 24 DISEÑO BLOQUES AL AZAR The ANOVA Procedure Dependent Variable: REND Source Model Error Corrected Total (2) DF 8 15 23 R-Square 0.816848 Source BLOQ VAR (3) (1) Sum of Squares 1278.333333 286.625000 1564.958333 Coeff Var 13.64257 DF 3 5 Mean Square 159.791667 19.108333 Root MSE 4.371308 Anova SS 27.125000 1251.208333 F Value 8.36 Pr > F 0.0002 REND Mean 32.04167 Mean Square 9.041667 250.241667 F Value 0.47 13.10 Pr > F 0.7055 <.0001 Interpretando la salida de la primera parte del OUTPUT, tenemos que organizar la salida, puesto que como se vio anteriormente esta distribuida en dos partes: (1) La información de las variables en estudio con sus respectivos niveles BLOQ (Bloques, 4 niveles: I, II, III y IV) VAR (Variedades 6 niveles: Bayo Cuyo Gastelu Mantequ Testigo Zirate). Más abajo la cantidad de valores (Number of observations = 24). La primera parte del análisis de varianza como ya se indico es el análisis en función del modelo (Model, Error y Total). La segunda parte es el análisis en función de las variables de estudio Bloque y Variedad (BLOQ Y VAR). (2) (3) Como se indico anteriormente debemos agrupar ambas partes (2 y 3) para tener un análisis de varianza, remplazando los valores del Model (2) por los valores de las variables de estudio (3): Source Model Error Corrected Total (2) DF 8 15 23 R-Square 0.816848 Source BLOQ VAR (3) Sum of Squares 1278.333333 286.625000 1564.958333 Coeff Var 13.64257 DF 3 5 Mean Square 159.791667 19.108333 Root MSE 4.371308 Anova SS 27.125000 1251.208333 F Value 8.36 Pr > F 0.0002 REND Mean 32.04167 Mean Square 9.041667 250.241667 F Value 0.47 13.10 Pr > F 0.7055 <.0001 Lo que nos dará finalmente el ANVA de un DBA, y mediante la regla de decisión extractamos las conclusiones: • • Si el valor de: Si el valor de: 54 Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Ing. Ramiro Raúl OCHOA TORREZ DISEÑO BLOQUES AL AZAR • Si el valor de: Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQ VAR Error Corrected Total DF 3 5 15 23 R-Square 0.816848 Squares 27.125000 1251.208333 286.625000 1564.958333 Coeff Var 13.64257 Mean Square 9.041667 250.241667 19.108333 Root MSE 4.371308 F Value 0.47 13.10 Pr > F 0.7055ns <.0001** REND Mean 32.04167 Conclusión Como conclusión señalamos que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un valor de probabilidad (Pr > F) mayor a 0.05 (0.7055), en el caso de las Variedades (VAR) el valor de probabilidad (Pr > F) es inferior a 0.01 (0.0001) por lo que indicamos que se tienen diferencias altamente significativa entre variedades, por lo que el rendimiento de las seis variedades de fríjol son significativamente diferentes. Teniéndose un Coeficiente de Variación de 13.64257% y un promedio general de 32.04167 kg/ha. La segunda parte corresponde a la prueba de Tukey: DISEÑO BLOQUES AL AZAR The ANOVA Procedure Tukey's Studentized Range (HSD) Test for REND NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 (1) Error Degrees of Freedom 15 Error Mean Square 19.10833 Critical Value of Studentized Range 4.59474 Minimum Significant Difference 10.043 Means with the same letter are not significantly different. Tukey Grouping Mean N VAR A 41.750 4 Bayo A A 40.750 4 Cuyo A B A 32.750 4 Gastelu B B C 27.750 4 Mantequ B C B C 27.250 4 Zirate C C 22.000 4 Testigo (2) La salida de la prueba de Tukey nos indica: (1) (2) La información de los valores de significancia (Alpha), Grados de Libertad del Error, Cuadrado Medio del Error, Valor referencial de Tukey y la Mínima Diferencia Significativa. El agrupamiento según Tukey. Conclusión Como conclusión de la prueba de Tukey, observando las variedades en estudio estas forman 3 grupos (A, B y C) de los cuales en el primer grupo las variedades Bayo y Cuyo son las que mayor promedio de rendimiento presentan, Ing. Ramiro Raúl OCHOA TORREZ 55 siendo estas significativamente superiores al resto de las variedades, en tanto que la variedad Testigo es la que menor valor de rendimiento obtuvo. 6.2. DBA con muestreo Ejercicio Los datos siguientes expresan las producciones de forraje verde de triticale, obtenidas en un estudio donde se probaron cuatro dosis diferentes de nitrógeno en una misma variedad (Rodríguez, 1991). Dosis Muestra 1 2 3 1 2 3 1 2 3 1 2 3 100 kg/ha 200 kg/ha 300 kg/ha 400 kg/ha Modelo lineal aditivo: I 24 23 21 25 28 30 56 65 58 24 19 23 II 19 21 24 31 24 32 62 60 59 21 22 24 III 18 19 22 28 32 36 61 60 64 23 18 22 IV 23 22 20 34 33 29 62 60 61 19 21 23 Yijk = μ + βj + αi + εij +θijk Donde: Yijk μ βj αi εij θijk = Una observación cualquiera = Media poblacional = Efecto del j – ésimo bloque = Efecto del i – ésimo tratamiento = Error experimental (de la unidad experimental) = Error de muestreo (de la sub unidad experimental) Tratamiento Bloque Muestra i… j… k… t… r… m… 1… 1… 1… 4 4 3 Las Hipótesis a probar serán: Ho: β1 = β2 =β3 = β4 = β5 = β6 α1 = α2 = α3 = α4 = α5 = α6 m1 = m2 = m3 Bloques Tratamientos Muestras Ha: β1 ≠ β2 ≠ β3 ≠ β4 ≠ β5 ≠ β6 α1 ≠ α2 ≠ α3 ≠ α4 ≠ α5 ≠ α6 m1 ≠ m2 ≠ m3 Bloques Tratamientos Muestras Organizando los datos de manera columnar para introducir en el SAS, tenemos: 56 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO BLOQUES AL AZAR I I I I I I I I I I I I II II II II II II II II II II II II 100kg 100kg 100kg 200kg 200kg 200kg 300kg 300kg 300kg 400kg 400kg 400kg 100kg 100kg 100kg 200kg 200kg 200kg 300kg 300kg 300kg 400kg 400kg 400kg M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 24 23 21 25 28 30 56 65 58 24 19 23 19 21 24 31 24 32 62 60 59 21 22 24 III III III III III III III III III III III III IV IV IV IV IV IV IV IV IV IV IV IV 100kg 100kg 100kg 200kg 200kg 200kg 300kg 300kg 300kg 400kg 400kg 400kg 100kg 100kg 100kg 200kg 200kg 200kg 300kg 300kg 300kg 400kg 400kg 400kg M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 M1 M2 M3 18 19 22 28 32 36 61 60 64 23 18 22 23 22 20 34 33 29 62 60 61 19 21 23 Como se observa se forman 4 columnas, la primera correspondiente a los Bloques (I, II, III y IV), la segunda a los Tratamientos (100 kg, 200 kg, 300 kg y 400 kg), la tercera a las Muestras (M1, M2 Y M3) y la cuarta a la producción de forraje o variable de respuesta. Una vez organizado procedemos a introducir los datos en el PROGRAM EDITOR del SAS: Ing. Ramiro Raúl OCHOA TORREZ 57 OPTIONS NODATE NONUMBER; DATA DBA2; INPUT BLOQ $ DOSIS $ MUES $ PROD; CARDS; I 100kg M1 24 I 100kg M2 23 I 100kg M3 21 I 200kg M1 25 I 200kg M2 28 I 200kg M3 30 I 300kg M1 56 I 300kg M2 65 I 300kg M3 58 I 400kg M1 24 I 400kg M2 19 I 400kg M3 23 II 100kg M1 19 II 100kg M2 21 II 100kg M3 24 II 200kg M1 31 II 200kg M2 24 II 200kg M3 32 II 300kg M1 62 II 300kg M2 60 II 300kg M3 59 II 400kg M1 21 II 400kg M2 22 II 400kg M3 24 III 100kg M1 18 III 100kg M2 19 III 100kg M3 22 III 200kg M1 28 III 200kg M2 32 III 200kg M3 36 III 300kg M1 61 III 300kg M2 60 III 300kg M3 64 III 400kg M1 23 III 400kg M2 18 III 400kg M3 22 IV 100kg M1 23 IV 100kg M2 22 IV 100kg M3 20 IV 200kg M1 34 IV 200kg M2 33 IV 200kg M3 29 IV 300kg M1 62 IV 300kg M2 60 IV 300kg M3 61 IV 400kg M1 19 IV 400kg M2 21 IV 400kg M3 23 ; PROC ANOVA; CLASS BLOQ DOSIS MUES; MODEL PROD=BLOQ DOSIS BLOQ*DOSIS; TEST H=BLOQ DOSIS E=BLOQ*DOSIS; RUN; (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Revisando las sentencias introducidas tenemos: 58 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO BLOQUES AL AZAR (1) (2) (3) (4) (5) (6) (7) (8) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DBA2; le indicamos que genere un archivo con el nombre DBA2. Con INPUT BLOQ $ DOSIS $ MUES $ PROD; le indicamos que ingrese las variables Bloque, Dosis y Muestra (alfanumérico) y Producción (numérico). CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos nuestros datos ordenados en forma de filas. PROC ANOVA; le indica que realice el calculo de análisis de varianza. CLASS BLOQ DOSIS MUES; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Bloques, Dosis y Muestra. MODEL PROD=BLOQ DOSIS BLOQ*DOSIS; este punto esta en directa relación con el modelo lineal de un diseño bloques al azar con muestreo (Yijk = μ + βj + αi + εij + θijk), donde se coloca como: Yijk = μ + βj + αi + εij + θijk Variable de respuesta = Variables de estudio Producción = Bloques Dosis Muestra No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del modelo. (9) TEST H=BLOQ DOSIS E=BLOQ*DOSIS; con esta sentencia le indicamos al SAS que para el caso de las variables Bloques y Dosis, la obtención de su valor calculado de F (F value) tomara como cuadrado medio del error al cuadrado medio del error experimental (BLOQ*DOSIS). Para esto se debe recordar la forma de obtención de los valores al realizar el calculo del ANVA: FV βj Bloq αi Trat εij EE θijk EM Total GL r–1 t–1 (t – 1)(r – 1) tr(m – 1) trm – 1 SC SCB SCt SCE SCEM SCT CM SCB / GL B SCt / GLt SCE / GLE SCEM / GLEM Fc CMB / CME CMt / CME CME / CMEM Ft f(GLB, GLE) f(GLt, GLE) f(GLE, GLEM) Podemos observar que para el calculo del Fc de los Bloques y Tratamientos se lo obtiene dividiendo los Cuadrados medios de los bloques y tratamientos entre los Cuadrados medios del Error Experimental (FcBloque = CMB / CME; FcTratamiento = CMt / CME); y que para la obtención del valor de Fc de Error experimental este se obtiene diviendo los Cuadrados medios del error experimental entre los Cuadrados medios del error de Muestreo (CME / CMEM). En este caso para el análisis con el SAS se debe indicar cual valor va ha ser considerado como dividendo, toda vez que el SAS considera un solo error experimental (el error de muestreo) como divisor para todas las fuentes de variación en estudio. (10) Con RUN; le señalamos que las sentencias anteriores son ejecutables. La salida de los resultados nos presentara, primeramente las variables estudiadas, posteriormente el análisis de varianza de la cual hay que tener en cuenta cual fue el error para el calculo de los valores tabulares de bloque y dosis (el error para ambos será la muestra) Ing. Ramiro Raúl OCHOA TORREZ 59 DISEÑO BLOQUES AL AZAR CON MUESTREO The ANOVA Procedure Class Level Information Class Levels Values BLOQ 4 I II III IV DOSIS 4 100kg 200kg 300kg 400kg MUES 3 M1 M2 M3 Number of observations 48 DISEÑO BLOQUES AL AZAR CON MUESTREO The ANOVA Procedure Dependent Variable: PROD Source Model Error Corrected Total (2) DF 15 32 47 R-Square 0.982140 Source BLOQ DOSIS BLOQ*DOSIS (3) (4) (1) Sum of Squares 12537.81250 228.00000 12765.81250 Coeff Var 7.982862 DF 3 3 9 Mean Square 835.85417 7.12500 Root MSE 2.669270 Anova SS 5.72917 12469.89583 62.18750 F Value 117.31 Pr > F <.0001 PROD Mean 33.43750 Mean Square 1.90972 4156.63194 6.90972 F Value 0.27 583.39 0.97 Pr > F 0.8479 <.0001 0.4824 Tests of Hypotheses Using the Anova MS for BLOQ*DOSIS as an Error Term Source BLOQ DOSIS (5) DF 3 3 Anova SS 5.72917 12469.89583 Mean Square 1.90972 4156.63194 F Value 0.28 601.56 Pr > F 0.8411 <.0001 Revisando la salida del SAS tenemos: (1) La información de las variables en estudio con sus respectivos niveles BLOQ (Bloques, 4 niveles: I, II, III y IV), DOSIS (Dosis 4 niveles: 100kg, 200kg, 300kg y 400kg) y MUES (Muestra 3: M1, M2 y M3), más abajo el número de observaciones analizadas (Number of observations = 48). (2) La primera parte del análisis de varianza como ya se indico es el análisis en función del modelo (Model, Error y Total). (3) La segunda parte es el análisis en función de las variables de estudio Bloque, Dosis y Bloque*Dosis (BLOQ, DOSIS Y BLOQ*DOSIS), en este caso considera como cuadrado medio del error para el calculo de los valores de Fc, al cuadrado medio del error de muestreo de la primera parte (1). (4) La tercera parte de la salida de resultados nos presenta un mensaje donde se nos indica que para las pruebas de Hipótesis en el análisis de varianza, se esta empleando BLOQ*DOSIS como un término del Error, para las variables BLOQ y DOSIS (Bloque y Dosis) Para tener un ANVA de DBA con muestreo completo debemos organizar los resultados, esto lo realizaremos en dos partes: 1° Parte Los valores correspondientes a Bloque y Dosis donde se considera como termino de Error a BLOQ*DOSIS (5), ambas variables con todos sus valores lo remplazamos en el punto (3): (3) Source BLOQ DOSIS 60 DF 3 3 Anova SS 5.72917 12469.89583 Mean Square 1.90972 4156.63194 F Value 0.27 583.39 Pr > F 0.8479 <.0001 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO BLOQUES AL AZAR BLOQ*DOSIS (4) 9 62.18750 6.90972 0.97 0.4824 Tests of Hypotheses Using the Anova MS for BLOQ*DOSIS as an Error Term Source BLOQ DOSIS (5) DF 3 3 Anova SS 5.72917 12469.89583 Mean Square 1.90972 4156.63194 F Value 0.28 601.56 Pr > F 0.8411 <.0001 DF 3 3 9 Anova SS 5.72917 12469.89583 62.18750 Mean Square 1.90972 4156.63194 6.90972 F Value 0.28 601.56 0.97 Pr > F 0.8411 <.0001 0.4824 Quedandonos: (3’) Source BLOQ DOSIS BLOQ*DOSIS 2° Parte Por ultimo los valores del punto (3’) correspondientes a las fuentes de variación BLOQ, DOSIS y BLOQ*DOSIS, lo remplazamos en el lugar donde se ubica el término Model del punto (2): Source Model Error Corrected Total (2) DF 15 32 47 R-Square 0.982140 (3’) Source BLOQ DOSIS BLOQ*DOSIS Coeff Var 7.982862 Mean Square 835.85417 7.12500 Root MSE 2.669270 F Value 117.31 Pr > F <.0001 PROD Mean 33.43750 DF 3 3 9 Anova SS 5.72917 12469.89583 62.18750 Mean Square 1.90972 4156.63194 6.90972 F Value 0.28 601.56 0.97 Pr > F 0.8411 <.0001 0.4824 DF 3 3 9 32 47 Sum of Squares 5.72917 12469.89583 62.18750 228.00000 12765.81250 Mean Square 1.90972 4156.63194 6.90972 7.12500 F Value 0.28 601.56 0.97 Pr > F 0.8411 <.0001 0.4824 Lo que nos dará como resultado final: Source BLOQ DOSIS BLOQ*DOSIS Error Corrected Total Squares 12537.81250 228.00000 12765.81250 Ahora como paso final indicamos que la interacción BLOQ*DOSIS corresponde al Error Experimental y los que se indica como Error dentro del ANVA corresponde la Error de Muestreo, finalmente comenzamos a indicar si es significativo, altamente o no significativo, mediante la regla de decisión: • • • Si el valor de: Si el valor de: Si el valor de: Source BLOQ DOSIS Error Error Muestreo Ing. Ramiro Raúl OCHOA TORREZ Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) DF 3 3 9 32 Sum of Squares 5.72917 12469.89583 62.18750 228.00000 Mean Square 1.90972 4156.63194 6.90972 7.12500 F Value 0.28 601.56 0.97 Pr > F 0.8411ns <.0001** 0.4824ns 61 Corrected Total 47 R-Square 0.982140 12765.81250 Coeff Var 7.982862 Root MSE 2.669270 PROD Mean 33.43750 Conclusión Como conclusión podemos indicar que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un valor de probabilidad (Pr > F) mayor a 0.05 (0.7055), en el caso de las Dosis (DOSIS) el valor de probabilidad (Pr > F) es inferior a 0.01 (0.0001) por lo que indicamos que se tienen diferencias altamente significativa entre dosis, por lo que la producción de forraje de triticale es diferente a la aplicación de las diferentes dosis de nitrógeno, en el caso de las muestras no se tienen diferencias entre estas (Pr > 0.05). Teniéndose un Coeficiente de Variación de 7.982862% y un promedio general de producción de forraje de 33.43750. El caso de requerir la prueba de medias agregamos las respectivas sentencias en PROGRAM EDITOR, esta deberá indicarse en la parte correspondiente al procedimiento: OPTIONS NODATE NONUMBER; DATA DBA2; INPUT BLOQ $ DOSIS $ MUES $ PROD; CARDS; I 100kg M1 24 I 100kg M2 23 I 100kg M3 21 . . . . . . . . . . . . . . . . IV 300kg M1 62 IV 300kg M2 60 IV 300kg M3 61 IV 400kg M1 19 IV 400kg M2 21 IV 400kg M3 23 ; PROC ANOVA; CLASS BLOQ DOSIS MUES; MODEL PROD=BLOQ DOSIS BLOQ*DOSIS; TEST H=BLOQ DOSIS E=BLOQ*DOSIS; MEANS DOSIS/DUNCAN E=BLOQ*DOSIS; RUN; (1) Considerando el ajuste que se debe realizar tenemos: (1) MEANS DOSIS/DUNCAN E=BLOQ*DOSIS; realizara la prueba de medias de Duncan para los tratamientos considerando como Cuadrado Medio del Error al valor de BLOQ*DOSIS. Corrección que debe ser realizada como ya se indico anteriormente (la puntuaciones señalan los restantes valores). La primera parte de los resultados será la misma que describimos anteriormente, agregándose la parte de la prueba de Duncan: 62 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO BLOQUES AL AZAR DISEÑO BLOQUES AL AZAR CON MUESTREO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 9 Error Mean Square 6.909722 Number of Means Critical Range 2 2.428 3 2.534 4 2.595 Means with the same letter are not significantly different. Duncan Grouping A Mean 60.667 N 12 DOSIS 300kg B 30.167 12 200kg C C C 21.583 12 400kg 21.333 12 100kg Conclusión Como conclusión de la prueba de medias de Duncan, se tiene una respuesta muy diferenciada entre las diferentes dosis de nitrógeno, de las cuales señalamos que la aplicación de una dosis de 300 kg de nitrógeno al cultivo de triticale produce una producción significativamente diferente (letra “A”) y superior al resto de las dosis con un promedio de 60.667, seguido en promedio de producción la dosis de 200 kg de nitrógeno con 30.167 (letra “B”); finalmente las dosis de 400 y 100 kg de nitrógeno resultan significativamente diferentes e inferiores con relación a las anteriores dosis con producciones de 21.583 y 21.333 respectivamente (letra “C”). Ing. Ramiro Raúl OCHOA TORREZ 63 7. DISEÑO CUADRADO LATINO (DCL) 7.1. DCL con igual número de repeticiones Ejercicio En un experimento se probaron tres dietas (A, B, C) para medir su efecto en la producción de leche, las dietas se aplicaron a 3 vacas en tres periodos de lactancia diferentes, los resultados son los siguientes (Rodríguez, 1991): Periodos I II III Modelo lineal aditivo: Donde: Yijk μ βj θk αi εijk 1 A 608 B 715 C 884 Vacas 2 B 885 C 1087 A 771 3 C 940 A 766 B 832 Yijk = μ + βj + θk + αi + εijk = Una observación cualquiera = Media poblacional = Efecto del j – ésimo bloque = Efecto de la k – ésima columna = Efecto del i – ésimo tratamiento = Error experimental Tratamiento Bloque Columna i… j… k… t… r… c… 1… 1… 1… 3 3 3 Las hipótesis a probar serán: Ho: β1 = β2 =β3 θ1 = θ2 =θ3 α1 = α2 = α3 Bloques Columnas Tratamientos Ho: β1 ≠ β2 ≠ β3 θ1 ≠ θ2 ≠ θ3 α1 ≠ α2 ≠ α3 Bloques Columnas Tratamientos Ordenando los datos para poder introducirlos al SAS tendremos: 64 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO CUADRADO LATINO OPTIONS NODATE NONUMBER; DATA DCL; INPUT BLOQ $ COL TRAT $ PROD; CARDS; I 1 A 608 II 1 B 715 III 1 C 884 I 2 B 885 II 2 C 1087 III 2 A 771 I 3 C 940 II 3 A 766 III 3 B 832 ; PROC ANOVA; TITLE'DISEÑO CUADRADO LATINO'; CLASS BLOQ COL TRAT; MODEL PROD=BLOQ COL TRAT; RUN; (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7) (8) (9) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCL; le indicamos que genere un archivo con el nombre DCL. Con INPUT BLOQ $ COL $ TRAT $ PROD; le indicamos que ingrese las variables Bloques y Tratamientos (alfanuméricos), Columnas y Producción (numérico) en forma columnar. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos nuestros datos ordenados en forma de filas. PROC ANOVA; le indica que realice el calculo de análisis de varianza. TITLE’DISEÑO CUADRADO LATINO’; indica el nombre del titulo del trabajo. CLASS BLOQ COL TRAT; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Bloques, Columnas y Tratamientos. MODEL PROD=BLOQ COL TRAT; este punto esta en directa relación con el modelo lineal de un diseño bloques cuadrado latino (Yijk = μ + βj + θk + αi + εijk), donde se coloca como: Yijk = μ + βj + θk + αi + εijk Variable de respuesta = Variables de estudio Producción de leche = Bloques Columna Tratamientos Producción de leche = Periodos Vacas Dietas No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. (10) Con RUN; le señalamos que las sentencias anteriores son ejecutables. Los resultados que determinaremos serán: Ing. Ramiro Raúl OCHOA TORREZ 65 DISEÑO CUADRADO LATINO (1) The ANOVA Procedure Class Level Information (2) Class BLOQ COL TRAT Levels 3 3 3 Values I II III 1 2 3 A B C Number of observations (3) 9 (4) En un inicio nos presentara: (1) (2) (3) (4) El titulo del trabajo DISEÑO CUADRADO LATINO El procedimiento empleado ANOVA La información sobre las variables de estudio y sus respectivos niveles (Bloque 3 niveles: I, II y III; Columnas 3 niveles: 1, 2 y 3; y los Tratamientos 3 niveles: A, B y C) El número de observaciones o datos analizados para nuestro ejercicio será 9. Seguidamente la salida nos presenta el análisis de varianza para un diseño cuadrado latino: DISEÑO CUADRADO LATINO The ANOVA Procedure Dependent Variable: PROD Source Model Error Corrected Total (1) DF 6 2 8 R-Square 0.984037 Source BLOQ COL TRAT (2) Sum of Squares 151683.3333 2460.6667 154144.0000 Coeff Var 4.215878 DF 2 2 2 Mean Square 25280.5556 1230.3333 Root MSE 35.07611 Anova SS 3078.00000 48764.66667 99840.66667 F Value 20.55 Pr > F 0.0471 PROD Mean 832.0000 Mean Square 1539.00000 24382.33333 49920.33333 F Value 1.25 19.82 40.57 Pr > F 0.4443 0.0480 0.0241 La salida del ANVA, en este caso nos presenta 2 partes: (1) (2) La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación. La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son: Bloques, Columnas y Tratamientos. Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2) donde se tienen todas las fuentes de variación (Bloque, Columna y Tratamientos) en la primera parte (1) en vez de los valores de Model: (1) Source Model 66 DF 6 Sum of Squares 151683.3333 Mean Square 25280.5556 F Value 20.55 Pr > F 0.0471 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO CUADRADO LATINO Error Corrected Total 2 8 R-Square 0.984037 Source BLOQ COL TRAT (2) 2460.6667 154144.0000 Coeff Var 4.215878 DF 2 2 2 1230.3333 Root MSE 35.07611 Anova SS 3078.00000 48764.66667 99840.66667 PROD Mean 832.0000 Mean Square 1539.00000 24382.33333 49920.33333 F Value 1.25 19.82 40.57 Pr > F 0.4443 0.0480 0.0241 F Value 1.25 19.82 40.57 Pr > F 0.4443ns 0.0480* 0.0241* Dando como resultado final para su interpretación mediante las reglas de decisión: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQ COL TRAT Error Corrected Total DF 2 2 2 2 8 R-Square 0.984037 Sum of Squares 3078.00000 48764.66667 99840.66667 2460.6667 154144.0000 Coeff Var 4.215878 Mean Square 1539.00000 24382.33333 49920.33333 1230.3333 Root MSE 35.07611 PROD Mean 832.0000 Conclusión Como conclusión podemos indicar que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un valor de probabilidad (Pr > F) mayor a 0.05 (0.4443), en tanto que entre Columnas y Tratamientos se tienen diferencias significativas por que sus valores de probabilidad son inferiores a 0.05 (0.0480 y 0.0241 respectivamente) de lo cual concluimos que las diferentes dietas (A, B y C) presentan diferencias significativas con relación a sus valores de producción de leche. Teniéndose por otra parte un coeficiente de variación de 4.215878% mostrando un alto grado de confiabilidad de los datos y un promedio general de 832.00 litros producción de leche Por otra parte se puede agregar la sentencia MEANS BLOQ COL TRAT/DUNCAN; a todo el procedimiento y con esto se pide la realización de la prueba de medias de Duncan para Bloques, Columna y Tratamientos. Ing. Ramiro Raúl OCHOA TORREZ 67 OPTIONS NODATE NONUMBER; DATA DCL; INPUT BLOQ $ COL TRAT $ PROD; CARDS; I 1 A 608 II 1 B 715 III 1 C 884 I 2 B 885 II 2 C 1087 III 2 A 771 I 3 C 940 II 3 A 766 III 3 B 832 ; PROC ANOVA; TITLE'DISEÑO CUADRADO LATINO'; CLASS BLOQ COL TRAT; MODEL PROD=BLOQ COL TRAT; MEANS BLOQ COL TRAT/DUNCAN; RUN; (1) Revisando la sentencia introducida tenemos: (1) MEANS BLOQ COL TRAT/DUNCAN; realizara la prueba de medias de Duncan para los bloques, columnas y tratamientos. Los resultados serán en este caso los mismos que se analizaron anteriormente, con la variante de que se adicionaron en la parte final la prueba de Duncan para Bloques, Columna y Tratamientos. La primera salida corresponde a los Bloques o Periodos: DISEÑO CUADRADO LATINO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Number of Means Critical Range 2 123.2 3 117.7 Means with the same letter are not significantly different. Duncan Grouping A A A A A Mean 856.00 N 3 BLOQ II 829.00 3 III 811.00 3 I Conclusión 68 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO CUADRADO LATINO En el caso de los bloques que vienen a ser en nuestro ejemplo los Periodos, se confirma la no significancia encontrada en el análisis de varianza, observándose que ninguno de los bloques o periodos es estadísticamente diferente (Presentan la misma letra “A”), pero si se tienen diferencias numéricas donde el Bloque II o Periodo II es el que registra los valores más altos de producción de leche, siendo el Periodo I el que menor promedio de producción de leche registro. La siguiente salida corresponde a las Columnas o Vacas: DISEÑO CUADRADO LATINO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Number of Means Critical Range 2 123.2 3 117.7 Means with the same letter are not significantly different. Duncan Grouping A A B A B B Mean 914.33 N 3 COL 2 846.00 3 3 735.67 3 1 Conclusión En el caso de las Columnas o Vacas se observa que estas son diferentes (Presentan diferentes letras A y B), donde la Columna 2 o Vaca 2 es la es significativamente superior en producción de leche al resto de las Columnas o Vacas, en tanto que la Columna 1 o Vaca 1 es la que presenta el menor promedio de producción de leche, siendo este valor significativamente diferente al de las dos anteriores Columnas o Vacas. Por ultimo se tiene la que corresponde a los Tratamientos: Ing. Ramiro Raúl OCHOA TORREZ 69 DISEÑO CUADRADO LATINO The ANOVA Procedure Duncan's Multiple Range Test for PROD NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Number of Means Critical Range 2 123.2 3 117.7 Means with the same letter are not significantly different. Duncan Grouping A Mean 970.33 N 3 TRAT C B B B 810.67 3 B 715.00 3 A Conclusión En el caso de los tratamientos en estos se forman 2 grupos claramente diferenciados con letras diferentes (Duncan Grouping), de estos el tratamiento C es el que mayor promedio de producción de leche obtuvo, siendo este valor significativamente superior al de los tratamientos B y A, siendo que esos dos últimos tratamientos presentan estadísticamente similares promedios de producción de leche. También se puede pedir la realización de la prueba de Medias de Scheffe, esto se lo hace añadiendo el respectivo comando a la parte de procedimiento: OPTIONS NODATE NONUMBER; DATA DCL; INPUT BLOQ $ COL TRAT $ PROD; CARDS; I 1 A 608 II 1 B 715 III 1 C 884 I 2 B 885 II 2 C 1087 III 2 A 771 I 3 C 940 II 3 A 766 III 3 B 832 ; PROC ANOVA; TITLE'DISEÑO CUADRADO LATINO'; CLASS BLOQ COL TRAT; MODEL PROD=BLOQ COL TRAT; MEANS TRAT/SCHEFFE; RUN; (1) Revisando la sentencia introducida tenemos: (1) MEANS TRAT/SCHEFFE; realizara la prueba de medias de Scheffe para tratamientos. 70 Ing. Ramiro Raúl OCHOA TORREZ DISEÑO CUADRADO LATINO Los resultados del ANVA serán en este caso los mismos que se analizaron anteriormente, con la variante de que solo se tendrá la prueba de medias para Tratamientos. Siendo los resultados: DISEÑO CUADRADO LATINO The ANOVA Procedure Scheffe's Test for PROD NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 2 Error Mean Square 1230.333 Critical Value of F 19.00000 Minimum Significant Difference 176.55 Means with the same letter are not significantly different. Scheffe Grouping Mean N TRAT A A A 970.33 3 C 810.67 3 B 715.00 3 A B B B Conclusión En el caso de los tratamientos en estos se forman 2 grupos claramente diferenciados con letras diferentes (Scheffe Grouping), de estos el tratamiento C es el que mayor promedio de producción de leche obtuvo, siendo este valor significativamente superior al de los tratamientos B y A, siendo que esos dos últimos tratamientos presentan estadísticamente similares promedios de producción de leche. En muchos de los ensayos solo es necesario realizar la prueba de medias (Duncan, Tukey, LSD, etc.) de los tratamientos, para la realización de las pruebas de medias de los bloques y columnas, se deben tomar en cuenta que el experimento es llevado a cabo en la parte agrícola o en la parte pecuaria. En el caso anterior si se lleva a cabo en la parte pecuaria las fuentes de variación bloques y columnas pueden tener otra significación, como se vio en el ejercicio anterior en el cual las columnas representan las vacas y los bloques los periodos. En el caso de un ensayo en la parte agrícola, se deben considerar que representa los bloques o columnas, o si se tienen dos fuentes de variación en el terreno. Ing. Ramiro Raúl OCHOA TORREZ 71 8. COMPARACIONES ORTOGONALES 8.1. Comparaciones ortogonales de experimentos simples Ejercicio Los siguientes datos provenientes de rendimiento de kg/ha, corresponden a el cultivo de quinua, bajo la incorporación de abonos orgánicos y fertilizantes químicos, el ensayo fue realizado bajo un diseño bloques al azar con cuatro bloques (IBTA, 1988) N° T1 = T2 = T3 = T4 = T5 = Bloque I II III IV T1 233.20 182.57 231.97 340.23 Tratamiento Testigo 4 t MO 8 t MO 12 t MO 46 – 00 – 00 (Urea) T2 243.12 314.76 253.56 478.64 T3 300.71 209.06 375.17 476.44 T4 549.08 441.61 408.49 658.33 T5 562.36 506.91 554.16 520.40 En el caso de las comparaciones ortogonales, se debe considerar que los tratamientos puedan agruparse, planeando comparaciones independientes con los totales de cada tratamiento. Para esto recurriremos al uso de coeficientes para su desarrollo, respetando las reglas definidas para estos, donde el número de comparaciones independientes se obtiene con la formula (t – 1), donde t es el numero de tratamientos. Siendo este valor igual al número de GL de los tratamientos. Los tratamientos deben estar hábilmente agrupados y seleccionados, cuando son independientes reciben el nombre de ortogonales. La prueba es utilizada para comparar grupos de tratamientos y entre tratamientos. La suma de los coeficientes debe ser igual a 0 (cero), y la suma de los productos de los coeficientes correspondientes a las comparaciones cualesquiera debe ser necesariamente igual a cero. Para nuestro ejercicio tenemos cinco tratamientos, y por tanto el número de comparaciones que tenemos será: #C = t – 1 #C = 5 – 1 #C = 4 (4 comparaciones) Formulando las comparaciones mediante los coeficientes y respetando las reglas para su formulacion tenemos: # Comparación C1 C2 C3 C4 72 Testigo T1 4 0 0 0 4 t MO T2 –1 1 2 0 8 t MO T3 –1 1 –1 1 12 t MO T4 –1 1 –1 –1 Urea T5 –1 –3 0 0 Σ 0 0 0 0 Ing. Ramiro Raúl OCHOA TORREZ COMPARACIONES ORTOGONALES Este paso es importante para la realización de Comparaciones Ortogonales en el SAS, porque son los coeficientes los que deben introducirse en el PROGRAM EDITOR del SAS, la opción de contrastes ortogonales solo esta disponible cuando el procedimiento PROC es GLM: OPTIONS NODATE NONUMBER; DATA DBA; INPUT BLOQ $ TRAT $ REND; CARDS; I T1 233.2 II T1 182.57 III T1 231.97 IV T1 340.23 I T2 243.12 II T2 314.76 III T2 253.56 IV T2 478.64 I T3 300.71 II T3 209.06 III T3 375.17 IV T3 476.44 I T4 549.08 II T4 441.61 III T4 408.49 IV T4 658.33 I T5 562.36 II T5 506.91 III T5 554.16 IV T5 520.4 ; PROC GLM; TITLE'DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES'; CLASS BLOQ TRAT; MODEL REND=BLOQ TRAT/SS3; RUN; */TYPE-ORDER----------------------T1- T2- T3- T4- T5 */ CONTRAST'T1 VS T2 T3 T4 T5' TRAT 4 -1 -1 -1 -1; CONTRAST'T1 VS T2 T3 T4 T5' TRAT 4 -1 -1 -1 -1; CONTRAST'T2 T3 T4 VS T5' TRAT 0 1 1 1 -3; CONTRAST'T2 VS T3 T4' TRAT 0 2 -1 -1 0; CONTRAST'T3 VS T4' TRAT 0 0 1 -1 0; RUN; (1) (2) (2) (3) (4) (5) (6) Revisando la sentencia introducida tenemos: (1) (2) (3) (4) (5) (6) La primera parte es la que corresponde en este caso para un diseño bloques al azar, considerando bloques y tratamientos en el modelo. Revisando tenemos a TRAT como variable de estudio. CONTRAST’T1 VS T2 T3 T4 T5’ TRAT 4 –1 –1 –1 –1; Primer contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. CONTRAST’T2 VS T3 T4 T5’ TRAT 0 1 1 1 –3; Segundo contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. CONTRAST’T2 VS T3 T4’ TRAT 0 2 –1 –1 0; Tercer contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. CONTRAST’T3 VS T4’ TRAT 0 0 1 –1 0; Cuarto contraste ortogonal, considerando la variable de estudio tratamientos con los coeficientes de la respectiva comparación. RUN; ejecuta los comandos. Ing. Ramiro Raúl OCHOA TORREZ 73 Lo que nos dará los siguientes resultados: DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES The GLM Procedure Class Level Information Class Levels Values BLOQ 4 I II III IV TRAT 5 T1 T2 T3 T4 T5 Number of observations 20 DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES The GLM Procedure Dependent Variable: REND Sum of Source DF Squares Mean Square F Value Model 7 333112.8945 47587.5564 11.06 Error 12 51620.9708 4301.7476 Corrected Total 19 384733.8653 R-Square 0.865827 Source BLOQ TRAT Coeff Var 16.72992 DF 3 4 Root MSE 65.58771 Type III SS 76221.3290 256891.5655 Pr > F 0.0002 REND Mean 392.0385 Mean Square 25407.1097 64222.8914 F Value 5.91 14.93 Pr > F 0.0103 0.0001 La primera parte corresponderá al análisis de varianza de un diseño bloques al azar, el cual lo organizamos como ya mencionamos anteriormente. La segunda parte corresponde al análisis de varianza de las comparaciones ortogonales: DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES The GLM Procedure Dependent Variable: REND Contrast (1) (2) (3) (4) T1 T2 T2 T3 VS T3 VS VS T2 T3 T4 T5 T4 VS T5 T3 T4 T4 DF Contrast SS Mean Square F Value Pr > F 1 1 1 1 105191.7106 61814.0656 29311.1672 60574.6221 105191.7106 61814.0656 29311.1672 60574.6221 24.45 14.37 6.81 14.08 0.0003 0.0026 0.0228 0.0028 La salida del ANVA de comparaciones ortogonales los interpretamos de la siguiente forma: (1) Como fuente de variación toma a la primera comparación T1 VS T2 T3 T4 T5. (2) Como fuente de variación toma a la segunda comparación T2 VS T3 T4 T5. (3) Como fuente de variación toma a la tercera comparación T2 VS T3 T4. (4) Como fuente de variación toma a la cuarta comparación T3 VS T4. En función de las reglas de decisión similar a las del ANVA interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: 74 Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Ing. Ramiro Raúl OCHOA TORREZ COMPARACIONES ORTOGONALES Dándonos finalmente: T1 T2 T2 T3 VS T3 VS VS T2 T3 T4 T5 T4 VS T5 T3 T4 T4 1 1 1 1 105191.7106 61814.0656 29311.1672 60574.6221 105191.7106 61814.0656 29311.1672 60574.6221 24.45 14.37 6.81 14.08 0.0003** 0.0026** 0.0228* 0.0028** Conclusión Como conclusión podemos indicar que entre la comparación del Testigo (T1) con el resto de los tratamientos con aplicación (T2, T3, T4 y T5) existen diferencias altamente significativas en el rendimiento del cultivo de quinua, en el caso de la segunda comparación tenemos que los abonos orgánicos (T2, T3 y T4) comparada con la Urea (T5) presentan diferencias altamente significativas en el rendimiento de quinua, la comparación del tratamiento 2 (4 t MO) con los tratamientos 3 y 4 (8 y 12 t MO) presentan significancia (Pr < 0.05) en los valores del rendimiento de quinua; por ultimo en la comparación del tratamiento 3 (8 t MO) con el tratamiento 4 (12 t MO) presentan diferencias altamente significativas (Pr < 0.01) en el rendimiento de quinua. Ing. Ramiro Raúl OCHOA TORREZ 75 9. EXPERIMENTOS FACTORIALES 9.1. DCA con arreglo factorial 9.1.1. DCA con arreglo factorial – dos factores Ejercicio En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta de Kochia scoparia, bajo dos condiciones de cultivo y de cuatro alturas de corte (Rodríguez 1991). Condiciones Altura de Corte (cm) 25 Invierno 50 75 100 25 Verano 50 75 100 Modelo lineal aditivo: I 14.9 17.5 20.7 22.5 16.8 19.9 23.5 25.8 II 14.3 16.6 19.6 21.9 17.3 20.3 23.2 26.4 III 15.0 17.2 21.4 22.6 16.4 21.4 23.0 25.9 IV 14.3 16.3 20.3 21.8 17.1 20.8 24.1 27.1 Yijk = µ + αi + βj + αβij + εijk Donde: Yijk µ αi βj αβij εijk = Una observación = Media poblacional = Efecto del i – esimo nivel del factor A (Condiciones) = Efecto del j – esimo nivel del factor B (Altura de corte) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Condicion x Altura de corte) = Error experimental A B Repetición i… j… k… a… b… r… 1… 1… 1… 2 4 4 Las hipótesis a probar serán: Ho: Invierno = Verano (Condiciones) 25 = 50 = 75 = 100 (Altura de corte cm) Invierno – 25 = … = Verano – 100 Ha: Invierno ≠ Verano (Condiciones) 25 ≠ 50 ≠ 75 ≠ 100 (Altura de corte cm) Invierno – 25 ≠ … ≠ Verano – 100 Introduciendo los datos en el SAS tendremos: 76 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES OPTIONS NODATE NONUMBER; DATA DCAFAC1; INPUT CONDICION $ ALTURA FIBRA; CARDS; INVIERNO 25 14.9 INVIERNO 50 17.5 INVIERNO 75 20.7 INVIERNO 100 22.5 VERANO 25 16.8 VERANO 50 19.9 VERANO 75 23.5 VERANO 100 25.8 INVIERNO 25 14.3 INVIERNO 50 16.6 INVIERNO 75 19.6 INVIERNO 100 21.9 VERANO 25 17.3 VERANO 50 20.3 VERANO 75 23.2 VERANO 100 26.4 INVIERNO 25 15.0 INVIERNO 50 17.2 INVIERNO 75 21.4 INVIERNO 100 22.6 VERANO 25 16.4 VERANO 50 21.4 VERANO 75 23.0 VERANO 100 25.9 INVIERNO 25 14.3 INVIERNO 50 16.3 INVIERNO 75 20.3 INVIERNO 100 21.8 VERANO 25 17.1 VERANO 50 20.8 VERANO 75 24.1 VERANO 100 27.1 ; PROC GLM; CLASS CONDICION ALTURA; MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA; MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN; RUN; (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Revisando las sentencias introducidas tenemos: (1) (2) (3) (4) (5) (6) (7) Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página. Con DATA DCAFAC; le indicamos que genere un archivo con el nombre DCAFAC. Con INPUT CONDICION $ ALTURA FIBRA; le indicamos que ingrese las variables Condición, Altura y Fibra. CARDS; le señala que los datos vienen a continuación. Seguidamente se ubican todos nuestros datos ordenados en forma de filas. PROC GLM; le indica que realice el calculo de análisis de varianza considerando el modelo lineal. CLASS CONDICION ALTURA; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Condición y Altura. Ing. Ramiro Raúl OCHOA TORREZ 77 (8) MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con arreglo factorial (Yijk = µ + αi + βj + αβij + εijk), donde se coloca como: Yijk = µ + αi + βj + αβij + εijk Variable de respuesta = Variables de estudio Fibra = Condición Altura Condición*Altura No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. (9) (10) MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN; le pedimos al SAS que realice la prueba de medias de Duncan para los factores de estudio Condición y Altura, y también nos presente los promedios de la interacción de ambos factores. Con RUN; le señalamos que las sentencias anteriores son ejecutables. Los resultados del SAS serán en la primera parte el análisis de varianza: The SAS System The GLM Procedure Class Level Information Class Levels Values CONDICION 2 INVIERNO VERANO ALTURA 4 25 50 75 100 Number of observations The SAS System The GLM Procedure Dependent Variable: FIBRA (1) Source Model Error Corrected Total DF 7 24 31 R-Square 0.983594 (2) Source CONDICION ALTURA CONDICION*ALTURA Sum of Squares 419.5246875 6.9975000 426.5221875 Coeff Var 2.675165 DF 1 3 3 32 Mean Square 59.9320982 0.2915625 Root MSE 0.539965 Anova SS 84.8253125 330.7684375 3.9309375 F Value 205.55 Pr > F <.0001 F Value 290.93 378.16 4.49 Pr > F <.0001 <.0001 0.0122 FIBRA Mean 20.18438 Mean Square 84.8253125 110.2561458 1.3103125 La salida del ANVA, en este caso nos presenta 2 partes: (1) (2) La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación. La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son los dos factores en estudio Condición, Altura y la interacción Condición*Altura. Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2) donde se tienen todos los factores de estudio Condición, Altura y la interacción Condición*Altura en la parte (1) en vez de los valores de Model: Sum of 78 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES Source Model Error Corrected Total (1) DF 7 24 31 R-Square 0.983594 Source CONDICION ALTURA CONDICION*ALTURA (2) Squares 419.5246875 6.9975000 426.5221875 Coeff Var 2.675165 DF 1 3 3 Mean Square 59.9320982 0.2915625 Root MSE 0.539965 Anova SS 84.8253125 330.7684375 3.9309375 F Value 205.55 Pr > F <.0001 F Value 290.93 378.16 4.49 Pr > F <.0001 <.0001 0.0122 FIBRA Mean 20.18438 Mean Square 84.8253125 110.2561458 1.3103125 Dando como resultado final para su interpretación y mediante las reglas de decisión tenemos: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source CONDICION ALTURA CONDICION*ALTURA Error Corrected Total R-Square 0.983594 DF 1 3 3 24 31 Squares 84.8253125 330.7684375 3.9309375 6.9975000 426.5221875 Coeff Var 2.675165 Mean Square 84.8253125 110.2561458 1.3103125 0.2915625 Root MSE 0.539965 F Value 290.93 378.16 4.49 Pr > F <.0001** <.0001** 0.0122* FIBRA Mean 20.18438 Conclusión Como conclusión podemos indicar que los factores de estudio Condición y Altura presentan diferencias altamente significativas (Pr < 0.01), por los que entre condición (Verano e Invierno) existen diferencias en el contenido de fibra, así mismo entre alturas de corte (25, 50, 75 y 100 cm) existen diferencias en la altura de corte; en la interacción Condición x Altura se tienen diferencias significativas (Pr < 0.05). Teniéndose por otra parte un coeficiente de variación de 2.675165% mostrando un alto grado de confiabilidad de los datos y un promedio general de 20.18438 % de contenido de fibra. La siguiente parte de los resultados del SAS son la prueba de medias de Duncan, para ambos factores, la primera prueba es la de Condición (Verano e Invierno): Ing. Ramiro Raúl OCHOA TORREZ 79 The SAS System The GLM Procedure Duncan's Multiple Range Test for FIBRA NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 0.291562 Number of Means 2 Critical Range .3940 Means with the same letter are not significantly different. Duncan Grouping A Mean 21.8125 N 16 CONDICION VERANO B 18.5563 16 INVIERNO Conclusión En el caso de la Condición, la prueba de Duncan presenta diferencias significativas entre ambas (Distintas letras A y B en el Duncan Grouping), siendo Verano la que presenta el valor más alto de porcentaje de fibra, siendo este significativamente superior al valor de porcentaje de fibra de Invierno. La siguiente parte corresponde al factor altura de corte (25, 50, 75 y 100 cm): The SAS System The GLM Procedure Duncan's Multiple Range Test for FIBRA NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 0.291562 Number of Means 2 3 4 Critical Range .5572 .5852 .6032 Means with the same letter are not significantly different. Duncan Grouping A Mean 24.2500 N 8 ALTURA 100 B 21.9750 8 75 C 18.7500 8 50 D 15.7625 8 25 Conclusión En el caso de altura de corte, la prueba de Duncan presenta diferencias significativas entre todas las altura de corte (Letras distintas A, B, C y D en el Duncan Grouping), siendo la altura de corte de 100 cm la que mayor valor de 80 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES porcentaje de fibra registra, valor significativamente diferente al resto de las alturas, por otra parte la altura de corte de 25 cm es la que presenta el valor más bajo de porcentaje de fibra. Por ultimo se tiene la salida de los valores promedios de porcentaje de fibra, así como el desvió estándar del las interacciones de ambos factores en estudio: Level of CONDICION INVIERNO INVIERNO INVIERNO INVIERNO VERANO VERANO VERANO VERANO Level of ALTURA 25 50 75 100 25 50 75 100 N 4 4 4 4 4 4 4 4 ------------FIBRA-----------Mean Std Dev 14.6250000 0.37749172 16.9000000 0.54772256 20.5000000 0.75277265 22.2000000 0.40824829 16.9000000 0.39157800 20.6000000 0.64807407 23.4500000 0.47958315 26.3000000 0.59441848 Los anteriores valores que nos dieron de resultado, no servirán posteriormente. En el caso de que se tenga significanicia en el análisis de varianza para la interacción (A x B) o en nuestro caso interacción de los factores Condición x Altura, se deberá proceder a la realización del análisis de Varianza de Efectos Simples, tomando los valores originales, y los anteriores resultados nos servirán posteriormente para graficar los efectos simples. FV B(a1) B(a2) A(b1) A(b2) A(b3) A(b4) EE GL b–1 b–1 a–1 a–1 a–1 a–1 ab(r –1) SC SCB(a1) SCB(a2) SCA(b1) SCA(b2) SCA(b3) SCA(b4) SCE CM SCB(a1)/GL B(a1) SCB(a2)/GL B(a2) SCA(b1)/GL A(b1) SCA(b2)/GL A(b2) SCA(b3)/GL A(b3) SCA(b4)/GL A(b4) SCE/GLE Fc CMB(a1)CME CMB(a2)/CME CMA(b1)/CME CMA(b2)/CME CMA(b3)/CME CMA(b4)/CME Ft f(GL B(a1), GLE) f(GL B(a2), GLE) f(GL A(b1), GLE) f(GL A(b2), GLE) f(GL A(b3), GLE) f(GL A(b4), GLE) Para esto lo que debemos es agregar en el PROGRAM EDITOR, en la parte de procedimiento (PROC), los comandos necesarios para que nos proporcione el respectivo análisis de efectos simples, los comandos a ser agregados son: LSMEANS CONDICION*ALTURA / SLICE=CONDICION SLICE=ALTURA; RUN; Quedando como datos: Ing. Ramiro Raúl OCHOA TORREZ 81 OPTIONS NODATE NONUMBER; DATA DCAFAC1; INPUT CONDICION $ ALTURA FIBRA; CARDS; INVIERNO 25 14.9 INVIERNO 50 17.5 INVIERNO 75 20.7 INVIERNO 100 22.5 . . . . . . . . . VERANO 25 17.1 VERANO 50 20.8 VERANO 75 24.1 VERANO 100 27.1 ; PROC GLM; CLASS CONDICION ALTURA; MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA; MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN; LSMEANS CONDICION*ALTURA / SLICE=CONDICION SLICE=ALTURA; RUN; (1) (2) La primera parte de la introducción de datos ya se explico anteriormente, revisamos la segunda parte de las sentencias introducidas tenemos: (1) (2) Con LSMEANS CONDICION*ALTURA / SLICE=CONDICION SLICE=ALTURA; indicamos que realice el análisis de varianza de efectos simples. Con RUN; le señalamos que las sentencias anteriores son ejecutables. La salida del SAS para los efectos simples será la siguiente: 82 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES Sistema SAS Procedimiento GLM Medias de cuadrados mínimos CONDICION ALTURA INVIERNO INVIERNO INVIERNO INVIERNO VERANO VERANO VERANO VERANO 25 50 75 100 25 50 75 100 FIBRA LSMEAN 14.6250000 16.9000000 20.5000000 22.2000000 16.9000000 20.6000000 23.4500000 26.3000000 Sistema SAS Procedimiento GLM Medias de cuadrados mínimos CONDICION*ALTURA Efecto dividido por CONDICION for FIBRA (1) CONDICION INVIERNO VERANO DF 3 3 Suma de cuadrados 141.011875 193.687500 Cuadrado de la media 47.003958 64.562500 F-Valor 161.21 221.44 Pr > F <.0001 <.0001 Sistema SAS Procedimiento GLM Medias de cuadrados mínimos CONDICION*ALTURA Efecto dividido por ALTURA for FIBRA ALTURA (2) 25 50 75 100 DF Suma de cuadrados Cuadrado de la media F-Valor Pr > F 1 1 1 1 10.351250 27.380000 17.405000 33.620000 10.351250 27.380000 17.405000 33.620000 35.50 93.91 59.70 115.31 <.0001 <.0001 <.0001 <.0001 Analizando la salida del SAS tenemos: (1) (2) Nos señala que la salida de cada una de las condiciones esta finfluencias por toda las alturas. Nos señala que cada una de las altura esta influenciada por las dos condiciones. La primera parte se la anotara de la siguiente forma: CONDICION DF INVIERNO (ALTURA) 3 VERANO (ALTURA) 3 Suma de cuadrados 141.011875 193.687500 La segunda parte se la anotara de la siguiente forma: Suma de Ing. Ramiro Raúl OCHOA TORREZ Cuadrado de la media 47.003958 64.562500 F-Valor 161.21 221.44 Pr > F <.0001 <.0001 Cuadrado de 83 ALTURA DF 25(CONDICION) 50(CONDICION) 75(CONDICION) 100(CONDICION) 1 1 1 1 cuadrados la media F-Valor Pr > F 10.351250 27.380000 17.405000 33.620000 10.351250 27.380000 17.405000 33.620000 35.50 93.91 59.70 115.31 <.0001 <.0001 <.0001 <.0001 Agrupando la salida de los dos factores y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Lo que nos dará: CONDICION DF INVIERNO (ALTURA) 3 VERANO (ALTURA) 3 25(CONDICION) 1 50(CONDICION) 1 75(CONDICION) 1 100(CONDICION) 1 Suma de cuadrados 141.011875 193.687500 10.351250 27.380000 17.405000 33.620000 Cuadrado de la media 47.003958 64.562500 10.351250 27.380000 17.405000 33.620000 F-Valor 161.21 221.44 35.50 93.91 59.70 115.31 Pr > F <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 ** ** ** ** ** ** Conclusión El análisis de varianza de efectos simples nos indica que en el caso de la altura esta tiene un comportamiento significativamente diferente por efecto de la condición invierno, al igual que en el caso de que el factor altura sea afectado por la condición verano, en el caso del factor condición registran diferencias altamente significativas por efecto de los diferentes niveles del factor altura. 9.1.2. DCA con arreglo factorial – tres factores Ejercicio Los datos siguientes se refieren al consumo diario de alimento de pollos asaderos, distribuidos en grupos homogéneos de 100. Los datos corresponden a la séptima semana, y se consideran como factores las siguientes variables (Rodríguez 1991): Saborizantes (SA) Forma Física (FF) Fuente Proteica (FP) Saborizante Zanahoria Melaza 84 Forma Molido Rolado Molido Rolado Harina Soya Pescado Soya Pescado Soya Pescado Soya Pescado I 6.42 6.60 5.84 7.16 5.94 6.01 6.20 6.40 II 6.35 6.68 6.93 7.21 5.63 6.14 6.24 6.38 III 6.40 6.70 7.02 7.19 5.85 6.00 6.16 6.41 IV 6.38 6.65 6.95 7.22 5.74 6.04 6.29 6.39 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES El modelo aditivo lineal para un diseño completamente al azar con arreglo factorial de tres factores es el siguiente: Yijkl = µ + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl Donde: Yijkl µ αi δj αδij λk αλik δλjk αδλijk εijkl = Una observación = Media poblacional = Efecto del i – esimo nivel del factor A (Saborizantes) = Efecto del j – esimo nivel del factor B ((Forma) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Saborizantes x Forma) = Efecto del k – esimo nivel del factor C (Harina) = Efecto del i – esimo nivel del factor A, con el k – esimo nivel del factor (interacción A x C) (Saborizantes x Harina) = Efecto del j – esimo nivel del factor B, con el k – esimo nivel del factor C (interacción B x C) (Forma x Harina) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B y el k – esimo nivel del factor C (interacción A x B x C) (Saborizantes x Forma x Harina) = Error experimental A B C i... j... k... a... b... c... 1... 1... 1... 2 2 2 Las hipótesis a probar serán: Ho: Zanahoria = Melaza (Saborizante) Molido = Rolado (Forma) Soya = Pescado (Harina) Zanahoria – Molido – Soya = … = Melaza – Rolado – Pescado Ha: Zanahoria ≠ Melaza (Saborizante) Molido ≠ Rolado (Forma) Soya ≠ Pescado (Harina) Zanahoria – Molido – Soya ≠ … ≠ Melaza – Rolado – Pescado Introduciendo los datos en el PROGRAM EDITOR del SAS tenemos: Ing. Ramiro Raúl OCHOA TORREZ 85 OPTIONS NODATE NONUMBER; DATA FACDCA2; INPUT SABORIZANTE $ FORMA $ HARINA $ CONSUMO; CARDS; Zanahoria Molido Soya 6.42 Zanahoria Molido Pescado 6.60 Zanahoria Rolado Soya 5.84 Zanahoria Rolado Pescado 7.16 Melaza Molido Soya 5.94 Melaza Molido Pescado 6.01 Melaza Rolado Soya 6.20 Melaza Rolado Pescado 6.40 Zanahoria Molido Soya 6.35 Zanahoria Molido Pescado 6.68 Zanahoria Rolado Soya 6.93 Zanahoria Rolado Pescado 7.21 Melaza Molido Soya 5.63 Melaza Molido Pescado 6.14 Melaza Rolado Soya 6.24 Melaza Rolado Pescado 6.38 Zanahoria Molido Soya 6.40 Zanahoria Molido Pescado 6.70 Zanahoria Rolado Soya 7.02 Zanahoria Rolado Pescado 7.19 Melaza Molido Soya 5.85 Melaza Molido Pescado 6.00 Melaza Rolado Soya 6.16 Melaza Rolado Pescado 6.41 Zanahoria Molido Soya 6.38 Zanahoria Molido Pescado 6.65 Zanahoria Rolado Soya 6.95 Zanahoria Rolado Pescado 7.22 Melaza Molido Soya 5.74 Melaza Molido Pescado 6.04 Melaza Rolado Soya 6.29 Melaza Rolado Pescado 6.39 ; PROC GLM; TITLE'DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)'; CLASS SABORIZANTE FORMA HARINA; MODEL CONSUMO=SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA; RUN; (1) (2) (3) (4) (5) La introducción de los datos y los comandos iniciales son los mismos para todos los casos, en este caso analizaremos los comandos del procedimiento, después de introducidos los datos: (1) (2) (3) (4) PROC GLM; le indica que realice el calculo de análisis de varianza considerando el modelo lineal. TITLE’DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES); le indicamos el titulo del trabajo. CLASS SABORIZANTE FORMA HARINA; le indicamos cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Saborizante, Forma y Harina. MODEL CONSUMO=SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con arreglo factorial para tres factores (Yijkl = µ + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl), donde se coloca como: 86 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES Yijkl = µ + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl Variable de respuesta = Variables de estudio Consumo = Saborizante Forma Saborizante*Forma Harina Saborizante*Harina Forma*Harina Saborizante*Forma*Harina (5) Con RUN; le señalamos que las sentencias anteriores son ejecutables. Los resultados del SAS serán los siguientes: DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES) The GLM Procedure Class Level Information Class Levels SABORIZANTE FORMA HARINA Values 2 2 2 Melaza Zanahori Molido Rolado Pescado Soya Number of observations 32 DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES) The GLM Procedure Dependent Variable: CONSUMO (1) Source Model Error Corrected Total DF 7 24 31 R-Square 0.833285 (2) Source SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA FORMA*HARINA SABORIZ*FORMA*HARINA Sum of Squares 5.21420000 1.04320000 6.25740000 Coeff Var 3.246191 DF 1 1 1 1 1 1 1 Mean Square 0.74488571 0.04346667 Root MSE 0.208487 Anova SS 3.05045000 1.30411250 0.00151250 0.73205000 0.06125000 0.01201250 0.05281250 F Value 17.14 Pr > F <.0001 CONSUMO Mean 6.422500 Mean Square 3.05045000 1.30411250 0.00151250 0.73205000 0.06125000 0.01201250 0.05281250 F Value 70.18 30.00 0.03 16.84 1.41 0.28 1.22 Pr > F <.0001 <.0001 0.8536 0.0004 0.2468 0.6039 0.2813 La salida del ANVA, en este caso nos presenta 2 partes: (1) (2) La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación. La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son los tres factores en estudio: Saborizante, Forma, Saborizante*Forma, Harina, Saborizante*Harina, Forma*Harina y Saborizante*Forma*Harina. Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2) donde se tienen todas las fuentes de variación en la parte (1) en vez de los valores de Model: Ing. Ramiro Raúl OCHOA TORREZ 87 Source Model Error Corrected Total (1) DF 7 24 31 R-Square 0.833285 Source SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA FORMA*HARINA SABORIZ*FORMA*HARINA (2) Sum of Squares 5.21420000 1.04320000 6.25740000 Coeff Var 3.246191 DF 1 1 1 1 1 1 1 Mean Square 0.74488571 0.04346667 Root MSE 0.208487 Anova SS 3.05045000 1.30411250 0.00151250 0.73205000 0.06125000 0.01201250 0.05281250 F Value 17.14 Pr > F <.0001 CONSUMO Mean 6.422500 Mean Square 3.05045000 1.30411250 0.00151250 0.73205000 0.06125000 0.01201250 0.05281250 F Value 70.18 30.00 0.03 16.84 1.41 0.28 1.22 Pr > F <.0001 <.0001 0.8536 0.0004 0.2468 0.6039 0.2813 F Value 70.18 30.00 0.03 16.84 1.41 0.28 1.22 Pr > F <.0001** <.0001** 0.8536ns 0.0004** 0.2468ns 0.6039ns 0.2813ns Dando como resultado final para su interpretación mediante las reglas de decisión: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA FORMA*HARINA SABORIZ*FORMA*HARINA Error Corrected Total R-Square 0.833285 DF 1 1 1 1 1 1 1 24 31 Sum of Squares 3.05045000 1.30411250 0.00151250 0.73205000 0.06125000 0.01201250 0.05281250 1.04320000 6.25740000 Coeff Var 3.246191 Mean Square 3.05045000 1.30411250 0.00151250 0.73205000 0.06125000 0.01201250 0.05281250 0.04346667 Root MSE 0.208487 CONSUMO Mean 6.422500 Conclusión Como conclusión podemos indicar que los factores de estudio Saborizante, Forma y Harina presentan diferencias altamente significativas (Pr < 0.01), existiendo diferencias altamente significativas en el consumo diario de pollos asaderos, en tanto que en las interacciones de dos factores y de tres factores no presentan diferencia significativa en sus valores de consumo diario. Teniéndose un coeficiente de variación de 3.246191% y un promedio general de 6.4225 de consumo de alimento. En el presente ejercicio, después de la interpretación de los resultados observamos que se necesita realizar las respectivas pruebas de medias, como son la de Duncan o Tukey, para este caso se deberá agregar los respectivos comandos en la parte de procedimiento, la interpretación de los resultados de las pruebas de medias será la misma que en los anteriores casos. Por otra parte observamos que no se requiere el análisis de efectos simples, toda vez que no se presentaron significancias en las interacciones sean estas de dos y tres factores pero en este caso se puede pedir una interpretación en función a los promedios y el desvió estándar que pudiera presentar cada una de las interacciones. La presentación de los procedimientos en el SAS será la siguiente: 88 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES OPTIONS NODATE NONUMBER; DATA FACDCA2; INPUT SABORIZANTE $ FORMA $ HARINA $ CONSUMO; CARDS; Zanahoria Molido Soya 6.42 Zanahoria Molido Pescado 6.60 Zanahoria Rolado Soya 5.84 Zanahoria Rolado Pescado 7.16 . . . . . . . . . . . . Melaza Molido Soya 5.74 Melaza Molido Pescado 6.04 Melaza Rolado Soya 6.29 Melaza Rolado Pescado 6.39 ; PROC GLM; TITLE'DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)'; CLASS SABORIZANTE FORMA HARINA; MODEL CONSUMO=SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA; MEANS SABORIZANTE FORMA HARINA/DUNCAN; (1) MEANS SABORIZANTE*FORMA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA;(2) RUN; (3) La introducción de los datos y los comandos iniciales son los mismos para todos los casos, en este caso analizaremos los comandos del procedimiento, después de introducidos la totalidad de los datos: (1) (2) (3) MEANS SABORIZANTE FORMA HARINA/DUNCAN; le indica que realice la prueba de Duncan para los tres factores en estudio. MEANS SABORIZANTE*FORMA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA; le pedimos al SAS que realice el calculo de los promedios y el desvió estándar de todas las interacciones de dos factores y tres factores. Con RUN; le señalamos que las sentencias anteriores son ejecutables. La primera parte de la salida del SAS corresponde al análisis de varianza siendo la misma que anteriormente se analizo, posteriormente se presenta la salida la prueba de Duncan para los tres factores en estudio, y los promedios y los desvió estándar de las interacciones, la primera corresponderá a la prueba de Duncan para el factor Saborizante: Ing. Ramiro Raúl OCHOA TORREZ 89 DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES) The GLM Procedure Duncan's Multiple Range Test for CONSUMO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 0.043467 Number of Means Critical Range 2 .1521 Means with the same letter are not significantly different. Duncan Grouping Mean N SABORIZANTE A 6.73125 16 Zanahori B 6.11375 16 Melaza Conclusión En el caso de Saborizante, la prueba de Duncan presenta diferencias significativas entre los dos saborizantes (Letras distintas A y B en el Duncan Grouping), siendo la Zanahoria la que mayor consumo de alimento registro, valor significativamente diferente y superior al presentado por la Melaza. La siguiente es la presentación de la prueba de Duncan para el factor Forma física del alimento: DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES) The GLM Procedure Duncan's Multiple Range Test for CONSUMO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 0.043467 Number of Means Critical Range 2 .1521 Means with the same letter are not significantly different. Duncan Grouping Mean N FORMA A 6.62438 16 Rolado B 6.22063 16 Molido Conclusión En el caso del factor Forma física del alimento, la prueba de Duncan a un nivel de significancia del 5% (α = 0.05) presenta diferencias significativas entre las dos formas de alimentos (Letras distintas A y B en el Duncan Grouping), 90 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES siendo la forma física de Rolado la que mayor consumo de alimento registra, valor significativamente diferente y superior al presentado por la forma física Molida. La siguiente es la presentación de la prueba de Duncan para el factor Harina (Fuente proteica): DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES) The GLM Procedure Duncan's Multiple Range Test for CONSUMO NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 0.043467 Number of Means Critical Range 2 .1521 Means with the same letter are not significantly different. Duncan Grouping Mean N HARINA A 6.57375 16 Pescado B 6.27125 16 Soya Conclusión En el caso del factor Harina o Fuente proteica, la prueba de Duncan a un nivel de significancia del 5% (α = 0.05) presenta diferencias significativas entre las dos fuentes proteicas (Letras distintas A y B en el Duncan Grouping), siendo la fuente proteica de Pescado la que mayor consumo de alimento registra, valor significativamente diferente y superior al presentado por la fuente proteica de Soya. Por ultimo se observa la salida de los promedios y los desvió estándar de las interacciones de los tres factores en estudio: SABORIZANTE*FORMA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA Siendo la presentación de los resultados en el mismo orden en el que se introdujo en los comandos en el SAS, la interpretación de las mismas se hace de interacción en interacción, rescatando el valor máximo y mínimo presentado por cada interacción. Ing. Ramiro Raúl OCHOA TORREZ 91 DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES) The GLM Procedure Level of SABORIZANTE Melaza Melaza Zanahori Zanahori Level of FORMA Molido Rolado Molido Rolado N 8 8 8 8 -----------CONSUMO----------Mean Std Dev 5.91875000 0.16864481 6.30875000 0.09948977 6.52250000 0.14839619 6.94000000 0.45962718 Level of SABORIZANTE Melaza Melaza Zanahori Zanahori Level of HARINA Pescado Soya Pescado Soya N 8 8 8 8 -----------CONSUMO----------Mean Std Dev 6.22125000 0.19059587 6.00625000 0.25002500 6.92625000 0.28923236 6.53625000 0.40288026 Level of FORMA Molido Molido Rolado Rolado Level of SABORIZANTE Melaza Melaza Melaza Melaza Zanahori Zanahori Zanahori Zanahori Level of HARINA Pescado Soya Pescado Soya Level of FORMA Molido Molido Rolado Rolado Molido Molido Rolado Rolado N 8 8 8 8 Level of HARINA Pescado Soya Pescado Soya Pescado Soya Pescado Soya -----------CONSUMO----------Mean Std Dev 6.35250000 0.32996753 6.08875000 0.33185356 6.79500000 0.42805207 6.45375000 0.44618822 N 4 4 4 4 4 4 4 4 -----------CONSUMO----------Mean Std Dev 6.04750000 0.06396614 5.79000000 0.13441230 6.39500000 0.01290994 6.22250000 0.05560276 6.65750000 0.04349329 6.38750000 0.02986079 7.19500000 0.02645751 6.68500000 0.56465329 Conclusión En el caso de la interacción Saborizante x Forma (Saborizante x Forma física), la interacción correspondiente a Zanahoria – Rolado, es la que mayor valor de consumo de alimento registra con 6.94, en contraposición con Melaza – Molido, que presenta el consumo mas bajo con 5.91875. Con relación a la interacción de los factores Saborizante x Harina (Saborizante x Fuente Proteica), la combinación correspondiente a Zanahoria – Pescado es la que mayor valor de consumo de alimento registra con 6.92625, siendo la combinación de Melaza – Soya la que menor valor de consumo de alimento registro con 6.00. Para el caso de la interacción de Forma x Harina (Forma física x Fuente Proteica), la combinación correspondiente a Rolado – Molido es la que mayor consumo de alimento presenta, siendo el menor consumo el de la combinación de Molido – Soya. En el caso de la interacción de los tres factores, se tiene que la combinación correspondiente a Melaza – Molido – Soya la que menor valor de consumo de alimento presenta con un valor de 5.79, siendo el tratamiento de Zanahoria – Rolado – Molido la que mayor valor de consumo presenta con un valor de 7.195; el resto de los valores de consumo de alimento de los demás tratamientos se encuentran dentro de esos rangos. 9.2. DBA con arreglo factorial 9.2.1. DBA con arreglo factorial – dos factores 92 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES Ejercicio En un experimento se estudio mediante el DBA con 3 repeticiones, se analizaron 3 laminas de riego en 3 variedades de arroz, teniéndose los datos de rendimiento en kg/parcela (Padrón, 1996) Lamina de Riego (mm) 5mm 5mm 5mm 10mm 10mm 10mm 15mm 15mm 15mm Variedad de arroz V1 V2 V3 V1 V2 V3 V1 V2 V3 I 28 32 33 21 40 50 36 38 52 II 36 30 36 28 42 51 50 49 50 III 38 29 37 27 44 50 48 51 53 El modelo lineal para un diseño bloques al azar con arreglo factorial de dos factores es el siguiente: Yijk = µ + βk + αi + λj + αλij + εijk Donde: Yijk µ βk αi λj αλij εijk = Una observación = Media poblacional = Efecto del k – esimo bloque = Efecto del i – esimo nivel del factor A (Lamina de Riego) = Efecto del j – esimo nivel del factor B (Variedad de arroz) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Lamina de riego x Variedad de Arroz) = Error experimental Lamina Variedad Bloque i… j… k… a… b… r… 1… 1… 1… 3 3 3 Las hipótesis a probar serán: Ho: Ha: 5mm = 10mm = 15 mm V1 = V2 = V3 5mm – V1 = … = 15mm – V3 Bloque I = Bloque = Bloque III (Lamina de riego) (Variedad de arroz) 5mm ≠ 10mm ≠ 15 mm V1 ≠ V2 ≠ V3 5mm – V1 ≠ … ≠ 15mm – V3 Bloque I ≠ Bloque ≠ Bloque III (Lamina de riego) (Variedad de arroz) (Bloques) (Bloques) Introduciendo los datos en el SAS de forma lineal tendremos: Ing. Ramiro Raúl OCHOA TORREZ 93 OPTIONS NODATE NONUMBER; DATA FACDBA; INPUT BLOQUE LAMINA $ VAR $ REND @@; CARDS; 1 5mm V1 28 2 5mm V1 36 3 5mm V1 38 1 5mm V2 32 2 5mm V2 30 3 5mm V2 29 1 5mm V3 33 2 5mm V3 36 3 5mm V3 37 1 10mm V1 21 2 10mm V1 28 3 10mm V1 27 1 10mm V2 40 2 10mm V2 42 3 10mm V2 44 1 10mm V3 50 2 10mm V3 51 3 10mm V3 50 1 15mm V1 36 2 15mm V1 50 3 15mm V1 48 1 15mm V2 38 2 15mm V2 49 3 15mm V2 51 1 15mm V3 52 2 15mm V3 50 3 15mm V3 53 ; PROC ANOVA; TITLE'DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES)'; CLASS BLOQUE LAMINA VAR; MODEL REND=BLOQUE LAMINA VAR LAMINA*VAR; RUN; (1) (2) (3) (4) (5) La introducción de los datos y los comandos iniciales son los mismos para todos los casos, en este caso analizaremos los comandos del procedimiento, después de introducidos los datos: (1) (2) (3) (4) PROC ANOVA; le indica que realice el calculo de análisis de varianza. TITLE’DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES); le indicamos el titulo del trabajo. CLASS BLOQUE LAMINA VAR; le indicamos cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Bloque, Lámina y Variedad. MODEL REND=BLOQUE LAMINA VAR LAMINA*VAR; este punto esta en directa relación con el modelo lineal de un diseño bloques al azar con arreglo factorial para dos (Yijk = µ + βk + αi + λj + αλij + εijk), donde se coloca como: Yijk = µ + βk + αi + λj + αλij + εijk Variable de respuesta = Variables de estudio Rendimiento = Bloque Lamina Variedad Lamina * Variedad (5) RUN; le señalamos que las sentencias anteriores son ejecutables. Los resultados presentados serán similares a los que se registro en los anteriores ejercicios, presentándonos primeramente el análisis de varianza para un diseño bloques al azar con arreglo factorial, posteriormente las pruebas de medias de los factores en estudio (Lamina de riego y Variedad), posteriormente los valores de los promedios y el desvió estándar de los tratamientos y por ultimo el análisis de varianza de efectos simples de la interacción de los dos factores: 94 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES) The ANOVA Procedure Class Level Information Class Levels Values BLOQUE 3 1 2 3 LAMINA 3 10mm 15mm 5mm VAR 3 V1 V2 V3 Number of observations 27 DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES) The ANOVA Procedure Dependent Variable: REND Sum of Source DF Squares Mean Square F Value Model 10 2161.037037 216.103704 19.65 Error 16 175.925926 10.995370 Corrected Total 26 2336.962963 R-Square 0.924720 Source BLOQUE LAMINA VAR LAMINA*VAR Coeff Var 8.297500 DF 2 2 2 4 Root MSE 3.315927 Anova SS 148.0740741 917.6296296 559.1851852 536.1481481 Pr > F <.0001 REND Mean 39.96296 Mean Square 74.0370370 458.8148148 279.5925926 134.0370370 F Value 6.73 41.73 25.43 12.19 Pr > F 0.0076 <.0001 <.0001 <.0001 Organizando la salida de nuestros como se lo hizo anteriormente en los anteriores ejercicios, tenemos para el análisis de varianza, y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQUE LAMINA VAR LAMINA*VAR Error Corrected Total DF 2 2 2 4 16 26 R-Square 0.924720 Sum of Squares 148.0740741 917.6296296 559.1851852 536.1481481 175.925926 2336.962963 Coeff Var 8.297500 Mean Square 74.0370370 458.8148148 279.5925926 134.0370370 10.995370 Root MSE 3.315927 F Value 6.73 41.73 25.43 12.19 Pr > F 0.0076** <.0001** <.0001** <.0001** REND Mean 39.96296 Conclusión Como conclusión podemos indicar que en todas las fuentes de variación (Bloques, Lamina, Variedad y Lamina x Variedad) se presentan diferencias altamente significativas (Pr < 0.01), en los valores de rendimiento. Teniéndose un coeficiente de variación de 8.297500% y un promedio general de 39.96296 de rendimiento. 9.2.2. DBA con arreglo factorial – tres factores Ejercicio Ing. Ramiro Raúl OCHOA TORREZ 95 El siguiente estudio se llevo a cabo con el fin de observar el consumo de alimento de gazapos en desarrollo, destinados para engorde y reproducción. El experimento se efectuó con dos razas y dos dietas diferentes, durante cuatro épocas del año (Rodríguez 1991) Razas Californiana Californiana Californiana Californiana Azul de Beveren Azul de Beveren Azul de Beveren Azul de Beveren Objetivo Engorde Engorde Reproducción Reproducción Engorde Engorde Reproducción Reproducción Dieta D1 D2 D1 D2 D1 D2 D1 D2 Verano 160 169 200 217 145 149 201 224 Otoño 170 176 210 224 156 161 230 232 Invierno 175 182 224 236 164 173 236 249 Primavera 163 171 202 206 150 154 221 230 El modelo aditivo lineal para un diseño bloques al azar con arreglo factorial de tres factores es el siguiente: Yijkl = µ + βl + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl Donde: Yijkl µ βl αi δj αδij λk αλik δλjk αδλijk εijkl = Una observación = Media poblacional = Efecto del l – esimo bloque = Efecto del i – esimo nivel del factor A (Razas) = Efecto del j – esimo nivel del factor B (Objetivo) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Razas x Objetivo) = Efecto del k – esimo nivel del factor C (Dieta) = Efecto del i – esimo nivel del factor A, con el k – esimo nivel del factor (interacción A x C) (Razas x Dieta) = Efecto del j – esimo nivel del factor B, con el k – esimo nivel del factor C (interacción B x C) (Objetivo x Dieta) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B y el k – esimo nivel del factor C (interacción A x B x C) (Razas x Objetivo x Dieta) = Error experimental A B C Bloque i... j... k... l... a... b... c... r... 1... 1... 1... 1... 2 2 2 4 Las hipótesis a probar serán: Ha: Ha: 96 Californiana = Azul de Beveren (Razas) (1: Californiana y 2: Azul de Beveren) Engorde = Reproducción (Objetivo) (1: Engorde y 2: Reproducción) D1 = D2 (Dietas) (1: D1 y 2: D2) Californiana – Engorde – D1 = … = Azul de Beveren – Reproducción – D2 Verano ≠ Otoño ≠ Invierno ≠ Primavera (Bloques) (1: Verano, 2: Otoño, 3: Invierno y 4: Primavera) Californiana ≠ Azul de Beveren (Razas) (1: Californiana y 2: Azul de Beveren) Engorde ≠ Reproducción (Objetivo) (1: Engorde y 2: Reproducción) D1 ≠ D2 (Dietas) (1: D1 y 2: D2) Californiana – Engorde – D1 ≠ … ≠ Azul de Beveren – Reproducción – D2 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES Verano ≠ Otoño ≠ Invierno ≠ Primavera (Bloques) (1: Verano, 2: Otoño, 3: Invierno y 4: Primavera) Introduciendo los datos en el SAS tenemos: OPTIONS NODATE NONUMBER; DATA DBAFAC; INPUT BLOQUES RAZAS OBJETIVO DIETA CONSUMO; CARDS; 1 1 1 1 160 1 1 1 2 169 1 1 2 1 200 1 1 2 2 217 1 2 1 1 145 1 2 1 2 149 1 2 2 1 201 1 2 2 2 224 2 1 1 1 170 2 1 1 2 176 2 1 2 1 210 2 1 2 2 224 2 2 1 1 156 2 2 1 2 161 2 2 2 1 230 2 2 2 2 232 3 1 1 1 175 3 1 1 2 182 3 1 2 1 224 3 1 2 2 236 3 2 1 1 164 3 2 1 2 173 3 2 2 1 236 3 2 2 2 249 4 1 1 1 163 4 1 1 2 171 4 1 2 1 202 4 1 2 2 206 4 2 1 1 150 4 2 1 2 154 4 2 2 1 221 4 2 2 2 230 ; PROC ANOVA; CLASS BLOQUES RAZAS OBJETIVO DIETA; MODEL CONSUMO=BLOQUES RAZAS OBJETIVO RAZAS*OBJETIVO DIETA RAZAS*DIETA OBJETIVO*DIETA RAZAS*OBJETIVO*DIETA; RUN; Lo que nos dará como resultado: Ing. Ramiro Raúl OCHOA TORREZ 97 The SAS System The ANOVA Procedure Class Level Information Class Levels Values BLOQUES 4 1 2 3 4 RAZAS 2 1 2 OBJETIVO 2 1 2 DIETA 2 1 2 Number of observations 32 The SAS System The ANOVA Procedure Dependent Variable: CONSUMO Source Model Error Corrected Total DF 10 21 31 R-Square 0.986127 Source BLOQUES RAZAS OBJETIVO RAZAS*OBJETIVO DIETA RAZAS*DIETA OBJETIVO*DIETA RAZAS*OBJETIVO*DIETA Sum of Squares 31098.50000 437.50000 31536.00000 Coeff Var 2.371093 DF 3 1 1 1 1 1 1 1 Mean Square 3109.85000 20.83333 Root MSE 4.564355 Anova SS 2204.50000 3.12500 26680.50000 1485.12500 666.12500 2.00000 55.12500 2.00000 F Value 149.27 Pr > F <.0001 CONSUMO Mean 192.5000 Mean Square 734.83333 3.12500 26680.50000 1485.12500 666.12500 2.00000 55.12500 2.00000 F Value 35.27 0.15 1280.66 71.29 31.97 0.10 2.65 0.10 Pr > F <.0001 0.7024 <.0001 <.0001 <.0001 0.7597 0.1187 0.7597 Organizando los resultados de los tres factores y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Lo que nos dará: Source BLOQUES RAZAS OBJETIVO RAZAS*OBJETIVO DIETA RAZAS*DIETA OBJETIVO*DIETA RAZAS*OBJETIVO*DIETA Error Corrected Total R-Square 0.986127 98 DF 3 1 1 1 1 1 1 1 21 31 Sum of Squares 2204.50000 3.12500 26680.50000 1485.12500 666.12500 2.00000 55.12500 2.00000 437.50000 31536.00000 Coeff Var 2.371093 Mean Square 734.83333 3.12500 26680.50000 1485.12500 666.12500 2.00000 55.12500 2.00000 20.83333 Root MSE 4.564355 F Value 35.27 0.15 1280.66 71.29 31.97 0.10 2.65 0.10 Pr > F <.0001** 0.7024ns <.0001** <.0001** <.0001** 0.7597ns 0.1187ns 0.7597ns CONSUMO Mean 192.5000 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES CONCLUSIÓN Como conclusión podemos indicar que en las fuentes de variación Bloques, Objetivo, Dieta y la interacción Razas x Objetivo se tienen diferencias altamente significativas en cuanto al consumo de alimento, en tanto que en las fuentes de variación Razas, las interacciones Razas x Dieta, Objetivo x Dieta y Razas x Objetivo x Dieta no se presentan diferencias estadísticas. Teniéndose un coeficiente de variación de 2.371093% y un promedio general de consumo de alimento de 192.50. 9.3. DCL con arreglo factorial 9.3.1. DCL con arreglo factorial – dos factores Ejercicio En un experimento se estudiaron dos insecticidas, cada uno con tres dosis para el control del gusano bellotero en el algodón (Reyes 1999): Factor A: Insecticidas a1= Insecticida de uso común a2= Insecticida experimental Combinación Tratamiento a1b1 A a1b2 B Factor B: Dosis b1= 3 kg/ha de material técnico b2= 6 kg/ha de material técnico b3= 9 kg/ha de material técnico a1b3 C a2b1 D a2b2 E a2b3 F Los valores a continuación representan el rendimiento de algodón en parcelas de 40 m2 distribuidos en el campo. Bloque VI 1 C 7 2 F 8 Columna 3 4 D A 6 4 5 E 3 6 B 5 V B 5 E 3 C 7 F 9 D 6 A 3 IV A 4 D 7 B 5 E 4 C 6 F 8 III F 9 C 7 A 4 D 7 B 6 E 4 II E 3 B 6 F 9 C 8 A 3 D 6 I D 7 A 3 E 4 B 5 F 8 C 7 El modelo lineal para un diseño cuadrado latino con arreglo factorial, es el siguiente: Yijkl = µ + βk + θl+ αi + λj + αλij + εijkl Donde: Yijkl = Una observación Ing. Ramiro Raúl OCHOA TORREZ 99 µ βk θl αi λj αλij εijkl = Media poblacional = Efecto del k – esimo bloque = Efecto de la l – esima columna = Efecto del i – esimo nivel del factor A (Insecticida) = Efecto del j – esimo nivel del factor B (Dosis) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Insecticida x Dosis) = Error experimental Insecticida Dosis Bloque Columna i... j... k... l... a... b... c... r... 1... 1... 1... 1... 2 3 6 6 Las hipótesis a probar serán: Ho: a1 = a2 (Insecticidas) b1 = b2 = b3 (Dosis) a1b1 = a1b2 = a1b3 = a2b1 = a2b2 = a2b3 I = II = III = IV = V = VI (Bloques) 1 = 2 = 3 = 4= 5 = 6 (Columnas) Ha: a1 ≠ a2 (Insecticidas) b1 ≠ b2 ≠ b3 (Dosis) a1b1 ≠ a1b2 ≠ a1b3 ≠ a2b1 ≠ a2b2 ≠ a2b3 I ≠ II ≠ III ≠ IV ≠ V ≠ VI (Bloques) 1 ≠ 2 ≠ 3 ≠ 4≠ 5 ≠ 6 (Columnas) Introduciendo los datos en el SAS, respetando la distribución de cada tratamiento (combinación de los niveles de los dos factores) en cada bloque y cada columna: 100 Ing. Ramiro Raúl OCHOA TORREZ EXPERIMENTOS FACTORIALES OPTIONS NODATE NONUMBER; DATA DCLFAC; INPUT BLOQUE $ COLUMNA INSEC $ DOSIS $ REND; CARDS; VI 1 a1 b3 7 VI 2 a2 b3 8 VI 3 a2 b1 6 VI 4 a1 b1 4 VI 5 a2 b2 3 VI 6 a1 b2 5 V 1 a1 b2 5 V 2 a2 b2 3 V 3 a1 b3 7 V 4 a2 b3 9 V 5 a2 b1 6 V 6 a1 b1 3 IV 1 a1 b1 4 IV 2 a2 b1 7 IV 3 a1 b2 5 IV 4 a2 b2 4 IV 5 a1 b3 6 IV 6 a2 b3 8 III 1 a2 b3 9 III 2 a1 b3 7 III 3 a1 b1 4 III 4 a2 b1 7 III 5 a1 b2 6 III 6 a2 b2 4 II 1 a2 b2 3 II 2 a1 b2 6 II 3 a2 b3 9 II 4 a1 b3 8 II 5 a1 b1 3 II 6 a2 b1 6 I 1 a2 b1 7 I 2 a1 b1 3 I 3 a2 b2 4 I 4 a1 b2 5 I 5 a2 b3 8 I 6 a1 b3 7 ; PROC ANOVA; CLASS BLOQUE COLUMNA INSEC DOSIS; MODEL REND=BLOQUE COLUMNA INSEC DOSIS INSEC*DOSIS; RUN; La salida de los resultados será la siguiente: Ing. Ramiro Raúl OCHOA TORREZ 101 The SAS System The ANOVA Procedure Class Level Information Class Levels Values BLOQUE 6 I II III IV V VI COLUMNA 6 1 2 3 4 5 6 INSEC 2 a1 a2 DOSIS 3 b1 b2 b3 Number of observations 36 The SAS System The ANOVA Procedure Dependent Variable: REND Source Model Error Corrected Total DF 15 20 35 R-Square 0.962167 Source BLOQUE COLUMNA INSEC DOSIS INSEC*DOSIS Sum of Squares 124.3333333 4.8888889 129.2222222 Coeff Var 8.640231 DF 5 5 1 2 2 Mean Square 8.2888889 0.2444444 Root MSE 0.494413 Anova SS 1.88888889 2.55555556 7.11111111 76.05555556 36.72222222 F Value 33.91 Pr > F <.0001 REND Mean 5.722222 Mean Square 0.37777778 0.51111111 7.11111111 38.02777778 18.36111111 F Value 1.55 2.09 29.09 155.57 75.11 Pr > F 0.2209 0.1090 <.0001 <.0001 <.0001 Organizando los resultados y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQUE COLUMNA INSEC DOSIS INSEC*DOSIS Error Corrected Total DF 5 5 1 2 2 20 35 R-Square 0.962167 Sum of Squares 1.88888889 2.55555556 7.11111111 76.05555556 36.72222222 4.8888889 129.2222222 Coeff Var 8.640231 Mean Square 0.37777778 0.51111111 7.11111111 38.02777778 18.36111111 0.2444444 Root MSE 0.494413 F Value 1.55 2.09 29.09 155.57 75.11 Pr > F 0.2209ns 0.1090ns <.0001** <.0001** <.0001** REND Mean 5.722222 CONCLUSIÓN El análisis de varianza nos muestra que no se tienen diferencias estadísticas entre bloques y columnas, presentando diferencias altamente significativas para Insecticidas, Dosis y la interacción Insecticidas x Dosis, teniéndose un promedio general de 5.722 de rendimiento por parcela y un coeficiente de variación de 8.640231%. 102 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS 10. PARCELAS DIVIDIDAS 10.1.DCA con arreglo en parcelas divididas EJERCICIO Los datos siguientes se refieren al aumento de peso diario en kilogramos, logrado por novillos criollos, en corral, bajo una misma alimentación, pero en diferentes dosis de desparacitadores (ml/100 kg de peso) e implantados con Sinovex y Revalor (Rodríguez 1991). Dosis 10 10 12 12 14 14 Implante Sinovex Revalor Sinovex Revalor Sinovex Revalor I 1.525 1.721 1.724 1.925 1.935 1.616 II 1.532 1.729 1.728 1.923 1.928 1.625 III 1.549 1.732 1.732 1.940 1.926 1.631 IV 1.562 1.744 1.740 1.952 1.941 1.623 El modelo lineal para un diseño completamente al azar con arreglo en parcelas divididas: Yijk = µ + αi + εik + λj + αλij + εijk Donde: Yijk µ αi εik λj αλij εijk = Una observación = Media poblacional = Efecto del i – esimo nivel del factor A (Dosis) = Error experimental de la parcela mayor (Ea) = Efecto del j – esimo nivel del factor B (Implante) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Dosis x Implante) = Error experimental de la parcela menor (Eb) A B Repetición i… j… k… a… b… r… 1… 1… 1… 3 2 4 Las hipótesis a probar serán: Ho: 10 = 12 = 14 (Dosis) Sinovex = Revalor (Implante) 10 – Sinovex = … = 14 – Revalor Ha: a1 ≠ a2 (Insecticidas) b1 ≠ b2 ≠ b3 (Dosis) 10 – Sinovex ≠ … ≠ 14 – Revalor Introduciendo los datos de manera columnar tendremos: Ing. Ramiro Raúl OCHOA TORREZ 103 OPTIONS NODATE NONUMBER; DATA PDDCA; INPUT REPETI DOSIS IMPLA $ PESO; CARDS; 1 10 Sinovex 1.525 1 10 Revalor 1.721 1 12 Sinovex 1.724 1 12 Revalor 1.925 1 14 Sinovex 1.935 1 14 Revalor 1.616 2 10 Sinovex 1.532 2 10 Revalor 1.729 2 12 Sinovex 1.728 2 12 Revalor 1.923 2 14 Sinovex 1.928 2 14 Revalor 1.625 3 10 Sinovex 1.549 3 10 Revalor 1.732 3 12 Sinovex 1.732 3 12 Revalor 1.94 3 14 Sinovex 1.926 3 14 Revalor 1.631 4 10 Sinovex 1.562 4 10 Revalor 1.744 4 12 Sinovex 1.74 4 12 Revalor 1.952 4 14 Sinovex 1.941 4 14 Revalor 1.623 ; PROC ANOVA; CLASS REPETI DOSIS IMPLA; MODEL PESO=DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA; TEST H=DOSIS E=REPETI*DOSIS; RUN; (1) (2) (3) (1) (2) (3) (4) (5) PROC ANOVA; le indica que realice el calculo de análisis de varianza. CLASS REPETI DOSIS IMPLA; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Repetición, Dosis e Implantación. MODEL PESO=DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con arreglo en parcelas divididas (Yijk = µ + αi + εik + λj + αλij + εijk), donde se coloca como: Yijk = µ + αi + εik + λj + αλij + εijk Variable de respuesta = Variables de estudio Peso = Dosis E(a) Implantación Dosis*Implantacion No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. (4) TEST H=DOSIS E=REPETI*DOSIS; este comando se incorpora con la finalidad de ajustar el valor de Fc (Efe calculado) y Probabilidad, para las dosis, considerando que el CME (Cuadrado Medio del Error) para dicho calculo será el CMEa (Cuadrado Medio del Error de A), esto se hace considerando las formulas del ANVA, donde se observa que para el calculo del valor de Fc del factor A (en nuestro ejemplo Dosis), se divide entre el CMEa, este para el análisis en el SAS esta conformado por la combinación de la Repetición*Dosis: 104 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS FV αi A εik Ea λj B αλij AB εijk Eb Total (5) GL a–1 a(r – 1) b–1 (a – 1)(b – 1) a(r – 1)(b – 1) abr – 1 SC CM SCA / GLA SCEa / GLEa SCB / GLB SCAB / GLAB SCE / GLE SCA SCEa SCB SCAB SCE SCT Fc CMA / CME Ft f(GLA, GLEa) CMB /CME CMAB /CME f(GLB, GLEb) f(GLAB, GLEb) Con RUN; le señalamos que las sentencias anteriores son ejecutables. Los resultados que nos proporcionara serán: The SAS System The ANOVA Procedure Class Level Information Class Levels Values REPETI 4 1 2 3 4 DOSIS 3 10 12 14 IMPLA 2 Revalor Sinovex Number of observations 24 The SAS System The ANOVA Procedure Dependent Variable: PESO (1) Source Model Error Corrected Total DF 14 9 23 R-Square 0.999238 (2) (3) Source DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA Sum of Squares 0.51141308 0.00038987 0.51180296 Coeff Var 0.376252 DF 2 9 1 2 Mean Square 0.03652951 0.00004332 Root MSE 0.006582 Anova SS 0.16403258 0.00167487 0.00478838 0.34091725 F Value 843.26 Pr > F <.0001 PESO Mean 1.749292 Mean Square 0.08201629 0.00018610 0.00478838 0.17045862 F Value 1893.29 4.30 110.54 3934.92 Pr > F <.0001 0.0204 <.0001 <.0001 Tests of Hypotheses Using the Anova MS for REPETI*DOSIS as an Error Term Source DF Anova SS Mean Square F Value Pr > F DOSIS 2 0.16403258 0.08201629 440.72 <.0001 Los resultados encontrados deberán ordenarse para poder interpretarlos. Primeramente se considera el punto (3): (3) DOSIS (2) Source DOSIS REPETI*DOSIS 2 0.16403258 0.08201629 440.72 <.0001 DF 2 9 Anova SS 0.16403258 0.00167487 Mean Square 0.08201629 0.00018610 F Value 1893.29 4.30 Pr > F <.0001 0.0204 Los valores correspondientes a DOSIS, deberán ser remplazados en el punto (2), donde se encuentra las demás fuentes de variación: Ing. Ramiro Raúl OCHOA TORREZ 105 IMPLA DOSIS*IMPLA 1 2 0.00478838 0.34091725 0.00478838 0.17045862 110.54 3934.92 <.0001 <.0001 DF 2 9 1 2 Anova SS 0.16403258 0.00167487 0.00478838 0.34091725 Mean Square 0.08201629 0.00018610 0.00478838 0.17045862 F Value 440.72 4.30 110.54 3934.92 Pr > F <.0001 0.0204 <.0001 <.0001 Quedandonos: Source DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA Una vez remplazado este valor, se procede a remplazar todas las fuentes de variación en el punto (1) en remplazo de Model: Source Model Error Corrected Total (1) DF 14 9 23 R-Square 0.999238 Squares 0.51141308 0.00038987 0.51180296 Coeff Var 0.376252 Mean Square 0.03652951 0.00004332 Root MSE 0.006582 F Value 843.26 Pr > F <.0001 PESO Mean 1.749292 Lo que nos dará como resultado final, considerando a la interacción REPETI*DOSIS como el E(a): Source DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA Error Corrected Total DF 2 9 1 2 9 23 R-Square 0.999238 Squares 0.16403258 0.00167487 0.00478838 0.34091725 0.00038987 0.51180296 Coeff Var 0.376252 Mean Square 0.08201629 0.00018610 0.00478838 0.17045862 0.00004332 Root MSE 0.006582 F Value 440.72 4.30 110.54 3934.92 Pr > F <.0001 0.0204 <.0001 <.0001 PESO Mean 1.749292 Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: Source DOSIS E (a) IMPLA DOSIS*IMPLA Error Corrected Total Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) R-Square 0.999238 Sum of DF Squares Mean Square F Value 2 0.16403258 0.08201629 440.72 9 0.00167487 0.00018610 1 0.00478838 0.00478838 110.54 2 0.34091725 0.17045862 3934.92 9 0.00038987 0.00004332 23 0.51180296 Coeff Var Root MSE PESO Mean 0.376252 0.006582 1.749292 Pr > F <.0001** <.0001** <.0001** Conclusión El análisis de varianza, nos presenta que entre los factores Dosis, Implantación y la interacción de Dosis x Implantación, se tienen diferencias altamente significativas en los valores de aumento de peso, teniéndose un promedio general de 1.749292 kilogramos de aumento de peso, con un coeficiente de variación de 0.376253%. 106 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS Como se observo se hace necesario el calculo de las pruebas de medias y el análisis de varianza de efectos simples, el procedimiento es similar al descrito en los ejercicios de experimentos factoriales. 10.2.DBA con arreglo en parcelas divididas Ejercicio Se tiene la producción total de materia seca del pasto estrella africana, en tres frecuencias de corte (Parcela Grande) y tres alturas de corte (Parcela Chica) (Padrón 1996): Frecuencia de corte 20dias 20dias 20dias 40dias 40dias 40dias Altura de corte 0cm 5cm 10cm 0cm 5cm 10cm I 5.69 3.72 3.66 6.48 3.86 11.15 II 5.98 3.20 2.85 7.92 4.54 3.54 III 5.37 3.90 2.60 4.74 4.42 3.91 IV 6.30 4.51 3.83 6.30 5.06 3.66 El modelo lineal para un diseño bloques al azar con arreglo en parcelas divididas es el siguiente: Yijk = µ + βk + αi + εik + λj + αλij + εijk Donde: Yijk µ βk αi εik λj αλij εijk A B Bloques = Una observación = Media poblacional = Efecto del k – esimo bloque = Efecto del i – esimo nivel del factor A (Frecuencia de corte) = Error experimental de la parcela mayor (Ea) = Efecto del j – esimo nivel del factor B (Altura de corte) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Frecuencia de corte x Altura de corte) = Error experimental de la parcela menor (Eb) i… j… k… a… b… r… 1… 1… 1… 2 3 4 Las hipótesis a probar serán: Ho: 20dias = 40dias (Frecuencia de corte) 0cm = 5cm = 10cm (Altura de corte) 20dias – 0cm = … = 40dias – 10cm I = II = III = IV (Bloques) Ho: 20dias ≠ 40dias (Frecuencia de corte) 0cm ≠ 5cm ≠ 10cm (Altura de corte) 20dias – 0cm ≠ … ≠ 40dias – 10cm I ≠ II ≠ III ≠ IV (Bloques) Introduciendo los datos de manera columnar tendremos: Ing. Ramiro Raúl OCHOA TORREZ 107 OPTIONS NODATE NONUMBER; DATA PD_DBA; INPUT BLOQUE $ FREC $ ALTURA $ PROD; CARDS; I 20dias 0cm 5.69 I 20dias 5cm 3.72 I 20dias 10cm 3.66 I 40dias 0cm 6.48 I 40dias 5cm 3.86 I 40dias 10cm 11.15 II 20dias 0cm 5.98 II 20dias 5cm 3.2 II 20dias 10cm 2.85 II 40dias 0cm 7.92 II 40dias 5cm 4.54 II 40dias 10cm 3.54 III 20dias 0cm 5.37 III 20dias 5cm 3.9 III 20dias 10cm 2.6 III 40dias 0cm 4.74 III 40dias 5cm 4.42 III 40dias 10cm 3.91 IV 20dias 0cm 6.3 IV 20dias 5cm 4.51 IV 20dias 10cm 3.83 IV 40dias 0cm 6.3 IV 40dias 5cm 5.06 IV 40dias 10cm 3.66 ; PROC ANOVA; CLASS BLOQUE FREC ALTURA; MODEL PROD=BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA; TEST H=BLOQUE FREC E=BLOQUE*FREC; RUN; (1) (2) (3) (1) (2) (3) (4) (5) PROC ANOVA; le indica que realice el calculo de análisis de varianza. CLASS BLOQUE FREC ALTURA; le señala cuales variables estarán en estudio o de clasificación para nuestro caso las variables son: Bloques, Frecuencia y Altura. MODEL PROD=BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA; este punto esta en directa relación con el modelo lineal de un diseño completamente al azar con arreglo en parcelas divididas (Yijk = µ + βk + αi + εik + λj + αλij + εijk), donde se coloca como: Yijk = µ + βk + αi + εik + λj + αλij + εijk Variable de respuesta = Variables de estudio Producción = Bloque Frecuencia Bloque*Frecuencia Altura Frecuencia*Altura Producción = Bloque Frecuencia E(a) Altura Frecuencia*Altura No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del modelo. (4) TEST H=BLOQUE FREC E=BLOQUE*FREC; este comando se incorpora con la finalidad de ajustar el valor de Fc (Efe calculado) y Probabilidad, para los bloques y la frecuencia de corte, considerando que el CME (Cuadrado Medio del Error) para dicho calculo será el CMEa (Cuadrado Medio del Error de A), esto se hace considerando las formulas del ANVA, donde se observa que para el calculo del valor de Fc de bloques y el 108 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS factor A (Frecuencia de corte), se divide entre el CMEa, este para el análisis en el SAS esta conformado por la combinación de Bloque*Frec: FV βk Bloque αi A εik Ea λj B αλij AB εijk Eb Total (5) GL r–1 a–1 (r – 1)(a – 1) b–1 (a – 1)(b – 1) a(b – 1)(r – 1) abr – 1 SC SCBlo SCA SCEa SCB SCAB SCE SCT CM SCBlo / GLBlo SCA / GLA SCEa / GLEa SCB / GLB SCAB / GLAB SCE / GLE Fc CMBlo / CME CMA / CME Ft f(GLBlo, GLEa) f(GLA, GLEa) CMB /CME CMAB /CME f(GLB, GLEb) f(GLAB, GLEb) Con RUN; le señalamos que las sentencias anteriores son ejecutables. Los resultados que nos proporciona el SAS, al igual que en el anterior ejercicio se deberan organizar como en el anterior ejercicio, considerando las tres partes: The SAS System The ANOVA Procedure Class Level Information Class Levels Values BLOQUE 4 I II III IV FREC 2 20dias 40dias ALTURA 3 0cm 10cm 5cm Number of observations 24 The SAS System The ANOVA Procedure Dependent Variable: PROD (1) Source Model Error Corrected Total DF 11 12 23 R-Square 0.559701 (2) Source BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA Sum of Squares 44.81711250 35.25618333 80.07329583 Coeff Var 35.10328 DF 3 1 3 2 2 Mean Square 4.07428295 2.93801528 Root MSE 1.714064 Anova SS 8.06994583 8.13170417 6.57524583 17.95005833 4.09015833 F Value 1.39 Pr > F 0.2909 PROD Mean 4.882917 Mean Square 2.68998194 8.13170417 2.19174861 8.97502917 2.04507917 F Value 0.92 2.77 0.75 3.05 0.70 Pr > F 0.4626 0.1221 0.5452 0.0847 0.5176 Tests of Hypotheses Using the Anova MS for BLOQUE*FREC as an Error Term (3) Source BLOQUE FREC DF 3 1 Anova SS 8.06994583 8.13170417 Mean Square 2.68998194 8.13170417 F Value 1.23 3.71 Pr > F 0.4351 0.1497 Para la ordenación se considera primeramente el punto (3), donde sus valores serán remplazados en las fuentes de variación correspondientes en el punto (2): Source Ing. Ramiro Raúl OCHOA TORREZ DF Anova SS Mean Square F Value Pr > F 109 (3) BLOQUE FREC Source BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA (2) 3 1 8.06994583 8.13170417 2.68998194 8.13170417 1.23 3.71 0.4351 0.1497 DF 3 1 3 2 2 Anova SS 8.06994583 8.13170417 6.57524583 17.95005833 4.09015833 Mean Square 2.68998194 8.13170417 2.19174861 8.97502917 2.04507917 F Value 0.92 2.77 0.75 3.05 0.70 Pr > F 0.4626 0.1221 0.5452 0.0847 0.5176 Una vez remplazados el siguiente paso será remplazar estos en el punto (1) en el sitio que corresponde a Model: (1) Source BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA DF 3 1 3 2 2 Anova SS 8.06994583 8.13170417 6.57524583 17.95005833 4.09015833 Mean Square 2.68998194 8.13170417 2.19174861 8.97502917 2.04507917 F Value 1.23 3.71 0.75 3.05 0.70 Pr > F 0.4351 0.1497 0.5452 0.0847 0.5176 Source Model Error Corrected Total DF 11 12 23 Sum of Squares 44.81711250 35.25618333 80.07329583 Mean Square 4.07428295 2.93801528 F Value 1.39 Pr > F 0.2909 R-Square 0.559701 Lo que nos dará como resultado: Source BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA Error Corrected Total R-Square 0.559701 Coeff Var 35.10328 Root MSE 1.714064 PROD Mean 4.882917 Sum of DF Squares Mean Square F Value 3 8.06994583 2.68998194 1.23 1 8.13170417 8.13170417 3.71 3 6.57524583 2.19174861 0.75 2 17.95005833 8.97502917 3.05 2 4.09015833 2.04507917 0.70 12 35.25618333 2.93801528 23 80.07329583 Coeff Var Root MSE PROD Mean 35.10328 1.714064 4.882917 Pr > F 0.4351 0.1497 0.5452 0.0847 0.5176 Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las conclusiones, corrigiendo el valor de BLOQUE*ALTURA el cual corresponde a E(a) • • • Si el valor de: Si el valor de: Si el valor de: Source BLOQUE FREC E (a) ALTURA FREC*ALTURA Error Corrected Total 110 Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) DF 3 1 3 2 2 12 23 Sum of Squares 8.06994583 8.13170417 6.57524583 17.95005833 4.09015833 35.25618333 80.07329583 Mean Square 2.68998194 8.13170417 2.19174861 8.97502917 2.04507917 2.93801528 F Value 1.23 3.71 Pr > F 0.4351ns 0.1497ns 3.05 0.70 0.0847ns 0.5176ns Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS R-Square 0.559701 Coeff Var 35.10328 Root MSE 1.714064 PROD Mean 4.882917 Conclusión El análisis de varianza, nos presenta que entre las diferentes fuentes de variación (Bloques, Frecuencia de riego, Altura de corte y la interacción de Frecuencia x Altura de corte), no presentan diferencias significativas, el promedio de producción de materia seca es de 4.882917 y un coeficiente de variación de 35.10328%. En este ejercicio no es necesario realizar las pruebas de medias y el análisis de varianza de efectos simples, por tenerse en la totalidad de fuentes de variación no significancia, pero si se puede realizar la presentación de promedios y desvió estándar de cada fuente de variación (procedimiento ya indicado anteriormente). 10.3.DCL con arreglo en parcelas divididas Ejercicio En Apodaca N.L. se estudiaron cinco variedades de maíz, cada una sembrada a tres densidades de siembra (Reyes 1999). Parcelas Grandes Variedades (A) 1= N.L. H – 1 2= N.L. H – 2 3= N.L. H – 3 4= Sintético precoz 5= Sintético precoz selección por cuarteo Parcelas Chicas Densidades (B) a= 55000 pl/ha b= 65000 pl/ha c= 75000 pl/ha En el siguiente cuadro se muestran los siguientes datos: Número de variedad de maíz: Densidad de siembra: Producción de cada parcela 1, 2, 3, 4 y 5 a, b y c Experimento con arreglo en parcelas divididas y distribución en cuadrado latino 5 x 5, posición en el campo de variedades de maíz, densidad de siembra, producción de grano de las parcelas grandes y producción de grano seco por parcela útil en t/ha Bloques V IV III II b 5.0 1 5 c 4.9 a 4.9 b 5.5 3 a 4.9 c 5.8 1 b 5.9 c 5.5 Columnas 3 4 b a c 5.5 4.7 4.8 5 a 4.8 c 4.9 c 6.1 2 b 5.7 3 b 5.3 a 5.3 b 5.0 5 c 5.9 a 6.1 2 2 b 5.1 c 5.4 b 4.7 a 7.0 c 5.5 4 Ing. Ramiro Raúl OCHOA TORREZ 1 3 a 6.0 4 1 b 5.1 c 6.2 a 5.9 c 5.2 4 b 4.9 a 5.0 b 5.9 2 c 5.9 5 a 6.5 5 3 b 6.5 c 5.7 a 4.3 b 6.0 1 c 6.2 a 6.8 a 6.2 a 5.1 4 c 6.1 b 5.6 2 111 I b 4.9 a 5.4 c 5.5 a 6.5 b 6.3 c 5.6 b 6.1 a 5.8 c 5.0 a 5.2 b 4.1 c 5.2 c 5.6 a 5.7 b 5.6 b 5.6 2 a 6.1 c 6.8 b 5.3 4 c 5.3 a 5.4 a 5.6 1 c 5.9 b 5.9 c 4.8 3 a 6.2 b 5.2 b 5.0 5 c 5.4 a 6.0 El modelo lineal para un diseño cuadrado latino con arreglo en parcelas divididas es el siguiente: Yijkl = µ + βk + θl+ αi + εikl + λj + αλij + εijkl Donde: Yijkl µ βk θl αi εikl λj αλij εijkl = Una observación = Media poblacional = Efecto del k – esimo bloque = Efecto de la l – esima columna = Efecto del i – esimo nivel del factor A (Variedades) = Error experimental de la parcela mayor (Ea) = Efecto del j – esimo nivel del factor B (Densidades) = Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Variedades x Densidades) = Error experimental de la parcela menor (Eb) A B Bloques Columnas i… j… k… l… a… b… r… r… 1… 1… 1… 1… 5 3 5 5 Las hipótesis a probar serán: Ho: Ho: 1=2=3=4=5 a=b=c 1a = 1b = … = 5c I = II = III = IV = V 1=2=3=4=5 1≠2≠3≠4≠5 a≠b≠c 1a ≠ 1b ≠ … ≠ 5c I ≠ II ≠ III ≠ IV ≠ V 1≠2≠3≠4≠5 (Variedades) (Densidades de siembra) (Bloques) (Columnas) (Variedades) (Densidades de siembra) (Bloques) (Columnas) Introduciendo los datos de manera columnar tendremos: 112 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS OPTIONS NODATE NONUMBER; DATA PD_DCL; INPUT BLOQUE $ COL VAR DENSI $ PROD; CARDS; I 1 5 b 5 I 1 5 c 4.9 I 1 5 a 4.9 I 2 2 a 6.1 I 2 2 b 5.1 I 2 2 c 5.5 I 3 4 b 5.5 I 3 4 a 4.7 I 3 4 c 4.8 . . . . . . . . . . . . . . . V 3 1 a 5.6 V 3 1 c 5.9 V 3 1 b 5.9 V 4 3 c 4.8 V 4 3 a 6.2 V 4 3 b 5.2 V 5 5 b 5 V 5 5 c 5.4 V 5 5 a 6 ; PROC ANOVA; CLASS BLOQUE COL VAR DENSI; MODEL PROD=BLOQUE COL VAR BLOQUE*COL*VAR DENSI VAR*DENSI; TEST H=BLOQUE COL VAR E=BLOQUE*COL*VAR; RUN; Al igual que en el anterior caso se debe ajustar los valores de bloques, columna y del factor A (Variedades), considerando para que para estos su CME, estará dado por la interacción de BLOQUE*COL*VAR que viene a ser el E(a) Error de la parcela mayor en las fuentes de variación. Ing. Ramiro Raúl OCHOA TORREZ 113 The SAS System The ANOVA Procedure Class Level Information Class Levels Values BLOQUE 5 I II III IV V COL 5 1 2 3 4 5 VAR 5 1 2 3 4 5 DENSI 3 a b c Number of observations 75 The SAS System The ANOVA Procedure Dependent Variable: PROD Source Model Error Corrected Total (1) DF 34 40 74 R-Square 0.752579 Source BLOQUE COL VAR BLOQUE*COL*VAR DENSI VAR*DENSI (2) Sum of Squares 19.31680000 6.35066667 25.66746667 Coeff Var 7.178513 DF 4 4 4 12 2 8 Mean Square 0.56814118 0.15876667 Root MSE 0.398455 Anova SS 0.77013333 2.11946667 10.53546667 2.69573333 0.66106667 2.53493333 F Value 3.58 Pr > F <.0001 PROD Mean 5.550667 Mean Square 0.19253333 0.52986667 2.63386667 0.22464444 0.33053333 0.31686667 F Value 1.21 3.34 16.59 1.41 2.08 2.00 Pr > F 0.3206 0.0189 <.0001 0.1995 0.1380 0.0720 Tests of Hypotheses Using the Anova MS for BLOQUE*COL*VAR as an Error Term Source BLOQUE COL VAR (3) DF 4 4 4 Anova SS 0.77013333 2.11946667 10.53546667 Mean Square 0.19253333 0.52986667 2.63386667 F Value 0.86 2.36 11.72 Pr > F 0.5166 0.1121 0.0004 Organizando los resultados, remplazamos los valores de Bloque, Columna y Variedades del punto (3), en el punto (2), ya que los primeros consideran como CME a la interacción BLOQUE*COL*VAR. (3) (2) Source BLOQUE COL VAR DF 4 4 4 Anova SS 0.77013333 2.11946667 10.53546667 Mean Square 0.19253333 0.52986667 2.63386667 F Value 0.86 2.36 11.72 Pr > F 0.5166 0.1121 0.0004 Source BLOQUE COL VAR BLOQUE*COL*VAR DENSI VAR*DENSI DF 4 4 4 12 2 8 Anova SS 0.77013333 2.11946667 10.53546667 2.69573333 0.66106667 2.53493333 Mean Square 0.19253333 0.52986667 2.63386667 0.22464444 0.33053333 0.31686667 F Value 1.21 3.34 16.59 1.41 2.08 2.00 Pr > F 0.3206 0.0189 <.0001 0.1995 0.1380 0.0720 Una vez remplazado, los valores tenemos: 114 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS DIVIDIDAS Source BLOQUE COL VAR BLOQUE*COL*VAR DENSI VAR*DENSI DF 4 4 4 12 2 8 Anova SS 0.77013333 2.11946667 10.53546667 2.69573333 0.66106667 2.53493333 Mean Square 0.19253333 0.52986667 2.63386667 0.22464444 0.33053333 0.31686667 F Value 0.86 2.36 11.72 1.41 2.08 2.00 Pr > F 0.5166 0.1121 0.0004 0.1995 0.1380 0.0720 F Value 3.58 Pr > F <.0001 Todos estos valores se remplazan en el punto (1) que corresponde a Model: Source Model Error Corrected Total (1) DF 34 40 74 Sum of Squares 19.31680000 6.35066667 25.66746667 Mean Square 0.56814118 0.15876667 Teniéndose al final todo el ANVA de un Diseño Cuadrado Latino con arreglo en parcelas divididas: Source BLOQUE COL VAR BLOQUE*COL*VAR DENSI VAR*DENSI Error Corrected Total DF 4 4 4 12 2 8 40 74 Squares 0.77013333 2.11946667 10.53546667 2.69573333 0.66106667 2.53493333 6.35066667 25.66746667 Mean Square 0.19253333 0.52986667 2.63386667 0.22464444 0.33053333 0.31686667 0.15876667 F Value 0.86 2.36 11.72 1.41 2.08 2.00 Pr > F 0.5166 0.1121 0.0004 0.1995 0.1380 0.0720 El siguiente paso será remplazar el término BLOQUE*COL*VAR, como el E (a), y sacar las respectivas conclusiones mediante la regla de decisión: • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQUE COL VAR E (a) DENSI VAR*DENSI Error Corrected Total DF 4 4 4 12 2 8 40 74 R-Square 0.752579 Sum of Squares 0.77013333 2.11946667 10.53546667 2.69573333 0.66106667 2.53493333 6.35066667 25.66746667 Coeff Var 7.178513 Mean Square 0.19253333 0.52986667 2.63386667 0.22464444 0.33053333 0.31686667 0.15876667 Root MSE 0.398455 F Value 0.86 2.36 11.72 Pr > F 0.5166ns 0.1121ns 0.0004** 2.08 2.00 0.1380ns 0.0720ns PROD Mean 5.550667 Conclusión El análisis de varianza no presenta diferencias significativas entre Bloques y Columna, en tanto que entre Variedades se tienen diferencias altamente significativas en los valores de producción por t/ha, pero no se tienen diferencias en el factor Densidades de siembra no se tienen diferencias estadísticas, como así también en la interacción de Variedades x Densidades. Por otra parte se tiene un coeficiente de variación de 7.178513% y un promedio general de producción de 5.550667 t/ha. Ing. Ramiro Raúl OCHOA TORREZ 115 Se puede observar que en este ejercicio solo se tiene significancia entre variedades, y no así en las otras fuentes de variación por lo que no será necesario realizar el análisis de varianza de efectos simples. 116 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS SUBDIVIDIDAS 11. PARCELAS SUBDIVIDIDAS 11.1.DBA con arreglo en parcelas subdivididas Ejercicio En la estación experimental INIAA, se ensayo el desarrollo de tecnología en oca, para esto se experimento en parcelas subdivididas con tres bloques, evaluándose el factor A (parcela principal) con dos niveles: con estiércol y sin estiércol, el factor B (sub parcela) con niveles de: tubérculo semilla con brote y semilla sin brotes y el factor C (sub sub parcela) con niveles de: 1, 2 y 3 tubérculos/golpe. Los rendimientos fueron obtenidos en una parcela de 12.8 m2 con 4 surcos/parcela. La información se presenta a continuación (Ibáñez 1998). a0 = Con estiércol 2 t/ha b0 = Tubérculo semilla con brotes c0 = 1 tubérculo/golpe (15 g) a1 = Sin estiércol b1 = Tubérculo semilla sin brote c1 = 2 tubérculo/golpe (10 g) c2 = 3 tubérculo/golpe (8 g) Bloques I II II c0 10 9 8 b0 c1 5 14 7 a0 c2 14 6 10 b1 c1 18 5 15 c0 15 7 13 c2 9 11 18 c0 7 6 7 b0 c1 6 19 12 a1 c2 6 13 12 c0 3 9 4 b1 c1 13 5 5 c2 12 10 4 El modelo lineal para un diseño bloques al azar con arreglo en parcelas subdivididas esta dado por: Yijkl = µ + βl + αi + εil + δj + αδij + εijl + λk + αλik + δλjk + αδλijk + εijkl Donde: Yijkl µ βl αi εil δj αδij εijl λk αλik δλjk αδλijk εijkl = Una observación = Media poblacional = Efecto del l – ésimo bloque = Efecto del i – ésimo nivel del factor A = Error experimental de la parcela mayor (Ea) = Efecto del j – ésimo nivel del factor B = Efecto del i – ésimo nivel del factor A, con el j – ésimo nivel del factor B (interacción A x B) = Error experimental de la parcela mediana (Eb) = Efecto del k – ésimo nivel del factor C (Potasio) = Efecto del i – ésimo nivel del factor A, con el k – ésimo nivel del factor (interacción A x C) = Efecto del j – ésimo nivel del factor B, con el k – ésimo nivel del factor C (interacción B x C) = Efecto del i – ésimo nivel del factor A, con el j – ésimo nivel del factor B y el k – ésimo nivel del factor C (interacción A x B x C) = Error experimental de la parcela pequeña (Ec) A B C Bloque i... j... k... k... a... b... c... r... 1... 1... 1... 1... 2 2 3 3 Las hipótesis a probar serán: Ho: a0 = a1 b0 = b1 Ing. Ramiro Raúl OCHOA TORREZ (A) (B) 117 Ha: c0 = c1 =c 2 I = II = III (C) (Bloques) a0 ≠ a1 b0 ≠ b1 c0 ≠ c1 =c 2 I ≠ II ≠ III (A) (B) (C) (Bloques) Introduciendo los datos de manera columnar tendremos: OPTIONS NODATE NONUMBER; DATA PSD_DBA; INPUT BLOQUE $ A $ B $ CARDS; I a0 b0 c0 I a0 b0 c1 I a0 b0 c2 I a0 b1 c0 I a0 b1 c1 I a0 b1 c2 I a1 b0 c0 I a1 b0 c1 I a1 b0 c2 I a1 b1 c0 I a1 b1 c1 I a1 b1 c2 . . . . . . . . . . . . III a0 b0 c0 III a0 b0 c1 III a0 b0 c2 III a0 b1 c0 III a0 b1 c1 III a0 b1 c2 III a1 b0 c0 III a1 b0 c1 III a1 b0 c2 III a1 b1 c0 III a1 b1 c1 III a1 b1 c2 ; PROC ANOVA; CLASS BLOQUE A B C; MODEL REND=BLOQUE A BLOQUE*A TEST H=BLOQUE A E=BLOQUE*A; TEST H=B A*B E=BLOQUE*A*B; RUN; C $ REND; 10 5 14 15 18 9 7 6 6 3 13 12 . . . 8 7 10 13 15 18 7 12 12 4 5 4 B A*B BLOQUE*A*B C A*C B*C A*B*C; Al igual que en las parcelas divididas, se deben ajustar los valores de las parcelas grandes y subparcelas, en el primer caso los bloques y el factor A se considera como CME (a) a la interacción BLOQUE*A; y para el factor B y la interacción A*B los CME (b) será la interacción BLOQUE*A*B. Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados: 118 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS SUBDIVIDIDAS The SAS System The ANOVA Procedure Class Level Information Class Levels Values BLOQUE 3 I II III A 2 a0 a1 B 2 b0 b1 C 3 c0 c1 c2 Number of observations 36 The SAS System The ANOVA Procedure Dependent Variable: REND (1) Source Model Error Corrected Total DF 19 16 35 R-Square 0.607727 (2) Source BLOQUE A BLOQUE*A B A*B BLOQUE*A*B C A*C B*C A*B*C Sum of Squares 397.6388889 256.6666667 654.3055556 Coeff Var 41.55256 DF 2 1 2 1 1 4 2 2 2 2 Mean Square 20.9283626 16.0416667 Root MSE 4.005205 Anova SS 0.7222222 46.6944444 70.3888889 0.6944444 72.2500000 134.8888889 39.0555556 21.0555556 1.7222222 10.1666667 F Value 1.30 Pr > F 0.2982 F Value 0.02 2.91 2.19 0.04 4.50 2.10 1.22 0.66 0.05 0.32 Pr > F 0.9778 0.1073 0.1439 0.8378 0.0498 0.1280 0.3220 0.5322 0.9479 0.7329 REND Mean 9.638889 Mean Square 0.3611111 46.6944444 35.1944444 0.6944444 72.2500000 33.7222222 19.5277778 10.5277778 0.8611111 5.0833333 Tests of Hypotheses Using the Anova MS for BLOQUE*A as an Error Term (3) Source BLOQUE A DF 2 1 Anova SS 0.72222222 46.69444444 Mean Square 0.36111111 46.69444444 F Value 0.01 1.33 Pr > F 0.9898 0.3685 Tests of Hypotheses Using the Anova MS for BLOQUE*A*B as an Error Term (4) Source B A*B DF 1 1 Anova SS 0.69444444 72.25000000 Mean Square 0.69444444 72.25000000 F Value 0.02 2.14 Pr > F 0.8928 0.2171 Remplazando los valores de los puntos (4) correspondientes al factor B y la interacción A*B y (3) correspondientes a BLOQUE y el factor A en el punto (2) tenemos, en los valores que corresponde a Bloque y el factor A; y los valores del factor B y la interacción A*B: (3) Tests of Hypotheses Using the Anova MS for BLOQUE*A*B as an Error Term Source DF Anova SS Mean Square F Value Pr > F BLOQUE 2 0.72222222 0.36111111 0.01 0.9898 A 1 46.69444444 46.69444444 1.33 0.3685 Tests of Hypotheses Using the Anova MS for BLOQUE*A*B as an Error Term Ing. Ramiro Raúl OCHOA TORREZ 119 (4) (2) Source B A*B DF 1 1 Anova SS 0.69444444 72.25000000 Mean Square 0.69444444 72.25000000 F Value 0.02 2.14 Pr > F 0.8928 0.2171 Source BLOQUE A BLOQUE*A B A*B BLOQUE*A*B C A*C B*C A*B*C DF 2 1 2 1 1 4 2 2 2 2 Anova SS 0.7222222 46.6944444 70.3888889 0.6944444 72.2500000 134.8888889 39.0555556 21.0555556 1.7222222 10.1666667 Mean Square 0.3611111 46.6944444 35.1944444 0.6944444 72.2500000 33.7222222 19.5277778 10.5277778 0.8611111 5.0833333 F Value 0.02 2.91 2.19 0.04 4.50 2.10 1.22 0.66 0.05 0.32 Pr > F 0.9778 0.1073 0.1439 0.8378 0.0498 0.1280 0.3220 0.5322 0.9479 0.7329 Quedandonos todas las fuentes de variación, estas se remplazaran en el punto (1) en reemplazo de los valores que corresponden a Model: (1) Source BLOQUE A BLOQUE*A B A*B BLOQUE*A*B C A*C B*C A*B*C DF 2 1 2 1 1 4 2 2 2 2 Anova SS 0.72222222 46.69444444 70.3888889 0.69444444 72.25000000 134.8888889 39.0555556 21.0555556 1.7222222 10.1666667 Mean Square 0.36111111 46.69444444 35.1944444 0.69444444 72.25000000 33.7222222 19.5277778 10.5277778 0.8611111 5.0833333 F Value 0.01 1.33 2.19 0.02 2.14 2.10 1.22 0.66 0.05 0.32 Pr > F 0.9898 0.3685 0.1439 0.8928 0.2171 0.1280 0.3220 0.5322 0.9479 0.7329 Source Model Error Corrected Total DF 19 16 35 Sum of Squares 397.6388889 256.6666667 654.3055556 Mean Square 20.9283626 16.0416667 F Value 1.30 Pr > F 0.2982 F Value 0.01 1.33 2.19 0.02 2.14 2.10 1.22 0.66 0.05 0.32 Pr > F 0.9898 0.3685 0.1439 0.8928 0.2171 0.1280 0.3220 0.5322 0.9479 0.7329 R-Square 0.607727 Coeff Var 41.55256 Root MSE 4.005205 REND Mean 9.638889 Una vez remplazado todos los valores nos queda el análisis de varianza completo: Source BLOQUE A BLOQUE*A B A*B BLOQUE*A*B C A*C B*C A*B*C Error Corrected Total DF 2 1 2 1 1 4 2 2 2 2 16 35 R-Square 0.607727 120 Sum of Squares 0.72222222 46.69444444 70.3888889 0.69444444 72.25000000 134.8888889 39.0555556 21.0555556 1.7222222 10.1666667 256.6666667 654.3055556 Coeff Var 41.55256 Mean Square 0.36111111 46.69444444 35.1944444 0.69444444 72.25000000 33.7222222 19.5277778 10.5277778 0.8611111 5.0833333 16.0416667 Root MSE 4.005205 REND Mean 9.638889 Ing. Ramiro Raúl OCHOA TORREZ PARCELAS SUBDIVIDIDAS Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las conclusiones, corrigiendo el valor de BLOQUE*ALTURA el cual corresponde a E(a), y la interacción de BLOQUE*A*B corresponde E (b): • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQUE A E (a) B A*B E (b) C A*C B*C A*B*C Error Corrected Total DF 2 1 2 1 1 4 2 2 2 2 16 35 R-Square 0.607727 Sum of Squares 0.72222222 46.69444444 70.3888889 0.69444444 72.25000000 134.8888889 39.0555556 21.0555556 1.7222222 10.1666667 256.6666667 654.3055556 Coeff Var 41.55256 Mean Square 0.36111111 46.69444444 35.1944444 0.69444444 72.25000000 33.7222222 19.5277778 10.5277778 0.8611111 5.0833333 16.0416667 Root MSE 4.005205 F Value 0.01 1.33 Pr > F 0.9898ns 0.3685ns 0.02 2.14 0.8928ns 0.2171ns 1.22 0.66 0.05 0.32 0.3220ns 0.5322ns 0.9479ns 0.7329ns REND Mean 9.638889 Conclusión El análisis de varianza no presenta en las diferentes fuentes de variación no presenta diferencias estadísticas, tanto en el factor A y Bloques (Parcela Grande); así también el factor B y la interacción A*B no se presentan diferencias significativas (Sub Parcela); así también el factor C, las interacciones simples A*C y B*C, así también en la interacción triple A*B*C. el valor de rendimiento promedio encontrado en todo el experimento fue de 9.638889, teniéndose por otra parte un coeficiente de variación de 41.55256%. Se puede observar que en este ejercicio no se tienen significancias en ninguna de las fuentes de variación del análisis de varianza, por lo que no es necesario realizar pruebas de medias, pero si se pueden analizar los valores promedios de cada factor, como así también de las interacciones, revisando y analizando las variaciones numéricas de cada uno de estos. Ing. Ramiro Raúl OCHOA TORREZ 121 12. ARREGLO EN FRANJAS 12.1.Arreglo en franjas Ejercicio Los siguientes datos son de producciones de remolacha azucarera (t/acre) organizadas por tratamientos en un DBA con arreglo en franjas (Little & Hills, 1991) Libras de N/acre 0 0 0 0 120 120 120 120 Abono vegetal Barbecho Cebada Vicia Cebada+Vicia Barbecho Cebada Vicia Cebada+Vicia I 13.8 15.5 21.0 18.9 19.3 22.2 25.3 25.9 II 13.5 15.0 22.7 18.3 18.0 24.2 24.8 26.7 III 13.2 15.2 22.3 19.6 20.5 25.4 28.4 27.6 El modelo lineal aditivo para un diseño bloques al azar con arreglo en franjas esta dado por: Yijk = µ + βk + αi + εik + λj + εjk + αλij + εijk Donde: Yijk µ βk αi εik λj εjk αλij εijk = Una observación = Media poblacional = Efecto del k – ésimo bloque = Efecto del i – ésimo nivel del factor A = Error experimental de la parcela mayor del factor A (Ea) = Efecto del j – ésimo nivel del factor B = Error experimental de la parcela mayor del factor B (Eb) = Efecto del i – ésimo nivel del factor A, con el j – ésimo nivel del factor B (interacción A x B) = Error experimental de la parcela menor (Ec) A B Bloque i… j… k… a… b… r… 1… 1… 1… 2 4 3 Las hipótesis a probar serán: Ho: 0 = 120 Barbecho = Cebada = Vicia = Cebada+Vicia I = II = III (Libras de N/acre) (Abono Vegetal) (Bloques) Ho: 0 ≠ 120 Barbecho ≠ Cebada ≠ Vicia ≠ Cebada+Vicia I ≠ II ≠ III (Libras de N/acre) (Abono Vegetal) (Bloques) Introduciendo los datos de manera columnar tendremos: 122 Ing. Ramiro Raúl OCHOA TORREZ ARREGLO EN FRANJAS OPTIONS NODATE NONUMBER; DATA FRANJAS; INPUT BLOQUE LIBRAS ABONO $ PROD; CARDS; 1 0 BARBEC 13.8 1 0 CEBADA 15.5 1 0 CICIA 21 1 0 CEB_VIC 18.9 1 120 BARBEC 19.3 1 120 CEBADA 22.2 1 120 CICIA 25.3 1 120 CEB_VIC 25.9 2 0 BARBEC 13.5 2 0 CEBADA 15 2 0 CICIA 22.7 2 0 CEB_VIC 18.3 2 120 BARBEC 18 2 120 CEBADA 24.2 2 120 CICIA 24.8 2 120 CEB_VIC 26.7 3 0 BARBEC 13.2 3 0 CEBADA 15.2 3 0 CICIA 22.3 3 0 CEB_VIC 19.6 3 120 BARBEC 20.5 3 120 CEBADA 25.4 3 120 CICIA 28.4 3 120 CEB_VIC 27.6 ; PROC GLM; CLASS BLOQUE LIBRAS ABONO; MODEL PROD=BLOQUE LIBRAS BLOQUE*LIBRAS ABONO BLOQUE*ABONO LIBRAS*ABONO/SS3; TEST H=BLOQUE LIBRAS E=BLOQUE*LIBRAS; TEST H=ABONO E=BLOQUE*ABONO; RUN; Al igual que en las parcelas divididas o las parcelas subdivididas, se debe ajustar los valores de los dos factores donde los dos están ubicados en parcelas grandes, por lo que ambos tendrán sus respectivos errores E(a) y E(b). Para el factor A (Libras) y bloques su valor de CMEa estará conformado por la interacción BLOQUE*LIBRAS: TEST H=BLOQUE LIBRAS E=BLOQUE*LIBRAS; Para el factor B (Abono), su valor de CMEb estará conformado por la interacción BLOQUE*ABONO: TEST H=ABONO E=BLOQUE*ABONO; Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados: Ing. Ramiro Raúl OCHOA TORREZ 123 Class BLOQUE LIBRAS ABONO The SAS System The ANOVA Procedure Class Level Information Levels Values 3 1 2 3 2 0 120 4 BARBEC CEBADA CEB_VIC CICIA Number of observations 24 The SAS System The ANOVA Procedure Dependent Variable: PROD (1) Source Model Error Corrected Total DF 17 6 23 R-Square 0.990776 (2) Source BLOQUE LIBRAS BLOQUE*LIBRAS ABONO BLOQUE*ABONO LIBRAS*ABONO Sum of Squares 511.3587500 4.7608333 516.1195833 Coeff Var 4.298913 DF 2 1 2 3 6 3 Mean Square 30.0799265 0.7934722 Root MSE 0.890771 Anova SS 7.8658333 262.0204167 5.0358333 215.2612500 2.4775000 18.6979167 F Value 37.91 Pr > F 0.0001 F Value 4.96 330.22 3.17 90.43 0.52 7.85 Pr > F 0.0536 <.0001 0.1148 <.0001 0.7767 0.0168 PROD Mean 20.72083 Mean Square 3.9329167 262.0204167 2.5179167 71.7537500 0.4129167 6.2326389 Tests of Hypotheses Using the Anova MS for BLOQUE*LIBRAS as an Error Term (3) (4) Source BLOQUE LIBRAS DF 2 1 Anova SS 7.8658333 262.0204167 Mean Square 3.9329167 262.0204167 F Value 1.56 104.06 Pr > F 0.3903 0.0095 Tests of Hypotheses Using the Anova MS for BLOQUE*ABONO as an Error Term Source DF Anova SS Mean Square F Value Pr > F ABONO 3 215.2612500 71.7537500 173.77 <.0001 Remplazando los valores de los puntos (4) correspondiente a ABONO y (3) correspondientes a BLOQUES Y LIBRAS en los respectivos lugares de las variables de respuesta ya mencionados, tenemos: Source BLOQUE LIBRAS BLOQUE*LIBRAS ABONO BLOQUE*ABONO LIBRAS*ABONO DF 2 1 2 3 6 3 Anova SS 7.8658333 262.0204167 5.0358333 215.2612500 2.4775000 18.6979167 Mean Square 3.9329167 262.0204167 2.5179167 71.7537500 0.4129167 6.2326389 F Value 1.56 104.06 3.17 173.77 0.52 7.85 Pr > F 0.3903 0.0095 0.1148 <.0001 0.7767 0.0168 Una vez remplazados estos se remplazan el punto (1) todas las fuentes de variación en reemplazo de Model, lo que nos dará: Source BLOQUE 124 DF 2 Sum of Squares 7.8658333 Mean Square 3.9329167 F Value 1.56 Pr > F 0.3903 Ing. Ramiro Raúl OCHOA TORREZ ARREGLO EN FRANJAS LIBRAS BLOQUE*LIBRAS ABONO BLOQUE*ABONO LIBRAS*ABONO Error Corrected Total 1 2 3 6 3 6 23 R-Square 0.990776 262.0204167 5.0358333 215.2612500 2.4775000 18.6979167 4.7608333 516.1195833 Coeff Var 4.298913 262.0204167 2.5179167 71.7537500 0.4129167 6.2326389 0.7934722 Root MSE 0.890771 104.06 3.17 173.77 0.52 7.85 0.0095 0.1148 <.0001 0.7767 0.0168 PROD Mean 20.72083 Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las conclusiones, corrigiendo el valor de BLOQUE*LIBRAS el cual corresponde a E(a), y la interacción de BLOQUE*ABONO corresponde E (b): • • • Si el valor de: Si el valor de: Si el valor de: Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Source BLOQUE LIBRAS E (a) ABONO E (B) LIBRAS*ABONO Error Corrected Total DF 2 1 2 3 6 3 6 23 R-Square 0.990776 Sum of Squares 7.8658333 262.0204167 5.0358333 215.2612500 2.4775000 18.6979167 4.7608333 516.1195833 Coeff Var 4.298913 Mean Square 3.9329167 262.0204167 2.5179167 71.7537500 0.4129167 6.2326389 0.7934722 Root MSE 0.890771 F Value 1.56 104.06 Pr > F 0.3903ns 0.0095** 173.77 <.0001** 7.85 0.0168* PROD Mean 20.72083 Conclusión El análisis de varianza presenta diferencias altamente significativas (α = 0.01) en los dos factores de estudio para la variable producción de remolacha (t/acre), en tanto que solo es significativa (α = 0.05) para la interacción de Libras x Abono. Teniéndose un coeficiente de variación de 4.298913% y un promedio general de 20.72083 t/ha de producción. En este ejercicio será necesario realizar la prueba de medias (Duncan, Tukey, etc.) mediante la adición de los respectivos comandos y el análisis de varianza de efectos simples para completar el análisis y la posterior interpretación. Ing. Ramiro Raúl OCHOA TORREZ 125 13. DISEÑOS JERÁRQUICOS O ANIDADOS 13.1.Jerarquicos o anidados Ejercicio En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta Kochia scorparia, bajo dos condiciones de cultivo en cuatro alturas de corte (Rodríguez 1991). Como en el presente se tienen que analizar los bloques anidados en las localidades el mismo ejercicio tenemos: Factor A Factor B Factor C Localidades Tratamientos Bloques Cruzado A Cruzado B Anidado C(A) El modelo lineal para esta relación estará dado por: Yijk = µ + αi + β(α)k(i) + τ j + ατ (ij)+ ε k(ij) Donde: Yijk µ αi β(α)k(i) τj ατ (ij) εk(ij) = Una observación = Media poblacional = Efecto de la i – esima condición (factor A) = Efecto del k – esimo bloque anidado en la i – esima condición (B(A)) = Efecto de la j – esima altura de corte (factor B) = Efecto de la i – esima condición, con la j – esima altura de corte (interacción A x B) = Error experimental Condición Invierno Verano A B Bloque Altura de corte (cm) 25 50 75 100 25 50 75 100 i… j… k… a… b… r… I II III IV 14.9 17.5 20.7 22.5 16.8 19.9 23.5 25.8 14.3 16.9 19.6 21.9 17.3 20.3 23.2 26.4 15 17.2 21.4 22.6 16.4 21.4 23 25.9 14.3 16.4 20.3 21.8 17.1 20.8 24.1 27.1 1… 1… 1… Las hipótesis a probar serán: Ho: Invierno = Verano 25 = 50 = 75 = 100 Invierno – 25 = … = Verano – 100 Bloque (Invierno) =…= Bloque (Verano) Ho: Invierno ≠ Verano 25 ≠ 50 ≠ 75 ≠ 100 Invierno – 25 ≠ … ≠ Verano – 100 126 2 4 4 (Condicion) (Altura de corte) (Interacción Condicion x Altura de corte) (Bloque anidado en Condicion) (Condicion) (Altura de corte) (Interacción Condicion x Altura de corte) Ing. Ramiro Raúl OCHOA TORREZ DISEÑOS JERARQUICOS O ANIDADOS Bloque (Invierno) ≠…≠ Bloque (Verano) (Bloque anidado en Condicion) Introduciendo los datos de manera columnar tendremos: OPTIONS NODATE NONUMBER; DATA ANIDADO; INPUT BLOQUE $ CONDI $ ALT_COR CON_FIB; CARDS; I INVIER 25 14.9 I INVIER 50 17.5 I INVIER 75 20.7 I INVIER 100 22.5 I VERANO 25 16.8 I VERANO 50 19.9 I VERANO 75 23.5 I VERANO 100 25.8 II INVIER 25 14.3 II INVIER 50 16.9 II INVIER 75 19.6 II INVIER 100 21.9 II VERANO 25 17.3 II VERANO 50 20.3 II VERANO 75 23.2 II VERANO 100 26.4 III INVIER 25 15 III INVIER 50 17.2 III INVIER 75 21.4 III INVIER 100 22.6 III VERANO 25 16.4 III VERANO 50 21.4 III VERANO 75 23 III VERANO 100 25.9 IV INVIER 25 14.3 IV INVIER 50 16.4 IV INVIER 75 20.3 IV INVIER 100 21.8 IV VERANO 25 17.1 IV VERANO 50 20.8 IV VERANO 75 24.1 IV VERANO 100 27.1 ; PROC ANOVA; CLASS BLOQUE CONDI ALT_COR; MODEL CON_FIB=CONDI BLOQUE(CONDI) ALT_COR CONDI*ALT_COR; TEST H=CONDI ALT_COR E=CONDI*ALT_COR; RUN; Al igual que en los anteriores casos se tiene que ajustar los valores de los dos factores Condicion y Altura de Corte, donde el valor del Cuadrado Medio del Error para ambos estara dado por la interacción de ambos factores (CONDI*ALT_COR). TEST H=CONDI ALT_COR E=CONDI*ALT_COR; Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados: Ing. Ramiro Raúl OCHOA TORREZ 127 Sistema SAS Procedimiento ANOVA Variable dependiente: CON_FIB (1) Fuente Modelo Error Total correcto DF 13 18 31 R-cuadrado 0.993136 (2) Fuente CONDI BLOQUE(CONDI) ALT_COR CONDI*ALT_COR Suma de cuadrados 420.7815625 2.9081250 423.6896875 Coef Var 1.990151 DF 1 6 3 3 Cuadrado de la media 32.3678125 0.1615625 Raiz MSE 0.401948 Pr > F <.0001 CON_FIB Media 20.19688 Cuadrado de la media 83.5278125 0.6415625 109.8786458 1.2561458 Anova SS 83.5278125 3.8493750 329.6359375 3.7684375 F-Valor 200.34 F-Valor 517.00 3.97 680.10 7.77 Pr > F <.0001 0.0105 <.0001 0.0015 Tests de hipótesis usando el MS Anova para CONDI*ALT_COR como un término de error (3) Fuente CONDI ALT_COR DF 1 3 Cuadrado de la media 83.5278125 109.8786458 Anova SS 83.5278125 329.6359375 F-Valor 66.50 87.47 Pr > F 0.0039 0.0020 Remplazando los valores del punto (3) correspondiente a CONDI y ALT_COR en el punto (2) en los respectivos lugares de las variables de respuesta ya mencionados, tenemos: Fuente CONDI BLOQUE(CONDI) ALT_COR CONDI*ALT_COR DF 1 6 3 3 Anova SS 83.5278125 3.8493750 329.6359375 3.7684375 Cuadrado de la media 83.5278125 0.6415625 109.8786458 1.2561458 F-Valor 66.50 3.97 87.47 7.77 Pr > F 0.0039 0.0105 0.0020 0.0015 Una vez remplazados estos se remplazan el punto (1) todas las fuentes de variación en reemplazo de Model, lo que nos dará: Fuente CONDI BLOQUE(CONDI) ALT_COR CONDI*ALT_COR Error Total correcto DF 1 6 3 3 18 31 R-cuadrado 0.993136 Suma de cuadrados 83.5278125 3.8493750 329.6359375 3.7684375 2.9081250 423.6896875 Coef Var 1.990151 Cuadrado de la media 83.5278125 0.6415625 109.8786458 1.2561458 0.1615625 Raiz MSE 0.401948 F-Valor 66.50 3.97 87.47 7.77 Pr > F 0.0039 0.0105 0.0020 0.0015 CON_FIB Media 20.19688 Organizando los valores del análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • Si el valor de: 128 Pr > 0.05 → ns (No significativo) Ing. Ramiro Raúl OCHOA TORREZ DISEÑOS JERARQUICOS O ANIDADOS • • Si el valor de: Si el valor de: Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) Fuente CONDI BLOQUE(CONDI) ALT_COR CONDI*ALT_COR Error Total correcto R-cuadrado 0.993136 DF 1 6 3 3 18 31 Suma de cuadrados 83.5278125 3.8493750 329.6359375 3.7684375 2.9081250 423.6896875 Coef Var 1.990151 Cuadrado de la media 83.5278125 0.6415625 109.8786458 1.2561458 0.1615625 Raiz MSE 0.401948 F-Valor 66.50 3.97 87.47 7.77 Pr > F 0.0039 0.0105 0.0020 0.0015 ** * ** ** CON_FIB Media 20.19688 Conclusión El análisis de varianza presenta diferencias altamente significativas (P < 0.01) en las fuentes de variación Condicion, Altura de Corte y la interacción Condicion x Altura de Corte y significativa (P < 0.05) para los Bloques anidados en el factor Condición. Teniéndose un coeficiente de variación de 1.990151% y un promedio general de 20.19688 % de contenido de Fibra Cruda. Como se puede apreciar se tiene que realizar las pruebas de medias (Duncan, Tukey, etc.) mediante la adición de los respectivos comandos y el análisis de varianza de efectos simples para completar el análisis y la posterior interpretación. Ing. Ramiro Raúl OCHOA TORREZ 129 TRANSFORMACIÓN DE DATOS 14. EXPERIMENTOS EN SERIE O REPETIDOS 14.1.Serie de experimentos Ejercicio En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta Kochia scorparia, bajo dos condiciones de cultivo en cuatro alturas de corte (Rodríguez, 1991). Condición Invierno Verano Altura de corte (cm) 25 50 75 100 25 50 75 100 Condición Altura de corte Bloque A B R I II III IV 14.9 17.5 20.7 22.5 16.8 19.9 23.5 25.8 14.3 16.9 19.6 21.9 17.3 20.3 23.2 26.4 15.0 17.2 21.4 22.6 16.4 21.4 23.0 25.9 14.3 16.4 20.3 21.8 17.1 20.8 24.1 27.1 i… j… k… a… b… r… 1… 1… 1… 2 4 4 Teniendo el modelo lineal: Yijk = µ + αi + βj + αβ(ij) + εk(ij) Donde: Yijk µ αi βj αβ(ij) εk(ij) = Una observación = Media poblacional = Efecto de la i – esima condición (factor A) = Efecto de la j – esima altura de corte (factor B) = Efecto de la i – esima condición, con la j – esima altura de corte (interacción A x B) = Error experimental Las hipótesis que nos formulamos serán: Ho: Invierno = Verano 25 = 50 = 75 = 100 Invierno – 25 = … = Verano – 100 Ho: Invierno ≠ Verano 25 ≠ 50 ≠ 75 ≠ 100 Invierno – 25 ≠ … ≠ Verano – 100 (Condicion) (Altura de corte) (Interacción Condicion x Altura de corte) (Condicion) (Altura de corte) (Interacción Condicion x Altura de corte) Introduciendo los datos de manera columnar tendremos: Ing. Ramiro Raúl OCHOA TORREZ 131 OPTIONS NODATE NONUMBER; DATA SERIE; INPUT BLOQUE $ CONDI $ ALT_COR CON_FIB; CARDS; I INVIER 25 14.9 I INVIER 50 17.5 I INVIER 75 20.7 I INVIER 100 22.5 I VERANO 25 16.8 I VERANO 50 19.9 I VERANO 75 23.5 I VERANO 100 25.8 II INVIER 25 14.3 II INVIER 50 16.9 II INVIER 75 19.6 II INVIER 100 21.9 II VERANO 25 17.3 II VERANO 50 20.3 II VERANO 75 23.2 II VERANO 100 26.4 III INVIER 25 15 III INVIER 50 17.2 III INVIER 75 21.4 III INVIER 100 22.6 III VERANO 25 16.4 III VERANO 50 21.4 III VERANO 75 23 III VERANO 100 25.9 IV INVIER 25 14.3 IV INVIER 50 16.4 IV INVIER 75 20.3 IV INVIER 100 21.8 IV VERANO 25 17.1 IV VERANO 50 20.8 IV VERANO 75 24.1 IV VERANO 100 27.1 ; PROC ANOVA; CLASS BLOQUE CONDI ALT_COR; MODEL CON_FIB=CONDI ALT_COR CONDI*ALT_COR; TEST H=CONDI ALT_COR E=CONDI*ALT_COR; RUN; Al igual que en los anteriores casos se tiene que ajustar los valores de los dos factores Condicion y Altura de Corte, donde el valor del Cuadrado Medio del Error para ambos estara dado por la interacción de ambos factores (CONDI*ALT_COR). TEST H=CONDI ALT_COR E=CONDI*ALT_COR; Tenga muy en cuenta que en este caso en particular no se considera los bloques en el análisis según lo que sujiere Cochran (1997). Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados: 132 Ing. Ramiro Raúl OCHOA TORREZ TRANSFORMACIÓN DE DATOS Sistema SAS Procedimiento ANOVA Variable dependiente: CON_FIB (1) Fuente Modelo Error Total correcto DF 7 24 31 R-cuadrado 0.984051 (2) (3) Fuente CONDI ALT_COR CONDI*ALT_COR Suma de cuadrados 416.9321875 6.7575000 423.6896875 Coef Var 2.627261 DF 1 3 3 Cuadrado de la media 59.5617411 0.2815625 Raiz MSE 0.530625 Pr > F <.0001 CON_FIB Media 20.19688 Cuadrado de la media 83.5278125 109.8786458 1.2561458 Anova SS 83.5278125 329.6359375 3.7684375 F-Valor 211.54 F-Valor 296.66 390.25 4.46 Pr > F <.0001 <.0001 0.0126 Tests de hipótesis usando el MS Anova para CONDI*ALT_COR como un término de error Cuadrado de Fuente DF Anova SS la media F-Valor Pr > F CONDI 1 83.5278125 83.5278125 66.50 0.0039 ALT_COR 3 329.6359375 109.8786458 87.47 0.0020 Remplazando los valores del punto (3) correspondiente a CONDI y ALT_COR en el punto (2) en los respectivos lugares de las variables de respuesta ya mencionados, tenemos: Fuente CONDI ALT_COR CONDI*ALT_COR DF 1 3 3 Anova SS 83.5278125 329.6359375 3.7684375 Cuadrado de la media 83.5278125 109.8786458 1.2561458 F-Valor 66.50 87.47 4.46 Pr > F 0.0039 0.0020 0.0126 Una vez remplazados estos se remplazan el punto (1) todas las fuentes de variación en reemplazo de Model, lo que nos dará: Fuente CONDI ALT_COR CONDI*ALT_COR Error Total correcto DF 1 3 3 24 31 R-cuadrado 0.984051 Suma de cuadrados 83.5278125 329.6359375 3.7684375 6.7575000 423.6896875 Coef Var 2.627261 Cuadrado de la media 83.5278125 109.8786458 1.2561458 0.2815625 Raiz MSE 0.530625 F-Valor 66.50 87.47 4.46 Pr > F 0.0039 0.0020 0.0126 CON_FIB Media 20.19688 Organizando los valores del análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las conclusiones: • • • Si el valor de: Si el valor de: Si el valor de: Ing. Ramiro Raúl OCHOA TORREZ Pr > 0.05 → ns (No significativo) Pr ≤ 0.05 → * (Significativo al 5% ) Pr ≤ 0.01 → ** (Altamente significativo al 1%) 133 Fuente CONDI ALT_COR CONDI*ALT_COR Error Total correcto R-cuadrado 0.984051 DF 1 3 3 24 31 Suma de cuadrados 83.5278125 329.6359375 3.7684375 6.7575000 423.6896875 Coef Var 2.627261 Cuadrado de la media 83.5278125 109.8786458 1.2561458 0.2815625 Raiz MSE 0.530625 F-Valor 66.50 87.47 4.46 Pr > F 0.0039 ** 0.0020 ** 0.0126 * CON_FIB Media 20.19688 Conclusión El análisis de varianza presenta diferencias altamente significativas (P < 0.01) en las fuentes de variación Condicion, Altura de Corte y significativas (P < 0.05) para la interacción Condicion x Altura de Corte. Teniéndose un coeficiente de variación de 2.627261% y un promedio general de 20.19688 % de contenido de Fibra Cruda. Como se puede apreciar se tiene que realizar las pruebas de medias (Duncan, Tukey, etc.) mediante la adición de los respectivos comandos y el análisis de varianza de efectos simples para completar el análisis y la posterior interpretación. 134 Ing. Ramiro Raúl OCHOA TORREZ BIBLIOGRAFIA 15. BIBLIOGRAFIA Calzada B., J 1982. Métodos Estadísticos para la Investigación. Ed. Universidad Nacional Agraria La Molina. LimaPerú. Cochran, W. y Cox, G. 1997. Diseños experimentales. 2ª. Ed. Trillas. México. De la Loma, J. 1980. Experimentación Agrícola. Ed. Hispanoamericana. México. Eduardo, E. 2003. Estadistica 1. La Paz, Bolivia. Freese, F. 1970. Métodos estadísticos elementales para técnicos forestales. Agencia para el Desarrollo Internacional (AID). México. Ibáñez. V., Zea, W. y Paredes, R. 1998. Aplicaciones con el sistema de análisis estadístico (S.A.S.).Facultad de Ingeniería Estadística e Informática, Universidad Nacional del Altiplano. Perú. IBTA (Instituto Boliviano de Tecnología Agropecuaria). 1988. Informe Anual 1998 – 1989. IBTA. La Paz, Bolivia. Little, T. y Hills, J. 1981. Métodos Estadísticos para la Investigación en la Agricultura. Ed. Trillas. México. López, G. y López, J. 1993. Introducción al Micro SAS: Aplicación al Análisis de Experimentos Agrícolas. Centro Agronómico Tropical de Investigación y Enseñanza C.A.T.I.E. Turrialba-Costa Rica. Martínez, A. 1981. Diseños Experimentales. CEC Colegio de Postgrados. Chapingo-México. Miller, R., Freund, J. y Jonson, R. 1992. Probabilidad y Estadística para Ingenieros. Ed. Hispanoamericana S.A. México. Montgomery, D. 1990. Diseño y Análisis de Experimentos. Ed. Iberoamericana. México. Ochoa, R. 2000. Diseños Experimentales. Universidad Mayor de San Andrés. La Paz, Bolivia. ________. 2006. Diseños Experimentales. Unidad Academica Campesina Carmen Pampa. La Paz, Bolivia. Padrón, E. 1996. Diseños Experimentales con Aplicación a la Agricultura y la Ganadería. Ed. Trillas. México. Panse, V. y Shukatme, P. 1963. Métodos Estadísticos para Investigadores Agrícolas. Ed. Fondo de Cultura Económica. México. Perez, C. 2001. El sistema estadistico SAS. Prentice Hall. Madrid, España. Quispe, V., Zea, W. y Paredes, R. 1998. Aplicaciones con el Sistema de Análisis Estadístico (S.A.S.). Ed. Facultad de Ingeniería Estadística e Informática. Puno-Perú. Reyes, P. 1978. Diseño de Experimentos Agrícolas. Ed. Trillas. México. Rodríguez, J. 1991. Métodos de Investigación Pecuaria. Ed. Trillas. México. Steel, R. y Torrie, J. 1996. Bioestadística: Principios y Procedimientos. Ed. Mc Graw – Hill. México. Ing. Ramiro Raúl OCHOA TORREZ 135