MANUAL SAS (5)

Anuncio
UNIVERSIDAD CATÓLICA BOLIVIANA
“SAN PABLO”
UNIDAD ACADÉMICA CAMPESINA – CARMEN PAMPA
INTRODUCCIÓN AL MANEJO DEL SAS
(SISTEMA DE ANÁLISIS ESTADÍSTICO)
ING. RAMIRO RAÚL OCHOA TORREZ
LA PAZ – BOLIVIA
OCTUBRE DE 2003
Introducción al manejo del SAS
(Sistema de Análisis Estadístico)
Ramiro Raúl OCHOA TORREZ
 Ramiro Raúl OCHOA TORREZ
Celular 71980140
E – mail: [email protected]
La Paz - Bolivia
CONTENIDO
CONTENIDO
1.
2.
3.
4.
5.
6.
7.
INTRODUCCIÓN ...........................................................................................................................1
1.1.
Introducción ...........................................................................................................................1
1.2.
Comenzando con el SAS..........................................................................................................1
1.2.
Menú y herramientas ...............................................................................................................2
1.2.1.
Menús ...........................................................................................................................2
1.2.2.
Iconos del menú ..............................................................................................................7
1.3.
Ventanas del SAS ...................................................................................................................8
PROGRAMACIÓN EN EL SAS .........................................................................................................9
2.1.
Introducción ...........................................................................................................................9
2.2.
Programa ..............................................................................................................................9
2.3.
Estructura de un programa SAS.................................................................................................9
2.3.1.
Sentencia DATA ..............................................................................................................9
2.3.1.1. Formas de asignar el nombre .........................................................................................9
2.3.1.2. Opciones asociados a la sentencia DATA .......................................................................10
2.3.2.
Sentencia input .............................................................................................................10
2.3.2.1. Tipos de variables..........................................................................................................10
2.3.2.2. Formas del INPUT .........................................................................................................11
2.3.2.3. Tipos de variables ......................................................................................................12
2.3.3.
Sentencia CARDS .........................................................................................................12
2.3.4.
Sentencia PROC ...........................................................................................................12
2.3.4.1. Proc ANOVA .............................................................................................................12
2.3.4.2. Proc CHART .............................................................................................................13
2.3.4.3. Proc CORR ..............................................................................................................13
2.3.4.4. Proc FREQ ...............................................................................................................13
2.3.4.5. Proc GLM .................................................................................................................14
2.3.4.6. Proc REG ................................................................................................................14
2.3.4.7. Proc LATTICE ...........................................................................................................15
2.3.4.8. Proc MEANS.............................................................................................................15
2.3.4.9. Proc PLOT ...............................................................................................................15
2.3.4.10.
Proc PRINT...........................................................................................................15
2.3.4.11.
Proc PRINCOMP ...................................................................................................16
2.3.4.12.
Proc SORT ...........................................................................................................16
2.3.4.13.
Proc TTEST ..........................................................................................................16
2.3.4.14.
Proc UNIVARIATE..................................................................................................16
2.4.
Interpretación de resultados ....................................................................................................17
ESTADÍSTICA BÁSICA .................................................................................................................18
3.1.
Estadísticos básicos ..............................................................................................................18
3.2.
Distribución de frecuencias .....................................................................................................19
SUPUESTOS DEL ANÁLISIS DE VARIANZA ....................................................................................22
4.1.
Normalidad ..........................................................................................................................22
4.2.
Homogeneidad de varianzas ...................................................................................................26
DISEÑO COMPLETAMENTE AL AZAR (DCA)...................................................................................31
5.1.
DCA con igual número de repeticiones ......................................................................................31
5.2.
DCA con diferente número de repeticiones ................................................................................37
5.3.
DCA con muestreo ................................................................................................................44
DISEÑO BLOQUE AL AZAR (DBA) .................................................................................................52
6.1.
DBA con igual número de repeticiones ......................................................................................52
6.2.
DBA con muestreo ................................................................................................................56
DISEÑO CUADRADO LATINO (DCL) ..............................................................................................64
7.1.
DCL con igual número de repeticiones ......................................................................................64
Ing. Ramiro Raúl OCHOA TORREZ
i
8.
COMPARACIONES ORTOGONALES ..............................................................................................72
8.1.
Comparaciones ortogonales de experimentos simples..................................................................72
9. EXPERIMENTOS FACTORIALES ...................................................................................................76
9.1.
DCA con arreglo factorial........................................................................................................76
9.1.1. DCA con arreglo factorial – dos factores ...................................................................................76
9.1.2.
DCA con arreglo factorial – tres factores ............................................................................84
9.2.
DBA con arreglo factorial ........................................................................................................92
9.2.1.
DBA con arreglo factorial – dos factores .............................................................................92
9.2.2.
DBA con arreglo factorial – tres factores.............................................................................95
9.3.
DCL con arreglo factorial ........................................................................................................99
9.3.1.
DCL con arreglo factorial – dos factores .............................................................................99
10.
PARCELAS DIVIDIDAS ...........................................................................................................103
10.1. DCA con arreglo en parcelas divididas ....................................................................................103
10.2. DBA con arreglo en parcelas divididas ....................................................................................107
10.3. DCL con arreglo en parcelas divididas ....................................................................................111
11.
PARCELAS SUBDIVIDIDAS .....................................................................................................117
11.1. DBA con arreglo en parcelas subdivididas ...............................................................................117
12.
ARREGLO EN FRANJAS.........................................................................................................122
12.1. Arreglo en franjas................................................................................................................122
13.
DISEÑOS JERÁRQUICOS O ANIDADOS ...................................................................................126
13.1. Jerarquicos o anidados ........................................................................................................126
14.
EXPERIMENTOS EN SERIE O REPETIDOS ...............................................................................131
14.1. Serie de experimentos .........................................................................................................131
15.
BIBLIOGRAFIA ......................................................................................................................135
ii
Ing. Ramiro Raúl OCHOA TORREZ
INTRODUCCION
1. INTRODUCCIÓN
1.1.
Introducción
El sistema SAS (Statistical Analisys System) es un software que abarca múltiples campos de trabajo, entre los más
destacados se tiene:
•
•
•
•
•
•
•
•
•
Entrada, recuperación y manejo de datos simples y mediante programación.
Gráficos.
Análisis estadístico y matemático.
Investigación operativa y gestión de proyectos.
Control de calidad.
Diseño de experimentos.
Desarrollo de aplicaciones
Planificación de negocios, predicción y soporte a la decisión.
Gestión financiera.
El sistema SAS consta de una serie de módulos, cada uno de ellos orientado a una tarea especifica.
El estudio del SAS comienza básicamente por aprender el manejo de un lenguaje de programación para manejar los
datos, procedimientos sencillos para el análisis de datos.
1.2.
Comenzando con el SAS
Para empezar a trabajar con el programa, basta con elegir de la opción programas del menú inicio de Windows y
seleccionar la opción The SAS System en programas, seguidamente seleccionamos The SAS System For
Windows V8, dependiendo de la versión del programa SAS, puede ser versión 6.11, versión 6.12, versión 8.0,
versión 8.0 e, versión 9.0, se obtiene la pantalla temporal, con información de la versión.
La pantalla del entorno SAS, la que nos permitirá a trabajar con el SAS.
Ing. Ramiro Raúl OCHOA TORREZ
1
INTRODUCCION AL MANEJO DEL SAS
1.2.
Menú y herramientas
En la línea superior de la pantalla vemos el icono de SAS. En la línea siguiente se presenta la Barra de menú, que
contiene el menú general de SAS con todas sus opciones (File, Edit, View, Tools, Run, Solutions, Windows y
Help). La tercera línea presenta la Barra de herramientas, cuyo contenido son diferentes iconos que permiten
acceder rápidamente a tareas más comunes en el trabajo con la aplicación sin necesidad de acudir al menú general.
1.2.1.
Menús
A continuación se explica la finalidad de las distintas opciones que aparecen en la barra de menú del programa,
presentando diversos tipos de menús desplegables, facilitando la tarea con el programa:

File. Si nos situamos en el menú File, de la barra del menú principal, se presentan las siguientes opciones:
2
Ing. Ramiro Raúl OCHOA TORREZ
INTRODUCCION
Definiendo cada una, tendremos:


















New, abre un archivo vació para editar una nueva sintaxis.
Open, abre archivos ya existentes.
Close, cierra el archivo actual.
Append, añadir un archivo existente al contenido actual del editor.
Open Object, abre un objeto seleccionando en el explorador.
Save, guarda el archivo actual.
Save as, guarda el archivo actual con otro nombre o tipo.
Save as Object, guarda el archivo actual con otro nombre o tipo de objeto.
Import Data, nos permite importar Datos ASCII, para el editor
Export Data, permite exportar Datos del editor a ASCII.
Page Setup, nos permite configurar la página.
Print Setup, configuración de la impresión.
Print Preview, vista previa de la ventana actual.
Print, imprime el contenido del editor.
Send Mail, envía por correo electrónico el contenido del editor.
Datos usados recientemente, muestra los archivos editados recientemente.
Exit, sale del SAS
Edit. desglosando este menú tendremos:
Ing. Ramiro Raúl OCHOA TORREZ
3
INTRODUCCION AL MANEJO DEL SAS
Definiendo cada una, tendremos:












Undo, deshace la última acción.
Redo, rehace la última acción desecha.
Cut, corta la selección para almacenar en el portapapeles.
Copy, copia la selección para almacenar en el portapapeles.
Paste, pega el contenido del portapapeles en la ubicación actual del cursor.
Clear, borra la selección.
Clear All, borra todo el contenido.
Select All, selecciona todo el contenido
Collapse All, compacta todo el contenido.
Expand All, expande todo el contenido.
Find, busca los datos que se especifiquen.
Replace, remplazar un contenido por otro.
View. Desglosando su opciones tenemos:

Definiendo tenemos:





Enhanced Editor, editor avanzado.
Program Editor, editor de programas.
Log, nos presenta la ventana Log.
Output, ventana de salida.
Graph, ventana de gráficos.
4
Ing. Ramiro Raúl OCHOA TORREZ
INTRODUCCION




Results, ventana de resultados.
Explorer, ventana del explorador.
Contents Only, nos presenta los contenidos del SAS.
My Favorite Folders, nos permite realizar una exploración en búsqueda de nuestros archivos.
Tools. Desglosando su opciones tenemos:









Query, realiza preguntas SQL con los ficheros de Datos especificados.
Table Editor, edita ficheros de Datos nuevos o ya existentes mediante filas y columnas.
Graphics Editor, edita gráficos.
Report Editor, genera informes con las variables de los conjuntos de Datos.
Image Editor, abre el editor de imágenes.
Text Editor, abre el editor de texto.
Customize, configura menús y barras de herramientas.
Options, configura opciones del sistema, del editor, etc.
Run. Desglosando el menú tenemos:

Donde tenemos:








Submit, ejecuta el programa escrito en el editor.
Recall Last Submit, recupera el texto del último programa ejecutado.
Signon.
Remote Submit, ejecución remota de programa.
Remote Get, búsqueda de remoto.
Remote Display, despliegue remoto.
Signoff
Solutions, desglosando sus opciones tenemos:
Ing. Ramiro Raúl OCHOA TORREZ
5
INTRODUCCION AL MANEJO DEL SAS
Donde tenemos:







Analysis, despliega todas las materias que se pueden trabajar en el SAS.
Development and programming, trabajo en desarrollo y programación.
Reporting, trabajo en informes.
Accessories, accesorios gráficos de edición, juegos, etc.
ASSIST, nos presenta el asistente del SAS.
Desktop, nos presenta el escritorio del SAS.
EIS / OLAP Aplication Builder, trabajo en aplicaciones OLAP.
Windows. Sus opciones son:

Nos presenta:
Minimize all windows, minimiza todas las ventanas abiertas.
Cascade, presenta las ventanas como cascada.
Tile vertically, presenta todas las ventanas abiertas en el monitor en forma vertical.
Tile horizontally, presenta todas las ventanas abiertas en el monitor en forma horizontal. Resize, nos
presenta la ventana de resultados Output.
 Docked.
 Las siguientes opciones, nos sirve para seleccionar a las diferentes ventanas: Editor, Log, Result, Outup y
Explorer.





Help. Sus opciones son:
6
Ing. Ramiro Raúl OCHOA TORREZ
INTRODUCCION
Definiendo tenemos:






1.2.2.
SAS System help, nos presenta los temas de ayuda del SAS.
Using This Windows, referencias del uso de las ventanas.
Books and Training, referencias para la práctica del SAS.
Getting Started whit SAS Software, guía del manejo del SAS.
SAS on the Web, ayuda del SAS en la Web.
About SAS System, nos presenta las referencias del el SAS y el equipo.
Iconos del menú
Los iconos que nos presenta el menú principal son:
Por orden de colocación se izquierda a derecha, los iconos de la barra de herramientas significan lo siguientes:
Introducción de comandos
Nuevo archivo, también Empleado para borrar el contenido de una ventana
Abrir archivo
Guardar archivo
Imprimir archivo
Vista preliminar
Cortar
Copiar
Pegar
Deshacer
Nueva librería
Explorador del SAS
Ejecución del programa
Borrar todo
Interrupción
Ayuda del SAS
Ing. Ramiro Raúl OCHOA TORREZ
7
INTRODUCCION AL MANEJO DEL SAS
1.3.
Ventanas del SAS
El modo de trabajo del SAS es el empleo de una serie de ventanas (la presentación siguiente fue realizada con la
opción Tile vertically de Windows, del menú del SAS):
Las cuales las principales son:
 PROGRAM EDITOR. Se utiliza para escribir programas, esta ventana corresponde a la ventana de sintaxis,
por lo tanto es editable.
 LOG. Se utiliza para hacer un seguimiento de la ejecución. En esta ventana se consulta y revisa todo lo que
se ha ejecutado, aparecen mensajes de advertencia y de error en caso necesario y se informa sobre la
velocidad de ejecución y recursos.
 OUTPUT. Para presentar la salida textual y numérica. Cuando se ejecutan procedimientos de SAS, en esta
ventana se muestran los listados, tablas y/o resultados.
 GRAPH. Para representar la salida de graficas.
 EXPLORER. Nos presenta el explorador del SAS en la parte izquierda, similar este al explorador de
Windows, principalmente cuando se hace correr los datos.
8
Ing. Ramiro Raúl OCHOA TORREZ
PROGRAMACIÓN EN EL SAS
2. PROGRAMACIÓN EN EL SAS
2.1.
Introducción
Para utilizar de una forma optima la extraordinaria flexibilidad y potencia del SAS es necesario trabajar con los
procedimientos SAS, lo que exige un mínimo de conocimiento básico del lenguaje de programación SAS y en
concreto de la estructura de cada uno de los procedimientos que se ilustrara con ejemplos.
2.2.
Programa
Un programa en el SAS es una serie de sentencias y procedimientos colocadas en orden definido, bajo un lenguaje o
sintaxis determinada, con el cual se puede ejecutar una determinada tarea.
2.3.
Estructura de un programa SAS
Se debe tomar en cuenta las siguientes reglas para escribir enunciados:
Los enunciados o sentencias SAS pueden comenzar o terminar en cualquier posición de la línea.
Los enunciados SAS terminan con un punto y coma (;) al final de la sentencia.
Pueden aparecer más de un enunciado SAS en la misma línea.
Los enunciados SAS pueden empezar en una línea y terminar en otra.
Los elementos de una sentencia SAS deben separarse de los elementos vecinos por uno o más espacios en
blanco.
 Si los elementos de un enunciado SAS están conectados por caracteres especiales, los espacios en blanco son
innecesarios. Por ejemplo, en el enunciado X=Y, los espacios en blanco son innecesarios, puesto que el signo
igual es un carácter especial.





2.3.1.
Sentencia DATA
Las sentencias de tipo DATA permiten crear un archivo de datos SAS, siendo un grupo de instrucciones
generalmente ubicada al inicio de cada trabajo, la instrucción DATA consiste de la palabra clave DATA que señala el
comienzo del paso DATA, seguido de un nombre que identifique al archivo SAS.
2.3.1.1.
Formas de asignar el nombre
Existen diferentes formas de asignar el nombre a la sentencia DATA, el nombre puede consistir de:
 NOMBRE DE UNA SOLA PALABRA. Se le asigna un solo nombre, una palabra de máximo 8 caracteres (de
preferencia se maneja solo siete caracteres), para crear un archivo temporáneo, que desaparecerá en el
momento de terminar la sesión SAS, por ejemplo:
DATA var;
DATA altura;
DATA peso_1;
(se crea un archivo temporario llamado var)
(se crea un archivo temporario llamado altura)
(se crea un archivo temporario llamado peso_1)
 DOS NOMBRES SEPARADOS POR UN PUNTO. Se puede crear un archivo de datos en forma permanente
asignando a la sentencia DATA dos nombres separados por un punto, la primera palabra corresponde al
nombre de la LIBRERÍA SAS en el cual reside el archivo de datos SAS cuyo nombre es la palabra que
sigue al punto. La librería SAS se puede crear mediante la sentencia LIBNAME, por ejemplo:
Ing. Ramiro Raúl OCHOA TORREZ
9
DATA millb.var;
(se crea un archivo permanente llamado var, que se almacena
en la librería SAS denominado millb)
 MÁS DE UN NOMBRE. Se puede crear cualquier número de datos SAS con una sola sentencia DATA, esto se
puede hacer asignando un nombre para cada uno de los archivos con la instrucción DATA, por ejemplo:
DATA var1 var2;
2.3.1.2.
(esta instrucción me indica que se crea dos archivos de datos SAS con
los nombres var1 y var2)
Opciones asociados a la sentencia DATA
Algunas sentencias del formato de salida de los resultados, se pueden indicar mediante la sentencia OPTIONS,
seguida de los comandos deseados:
 LINESIZE (LS). Indica el número de columnas por pagina (ancho):
OPTIONS LS=76;
OPTIONS LS=47;
 PAGESIZE (PS). Indica el número de líneas por pagina (alto de pagina):
OPTIONS PS=54;
OPTIONS PS=24;
 NODATE. No incluirá la fecha a la salida de los resultados:
OPTIONS LS=76 PS=56 NODATE;
 NONUMBER. No incluirá el número de pagina a la salida de los resultados:
OPTIONS LS=76 PS=56 NODATE NONUMBER;
2.3.2.
Sentencia input
La instrucción INPUT, describe al SAS el arreglo de las líneas de datos, indicando la forma en la que se introduce los
datos a la computadora y los tipos de datos.
Describiendo al SAS el arreglo de las líneas de datos, SAS emplea la información que encuentra en estas líneas
para producir las observaciones de un conjunto de datos, teniendo las siguientes características:
•
•
•
La instrucción INPUT lee las líneas de datos.
Asigna nombres a las variables SAS que corresponden a los campos de datos
Indica si una variable es numérica o de caracteres (alfanuméricos). Para esto se hace uso del signo $ para
indicar si una variable es alfanumérica
2.3.2.1.
Tipos de variables
En el SAS se distinguen dos tipos de variables:
 NUMÉRICAS. Cuando los valores que toma la variable son numéricas:
154
256
12
10
Ing. Ramiro Raúl OCHOA TORREZ
PROGRAMACIÓN EN EL SAS
144
0.2
 ALFANUMÉRICAS. Cuando los valores que toman las variables contienen al menos un carácter alfabético: a, b,
c, etc.:
Local
Var1
Var2
IBTA_80
2.3.2.2.
Formas del INPUT
El INPUT tiene dos formas:
 FORMA DE COLUMNA. Se especifica donde encontrar las variables en el registro de entrada por medio de la
posición de la columna:
DATA ejemplo;
INPUT nombre $ 1-8 sexo $ 11 edad 13–14;
Sus restricciones son:
•
(indica que se han creado las variables
alfanuméricas nombre que ocupa las
columnas 1 a 8, la variable alfanumérica sexo
que ocupa la columna 11 y la variable
numérica edad que ocupa las columnas 13 a
14)
Las posiciones para las variables son fijas.
 FORMA DE LISTA. Se listan las variables en el orden en el cual aparecen en el registro de entradas, por
ejemplo:
DATA ejemplo;
INPUT bloque tratam rend;
(indica que se han creado las variables
bloque, tratam y rend)
Cuando el SAS lea los datos el valor entre un espacio y otro corresponde a una variable diferente.
Bloque
tratam
rend
1
1
125
1
2
258
1
3
254
Sus restricciones son:
•
•
•
•
Las variables deben estar en el orden especificado.
Los campos deben estar separados por uno o más espacios blancos.
En los valores para las variables alfanuméricas, no se permiten espacios en blanco intermedios, la
longitud máxima es de 8 caracteres.
Los campos en blanco causan que los nombres de las variables y sus valores se desfasen. Hay que
indicar un valor faltante por un punto (.).
 FORMA DE LINEAS. Para leer un conjunto de datos con más de una observación por línea, se usa el puntero
de dirección @@, por ejemplo:
Ing. Ramiro Raúl OCHOA TORREZ
11
INPUT bloque trat rend @@;
1
1
548
1
2
478
1
3
789
2.3.2.3.
2
2
2
1
2
3
874
741
598
Tipos de variables
Existen dos tipos principales de variables que se emplean con la instrucción INPUT:
 VARIABLES ESTUDIO. Son denominada así, porque ayudan a identificar a los valores que se introducen, como
ser:
 Factores de estudio (variedades, densidades, raciones, etc.).
 Tratamientos.
 Variables independientes.
 VARIABLES DE RESPUESTA. Son todas las variables que representan a las mediciones efectuadas del
material de estudio, como ser:





2.3.3.
Altura.
Peso.
Rendimiento.
Largo.
Variables dependientes.
Sentencia CARDS
Cuando los datos forman parte del programa, se hace uso de la sentencia CARDS, la cual le indica al SAS que las
líneas que siguen a continuación son los datos de las diferentes variables sean estas variables de estudio y/o
variables de respuesta. Esta sentencia viene después de la sentencias INPUT, por ejemplo:
DATA ejemplo;
INPUT bloque trat rend @@;
CARDS;
1
1
548
1
2
478
1
3
789
2.3.4.
2
2
2
1
2
3
874
741
598
Sentencia PROC
Las sentencias PROC se ejecutan después de INPUT, transformación de datos, CARDS y/o después de los datos,
cuando los datos forman parte del programa.
Para mostrar que las sentencias introducidas son programas y hay que ejecutarlos, al final de todas las sentencias
se coloca la sentencia RUN. Lo que nos permitirá ejecutar la sentencia PROC. Algunas de las sentencias usuales
son:
2.3.4.1.
Proc ANOVA
Es uno de los procedimientos más empleados en el análisis de los diseños experimentales, realizando el análisis de
la varianza de datos balanceados, que tienen la misma cantidad de datos y repeticiones. Siendo su enunciado:
12
Ing. Ramiro Raúl OCHOA TORREZ
PROGRAMACIÓN EN EL SAS
PROC ANOVA;
CLASS TRAT BLOQ;
MODEL REND=TRAT BLOQ;
RUN;
(1)
(2)
(3)
(4)
2.3.4.2.
(1) 1
(2)
(3)
(4)
Nos indica que el PROC (procedimiento) a emplear es ANOVA (análisis de varianza).
El comando CLASS señala las variables a estudiar en este caso TRAT (tratamiento) y BLOQ (bloques).
El comando MODEL nos señala el modelo a emplear en el análisis de varianza, señalando en la primera
parte la variable de respuesta REND (rendimiento) y en la segunda parte las variables en estudio TRAT
BLOQ (tratamientos y bloques).
El comando RUN, señala la ejecución del procedimiento antes señalado.
Proc CHART
Se emplea para la obtención de un diagrama de barras. Siendo su instrucción:
PROC CHART;
HBAR SEXO;
RUN;
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es CHART (diagrama de barras).
El comando HBAR, se emplea para la realización de barras horizontales de la variable SEXO.
RUN, ejecuta el procedimiento.
PROC CHART;
VBAR SEXO;
RUN;
(1)
(2)
(3)
2.3.4.3.
(1)
(2)
(3)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es CHART (diagrama de barras).
El comando VBAR, se emplea para la realización de barras verticales de la variable SEXO.
RUN, ejecuta el procedimiento.
Proc CORR
Realiza el análisis de correlación, obteniéndose el coeficiente de correlación entre dos variables. Siendo su
enunciado:
PROC CORR;
(1)
VAR REND ALTURA;
(2)
RUN;
(3)
(1)
(2)
(3)
2.3.4.4.
Nos indica que el PROC (procedimiento) a emplear es CORR (análisis de correlación).
El comando VAR, se emplea para la selección de las variables a ser analizadas mediante el análisis de
correlación, en este caso REN (rendimiento) y ALTURA (altura)
RUN, ejecuta el procedimiento.
Proc FREQ
Se emplea para la obtención de tablas de frecuencias para todas las variables en el archivo de datos de más
reciente creación, empleándose para ello la declaración:
1
Para cada comando se indica el número correspondiente entre paréntesis y el significado de este con el
respectivo valor p.e. PROC ANOVA (1), más abajo se aprecia el significado de este comando (1) Nos
indica que el PROC (procedimiento a emplear es ANOVA (analisis de varianza). Esto no se coloca en el
Editor solo es explicativo.
Ing. Ramiro Raúl OCHOA TORREZ
13
PROC FREQ;
RUN;
(1)
(2)
(1)
(2)
Nos indica que el PROC (procedimiento) a emplear es FREQ (distribución de frecuencias).
RUN, ejecuta el procedimiento.
Para obtener una tabla de tabulacion cruzada, se emplea la declaración:
PROC FREQ;
TABLES EDAD*SEXO;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es FREQ (distribución de frecuencias).
TABLES, señala que realizara una tabla de tabulacion cruzada de las variables EDAD*SEXO (edad x sexo).
RUN, ejecuta el procedimiento.
2.3.4.5.
Proc GLM
Al igual que la sentencia ANOVA, la opción GLM (General Linear Models) es una de las más empleadas, usa el
principio de mínimos cuadrados para ajustar un modelo de efectos fijos, a cualquier tipo de datos, el procedimiento
realiza análisis univariados como multivariados, así como los datos no son balanceados o sea cuando se tiene
diferente número de repeticiones por tratamiento o factor, o diferentes niveles por factor. Cuando se especifica dos o
más variables dependientes, GLM automáticamente agrupa aquellas variables dependientes con la misma estructura
de los valores perdidos. Su forma es:
PROC GLM;
CLASS TRAT BLOQ;
MODEL REND=TRAT BLOQ;
RUN;
(1)
(2)
(3)
(4)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es GLM (General Linear Models).
El comando CLASS señala las variables a estudiar en este caso TRAT (tratamiento) y BLOQ (bloques).
El comando MODEL nos señala el modelo a emplear en el análisis de varianza, señalando en la primera
parte la variable de respuesta REND (rendimiento) y en la segunda parte las variables en estudio TRAT
BLOQ (tratamientos y bloques).
(4)
El comando RUN, señala la ejecución del procedimiento antes señalado.
2.3.4.6.
Proc REG
Realiza el análisis de regresión simple y múltiple, con la siguiente sentencia:
PROC REG;
MODEL Y=X;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es REG (análisis de regresión).
MODEL, señala que el análisis de regresión múltiple empleara el siguiente modelo, teniendo como variable
dependiente Y y como variable independiente X.
RUN, ejecuta el procedimiento.
Para un análisis de regresión múltiple tendremos la siguiente sentencia:
PROC REG;
14
(1)
Ing. Ramiro Raúl OCHOA TORREZ
PROGRAMACIÓN EN EL SAS
MODEL Y=X1 X2 X3 X4;
RUN;
(1)
(2)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es REG (análisis de regresión).
MODEL, señala que el análisis de regresión múltiple empleara el siguiente modelo, teniendo como variable
dependiente Y y como variables independientes X1, X2, X3 y X4.
RUN, ejecuta el procedimiento.
(3)
2.3.4.7.
Proc LATTICE
Este procedimiento es el encargado de realizar el análisis de varianza para un diseño en latices. Su enunciado es:
PROC LATTICE DATA=EJEM;
(1)
VAR REND;
(2)
RUN;
(3)
(1)
Nos indica que el PROC (procedimiento) a emplear es LATTICE (latice) de DATA=EJEM (del archivo
llamado ejem).
VAR REND, señala que la variable de respuesta a ser analizadas mediante latices será REND
(rendimiento).
RUN, ejecuta el procedimiento.
(2)
(3)
2.3.4.8.
Proc MEANS
Esta sentencia le pide al SAS que realice los estadísticos descriptivos univariados de variables numéricas. Esta
sentencia tiene muchos parámetros, siendo su enunciado:
PROC MEANS MEAN SUM MIN MAX;
BY TRAT;
VAR REND;
RUN;
(1)
(2)
(3)
(4)
(1)
(2)
(3)
(4)
Nos indica que el PROC (procedimiento) a emplear es MEANS, que presentara la media (MEAN), la suma
total (SUM), el valor máximo (MIN) y el valor máximo (MAX).
BY TRAT, los análisis antes solicitados serán realizados de la variable de estudio TRAT (tratamiento).
VAR REND, señala que los análisis serán realizados de la variable de respuesta REND (rendimiento).
RUN, ejecuta el procedimiento.
2.3.4.9.
Proc PLOT
El procedimiento PLOT grafica los valores de una variable entera contra los valores de otra variable, produciendo un
diagrama bidimensional de puntos dispersos. Siendo su enunciado:
PROC PLOT;
PLOT X*Y;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es PLOT (grafico).
PLOT X*Y, el grafico deberá ser realizado de las variables X y Y.
RUN, ejecuta el procedimiento.
2.3.4.10.
Proc PRINT
Ing. Ramiro Raúl OCHOA TORREZ
15
Produce un listado de las variables de un archivo de datos SAS. Se puede especificar el archivo a usar, si no se
especifica, SAS usa el último que fue creado.
PROC PRINT;
(1)
BY ESPEC;
(2)
VAR TRAT;
(3)
RUN;
(4)
Nos indica que el PROC (procedimiento) a emplear es PRINT.
BY ESPEC, se obtiene el listado por valores de la (s) variable (s) que sigue al enunciado BY.
VAR, se indica cuales variables se deben presentar, por defecto se presentan todas.
RUN, ejecuta el procedimiento.
(1)
(2)
(3)
(4)
2.3.4.11.
Proc PRINCOMP
Realiza un el análisis en componentes principales. Su enunciado es de la forma:
PROC PRINCOMP COV OUT=PRIN;
VAR JULY JANUARY;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es PRINCOMP COV OUT=PRIN, componentes
principales y salida de las covarianzas.
VAR JULY JANUARY, se indica cuales variables deberán ser analizadas.
RUN, ejecuta el procedimiento.
2.3.4.12.
Proc SORT
Clasifica los datos, indicándole las variables por la cual se realizara la clasificación. Su enunciado esta dado por:
PROC SORT;
BY TRAT;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
Nos indica que el PROC (procedimiento) a emplear es SORT.
BY TRAT, indica que la clasificación será hecha de la variable TRAT (tratamiento).
RUN, ejecuta el procedimiento.
2.3.4.13.
Proc TTEST
Realiza la prueba de t de Student para probar la hipótesis que las medias de dos grupos de muestras (muestras no
pareadas) son iguales. Su enunciado es:
PROC TTEST;
CLASS TRAT;
VAR REND;
RUN;
(1)
(2)
(3)
(4)
(1)
(2)
(3)
(4)
Nos indica que el PROC (procedimiento) a emplear es TTEST.
CLASS TRAT, señala que la variable en estudio es TRAT (tratamiento).
VAR REND, indica que la variable de respuesta a ser empelada en la prueba de T es REND (rendimiento)
RUN, ejecuta el procedimiento.
2.3.4.14.
16
Proc UNIVARIATE
Ing. Ramiro Raúl OCHOA TORREZ
PROGRAMACIÓN EN EL SAS
Realiza la prueba de normalidad de datos, Su enunciado es:
(3)
PROC UNIVARIATE NORMAL PLOT;
(1)
VAR REND;
(2)
RUN;
(3)
Nos indica que el PROC (procedimiento) a emplear es UNIVARIATE, más la realización del grafico de
distribución normal de los datos (NORMAL PLOT).
VAR REND, indica que la variable de respuesta a ser empelada en la prueba de normalidad será REND
(rendimiento)
RUN, ejecuta el procedimiento.
2.4.
Interpretación de resultados
(1)
(2)
En el caso de los programas estadísticos, muchos de los mismos no presentan el valor tabular, como el de Ft, siendo
este valor remplazado por la Probabilidad (Pr), en cuyo caso la interpretación se lleva a cabo realizando una
comparación del valor Probabilidad y el nivel de significancia, siendo la toma de decisión de la siguiente forma:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Como por ejemplo si se tiene un valor de Probabilidad de 0.0380, asumimos como valor de significancia el 0.05 y el
0.01, teniendo:
0.01 (1%)
0.05 (5%)
0.038
0.038
Se puede apreciar que la conclusión se la realiza tomando en cuenta la superficie que ocupa el nivel de significancia,
comparado con la probabilidad encontrada, como en el ejemplo, en la figura de la izquierda se aprecia que la
superficie del 5% (0.05) es mayor al valor que ocupa la probabilidad encontrada (0.038), por lo que se rechaza la
hipótesis nula, esto aun nivel de significancia del 5%. En el caso de la figura de la izquierda, el valor de la superficie
encontrada (0.038), es mayor al valor de la significancia propuesta (0.01), por lo que se acepta la hipótesis nula.
Ing. Ramiro Raúl OCHOA TORREZ
17
3. ESTADÍSTICA BÁSICA
3.1.
Estadísticos básicos
Para el cálculo de los estadísticos más habituales se hace uso del procedimiento MEANS, con el cual se puede
calcular:
N
NMISS
MEAN
STD
MIN
MAX
RANGE
SUM
VAR
USS
CSS
STDERR
CV
SKEWNESS
KURTOSIS
T
PRT
SUMWGT
Número de observaciones sobre el cual se basan los cálculos
El número de valores perdidos
La media
La desviación estándar
El valor mínimo
El valor máximo
El rango
La suma
La varianza
La suma de cuadrados no corregida
La suma de cuadrados corregida
El error estándar de la media
El coeficiente de variación
Una medida de asimetría
Una medida de kurtosis
El valor de la t de Student para probar la hipótesis que la media de la población es cero
La probabilidad de un valor absoluto mayor para la t de Student anterior
Suma de los valores de WEIGTH
Ejercicio
Los datos corresponden a valores del extracto de malta de cebada Kindred cultivada en 14 localidades, en los
viveros de cebada del Valle del Mississippi durante 1948. La población para la cual se ha de hacer alguna inferencia,
puede considerarse como valores de extracto de malta de cebada Kindred cultivada durante 1948 en la región que
abarcan los viveros del Valle del Mississippi. (Steel & Torrie 1992)
77.7
75.4
76.0
76.0
76.9
76.0
74.6
73.9
74.7
77.4
76.5
76.6
74.2
77.3
Introduciendo los datos en el SAS tendremos:
OPTIONS NODATE NONUMBER;
DATA ESTBAS;
LABEL EXTRAC='EXTRACTO DE MALTA';
INPUT EXTRAC @@;
CARDS;
77.7
76.0
76.9
74.6
74.7
76.5
74.2
75.4
76.0
76.0
73.9
77.4
76.6
77.3
;
PROC MEANS N MEAN STD MIN MAX RANGE VAR USS STDERR CV;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Revisando las sentencias tenemos:
18
Ing. Ramiro Raúl OCHOA TORREZ
ESTADISTICA BASICA
(1)
(2)
(3)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA ESTBAS, le indicamos que genere un archivo con el nombre ESTBAS.
Con LABEL EXTRAC=’EXTRACTO DE MALTA’; le indicamos que nombre a la variable EXTRAC, con el
nombre de Extracto de Malta.
Con INPUT EXTRAC @@; le indicamos que ingrese la variable EXTRAC en forma de fila.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos los datos.
Como se menciono anteriormente con el PROC MEANS, le pedimos que nos presente: N (Número de
observaciones sobre el cual se basan los cálculos), MEAN (La media), STD (La desviación estándar),
MIN (El valor mínimo), MAX (El valor máximo), RANGE (El rango), SUM (La suma), VAR (La varianza), USS
(La suma de cuadrados no corregida), CSS (La suma de cuadrados corregida), STDERR (El error estándar
de la media), CV (El coeficiente de variación).
Con RUN; le señalamos que es ejecutable.
(4)
(5)
(6)
(7)
(8)
La salida de los resultados que nos presenta el SAS será:
The SAS System
The MEANS Procedure
Analysis Variable : EXTRAC EXTRACTO DE MALTA
(1)
(2)
(3)
(4)
(5)
(6)
(7)
N
Mean
Std Dev
Minimum
Maximum
Range
Variance
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
14
75.9428571
1.2270755
73.9000000
77.7000000
3.8000000
1.5057143
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Analysis Variable : EXTRAC EXTRACTO DE MALTA
(8)
(9)
(10)
Coeff of
USS
Std Error
Variation
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
80762.02
0.3279497
1.6157879
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
De la salida de resultados apreciamos que:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
N. El número de observaciones sobre el cual se basan los cálculos es 14
Mean. La Media es 75.9428571
Std Dev. El desvió estándar es 1.2270755
Minimun. El valor mínimo es 73.90
Maximun. El Valor máximo es 77.70
Range. El rango es 3.80
Variance. La varianza es 1.5057143
USS. La suma de cuadrados sin corregir es 80762.02
Std Error. El error estándar de la media es 0.3279497
Coeff of Variation. El coeficiente de variación es 1.6157879 %
3.2.
Distribución de frecuencias
Otra de las funciones que se emplean frecuentemente es la realización del cálculo de la distribución de frecuencias.
Ejercicio
Ing. Ramiro Raúl OCHOA TORREZ
19
Se tienen los datos de edades (en años cumplidos) de doce personas (Eduardo 2003).
16
15
17
14
16
17
16
15
14
16
18
15
Introduciendo los datos en el SAS tendremos:
OPTIONS NODATE NONUMBER;
DATA FREQ;
LABEL EDAD='EDAD DE PERSONAS';
INPUT EDAD @@;
CARDS;
16
15
17
14
16
16
15
14
16
18
;
PROC FREQ DATA=FREQ;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
17
15
(7)
(8)
Revisando las sentencias tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA FREQ, le indicamos que genere un archivo con el nombre FREQ.
Con LABEL EDAD=’EDAD DE PERSONAS’; le indicamos que el nombre de la variable EXTRAC, tendra
una etiqueta de Edad de Personas.
Con INPUT EDAD @@; le indicamos que ingrese la variable EDAD en forma de fila.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos los datos.
Con la opción PROC FREQ DATA=FREQ, indicamos que se va ha realizar una distribución de frecuencias
del archivo Freq.
Con RUN; le señalamos que es ejecutable.
Los resultados que obtendremos será:
The SAS System
The FREQ Procedure
EXTRACTO DE MALTA
(3)
(4)
(5)
Cumulative
Cumulative
EDAD
Frequency
Percent
Frequency
Percent
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
14
2
16.67
2
16.67
15
3
25.00
5
41.67
16
4
33.33
9
75.00
17
2
16.67
11
91.67
18
1
8.33
12
100.00
(1)
(2)
Los resultados presentados nos muestran 5 columnas, definiendo cada una de ellas tenemos:
(1)
(2)
(3)
EDAD. Los valores de la edad de las personas.
Frequency. La frecuencia o presencia de cada uno de los valores.
Percent. El porcentaje correspondiente a cada una de las frecuencias.
20
Ing. Ramiro Raúl OCHOA TORREZ
ESTADISTICA BASICA
(4)
(5)
Cumulative Frequency. La frecuencia acumulada.
Cumulative Percent. El porcentaje acumulado.
Ing. Ramiro Raúl OCHOA TORREZ
21
4. SUPUESTOS DEL ANÁLISIS DE VARIANZA
4.1.
Normalidad
Ejercicio
En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella, se tomaron cuatro macetas
por tratamiento. Obteniéndose los siguientes rendimientos (Padrón 1996):
Maceta
1
2
3
4
T1
101
93
93
96
T2
51
61
59
58
T3
83
68
72
75
T4
67
40
46
52
T5
29
45
51
42
En este caso no se considera los tratamientos, solo los datos:
101
93
93
96
51
61
59
58
83
68
72
75
67
40
46
52
29
45
51
42
Para la introducción se datos se puede realizar estos, tomando en cuenta si se va tratar de una manera columnar o
en filas, en el caso de filas se tendrá:
OPTIONS NODATE NONUMBER;
DATA NORMAL;
INPUT REND @@;
CARDS;
101
51
83
67
29
93
59
72
46
51
;
PROC UNIVARIATE NORMAL PLOT;
VAR REND;
RUN;
93
96
61
58
68
75
40
52
45
42
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Revisando las sentencias tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA NORMAL, le indicamos que genere un archivo con el nombre NORMAL.
Con INPUT REND @@; le indicamos que ingrese la variable REND (rendimiento) en forma de fila.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos los datos.
Con la opción PROC UNIVARIATE NORMAL PLOT, le pedimos que realice le procedimiento de normalidad
y el grafico de normalidad.
(7)
VAR REND, con esta sentencia se pide la realización del análisis de la variable REND (rendimiento).
(8)
Con RUN; le señalamos que ejecute los comandos mencionados.
Los resultados que obtendremos será:
22
Ing. Ramiro Raúl OCHOA TORREZ
SUPUESTOS DEL ANALISIS DE VARIANZA
RENDIMIENTO
The UNIVARIATE Procedure
Variable: REND
Moments
(1)
(2)
(3)
(4)
(5)
(6)
N
Mean
Std Deviation
Skewness
Uncorrected SS
Coeff Variation
20
64.1
20.7336492
0.34126669
90344
32.3457866
Sum Weights
Sum Observations
Variance
Kurtosis
Corrected SS
Std Error Mean
20
1282
429.884211
-0.8626058
8167.8
4.63618491
(7)
(8)
(9)
(10)
(11)
(12)
Basic Statistical Measures
Location
(13)
(14)
(15)
Mean
Median
Mode
Variability
64.10000
60.00000
51.00000
Std Deviation
Variance
Range
Interquartile Range
20.73365
429.88421
72.00000
30.50000
(16)
(17)
(18)
(19)
NOTE: The mode displayed is the smallest of 2 modes with a count of 2.
Tests for Location: Mu0=0
Test
-Statistic-
-----p Value------
Student's t
Sign
Signed Rank
t
M
S
Pr > |t|
Pr >= |M|
Pr >= |S|
13.82602
10
105
<.0001
<.0001
<.0001
(20)
Tests for Normality
Test
--Statistic---
-----p Value------
Shapiro-Wilk
Kolmogorov-Smirnov
Cramer-von Mises
Anderson-Darling
W
D
W-Sq
A-Sq
Pr
Pr
Pr
Pr
0.9538
0.120253
0.05233
0.357493
<
>
>
>
W
D
W-Sq
A-Sq
0.4285
>0.1500
>0.2500
>0.2500
(21)
(22)
(23)
(24)
Quantiles (Definition 5)
Quantile
Estimate
100% Max
99%
95%
90%
101.0
101.0
98.5
94.5
En el procedimiento se debe tomar en cuenta no incluir los tratamientos, porque en el análisis de los datos se toma a
todos de una manera general para determinar si la totalidad de los datos tienen o no una distribución normal, para
nuestro caso de los resultados del SAS rescatamos:
(1)
(2)
N. Total de datos 20
Mean. Media 64.1
Ing. Ramiro Raúl OCHOA TORREZ
23
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
Std Deviation. Desvió estándar 20.7336492
Skewness. Medida de asimetría 0.34126669
Uncorrected SS. Suma de cuadrados sin corregir 90344
Coeff Variation. Coeficiente de variación 32.34579
Sum Weights. Suma de valores ponderados 20
Sum Observations. Suma de la totalidad de observaciones 1282
Variance. Varianza 429.884211
Kurtosis. Medida de Kurtosis – 0.8626058
Corrected SS. Suma de cuadrados corregida 8167.8
Std Error Mean. Error estándar de la media 4.63618491
Más abajo nos presenta las medidas de estadística básica (Basic Statistical Measures):
(13)
(14)
(15)
(16)
(17)
(18)
(19)
Mean. Media 64.10000
Median. Mediana 60.00000
Mode. Moda 51.00000
Std Deviation. Desvió estándar 20.73365
Variance. Varianza 429.88421
Range. Rango 72.00000
Intercuartile Range. Rango intercuartil 30.50000
Seguidamente nos presenta la prueba de situación de que la media es igual a cero (Test for Location: MuO=0), esta
nos presenta en tres columnas Test (Prueba), Statistic (Estadístico) y p Value (Valor de la probabilidad):
(20)
Student’s t. Prueba de T con el valor de T 13.82602, el valor de la probabilidad (Pr > | t |) <.0001 nos indica
la probalidad de que la media sea igual a cero, siendo en este caso significativa.
Seguidamente nos presenta varias pruebas de normalidad (Test’s for Normality) al igual que el anterior caso nos
proporciona en tres columnas (Prueba, Estadistico y Valor de Probabilidad):
(21)
(22)
(23)
(24)
Shapiro-Wilk. Prueba de Shapiro-Wilk, valor de la prueba de la prueba W 0.9538, el valor de probabilidad
(Pr < W) 0.4285
Kolmogorov-Smirnov. Prueba de Kolmogorov-Smirnov, valor de la prueba D 0.120253, el valor de
probabilidad (Pr > D) >0.1500
Cramer-von Mises. Prueba de Cramer, valor de la prueba W-Sq 0.05233, el valor de la probabilidad (Pr >
W-Sq) >0.2500
Anderson-Darling. Prueba de Anderson y Darling, valor de la prueba A-Sq 0.357493, el valor de la
probabilidad (Pr > A.Sq) 0.2500
Más abajo nos presenta la definición de cuantiles, en dos columnas el quantil (Quantile) y valor estimado (Estimate).
Presenta la división de los datos en cuartas partes.
24
Ing. Ramiro Raúl OCHOA TORREZ
SUPUESTOS DEL ANALISIS DE VARIANZA
RENDIMIENTO
The UNIVARIATE Procedure
Variable: REND
Quantiles (Definition 5)
(26)
(25)
Quantile
75% Q3
50% Median
25% Q1
10%
5%
1%
0% Min
Estimate
79.0
60.0
48.5
41.0
34.5
29.0
29.0
Extreme Observations
----Lowest-------Highest--Value
Obs
Value
Obs
29
40
42
45
46
Stem
10
9
8
7
6
5
4
3
2
5
9
20
10
14
Leaf
1
336
3
25
178
11289
0256
83
93
93
96
101
3
6
11
16
1
#
1
3
1
2
3
5
4
9
1
----+----+----+----+
Multiply Stem.Leaf by 10**+1
Boxplot
|
|
|
+-----+
*--+--*
|
|
+-----+
|
|
RENDIMIENTO
The UNIVARIATE Procedure
Variable: REND
Normal Probability Plot
105+
+*+++
|
* * +*+++
|
*+++++
|
+*+*+
65+
++***
|
*+****
|
* *+*+*
|
+++++
25+
++*++
+----+----+----+----+----+----+----+----+----+----+
-2
-1
0
+1
+2
Continuando con la interpretación de los Cuarteles, tenemos:
Ing. Ramiro Raúl OCHOA TORREZ
25
(25)
(26)
25% Q1. El primer cuartil Q1, es el valor que tiene una cuarta parte, o 25%
75% Q3. Tercer cuartil Q3, es el valor que tiene tres terceras partes, o 75%
Más abajo nos presenta las observaciones extremas en dos columnas Lowest (valores bajos) y Highest (valores
altos), estos divididos a su vez en dos columnas donde tenemos el valor (Value) y el número de la observación
(Obs).
Seguidamente tenemos dos figuras, el primero de la izquierda la figura de ramas y hojas (Stem Leaf) y el de la
derecha la figura de cajas (Boxplot).
En la figura de ramas y hojas la interpretación se la hace multiplicando los valores por 10, o sea para el primer dato
Stem 10, Leaf 1 siendo el valor 101, este esta consignado como un solo dato. El siguiente valor de Stem 9 y Leaf
336, me indica que tengo 3 valores: 93, 93 y 96.
En el caso de la figura de cajas, que se basa en la media, los cuartiles y los valores extremos. La caja representa el
rango intercuartil que encierra el 50% de los valores y tiene la mediana dibujada dentro, el rango intercuartil tiene
como extremos el cuartil superior Q3 y el cuartil inferior Q1. Además se incluye la extensión de los datos mediante
segmentos que se extienden de la caja hacia el valor máximo y hacia el valor mínimo.
En vez de visualizar los valores individuales, se representa estadísticos básicos de la distribución: la mediana, el
centil 25, el centil 75 y los valores extremos de la distribución, para su interpretación se consideran dos categorías de
casos extremos, en función a cuanto se alejan con respecto del 50% central de la distribución. Aquellos casos con
valores alejados más de tres veces el rango intercuartil desde el extremo superior o inferior de la caja (casos más
extremos) y aquellos valores que están alejados entre 1.5 y tres veces de dicho rango. Los valores más pequeños y
más grandes que estén dentro de los limites primer cuartil –1.5 y tercer cuartil +1.5, veces el rango intercualtil (IQR)
constituyen los wiskers del grafico y aparecen representados mediante líneas horizontales dibujadas a ambos
extremos de la caja central. Para nuestro ejemplo de la posición de la mediana (Med = 60) podemos determinar la
tendencia central.
El ancho de la caja nos da una idea de la variabilidad de las observaciones. Si la mediana no esta en el centro de la
caja, podemos deducir que la distribución es asimétrica (si esta próxima al limite inferior de la caja, asimétrica
positiva y, si esta próxima al limite superior, asimétrica negativa). La mediana (Med) es 60, el Cuartil 1 (Q1) es 48.5,
el Cuartil 3 (Q3) es 79.
Posteriormente tenemos la figura de probabilidad normal (Normal Probability Plot), donde se aprecia la distribución
de los datos, observando si estos están dispersos o no.
Conclusión
De todos estos valores para determinar si los datos tienen una distribución normal son los de las pruebas de
normalidad las que se deben considerar como es el caso de Shapiro-Wilk (21), donde si el valor de probabilidad es
mayor a 0.05 se concluye que los datos presentan una distribución normal, si el valor de Pr < W es inferior a 0.05 se
concluye que los datos no tienen una distribución normal a un nivel de significancia del 5% (α = 0.05), si el valor de
Pr< W es inferior al 0.01 se concluirá que los datos no presentan una distribución normal al nivel de significancia del
1%. De similar forma se interpreta las otras pruebas (22), (23) y (24).
Para nuestro ejemplo, el valor de Pr < W es 0.4285 (superior a 0.05 y 0.01) por lo que se concluye que los valores
tienen una distribución normal.
4.2.
Homogeneidad de varianzas
26
Ing. Ramiro Raúl OCHOA TORREZ
SUPUESTOS DEL ANALISIS DE VARIANZA
Cuando se requiere realizar una prueba de homogeneidad de varianzas de mas de dos muestras, se puede hacer
uso de la prueba de Bartlett, que se emplea para determinar si hay o no homogeneidad de varianzas. Otro método
de determinación de la homogeneidad de varianzas es la prueba de F MÁXIMA.
Ejercicio
En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella, se tomaron cuatro macetas
por tratamiento. Obteniéndose los siguientes rendimientos (Padrón 1996):
Maceta
1
2
3
4
T1
101
93
93
96
T2
51
61
59
58
T3
83
68
72
75
T4
67
40
46
52
T5
29
45
51
42
La hipótesis a probar será:
Ho: σ2T1 = σ2T2 = σ2T3 = σ2T4 = σ2T5
Ha: σ2T1 ≠ σ2T2 ≠ σ2T3 ≠ σ2T4 ≠ σ2T5
4.2.1.
Prueba de Bartlett
Los datos que se deben colocar en el Editor de programas (PROGRAM EDITOR) del SAS con los comandos
respectivos será:
OPTIONS NODATE NONUMBER;
DATA BARTLETT;
INPUT TRAT $ REND @@;
CARDS;
T1
101
T2
51
T1
93
T2
61
T1
93
T2
59
T1
96
T2
58
;
PROC ANOVA;
TITLE'RENDIMIENTO';
CLASS TRAT;
MODEL REND=TRAT;
MEANS TRAT/HOVTEST=BARTLETT;
RUN;
T3
T3
T3
T3
83
68
72
75
T4
T4
T4
T4
67
40
46
52
T5
T5
T5
T5
29
45
51
42
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
La descripción de cada una de las sentencias empleada
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA BARTLETT, le indicamos que genere un archivo con el nombre BARTLETT.
Con INPUT TRAT $ REND @@; le indicamos que ingrese la variable TRAT $ (tratamiento variable
alfanumérica) y REND (rendimiento) en forma de fila.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos los datos.
Con la opción PROC ANOVA, le pedimos que realice le procedimiento de análisis de varianza.
CLASS TRAT, señalamos la variable en estudio.
MODEL REND=TRAT, agregamos el modelo con la variable de respuesta y la variable de estudio.
Ing. Ramiro Raúl OCHOA TORREZ
27
(9)
(10)
MEANS TRAT /HOVTEST=BARTLETT, sentencia que indica que de los promedios de los tratamientos
realice la prueba de Barltlett.
Con RUN; le señalamos que es ejecute.
Dándonos como resultado:
RENDIMIENTO
The ANOVA Procedure
Class Level Information
Class
TRAT
Levels
5
Values
T1 T2 T3 T4 T5
Number of observations
RENDIMIENTO
20
The ANOVA Procedure
Dependent Variable: REND
Source
Model
Error
Corrected Total
DF
4
15
19
R-Square
0.892015
Source
TRAT
Sum of
Squares
7285.800000
882.000000
8167.800000
Coeff Var
11.96274
DF
4
Mean Square
1821.450000
58.800000
Root MSE
7.668116
Anova SS
7285.800000
Level of
TRAT
T1
T2
T3
T4
T5
DF
4
N
4
4
4
4
4
Chi-Square
4.5524
RENDIMIENTO
Pr > F
<.0001
F Value
30.98
Pr > F
<.0001
REND Mean
64.10000
Mean Square
1821.450000
RENDIMIENTO
The ANOVA Procedure
Bartlett's Test for Homogeneity of REND Variance
Source
TRAT
F Value
30.98
(1)
Pr > ChiSq
0.3364
The ANOVA Procedure
-------------REND-----------Mean
Std Dev
95.7500000
3.7749172
57.2500000
4.3493295
74.5000000
6.3508530
51.2500000
11.5866302
41.7500000
9.2870878
La salida de resultados nos presenta varias etapas, la primera el análisis de varianza (más adelante analizaremos
más profundamente).
(1) Más abajo la prueba de Bartlett para la homogeneidad de varianzas (Bartlett’s Test for Homogeneity),
presentada en tres columnas Source (Fuentes de variación), DF (Grados de libertad), Chi-Square (Valor
calculado de Chi-cuadrado) y Pr > ChiSq (Valor de la probabilidad de Chi-cuadrado).
Conclusión
28
Ing. Ramiro Raúl OCHOA TORREZ
SUPUESTOS DEL ANALISIS DE VARIANZA
La prueba de Bartlett nos presenta una probabilidad (Pr > ChiSq) 0.3364 superior al valor de 0.05, por lo que
aceptamos la hipótesis nula de que las varianzas son homogéneas.
Si se quiere determinar de otra forma la homogeneidad o no de las varianzas, se debe determinar el valor de Chi–
cuadrado tabular para poder compararlo con el valor calculado, determinado este valor se aprecia que, el valor de
Chi–cuadrado calculado (X2C= 4.5524) es menor al valor de Chi–cuadrado tabular para 3 GL (X20.05 = 7.82), así que
se acepta la hipótesis nula de que las varianzas son homogéneas.
4.2.2.
Prueba de FMÁXIMA
Para la prueba de MÁXIMA se debe calcular los valores de suma de cuadrados (CSS) de los diferentes tratamientos,
para posteriormente poder realizar el cálculo de la MÁXIMA, mediante las siguientes sentencias y procedimientos:
OPTIONS NODATE NONUMBER;
DATA FMAXIMA;
INPUT TRAT $ REND;
CARDS;
T1
101
T1
93
T1
93
T1
96
T2
51
T2
61
T2
59
T2
58
T3
83
T3
68
T3
72
T3
75
T4
67
T4
40
T4
46
T4
52
T5
29
T5
45
T5
51
T5
42
;
PROC MEANS N MEAN CSS;
BY TRAT;
VAR REND;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Revisando las sentencias introducidas tenemos:
(1)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
(2)
Con DATA MÁXIMA, le indicamos que genere un archivo con el nombre MÁXIMA.
(3)
Con INPUT TRAT $ REND; le indicamos que ingrese la variable TRAT $ (tratamiento variable alfanumérica)
y REND (rendimiento) en forma de columnas.
(4)
CARDS; le señala que los datos vienen a continuación.
(5)
Seguidamente se ubican todos los datos.
(6)
Con la opción PROC MEANS N MEAN CSS, indicamos al SAS que nos presente el número total de valores
de cada tratamiento (N), el promedio de cada tratamiento (MEAN) y realice el calculo de la suma de
cuadrados corregida (CSS).
(7)
BY TRAT, indicamos que realice el análisis de la variable de estudio tratamiento (TRAT).
(8)
VAR REND, indicamos que la variable de respuesta a ser analizada será rendimiento (REND).
Ing. Ramiro Raúl OCHOA TORREZ
29
(9)
Con RUN; le señalamos que ejecute todos los comandos.
Dándonos como resultados en tres columnas para cada uno de los tramientos: el número de datos (N), el promedio
de cada tratamiento (Means) y la suma de cuadrados de cada tratamiento (Corrected CSS):
The SAS System
------------------------------------------- TRAT=T1 ----------------------------------------The MEANS Procedure
Analysis Variable : REND
N
Mean
Corrected SS
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
4
95.7500000
42.7500000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
------------------------------------------- TRAT=T2 ----------------------------------------Analysis Variable : REND
N
Mean
Corrected SS
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
4
57.2500000
56.7500000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
------------------------------------------- TRAT=T3 ----------------------------------------Analysis Variable : REND
N
Mean
Corrected SS
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
4
74.5000000
121.0000000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
------------------------------------------- TRAT=T4 ----------------------------------------Analysis Variable : REND
N
Mean
Corrected SS
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
4
51.2500000
402.7500000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
------------------------------------------- TRAT=T5 ----------------------------------------The MEANS Procedure
Analysis Variable : REND
N
Mean
Corrected SS
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
4
41.7500000
258.7500000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
De las sumas de cuadrados (Corrected CSS) de los diferentes tratamientos se seleccionan el valor más bajo y el
valor más alto, para determinar el valor de MÁXIMA, para luego comparar con el valor de F tabular, los valores
determinados para nuestro ejemplo serán:
FMAXIMA =
402.75
= 9.42
42.75
Conclusión
El valor de MÁXIMA tabular, para la prueba a un α=0.01, se la busca en la tabla de F, tomando el total de tratamientos
y (r – 1) grados de libertad, para nuestro ejemplo tendremos 5 y 3, luego será F0.01 (5 y 3) = 28.24; Como el valor de
MÁXIMA calculado es menor al valor de MÁXIMA tabular, se acepta la hipótesis nula de igualdad de varianzas.
30
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
5. DISEÑO COMPLETAMENTE AL AZAR (DCA)
5.1.
DCA con igual número de repeticiones
Ejercicio
Una persona que realiza plantaciones quiso comparar los efectos de cinco tratamientos de preparación en el sitio
sobre el crecimiento inicial en altura de plántulas de pino en el terreno. Dispuso de 25 plantines y aplico cada
tratamiento a 5 plantines escogidas al azar. Entonces, los plantines se plantaron a mano y, al final de 5 años, se
midió la altura de todos los pinos y se calculo la altura media de cada plantin. Las medidas de los plantines (en pies)
fueron como sigue (Freese 1970).
A
15
14
12
13
13
B
16
14
13
15
14
Modelo lineal aditivo
C
13
12
11
12
10
D
11
13
10
12
11
E
14
12
12
10
11
Yij = μ + τi + εij
Donde:
Yij
μ
τi
εij
= Una observación cualquiera
= Media poblacional
= Efecto del i – ésimo tratamiento
= Error experimental
Tratamiento
Repetición
i…
j…
t…
r…
1…
1…
5
5
Las Hipótesis a probar serán:
Ho: τ A = τB = τC = τD = τE
Ha: τ A ≠ τB ≠ τC ≠ τD ≠ τE
Introduciendo los datos a la el PROGRAM EDITOR del SAS tendremos:
Ing. Ramiro Raúl OCHOA TORREZ
31
OPTIONS NODATE NONUMBER;
DATA DCA;
INPUT TRAT $
ALTURA @@;
CARDS;
A
15
B
16
C
A
14
B
14
C
A
12
B
13
C
A
13
B
15
C
A
13
B
14
C
;
PROC ANOVA;
TITLE'DISEÑO COMPLETAMENTE AL AZAR';
CLASS TRAT;
MODEL ALTURA=TRAT;
MEANS TRAT/DUNCAN TUKEY;
MEANS TRAT/HOVTEST=BARTLETT;
RUN;
13
12
11
12
10
D
D
D
D
D
11
13
10
12
11
E
E
E
E
E
(1)
(2)
(3)
(4)
(5)
14
12
12
10
11
(6)
(7)
(8)
(9)
(10)
(11)
(12)
Revisando las sentencias introducidas tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DCA, le indicamos que genere un archivo con el nombre DCA.
Con INPUT TRAT $ ALTURA @@; le indicamos que ingrese la variable TRAT $ (tratamiento variable
alfanumérica) y ALTURA (rendimiento) en forma de filas.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos los datos.
PROC ANOVA; le indica que realice el calculo de análisis de varianza;
TITLE’DISEÑO COMPLETAMENTE AL AZAR’; le señala que el titulo para la salida de los resultados será
‘Diseño completamente al azar’,
CLASS TRAT; le señala cual variable es la de estudio o de clasificación para nuestro caso la variable
tratamiento.
MODEL ALTURA=TRAT; este punto esta en directa relación con el modelo lineal de un diseño
completamente al azar (Yij = μ + τi + εij) de donde se coloca como:
Yij = μ + τi + εij
Variable de respuesta = Tratamiento o variable de estudio
Altura = Tratamiento
(10)
(11)
(12)
No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del
modelo.
MEANS TRAT/DUNCAN TUKEY; con esta sentencia le solicitamos al SAS que los promedios de los
tratamientos los procese con las pruebas de Duncan y Tukey.
MEANS TRAT/HOVTEST=BARTLETT; con esta sentencia le solicitamos al SAS que realice la prueba de
homogeneidad de varianzas de Bartlett.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La salida de los resultados que el SAS nos presentara será:
32
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
DISEÑO COMPLETAMENTE AL AZAR
(1)
The ANOVA Procedure
Class Level Information
(4)
(5)
(6)
Class
Levels
Values
TRAT
5
A B C D E
Number of observations
25
Dependent Variable: ALTURA
(11)
Source
Model
Error
Corrected Total
(21)
Source
TRAT
(7)
DISEÑO COMPLETAMENTE AL AZAR
(8)
The ANOVA Procedure
(9)
(10)
(12)
(17)
R-Square
0.539228
(2)
(3)
(13)
(14)
(15)
Sum of
DF
Squares
Mean Square
F Value
4
34.64000000
8.66000000
5.85
20
29.60000000
1.48000000
24
64.24000000
(18)
(19)
(20)
Coeff Var
Root MSE
ALTURA Mean
9.716873
1.216553
12.52000
DF
4
Anova SS
34.64000000
Mean Square
8.66000000
F Value
5.85
(16)
Pr > F
0.0028
Pr > F
0.0028
De los resultados resaltamos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
(19)
(20)
(21)
Titulo del trabajo DISEÑO COMPLETAMENTE AL AZAR
El procedimiento empleado (Análisis of Variante Procedure)
Información de la variable analizada así como sus niveles (Class Level Information)
El nombre de la variable analizada (Class TRAT) en nuestro ejemplo TRAT representa tratamientos
Los niveles de la variable analizada (Levels) para nuestro caso 5
Los valores que toman los niveles de la variable analizada (Values) en nuestro ejemplo: A, B, C, D y E
El número de observaciones en el juego de datos (Number of observations in data set = 25)
El titulo del trabajo (DISEÑO COMPLETAMENTE AL AZAR)
El procedimiento empleado (Análisis of Variante Procedure)
La variable de respuesta analizada (Dependent Variable : ALTURA)
Las fuentes de variación (Source)
Grados de libertad (DF)
Suma de cuadrados (Sum of Squares)
Cuadrados medios (Mean Square)
F calculado (F value)
El valor de probabilidad mayor a F (Pr > F)
Coeficiente de determinación (R-Square)
Coeficiente de variación (CV)
Raíz cuadrada del Cuadrado medio del error (Root MSE)
Promedio general de la variable de respuesta (ALTURA Mean)
Valores correspondientes de FV, SC, CM, Fc y Prob de nuestra variable de estudio (TRAT)
La salida que presenta el SAS es en dos partes, una considerando al modelo (Model) como fuente de variación única
junto con el error experimental (Error) y total (Corrected total) y una segunda parte donde se presenta la variable de
clasificación o estudio (TRAT). En este caso se debe ordenar la salida del SAS, donde se reemplaza los valores de
Ing. Ramiro Raúl OCHOA TORREZ
33
la fuente de variación Model de la primera parte por los valores de nuestra(s) variable(s) de estudio(s) de la segunda
parte para nuestro ejemplo tratamiento, es decir:
Source
Model
Error
Corrected Total
DF
4
20
24
R-Square
0.539228
Source
TRAT
Sum of
Squares
34.64000000
29.60000000
64.24000000
Coeff Var
9.716873
Mean Square
8.66000000
1.48000000
Root MSE
1.216553
F Value
5.85
Pr > F
0.0028
ALTURA Mean
12.52000
DF
4
Anova SS
34.64000000
Mean Square
8.66000000
F Value
5.85
Pr > F
0.0028
DF
4
20
24
Sum of
Squares
34.64000000
29.60000000
64.24000000
Mean Square
8.66000000
1.48000000
F Value
5.85
Pr > F
0.0028
Quedando nuestros resultados:
Source
TRAT
Error
Corrected Total
R-Square
0.539228
Coeff Var
9.716873
Root MSE
1.216553
ALTURA Mean
12.52000
Mediante las reglas de decisión, decidimos si se tienen no significancia, significancia o alta significancia:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
TRAT
Error
Corrected Total
DF
4
20
24
R-Square
0.539228
Sum of
Squares
34.64000000
29.60000000
64.24000000
Coeff Var
9.716873
Mean Square
8.66000000
1.48000000
Root MSE
1.216553
F Value
5.85
Pr > F
0.0028**
ALTURA Mean
12.52000
Conclusión
La conclusión de los resultados como ya se indico en el acápite 2.4, se la realiza tomando en cuenta el valor de
probabilidad presentado, Pr > F = 0.028, siendo este valor inferior al 0.05 (5%) e inferior al 0.01 (1%) por lo que las
diferencias entre tratamientos serán altamente significativas (**).
Podemos indicar entonces que se tienen diferencias en el crecimiento en altura de las plántulas entre los
tratamientos de preparación de sustratos, siendo esta diferencia altamente significativa. El coeficiente de variación
de 9.716873% nos indica que los valores analizados son buenos, estando dentro del margen de aceptación.
La siguiente salida es de la prueba de Duncan:
34
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
DISEÑO COMPLETAMENTE AL AZAR
The ANOVA Procedure
Duncan's Multiple Range Test for ALTURA
(1)
(2)
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
(3)
Error Degrees of Freedom
20
(4)
Error Mean Square
1.48
(5)
Number of Means
Critical Range
5
1.771
(6)
(7)
Means with the same letter are not significantly different.
(8)
Duncan Grouping
A
A
B
A
B
B
C
C
C
C
C
2
1.605
3
1.685
4
1.735
Mean
14.4000
N
5
TRAT
B
13.4000
5
A
11.8000
5
E
11.6000
5
C
11.4000
5
D
(9)
Revisando los resultados tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Nombre de la prueba Duncan
Señala que controla el error de tipo I y no así la proporción de los experimentos (This test controls the type I
comparisonwise error rate, not the experimenwise error rate)
El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale
lo contrario.
Los grados de libertad del error (Error Degrees of Freedom = 20)
El cuadrado medio del error (Error Mean Square = 1.48)
Al ser una prueba de comparación múltiple presenta el número de medias (tratamientos) empleados en el
análisis (Number of Means), para nuestro caso al tener solo 5 tratamientos nos presentara: 2, 3, 4, 5.
El rango critico para cada promedio consistente en los valores referenciales de Duncan (Critical Range)
Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly
different), que nos indica que los promedios con la misma letra no son significativamente diferentes.
Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores
promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada
promedio.
Conclusión
Como conclusión de la prueba de Duncan, se aprecia que se formulan tres grupos representados por las letras de la
agrupación de Duncan (Duncan Grouping), de estos se observa que un primer grupo esta formado por los
tratamientos B y A, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los tratamientos A y
E, representados por la letra B y el tercer grupo formado por los tratamientos E, C y D representados por la letra C.
En conclusión indicamos que el tratamiento B posee un promedio de altura significativamente superior a los
tratamientos E, C y D, siendo este ultimo, el tratamiento D el que registra el promedio más bajo de altura de planta.
La siguiente salida es de la prueba de Tukey:
Ing. Ramiro Raúl OCHOA TORREZ
35
DISEÑO COMPLETAMENTE AL AZAR
The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for ALTURA
(1)
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher
Type II error rate than REGWQ.
Alpha
Error Degrees of Freedom
Error Mean Square
Critical Value of Studentized Range
Minimum Significant Difference
0.05
20
1.48
4.23186
2.3024
(2)
(3)
(4)
(5)
(6)
Means with the same letter are not significantly different.
Tukey Grouping
Mean
N
TRAT
A
A
A
14.4000
5
B
13.4000
5
A
11.8000
5
E
11.6000
5
C
11.4000
5
D
B
B
B
B
B
B
B
(7)
(8)
Analizando la salida de resultados tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Controla el error de tipo I y la proporción de los experimentos, pero tiene un alto valor del error de tipo II
(This test controls the type I experimentwise error rate, but generally has a higher type II error rate than
REWQ)
El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale
lo contrario.
Los grados de libertad del error (Error Degrees of Freedom = 20)
El cuadrado medio del error (Error Mean Square = 1.48)
El valor critico del rango studentizado (Critical Value of Studentized Range = 4.232)
La diferencia mínima significativa (Minimun Significant Difference = 2.3024)
Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly
different), que nos indica que los promedios con la misma letra no son significativamente diferentes.
Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores
promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada
promedio.
Conclusión
Como conclusión se aprecia que se formulan a diferencia de la prueba de Duncan dos grupos representados por las
letras de la agrupación de Tukey (Tukey Grouping), de estos se aprecia que un primer grupo esta formado por los
tratamientos B y A, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los tratamientos A,
E, C y D representados por la letra B. En síntesis concluimos que el tratamiento B posee un promedio de altura
significativamente superior a los tratamientos E, C y D, siendo este ultimo, el tratamiento D el que registra el
promedio más bajo de altura de planta. El tratamiento A queda en un punto intermedio entre los dos grupos.
36
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
La última salida es de la prueba de Bartlett, para la homogeneidad de varianzas:
DISEÑO COMPLETAMENTE AL AZAR
The ANOVA Procedure
Bartlett's Test for Homogeneity of ALTURA Variance
(1)
(2)
(3)
(4)
Source
DF
Chi-Square
Pr > ChiSq
TRAT
4
0.4447
0.9787
DISEÑO COMPLETAMENTE AL AZAR
The ANOVA Procedure
Level of
TRAT
N
A
B
C
D
E
5
5
5
5
5
------------ALTURA----------Mean
Std Dev
13.4000000
14.4000000
11.6000000
11.4000000
11.8000000
1.14017543
1.14017543
1.14017543
1.14017543
1.48323970
En la última parte se presenta la prueba de Bartlett para las varianza de los tratamientos:
(1)
(2)
(3)
(4)
Source, variable analizada en la prueba de Bartlett TRAT (Tratamiento)
DF, grados de libertad (DF = 4)
Chi – Square, valor de Chi – cuadrado (Chi – Square = 0.4447)
Pr > ChiSq, valor de la probabilidad mayor a ChiSq (Pr > ChiSq = 0.9787)
Conclusión
Apreciando el valor de probabilidad de la prueba de Bartlett este nos presenta una probabilidad Pr > ChiSq = 0.9787
superior al valor de 0.05, por lo tenemos no significancia, al no ser significativo aceptamos la hipótesis nula de que
las varianzas son homogéneas por lo que tenemos Ho: σ2A = σ2B = σ2C = σ2D = σ2E.
5.2.
DCA con diferente número de repeticiones
Ejercicio
Los datos siguientes se refieren a los pesos finales de corderos alimentados durante 90 días con una ración que
contenía 14 % de proteína. Los tratamientos fueron definidos de la siguiente manera (Rodríguez, 1991):
Tratamiento
1
2
3
4
T1
T2
T3
Ing. Ramiro Raúl OCHOA TORREZ
I
47
50
57
Corderos
Castrados
Enteros
Implantados con Sinovex S
Implantados con Estil Bestrol
II
52
54
53
III
56
54
IV
51
57
37
T4
62
Modelo lineal aditivo
Donde:
Yij
μ
τi
εij
Tratamiento
Repetición
65
74
50
Yij = μ + τi + εij
= Una observación cualquiera
= Media poblacional
= Efecto del i – ésimo tratamiento
= Error experimental
i…
j…
t…
r…
1…
1…
4
4
Las Hipótesis a probar serán:
Ho:
Ha:
τ1 = τ2 = τ3 = τ4
τ1 ≠ τ2 ≠ τ3 ≠ τ4
Introduciendo los datos al PROGRAM EDITOR del SAS, con el cuidado de que los tratamientos que no tienen igual
número de repeticiones, tenemos:
OPTIONS NODATE NONUMBER;
DATA DCA_UF;
LABEL PESFIN='PESO FINAL';
INPUT TRAT $ PESFIN;
CARDS;
T1
47
T2
50
T3
57
T4
62
T1
52
T2
54
T3
53
T4
65
T2
56
T3
54
T4
74
T1
51
T3
57
T4
50
;
PROC GLM;
CLASS TRAT;
MODEL PESFIN=TRAT;
MEANS TRAT/DUNCAN;
MEANS TRAT/TUKEY;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
Revisando las sentencias introducidas tenemos:
(1)
(2)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DCA_UF; le indicamos que genere un archivo con el nombre DCA_UF.
38
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Con LABEL PESFIN=’PESO FINAL’; le indicamos al SAS que la variable PESFIN, tendrá como etiqueta o
nombre ‘Peso final’.
Con INPUT TRAT $ PESFIN; le indicamos que ingrese las variables TRAT (tratamiento) y con el comando
$ indicamos que es del tipo alfanumérico y PESFIN como variable de respuesta en forma en forma
columnar.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se observan los datos ordenados en forma columnar.
PROC GLM; le indica que realice el calculo de análisis de varianza en base del modelo lineal general;
considerando que se tiene diferente número de repeticiones por tratamiento.
CLASS TRAT; le señala cual variable es la de estudio o de clasificación para nuestro caso la variable
tratamiento (TRAT).
MODEL PESFIN=TRAT; este punto esta en directa relación con el modelo lineal de un diseño
completamente al azar (Yij = μ + τi + εij) de donde se coloca como:
Yij = μ + τi + εij
Variable de respuesta = Tratamientos o Variables de estudio
Peso final = tratamientos
(10)
(11)
(12)
No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del
modelo.
MEANS TRAT/DUNCAN; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos
los procese con la pruebas de Duncan.
MEANS TRAT/DUNCAN; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos
los procese con la pruebas de Tukey.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La salida de los resultados que el SAS nos presentara será:
Ing. Ramiro Raúl OCHOA TORREZ
39
The SAS System
The GLM Procedure
(3)
Class
TRAT
(1)
Class Level Information
(4)
(5)
Levels
Values
4
T1 T2 T3 T4
Number of observations
(2)
14
(6)
The SAS System
The GLM Procedure
Dependent Variable: PESFIN
PESO FINAL
(8)
(18)
(9)
Source
Model
Error
Corrected Total
DF
3
10
13
(14)
R-Square
0.479640
(7)
(10)
Sum of
Squares
313.5476190
340.1666667
653.7142857
(15)
Coeff Var
10.44160
(11)
Mean Square
104.5158730
34.0166667
(16)
Root MSE
5.832381
(12)
(13)
F Value
3.07
Pr > F
0.0776
(17)
PESFIN Mean
55.85714
(19)
Source
TRAT
DF
3
Type I SS
313.5476190
Mean Square
104.5158730
F Value
3.07
Pr > F
0.0776
(20)
Source
TRAT
DF
3
Type III SS
313.5476190
Mean Square
104.5158730
F Value
3.07
Pr > F
0.0776
(1)
(2)
(3)
(4)
(5)
(6)
El procedimiento empleado (General Linear Models Procedure)
Información de la variable analizada así como sus niveles (Class Level Information)
El nombre de la variable analizada (Class TRAT) en nuestro ejemplo TRAT representa tratamientos
Los niveles de la variable analizada (Levels) para nuestro caso 4
Los valores que toman los niveles de la variable analizada (Values) en nuestro ejemplo: T1, T2, T3 y T4
El número de observaciones en el juego de datos (Number of observations in data set = 14)
Avanzando para apreciar la siguiente salida de resultados tendremos el análisis de varianza propiamente dicho:
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
La variable de respuesta analizada y su etiqueta (Dependent Variable: PESFIN PESO FINAL).
Las fuentes de variación (Source)
Grados de libertad (DF)
Suma de cuadrados (Sum of Squares)
Cuadrados medios (Mean Square)
F calculado (F value)
El valor de probabilidad mayor a F (Pr > F)
Coeficiente de determinación (R-Square)
Coeficiente de variación (CV)
Raíz cuadrada del Cuadrado medio del error (Root MSE)
Promedio general de la variable de respuesta (ALTURA Mean)
40
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
Como se puede apreciar, la salida del análisis de varianza, nos presenta en este caso tres partes:
(18)
(19)
(20)
La primera constituida por las fuentes de variación Model, Error y Corrected Total;
La segunda esta nuestra variable de clasificación o estudio TRAT, con la Suma de Cuadrados (SS) con el
tipo I,
La tercera también esta nuestra variable de clasificación o estudio TRAT, con la Suma de Cuadrados (SS)
con el tipo III,
Siendo los valores de las tres iguales, esto se debe a que tenemos una única variable de estudio que son
los tratamientos.
(18)
Source
Model
Error
Corrected Total
DF
3
10
13
R-Square
0.479640
Sum of
Squares
313.5476190
340.1666667
653.7142857
Coeff Var
10.44160
Mean Square
104.5158730
34.0166667
Root MSE
5.832381
F Value
3.07
Pr > F
0.0776
PESFIN Mean
55.85714
(19)
Source
TRAT
DF
3
Type I SS
313.5476190
Mean Square
104.5158730
F Value
3.07
Pr > F
0.0776
(20)
Source
TRAT
DF
3
Type III SS
313.5476190
Mean Square
104.5158730
F Value
3.07
Pr > F
0.0776
Al igual que en el anterior ejercicio debemos organizar la salida del SAS, para tener un ANVA, para tal caso
en la primera parte (18) los valores que corresponden a Model son remplazados por los valores de TRAT de
la segunda (19) o la tercera parte (20), siendo en este caso indistinto al ser los mismos valores, pero en
caso de que se tengan diferentes valores lo más recomendable es tomar los valores de la Suma de
Cuadrados con el Tipo III (20), por ser el más ajustado a los efectos del modelo. Quedando nuestro ANVA
de la siguiente forma:
Source
TRAT
Error
Corrected Total
R-Square
0.479640
Sum of
DF
Squares
Mean Square
F Value
3
313.5476190
104.5158730
3.07
10
340.1666667
34.0166667
13
653.7142857
Coeff Var
Root MSE
PESFIN Mean
10.44160
5.832381
55.85714
Pr > F
0.0776ns
Conclusión
La conclusión de los resultados como ya se indico anteriormente, se la realiza tomando en cuenta el valor de
probabilidad presentado, Pr > F = 0.0776, siendo este valor superior al 0.05 (5%) por lo que no se encuentran
diferencias entre tratamientos. Por lo que podemos afirmar que no se tienen diferencias en los pesos finales de
corderos alimentados durante 90 días con una ración que contenía 14 % de proteína.
La segunda parte de la salida del SAS de la ventana OUTPUT, nos presenta la prueba de medias de Duncan:
Ing. Ramiro Raúl OCHOA TORREZ
41
The SAS System
The GLM Procedure
Duncan's Multiple Range Test for PESFIN
(1)
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
10
Error Mean Square
34.01667
Harmonic Mean of Cell Sizes 3.428571
(2)
(3)
(4)
NOTE: Cell sizes are not equal.
Number of Means
Critical Range
2
9.93
3
10.37
4
10.63
Means with the same letter are not significantly different.
(8)
Duncan Grouping
Mean
N
TRAT
A
62.750
4
T4
A
B
A
55.250
4
T3
B
A
B
A
53.333
3
T2
B
B
50.000
3
T1
(5)
(6)
(7)
La siguiente salida del SAS será la prueba de Duncan:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Señala que controla el error de tipo I y no así la proporción de los experimentos (This test controls the type I
comparisonwise error rate, not the experimenwise error rate)
El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale
lo contrario.
Los grados de libertad del error (Error Degrees of Freedom = 10)
El cuadrado medio del error (Error Mean Square = 34.01667)
Al ser una prueba de comparación múltiple presenta el número de medias (tratamientos) empleados en el
análisis (Number of Means), para nuestro caso al tener solo 5 tratamientos nos presentara: 2, 3, 4 y 5.
El rango critico para cada promedio o valor referencial de Duncan (Critical Range)
Más abajo una indicación de que significa la salida de letras (Means with the same letter are not significantly
different), que nos indica que los promedios con la misma letra no son significativamente diferentes.
Por ultimo nos presenta el ordenamiento de los tratamientos según orden descenderte de los valores
promedios de cada tratamiento, y la agrupación según letras que le da la prueba de Duncan a cada
promedio.
Conclusión
Con relación a la prueba de Duncan, se aprecia que se formulan dos grupos representados por las letras de la
agrupación de Duncan (Duncan Grouping), de estos se aprecia que un primer grupo esta formado por los
tratamientos T4, T3 y T2, según Duncan Grouping dándoles la letra A, un segundo grupo formado por los
tratamientos T3, T2 y T1 representados por la letra B. Concluyendo que el tratamiento T4 posee un promedio de
peso final significativamente superior, siendo el tratamiento T1, el tratamiento el que registra el promedio más bajo
de peso final.
42
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
Más abajo nos presenta la prueba de medias de Tukey, siendo su salida:
The SAS System
The GLM Procedure
Tukey's Studentized Range (HSD) Test for PESFIN
NOTE: This test controls the Type I experimentwise error rate.
(1)
Alpha
0.05
Error Degrees of Freedom
10
Error Mean Square
34.01667
Critical Value of Studentized Range 4.32658
(2)
(3)
(4)
(5)
Comparisons significant at the 0.05 level are indicated by ***.
(6)
TRAT
Comparison
T4
- T3
T4
- T2
T4
- T1
T3
- T4
T3
- T2
T3
- T1
T2
- T4
T2
- T3
T2
- T1
T1
- T4
T1
- T3
T1
- T2
Difference
Between
Means
7.500
9.417
12.750
-7.500
1.917
5.250
-9.417
-1.917
3.333
-12.750
-5.250
-3.333
Simultaneous 95%
Confidence Limits
-5.117
20.117
-4.211
23.045
-0.878
26.378
-20.117
5.117
-11.711
15.545
-8.378
18.878
-23.045
4.211
-15.545
11.711
-11.236
17.902
-26.378
0.878
-18.878
8.378
-17.902
11.236
Siguiendo con la presentación de resultados del SAS, tenemos la prueba de Tukey:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Controla el error de tipo I y la proporción de los experimentos (This test controls the type I experimentwise
error rate)
El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale
lo contrario.
Los grados de libertad del error (Error Degrees of Freedom = 10)
El cuadrado medio del error (Error Mean Square = 34.01667)
El valor critico del rango studentizado (Critical Value of Studentized Range = 4.32658)
Más abajo una indicación de que significa la salida de Tukey (Comparisons significant at the 0.05 level are
indicated by ***), las comparaciones significantivas a un nivel del 0. 05 se indican por * * *.
Por ultimo nos presenta las diferentes comparaciones realizadas entre tratamientos (TRAT comparison), la
diferencia entre medias (Difference Between Means) y el limite de confianza simultaneo al 95%
(Simultaneous 95% Confidence Limit).
Conclusión
Se aprecia que ninguna de las comparaciones resulto significativa. Por lo que se concluye que ninguno de los
tratamientos presenta una superioridad en el peso final con relación a otro tratamiento.
Ing. Ramiro Raúl OCHOA TORREZ
43
La particularidad de la salida de los resultados de la prueba de Duncan se debe a que los datos no están
balanceados, es decir no están en la misma proporción.
5.3.
DCA con muestreo
Ejercicio
Los datos que se muestran a continuación se refieren a producciones parciales de forraje de maíz verde, tomadas
como muestras ante la imposibilidad de medir la producción total de cada unidad experimental. Los tratamientos
consisten en cantidades diferentes de estiércol incorporado al suelo como mejorador (Ibáñez, 2000).
Dosis
0 t / ha
4 t / ha
6 t / ha
2 t / ha
Modelo lineal aditivo
Donde:
Yijk
μ
τi
εij
εijk
Tratamiento
Repetición
Muestra
Muestra
1
2
3
1
2
3
1
2
3
1
2
3
I
24
23
21
25
28
30
56
65
58
24
19
23
II
19
21
24
31
24
32
62
60
59
21
22
24
III
18
19
22
28
32
36
61
60
64
23
18
22
IV
23
22
20
34
33
29
62
60
61
19
21
23
Yijk = μ + τi + εij + εijk
= Una observación cualquiera
= Media poblacional
= Efecto del i – ésimo tratamiento (dosis)
= Error experimental de la unidad experimental
= Error de la muestra (sub unidad experimental)
i…
j…
k…
t…
r…
m…
1…
1…
1…
4
4
3
Las hipótesis a probar serán:
Ho:
Ha:
0 t/ha = 2 t/ha = 4 t/ha = 6 t/ha
m1 = m2 = m3
0 t/ha ≠ 2 t/ha ≠ 4 t/ha ≠ 6 t/ha
m1 ≠ m2 ≠ m3
Introduciendo los datos al PROGRAM EDITOR del SAS tendremos:
44
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
OPTIONS NODATE NONUMBER;
DATA DCAMUE;
LABEL RENFOR='RENDIMIENTO DE FORRAJE';
INPUT DOSIS $ MUESTRA RENFOR @@;
CARDS;
0_t_ha 1
24
0_t_ha 1
0_t_ha 2
23
0_t_ha 2
0_t_ha 3
21
0_t_ha 3
4_t_ha 1
25
4_t_ha 1
4_t_ha 2
28
4_t_ha 2
4_t_ha 3
30
4_t_ha 3
6_t_ha 1
56
6_t_ha 1
6_t_ha 2
65
6_t_ha 2
6_t_ha 3
58
6_t_ha 3
2_t_ha 1
24
2_t_ha 1
2_t_ha 2
19
2_t_ha 2
2_t_ha 3
23
2_t_ha 3
0_t_ha 1
19
0_t_ha 1
0_t_ha 2
21
0_t_ha 2
0_t_ha 3
24
0_t_ha 3
4_t_ha 1
31
4_t_ha 1
4_t_ha 2
24
4_t_ha 2
4_t_ha 3
32
4_t_ha 3
6_t_ha 1
62
6_t_ha 1
6_t_ha 2
60
6_t_ha 2
6_t_ha 3
59
6_t_ha 3
2_t_ha 1
21
2_t_ha 1
2_t_ha 2
22
2_t_ha 2
2_t_ha 3
24
2_t_ha 3
;
PROC GLM;
CLASS DOSIS MUESTRA;
MODEL RENFOR=DOSIS MUESTRA(DOSIS);
TEST H=DOSIS E=MUESTRA(DOSIS);
LSMEANS DOSIS/PDIFF;
MEANS DOSIS/DUNNETT('0_t_ha');
RUN;
18
19
22
28
32
36
61
60
64
23
18
22
23
22
20
34
33
29
62
60
61
19
21
23
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
Revisando las sentencias introducidas tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DCAMUE; le indicamos que genere un archivo con el nombre DCAMUE.
Con LABEL RENFOR=’RENDIMIENTO DE FORRAJE’; le indicamos al SAS que la variable RENFOR,
tendrá como etiqueta o nombre ‘Rendimiento de forraje’.
Con INPUT DOSIS $ MUESTRA RENCOR @@; le indicamos que ingrese las variables dosis
(alfanumérico), muestra (numérico) y rendimiento de forraje en forma de filas.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos nuestros datos ordenados en forma de filas.
PROC GLM; le indica que realice el calculo de análisis de varianza se base en el modelo lineal general;
CLASS DOSIS MUESTRA; le señala cuales variables estarán en estudio o de clasificación para nuestro
caso las variables será dosis (DOSIS) y muestra (MUESTRA).
MODEL RENFOR=DOSIS MUESTRA(DOSIS); este punto esta en directa relación con el modelo lineal de
un diseño completamente al azar con muestreo (Yijk = μ + τi + εij + εijkj), donde se coloca como:
Yijk = μ + τi + εij + εijk
Variable de respuesta = Tratamientos o Variables de estudio
Ing. Ramiro Raúl OCHOA TORREZ
45
Producción de forraje verde = Dosis Muestra
No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del
modelo.
(10)
TEST H=DOSIS E=MUESTRA(DOSIS); con esta sentencia le indicamos al SAS que para el caso de la
variable Dosis, la obtención de su valor calculado de F (F value) tomara como cuadrado medio del error al
cuadrado medio de la Muestra(Dosis). Para esto se debe recordar la forma de obtención de los valores al
realizar el calculo del ANVA:
FV
τi Trat
εij EE
εijk EM
Total
GL
t–1
t(r – 1)
rt(m – 1)
trm – 1
SC
SCt
SCE
SCEM
SCT
CM
SCt / GLt
SCE / GLE
SCEM / GLEM
Fc
CMt / CME
CME / CMEM
Ft
f(GLt, GLE)
f(GLE, GLEM)
Podemos observar que para el calculo del Fc de los Tratamientos se lo obtiene dividiendo los Cuadrados
medios de los tratamientos entre los Cuadrados medios del Error Experimental (CMt / CME) y que para la
obtención del valor de Fc de Error experimental este se obtiene dividiendo los Cuadrados medios del error
experimental entre los Cuadrados medios del error de Muestreo (CME / CMEM).
En este caso para el análisis con el SAS se debe indicar cual valor va ha ser considerado como dividendo,
toda vez que el SAS considera un solo error experimental (en este caso el error de muestreo) como divisor
para todas las fuentes de variación en estudio.
(11)
(12)
(13)
LSMEANS DOSIS/PDIFF; con esta sentencia le solicitamos al SAS que realice la comparación de medias
de la prueba de DMS, realizando todas las comparaciones posibles entre las dosis (PDIFF)
MEANS TRAT/DUNNETT(‘0_t_ha); con esta sentencia le solicitamos al SAS que realice la prueba de
Dunnett, tomando como testigo al tratamiento 0_t_ha.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La salida de los resultados que el SAS nos presentara será:
The SAS System
The GLM Procedure
(3)
Class
DOSIS
MUESTRA
(1)
Class Level Information
(4)
(5)
Levels
Values
4
0_t_ha 2_t_ha 4_t_ha 6_t_ha
3
1 2 3
Number of observations
(2)
48
Donde apreciamos:
(1)
(2)
(3)
(4)
(5)
(6)
El procedimiento empleado General Linear Models Procedure (GLM)
Información de la variable analizada así como sus niveles (Class Level Information)
El nombre de las variables analizadas (Class DOSIS MUESTRA)
Los niveles de las variables analizada (Levels) Dosis 4 y Muestra 3
Los valores que toman los niveles de la variable analizada (Values), en este caso para DOSIS 0_t_ha,
2_t_ha, 4_t_ha y 6_t_ha; para MUESTRA 1, 2 y 3.
El número de observaciones en el juego de datos (Number of observations in data set = 48)
46
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
La siguiente salida es del ANVA:
The SAS System
The GLM Procedure
Dependent Variable: RENFOR
RENDIMIENTO DE FORRAJE
(3)
(13)
Source
Model
Error
Corrected Total
(1)
(2)
(4)
(9)
R-Square
0.979692
(5)
(6)
(7)
Sum of
DF
Squares
Mean Square
F Value
11
12506.56250
1136.96023
157.88
36
259.25000
7.20139
47
12765.81250
(10)
(11)
(12)
Coeff Var
Root MSE
RENFOR Mean
8.025541
2.683540
33.43750
(8)
Pr > F
<.0001
(14)
Source
DOSIS
MUESTRA(DOSIS)
DF
3
8
Type I SS
12469.89583
36.66667
Mean Square
4156.63194
4.58333
F Value
577.20
0.64
Pr > F
<.0001
0.7418
(15)
Source
DOSIS
MUESTRA(DOSIS)
DF
3
8
Type III SS
12469.89583
36.66667
Mean Square
4156.63194
4.58333
F Value
577.20
0.64
Pr > F
<.0001
0.7418
Tests of Hypotheses Using the Type III MS for MUESTRA(DOSIS) as an Error Term
(16)
Source
DOSIS
DF
3
Type III SS
12469.89583
Mean Square
4156.63194
F Value
906.90
Pr > F
<.0001
Avanzando para apreciar la siguiente salida de resultados tendremos el análisis de varianza propiamente dicho:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
El procedimiento empleado (GLM Procedure)
La variable de respuesta analizada con su respectiva etiqueta (Dependent Variable : RENFOR
RENDIMIENTO DE FORRAJE)
Las fuentes de variación (Source)
Grados de libertad (DF)
Suma de cuadrados (Sum of Squares)
Cuadrados medios (Mean Square)
F calculado (F value)
El valor de probabilidad mayor a F (Pr > F)
Coeficiente de determinación (R-Square)
Coeficiente de variación (CV)
Raíz cuadrada del Cuadrado medio del error (Root MSE)
Promedio general de la variable de respuesta (ALTURA Mean)
Como se puede apreciar, la salida del análisis de varianza, nos presenta en este caso cuatro partes:
(13)
(14)
(15)
La primera constituida por las fuentes de variación Model, Error y Corrected Total;
La segunda y tercera presenta nuestras variables de clasificación o estudio DOSIS y MUESTRA(DOSIS),
con la Suma de Cuadrados (SS) con el tipo I.
La tercera presenta nuestras variables de clasificación o estudio DOSIS y MUESTRA(DOSIS), con la Suma
de Cuadrados (SS) con el tipo III
Ing. Ramiro Raúl OCHOA TORREZ
47
(16)
La cuarta parte donde se menciona que para el calculo de los valores de F value (Fc) para DOSIS se tomo
como cuadrado medio del error a MUESTRA(DOSIS).
El ordenamiento se lo realizara en dos partes:
1° Parte
Estos valores deben ser organizados para su mejor interpretación, primeramente se considera el punto (16) donde
se considero como termino de Error a MUESTRA*DOSIS, los valores correspondientes a Dosis lo remplazamos en el
punto (15) correspondientes el análisis de nuestras fuentes de variación considerando el error de tipo III.
(15)
Source
DOSIS
MUESTRA(DOSIS)
DF
3
8
Type III SS
12469.89583
36.66667
Mean Square
4156.63194
4.58333
F Value
577.20
0.64
Pr > F
<.0001
0.7418
Tests of Hypotheses Using the Type III MS for MUESTRA(DOSIS) as an Error Term
(16)
Source
DOSIS
DF
3
Type III SS
12469.89583
Mean Square
4156.63194
F Value
906.90
Pr > F
<.0001
DF
3
8
Type III SS
12469.89583
36.66667
Mean Square
4156.63194
4.58333
F Value
906.90
0.64
Pr > F
<.0001
0.7418
Quedandonos (16’):
Source
(16’) DOSIS
MUESTRA(DOSIS)
2° Parte
Por ultimo los valores del punto (16’) correspondientes a las fuentes de variación DOSIS y MUESTRA(DOSIS), lo
remplazamos en el lugar donde se ubica el término Model del punto (13):
(13)
Source
Model
Error
Corrected Total
DF
11
36
47
R-Square
0.979692
Source
(16’) DOSIS
MUESTRA(DOSIS)
Coeff Var
8.025541
R-Square
0.979692
48
Mean Square
1136.96023
7.20139
Root MSE
2.683540
F Value
157.88
Pr > F
<.0001
RENFOR Mean
33.43750
DF
3
8
Type III SS
12469.89583
36.66667
Mean Square
4156.63194
4.58333
F Value
906.90
0.64
Pr > F
<.0001
0.7418
DF
3
8
36
47
Sum of
Squares
12469.89583
36.66667
259.25000
12765.81250
Mean Square
4156.63194
4.58333
7.20139
F Value
906.90
0.64
Pr > F
<.0001**
0.7418ns
Lo que nos dará como resultado final:
Source
DOSIS
MUESTRA(DOSIS)
Error
Corrected Total
Sum of
Squares
12506.56250
259.25000
12765.81250
Coeff Var
8.025541
Root MSE
2.683540
RENFOR Mean
33.43750
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
Ahora como paso final indicamos que la fuente de variación MUESTRA(DOSIS) corresponde al error experimental de
nuestro modelo línea y el termino que se indica como Error dentro del ANVA corresponde la Error de Muestreo,
finalmente comenzamos a indicar si es significativo, altamente o no significativo, mediante la regla de decisión:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Conclusión
La conclusión de los resultados como ya se indico, se la realiza tomando en cuenta el valor de probabilidad
presentada, en el caso de Dosis el valor de Pr > F = 0.0001, siendo este valor inferior al 0.05 e inferior al 0.01, por lo
que se acepta la Hipótesis alterna (Ha: 0 t/ha ≠ 2 t/ha ≠ 4 t/ha ≠ 6 t/ha), por lo que podemos indicar que entre dosis
se encuentran diferencias altamente significativas en el rendimiento de forraje. En el caso de las muestras su valor
de Pr > F es igual a 0.7418, valor superior a 0.05, por lo se acepta la Hipótesis nula (Ho: m1 = m2 = m3), por lo que
señalamos que entre muestras no se tienen diferencias estadísticas o significativas, siendo las muestras de cada
tratamiento similares en el rendimiento de forrajes.
Por otra parte se tuvo un coeficiente de variación de 8.025541%, debajo de 30%, por lo que los datos se encuentran
dentro de los márgenes de aceptabilidad, con un promedio general de 33.43750 de rendimiento de forraje. Otro valor
que se puede considerar para la interpretación de resultados es el R-Square (R2) que es el coeficiente de
determinación con un valor de 0.979692, valor que multiplicando por 100 será 97.9692%, es decir que el 97.9692%
del rendimiento de forraje esta influenciado por las dosis y las muestras, el restante porcentaje se algo más del 2%
se debe a otros factores.
Más abajo nos presenta la salida de la prueba de la DMS, de donde analizando su salida tenemos:
The SAS System
The GLM Procedure
Least Squares Means
DOSIS
0_t_ha
2_t_ha
4_t_ha
6_t_ha
RENFOR
LSMEAN
LSMEAN
Number
21.3333333
21.5833333
30.1666667
60.6666667
1
2
3
4
Least Squares Means for effect DOSIS
Pr > |t| for H0: LSMean(i)=LSMean(j)
(1)
Dependent Variable: RENFOR
i/j
1
2
3
4
1
0.8208
<.0001
<.0001
2
0.8208
<.0001
<.0001
3
<.0001
<.0001
4
<.0001
<.0001
<.0001
(2)
<.0001
(3)
NOTE: To ensure overall protection level, only probabilities associated with pre-planned
comparisons should be used.
Ing. Ramiro Raúl OCHOA TORREZ
49
La prueba de DMS del SAS se presenta en forma de matriz de probabilidades de cada par de comparcion donde:
(1)
(2)
(3)
Nos señala la hipótesis que se esta probando en función de la probabilidad: Pr > [T] for Ho: LSMeans (i) =
LSMeans (j) ; en este caso se indica que la Hipótesis nula a ser probada será: X i = X j .
Nos presenta en forma de matriz las probabilidades de las diferencias realizadas entre pares de
tratamientos.
Nos presenta una Nota (NOTE: To ensure overall protection level, only probabilities associated with preplanned comparisons should be used), que nos indica que: Para asegurar el nivel de protección global,
deben usarse sólo las probabilidades asociadas con comparaciones pre-planeadas.
Conclusión
Apreciando la matriz de prueba de DMS se observa que la comparación 1 y 2 (0_t_ha con 2_t_ha) no presenta
significancia alguna, siendo su valor de probabilidad mayor a 0.05 por lo que estadísticamente ambos promedios de
rendimiento de forraje son similares, en tanto que las comparaciones 1 y 3 (0_t_ha con 4_t_ha), 1 y 4 (0_t_ha y
6_t_ha), 2 y 3 (2_t_ha con 4_t_ha), 2 y 4 (2_t_ha y 6_t_ha), 3 y 4 (4_t_ha y 6_t_ha) son las que presentan
diferencias estadísticas altamente significativas por tener un valor de Pr > [T] inferior a 0.01, por lo que se puede
afirmar que los promedios de dichas comparaciones son diferentes.
Más abajo nos presenta la salida de la prueba de la Dunnett
The SAS System
The GLM Procedure
Dunnett's t Tests for RENFOR
(1)
NOTE: This test controls the Type I experimentwise error for comparisons of all treatments
against a control.
Alpha
0.05
Error Degrees of Freedom
36
Error Mean Square
7.201389
Critical Value of Dunnett's t
2.45216
Minimum Significant Difference
2.6865
(2)
(3)
(4)
(5)
(6)
Comparisons significant at the 0.05 level are indicated by ***.
(7)
DOSIS
Comparison
6_t_ha - 0_t_ha
4_t_ha - 0_t_ha
2_t_ha - 0_t_ha
Difference
Between
Means
39.333
8.833
0.250
Simultaneous 95%
Confidence Limits
36.647
42.020
6.147
11.520
-2.436
2.936
***
***
(8)
La salida de los resultados de la prueba de Dunnett son:
(1)
(2)
(3)
(4)
(5)
Una Nota que nos indica que: Controla el error de tipo I del experimento para las comparaciones de todos
los tratamientos contra el testigo (NOTE: This tests controls the type I experimentwise error for comparisons
of all treatments against a control)
El nivel de significancia (Alpha = 0.05), este valor es por defecto a menos que en el procedimiento se señale
lo contrario.
Los grados de libertad del error (Error Degrees of Freedom = 36)
El cuadrado medio del error (Error Mean Square = 7.201389)
El valor referencial de Dunnett (Critical Value of Dunnett’s = 2.45216)
50
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO COMPLETAMENTE AL AZAR
(6)
(7)
(8)
La diferencia mínima significativa (Minimun Significant Difference = 2.6865)
Más abajo una indicación de que significa la salida de Dunnett (Comparisons significant at the 0.05 level are
indicated by ***), que señala que las comparaciones significantivas a un nivel del 0. 05 se indican por * * *.
Por ultimo nos presenta las diferentes comparaciones realizadas entre tratamientos contra el testigo, la
diferencia entre promedios (Difference Between Means) y el limite de confianza simultaneo de 95%
(Simultaneous 95% Confidence Limits).
Conclusión
En el caso de la prueba de Dunnett, se aprecia primeramente que todas las comparaciones fueron realizadas contra
el testigo, todas las diferencias son favorables a los tratamientos 2_t_ha, 4_t_ha y 6_t_ha, y no así al testigo ya que
los valores encontrados son positivos (Difference Between Means). De estas comparaciones, la comparación
correspondiente a la dosis de 6_t:_ha, 0_t:_ha y 4_t_ha contra el testigo, presentan diferencias significativas entre
los valores de producciones parciales de forraje de maíz verde. En tanto que la comparación del tratamiento de
2_t_ha contra el testigo no presentan diferencias significativas entre los promedios de producciones parciales de
forraje de maíz verde siendo estadísticamente similares ambos tratamientos.
Por lo que los tratamientos de 6_t_ha y 4_t_ha de estiércol aplicados resultaron presentar mejores producciones de
forraje verde que el testigo y no asi el tratamiento de 2_t_ha, que su producción es superior al testigo en 0.250 pero
no suficiente para presentar una diferencia estadistica.
Ing. Ramiro Raúl OCHOA TORREZ
51
6. DISEÑO BLOQUE AL AZAR (DBA)
6.1.
DBA con igual número de repeticiones
Ejercicio
Se realizo un ensayo donde se evaluó seis variedades de fríjol, en el que se usaron 4 bloques por tratamiento
(variedad), teniéndose resultados del rendimiento en kg/parcela, siendo los siguientes (Padrón, 1996):
Variedades
Bayo
Gastelum
Mantequilla
Testigo
Cuyo
Zirate
Modelo lineal aditivo
Tratamiento
Bloque
II
46
38
32
20
42
25
III
38
31
28
26
46
22
IV
41
30
26
24
40
26
Yij = μ + βj + αi + εij
Donde:
Yij
μ
βj
αi
εij
I
42
32
25
18
35
36
= Una observación cualquiera
= Media poblacional
= Efecto del j – ésimo bloque
= Efecto del i – ésimo tratamiento (variedad)
= Error experimental
i…
j…
t…
r…
1…
1…
6
4
Las Hipótesis a probar serán:
Ho:
β1 = β2 =β3 = β4 = β5 = β6
α1 = α2 = α3 = α4 = α5 = α6
Bloques
Tratamientos
Ha:
β1 ≠ β2 ≠ β3 ≠ β4 ≠ β5 ≠ β6
α1 ≠ α2 ≠ α3 ≠ α4 ≠ α5 ≠ α6
Bloques
Tratamientos
Codificando los nombres de las variedades que son muy extensas (Tomar en cuenta que los nombres de las
variables no deben exceder 7 dígitos) para introducir como texto en el SAS tendremos:
Variedades
Bayo
Gastelum
Mantequilla
Testigo
Cuyo
Zirate
Introduciendo los datos en el SAS tendremos:
52
Código
Bayo
Gastelu
Mantequ
Testigo
Cuyo
Zirate
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO BLOQUES AL AZAR
OPTIONS NODATE NONUMBER;
DATA DBA;
INPUT BLOQ $ VAR $
REND @@;
CARDS;
I
Bayo
42
III
I
Gastelu 32
III
I
Mantequ 25
III
I
Testigo 18
III
I
Cuyo
35
III
I
Zirate 36
III
II
Bayo
46
IV
II
Gastelu 38
IV
II
Mantequ 32
IV
II
Testigo 20
IV
II
Cuyo
42
IV
II
Zirate 25
IV
;
PROC ANOVA;
TITLE'DISEÑO BLOQUES AL AZAR';
CLASS BLOQ VAR;
MODEL REND=BLOQ VAR;
MEANS VAR/TUKEY;
RUN;
Bayo
Gastelu
Mantequ
Testigo
Cuyo
Zirate
Bayo
Gastelu
Mantequ
Testigo
Cuyo
Zirate
38
31
28
26
46
22
41
30
26
24
40
26
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
Revisando las sentencias introducidas tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DBA; le indicamos que genere un archivo con el nombre DBA.
Con INPUT BLOQ $ VAR $ REND @@; le indicamos que ingrese las variables BLOQ (Bloque), VAR
(Variedades) y REND (Rendimiento) siendo las dos primeras del tipo alfanumérico y la ultima rendimiento
del tipo numérico; introducidas todas en forma de fila (@@).
CARDS; le señala que los datos vienen a continuación.
Seguidamente se observan los datos ordenados en forma de fila.
PROC ANOVA; le indica que realice el calculo de análisis de varianza en base del procedimiento ANOVA
(análisis de varianza).
Con la sentencia TITLE’DISEÑO BLOQUES AL AZAR’; indicamos que coloque el titulo a cada hoja de la
salida del OUTPUT.
CLASS BLOQ VAR; le señala las variable de estudio o de clasificación para nuestro caso son Bloque
(BLOQ) y Variedades (VAR).
MODEL REND=BLOQ VAR; este punto esta en directa relación con el modelo lineal de un diseño bloques la
azar (Yij = μ + βj + αi + εij) de donde se coloca como:
Yij = μ + βj + αi + εij
Variable de respuesta = Variables de estudio
Rendimiento = Bloques Variedades
(10)
(11)
No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del
modelo.
MEANS VAR/TUKEY; con esta sentencia le solicitamos al SAS que los promedios de los tratamientos los
procese con la pruebas de Tukey.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La salida de los resultados que el SAS nos presentara será:
Ing. Ramiro Raúl OCHOA TORREZ
53
Class
BLOQ
VAR
DISEÑO BLOQUES AL AZAR
The ANOVA Procedure
Class Level Information
Levels
Values
4
I II III IV
6
Bayo Cuyo Gastelu Mantequ Testigo Zirate
Number of observations
24
DISEÑO BLOQUES AL AZAR
The ANOVA Procedure
Dependent Variable: REND
Source
Model
Error
Corrected Total
(2)
DF
8
15
23
R-Square
0.816848
Source
BLOQ
VAR
(3)
(1)
Sum of
Squares
1278.333333
286.625000
1564.958333
Coeff Var
13.64257
DF
3
5
Mean Square
159.791667
19.108333
Root MSE
4.371308
Anova SS
27.125000
1251.208333
F Value
8.36
Pr > F
0.0002
REND Mean
32.04167
Mean Square
9.041667
250.241667
F Value
0.47
13.10
Pr > F
0.7055
<.0001
Interpretando la salida de la primera parte del OUTPUT, tenemos que organizar la salida, puesto que como se vio
anteriormente esta distribuida en dos partes:
(1)
La información de las variables en estudio con sus respectivos niveles BLOQ (Bloques, 4 niveles: I, II, III y
IV) VAR (Variedades 6 niveles: Bayo Cuyo Gastelu Mantequ Testigo Zirate). Más abajo la cantidad de
valores (Number of observations = 24).
La primera parte del análisis de varianza como ya se indico es el análisis en función del modelo (Model,
Error y Total).
La segunda parte es el análisis en función de las variables de estudio Bloque y Variedad (BLOQ Y VAR).
(2)
(3)
Como se indico anteriormente debemos agrupar ambas partes (2 y 3) para tener un análisis de varianza,
remplazando los valores del Model (2) por los valores de las variables de estudio (3):
Source
Model
Error
Corrected Total
(2)
DF
8
15
23
R-Square
0.816848
Source
BLOQ
VAR
(3)
Sum of
Squares
1278.333333
286.625000
1564.958333
Coeff Var
13.64257
DF
3
5
Mean Square
159.791667
19.108333
Root MSE
4.371308
Anova SS
27.125000
1251.208333
F Value
8.36
Pr > F
0.0002
REND Mean
32.04167
Mean Square
9.041667
250.241667
F Value
0.47
13.10
Pr > F
0.7055
<.0001
Lo que nos dará finalmente el ANVA de un DBA, y mediante la regla de decisión extractamos las conclusiones:
•
•
Si el valor de:
Si el valor de:
54
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO BLOQUES AL AZAR
•
Si el valor de:
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQ
VAR
Error
Corrected Total
DF
3
5
15
23
R-Square
0.816848
Squares
27.125000
1251.208333
286.625000
1564.958333
Coeff Var
13.64257
Mean Square
9.041667
250.241667
19.108333
Root MSE
4.371308
F Value
0.47
13.10
Pr > F
0.7055ns
<.0001**
REND Mean
32.04167
Conclusión
Como conclusión señalamos que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un valor de
probabilidad (Pr > F) mayor a 0.05 (0.7055), en el caso de las Variedades (VAR) el valor de probabilidad (Pr > F) es
inferior a 0.01 (0.0001) por lo que indicamos que se tienen diferencias altamente significativa entre variedades, por lo
que el rendimiento de las seis variedades de fríjol son significativamente diferentes. Teniéndose un Coeficiente de
Variación de 13.64257% y un promedio general de 32.04167 kg/ha.
La segunda parte corresponde a la prueba de Tukey:
DISEÑO BLOQUES AL AZAR
The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for REND
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher
Type II error rate than REGWQ.
Alpha
0.05
(1)
Error Degrees of Freedom
15
Error Mean Square
19.10833
Critical Value of Studentized Range 4.59474
Minimum Significant Difference
10.043
Means with the same letter are not significantly different.
Tukey Grouping
Mean
N
VAR
A
41.750
4
Bayo
A
A
40.750
4
Cuyo
A
B
A
32.750
4
Gastelu
B
B
C
27.750
4
Mantequ
B
C
B
C
27.250
4
Zirate
C
C
22.000
4
Testigo
(2)
La salida de la prueba de Tukey nos indica:
(1)
(2)
La información de los valores de significancia (Alpha), Grados de Libertad del Error, Cuadrado Medio del
Error, Valor referencial de Tukey y la Mínima Diferencia Significativa.
El agrupamiento según Tukey.
Conclusión
Como conclusión de la prueba de Tukey, observando las variedades en estudio estas forman 3 grupos (A, B y C) de
los cuales en el primer grupo las variedades Bayo y Cuyo son las que mayor promedio de rendimiento presentan,
Ing. Ramiro Raúl OCHOA TORREZ
55
siendo estas significativamente superiores al resto de las variedades, en tanto que la variedad Testigo es la que
menor valor de rendimiento obtuvo.
6.2.
DBA con muestreo
Ejercicio
Los datos siguientes expresan las producciones de forraje verde de triticale, obtenidas en un estudio donde se
probaron cuatro dosis diferentes de nitrógeno en una misma variedad (Rodríguez, 1991).
Dosis
Muestra
1
2
3
1
2
3
1
2
3
1
2
3
100 kg/ha
200 kg/ha
300 kg/ha
400 kg/ha
Modelo lineal aditivo:
I
24
23
21
25
28
30
56
65
58
24
19
23
II
19
21
24
31
24
32
62
60
59
21
22
24
III
18
19
22
28
32
36
61
60
64
23
18
22
IV
23
22
20
34
33
29
62
60
61
19
21
23
Yijk = μ + βj + αi + εij +θijk
Donde:
Yijk
μ
βj
αi
εij
θijk
= Una observación cualquiera
= Media poblacional
= Efecto del j – ésimo bloque
= Efecto del i – ésimo tratamiento
= Error experimental (de la unidad experimental)
= Error de muestreo (de la sub unidad experimental)
Tratamiento
Bloque
Muestra
i…
j…
k…
t…
r…
m…
1…
1…
1…
4
4
3
Las Hipótesis a probar serán:
Ho:
β1 = β2 =β3 = β4 = β5 = β6
α1 = α2 = α3 = α4 = α5 = α6
m1 = m2 = m3
Bloques
Tratamientos
Muestras
Ha:
β1 ≠ β2 ≠ β3 ≠ β4 ≠ β5 ≠ β6
α1 ≠ α2 ≠ α3 ≠ α4 ≠ α5 ≠ α6
m1 ≠ m2 ≠ m3
Bloques
Tratamientos
Muestras
Organizando los datos de manera columnar para introducir en el SAS, tenemos:
56
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO BLOQUES AL AZAR
I
I
I
I
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
II
II
II
II
100kg
100kg
100kg
200kg
200kg
200kg
300kg
300kg
300kg
400kg
400kg
400kg
100kg
100kg
100kg
200kg
200kg
200kg
300kg
300kg
300kg
400kg
400kg
400kg
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
24
23
21
25
28
30
56
65
58
24
19
23
19
21
24
31
24
32
62
60
59
21
22
24
III
III
III
III
III
III
III
III
III
III
III
III
IV
IV
IV
IV
IV
IV
IV
IV
IV
IV
IV
IV
100kg
100kg
100kg
200kg
200kg
200kg
300kg
300kg
300kg
400kg
400kg
400kg
100kg
100kg
100kg
200kg
200kg
200kg
300kg
300kg
300kg
400kg
400kg
400kg
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
M1
M2
M3
18
19
22
28
32
36
61
60
64
23
18
22
23
22
20
34
33
29
62
60
61
19
21
23
Como se observa se forman 4 columnas, la primera correspondiente a los Bloques (I, II, III y IV), la segunda a los
Tratamientos (100 kg, 200 kg, 300 kg y 400 kg), la tercera a las Muestras (M1, M2 Y M3) y la cuarta a la producción
de forraje o variable de respuesta.
Una vez organizado procedemos a introducir los datos en el PROGRAM EDITOR del SAS:
Ing. Ramiro Raúl OCHOA TORREZ
57
OPTIONS NODATE NONUMBER;
DATA DBA2;
INPUT BLOQ $ DOSIS $ MUES $ PROD;
CARDS;
I
100kg
M1
24
I
100kg
M2
23
I
100kg
M3
21
I
200kg
M1
25
I
200kg
M2
28
I
200kg
M3
30
I
300kg
M1
56
I
300kg
M2
65
I
300kg
M3
58
I
400kg
M1
24
I
400kg
M2
19
I
400kg
M3
23
II
100kg
M1
19
II
100kg
M2
21
II
100kg
M3
24
II
200kg
M1
31
II
200kg
M2
24
II
200kg
M3
32
II
300kg
M1
62
II
300kg
M2
60
II
300kg
M3
59
II
400kg
M1
21
II
400kg
M2
22
II
400kg
M3
24
III
100kg
M1
18
III
100kg
M2
19
III
100kg
M3
22
III
200kg
M1
28
III
200kg
M2
32
III
200kg
M3
36
III
300kg
M1
61
III
300kg
M2
60
III
300kg
M3
64
III
400kg
M1
23
III
400kg
M2
18
III
400kg
M3
22
IV
100kg
M1
23
IV
100kg
M2
22
IV
100kg
M3
20
IV
200kg
M1
34
IV
200kg
M2
33
IV
200kg
M3
29
IV
300kg
M1
62
IV
300kg
M2
60
IV
300kg
M3
61
IV
400kg
M1
19
IV
400kg
M2
21
IV
400kg
M3
23
;
PROC ANOVA;
CLASS BLOQ DOSIS MUES;
MODEL PROD=BLOQ DOSIS BLOQ*DOSIS;
TEST H=BLOQ DOSIS E=BLOQ*DOSIS;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
Revisando las sentencias introducidas tenemos:
58
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO BLOQUES AL AZAR
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DBA2; le indicamos que genere un archivo con el nombre DBA2.
Con INPUT BLOQ $ DOSIS $ MUES $ PROD; le indicamos que ingrese las variables Bloque, Dosis y
Muestra (alfanumérico) y Producción (numérico).
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos nuestros datos ordenados en forma de filas.
PROC ANOVA; le indica que realice el calculo de análisis de varianza.
CLASS BLOQ DOSIS MUES; le señala cuales variables estarán en estudio o de clasificación para nuestro
caso las variables son: Bloques, Dosis y Muestra.
MODEL PROD=BLOQ DOSIS BLOQ*DOSIS; este punto esta en directa relación con el modelo lineal de un
diseño bloques al azar con muestreo (Yijk = μ + βj + αi + εij + θijk), donde se coloca como:
Yijk = μ + βj + αi + εij + θijk
Variable de respuesta = Variables de estudio
Producción = Bloques Dosis Muestra
No se incorpora el promedio como tampoco el error, el programa sobrentiende estos componentes del
modelo.
(9)
TEST H=BLOQ DOSIS E=BLOQ*DOSIS; con esta sentencia le indicamos al SAS que para el caso de las
variables Bloques y Dosis, la obtención de su valor calculado de F (F value) tomara como cuadrado medio
del error al cuadrado medio del error experimental (BLOQ*DOSIS). Para esto se debe recordar la forma de
obtención de los valores al realizar el calculo del ANVA:
FV
βj Bloq
αi Trat
εij EE
θijk EM
Total
GL
r–1
t–1
(t – 1)(r – 1)
tr(m – 1)
trm – 1
SC
SCB
SCt
SCE
SCEM
SCT
CM
SCB / GL B
SCt / GLt
SCE / GLE
SCEM / GLEM
Fc
CMB / CME
CMt / CME
CME / CMEM
Ft
f(GLB, GLE)
f(GLt, GLE)
f(GLE, GLEM)
Podemos observar que para el calculo del Fc de los Bloques y Tratamientos se lo obtiene dividiendo los
Cuadrados medios de los bloques y tratamientos entre los Cuadrados medios del Error Experimental
(FcBloque = CMB / CME; FcTratamiento = CMt / CME); y que para la obtención del valor de Fc de Error
experimental este se obtiene diviendo los Cuadrados medios del error experimental entre los Cuadrados
medios del error de Muestreo (CME / CMEM).
En este caso para el análisis con el SAS se debe indicar cual valor va ha ser considerado como dividendo,
toda vez que el SAS considera un solo error experimental (el error de muestreo) como divisor para todas las
fuentes de variación en estudio.
(10)
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La salida de los resultados nos presentara, primeramente las variables estudiadas, posteriormente el análisis de
varianza de la cual hay que tener en cuenta cual fue el error para el calculo de los valores tabulares de bloque y
dosis (el error para ambos será la muestra)
Ing. Ramiro Raúl OCHOA TORREZ
59
DISEÑO BLOQUES AL AZAR CON MUESTREO
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQ
4
I II III IV
DOSIS
4
100kg 200kg 300kg 400kg
MUES
3
M1 M2 M3
Number of observations
48
DISEÑO BLOQUES AL AZAR CON MUESTREO
The ANOVA Procedure
Dependent Variable: PROD
Source
Model
Error
Corrected Total
(2)
DF
15
32
47
R-Square
0.982140
Source
BLOQ
DOSIS
BLOQ*DOSIS
(3)
(4)
(1)
Sum of
Squares
12537.81250
228.00000
12765.81250
Coeff Var
7.982862
DF
3
3
9
Mean Square
835.85417
7.12500
Root MSE
2.669270
Anova SS
5.72917
12469.89583
62.18750
F Value
117.31
Pr > F
<.0001
PROD Mean
33.43750
Mean Square
1.90972
4156.63194
6.90972
F Value
0.27
583.39
0.97
Pr > F
0.8479
<.0001
0.4824
Tests of Hypotheses Using the Anova MS for BLOQ*DOSIS as an Error Term
Source
BLOQ
DOSIS
(5)
DF
3
3
Anova SS
5.72917
12469.89583
Mean Square
1.90972
4156.63194
F Value
0.28
601.56
Pr > F
0.8411
<.0001
Revisando la salida del SAS tenemos:
(1)
La información de las variables en estudio con sus respectivos niveles BLOQ (Bloques, 4 niveles: I, II, III y
IV), DOSIS (Dosis 4 niveles: 100kg, 200kg, 300kg y 400kg) y MUES (Muestra 3: M1, M2 y M3), más abajo el
número de observaciones analizadas (Number of observations = 48).
(2)
La primera parte del análisis de varianza como ya se indico es el análisis en función del modelo (Model,
Error y Total).
(3)
La segunda parte es el análisis en función de las variables de estudio Bloque, Dosis y Bloque*Dosis (BLOQ,
DOSIS Y BLOQ*DOSIS), en este caso considera como cuadrado medio del error para el calculo de los
valores de Fc, al cuadrado medio del error de muestreo de la primera parte (1).
(4)
La tercera parte de la salida de resultados nos presenta un mensaje donde se nos indica que para las
pruebas de Hipótesis en el análisis de varianza, se esta empleando BLOQ*DOSIS como un término del
Error, para las variables BLOQ y DOSIS (Bloque y Dosis)
Para tener un ANVA de DBA con muestreo completo debemos organizar los resultados, esto lo realizaremos en dos
partes:
1° Parte
Los valores correspondientes a Bloque y Dosis donde se considera como termino de Error a BLOQ*DOSIS (5),
ambas variables con todos sus valores lo remplazamos en el punto (3):
(3)
Source
BLOQ
DOSIS
60
DF
3
3
Anova SS
5.72917
12469.89583
Mean Square
1.90972
4156.63194
F Value
0.27
583.39
Pr > F
0.8479
<.0001
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO BLOQUES AL AZAR
BLOQ*DOSIS
(4)
9
62.18750
6.90972
0.97
0.4824
Tests of Hypotheses Using the Anova MS for BLOQ*DOSIS as an Error Term
Source
BLOQ
DOSIS
(5)
DF
3
3
Anova SS
5.72917
12469.89583
Mean Square
1.90972
4156.63194
F Value
0.28
601.56
Pr > F
0.8411
<.0001
DF
3
3
9
Anova SS
5.72917
12469.89583
62.18750
Mean Square
1.90972
4156.63194
6.90972
F Value
0.28
601.56
0.97
Pr > F
0.8411
<.0001
0.4824
Quedandonos:
(3’)
Source
BLOQ
DOSIS
BLOQ*DOSIS
2° Parte
Por ultimo los valores del punto (3’) correspondientes a las fuentes de variación BLOQ, DOSIS y BLOQ*DOSIS, lo
remplazamos en el lugar donde se ubica el término Model del punto (2):
Source
Model
Error
Corrected Total
(2)
DF
15
32
47
R-Square
0.982140
(3’)
Source
BLOQ
DOSIS
BLOQ*DOSIS
Coeff Var
7.982862
Mean Square
835.85417
7.12500
Root MSE
2.669270
F Value
117.31
Pr > F
<.0001
PROD Mean
33.43750
DF
3
3
9
Anova SS
5.72917
12469.89583
62.18750
Mean Square
1.90972
4156.63194
6.90972
F Value
0.28
601.56
0.97
Pr > F
0.8411
<.0001
0.4824
DF
3
3
9
32
47
Sum of
Squares
5.72917
12469.89583
62.18750
228.00000
12765.81250
Mean Square
1.90972
4156.63194
6.90972
7.12500
F Value
0.28
601.56
0.97
Pr > F
0.8411
<.0001
0.4824
Lo que nos dará como resultado final:
Source
BLOQ
DOSIS
BLOQ*DOSIS
Error
Corrected Total
Squares
12537.81250
228.00000
12765.81250
Ahora como paso final indicamos que la interacción BLOQ*DOSIS corresponde al Error Experimental y los que se
indica como Error dentro del ANVA corresponde la Error de Muestreo, finalmente comenzamos a indicar si es
significativo, altamente o no significativo, mediante la regla de decisión:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Source
BLOQ
DOSIS
Error
Error Muestreo
Ing. Ramiro Raúl OCHOA TORREZ
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
DF
3
3
9
32
Sum of
Squares
5.72917
12469.89583
62.18750
228.00000
Mean Square
1.90972
4156.63194
6.90972
7.12500
F Value
0.28
601.56
0.97
Pr > F
0.8411ns
<.0001**
0.4824ns
61
Corrected Total
47
R-Square
0.982140
12765.81250
Coeff Var
7.982862
Root MSE
2.669270
PROD Mean
33.43750
Conclusión
Como conclusión podemos indicar que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un
valor de probabilidad (Pr > F) mayor a 0.05 (0.7055), en el caso de las Dosis (DOSIS) el valor de probabilidad (Pr >
F) es inferior a 0.01 (0.0001) por lo que indicamos que se tienen diferencias altamente significativa entre dosis, por lo
que la producción de forraje de triticale es diferente a la aplicación de las diferentes dosis de nitrógeno, en el caso de
las muestras no se tienen diferencias entre estas (Pr > 0.05). Teniéndose un Coeficiente de Variación de 7.982862%
y un promedio general de producción de forraje de 33.43750.
El caso de requerir la prueba de medias agregamos las respectivas sentencias en PROGRAM EDITOR, esta deberá
indicarse en la parte correspondiente al procedimiento:
OPTIONS NODATE NONUMBER;
DATA DBA2;
INPUT BLOQ $ DOSIS $ MUES $ PROD;
CARDS;
I
100kg
M1
24
I
100kg
M2
23
I
100kg
M3
21
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
IV
300kg
M1
62
IV
300kg
M2
60
IV
300kg
M3
61
IV
400kg
M1
19
IV
400kg
M2
21
IV
400kg
M3
23
;
PROC ANOVA;
CLASS BLOQ DOSIS MUES;
MODEL PROD=BLOQ DOSIS BLOQ*DOSIS;
TEST H=BLOQ DOSIS E=BLOQ*DOSIS;
MEANS DOSIS/DUNCAN E=BLOQ*DOSIS;
RUN;
(1)
Considerando el ajuste que se debe realizar tenemos:
(1)
MEANS DOSIS/DUNCAN E=BLOQ*DOSIS; realizara la prueba de medias de Duncan para los tratamientos
considerando como Cuadrado Medio del Error al valor de BLOQ*DOSIS. Corrección que debe ser realizada
como ya se indico anteriormente (la puntuaciones señalan los restantes valores).
La primera parte de los resultados será la misma que describimos anteriormente, agregándose la parte de la prueba
de Duncan:
62
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO BLOQUES AL AZAR
DISEÑO BLOQUES AL AZAR CON MUESTREO
The ANOVA Procedure
Duncan's Multiple Range Test for PROD
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
9
Error Mean Square
6.909722
Number of Means
Critical Range
2
2.428
3
2.534
4
2.595
Means with the same letter are not significantly different.
Duncan Grouping
A
Mean
60.667
N
12
DOSIS
300kg
B
30.167
12
200kg
C
C
C
21.583
12
400kg
21.333
12
100kg
Conclusión
Como conclusión de la prueba de medias de Duncan, se tiene una respuesta muy diferenciada entre las diferentes
dosis de nitrógeno, de las cuales señalamos que la aplicación de una dosis de 300 kg de nitrógeno al cultivo de
triticale produce una producción significativamente diferente (letra “A”) y superior al resto de las dosis con un
promedio de 60.667, seguido en promedio de producción la dosis de 200 kg de nitrógeno con 30.167 (letra “B”);
finalmente las dosis de 400 y 100 kg de nitrógeno resultan significativamente diferentes e inferiores con relación a las
anteriores dosis con producciones de 21.583 y 21.333 respectivamente (letra “C”).
Ing. Ramiro Raúl OCHOA TORREZ
63
7. DISEÑO CUADRADO LATINO (DCL)
7.1.
DCL con igual número de repeticiones
Ejercicio
En un experimento se probaron tres dietas (A, B, C) para medir su efecto en la producción de leche, las dietas se
aplicaron a 3 vacas en tres periodos de lactancia diferentes, los resultados son los siguientes (Rodríguez, 1991):
Periodos
I
II
III
Modelo lineal aditivo:
Donde:
Yijk
μ
βj
θk
αi
εijk
1
A
608
B
715
C
884
Vacas
2
B
885
C
1087
A
771
3
C
940
A
766
B
832
Yijk = μ + βj + θk + αi + εijk
= Una observación cualquiera
= Media poblacional
= Efecto del j – ésimo bloque
= Efecto de la k – ésima columna
= Efecto del i – ésimo tratamiento
= Error experimental
Tratamiento
Bloque
Columna
i…
j…
k…
t…
r…
c…
1…
1…
1…
3
3
3
Las hipótesis a probar serán:
Ho:
β1 = β2 =β3
θ1 = θ2 =θ3
α1 = α2 = α3
Bloques
Columnas
Tratamientos
Ho:
β1 ≠ β2 ≠ β3
θ1 ≠ θ2 ≠ θ3
α1 ≠ α2 ≠ α3
Bloques
Columnas
Tratamientos
Ordenando los datos para poder introducirlos al SAS tendremos:
64
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO CUADRADO LATINO
OPTIONS NODATE NONUMBER;
DATA DCL;
INPUT BLOQ $ COL
TRAT $ PROD;
CARDS;
I
1
A
608
II
1
B
715
III
1
C
884
I
2
B
885
II
2
C
1087
III
2
A
771
I
3
C
940
II
3
A
766
III
3
B
832
;
PROC ANOVA;
TITLE'DISEÑO CUADRADO LATINO';
CLASS BLOQ COL TRAT;
MODEL PROD=BLOQ COL TRAT;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
Revisando las sentencias introducidas tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DCL; le indicamos que genere un archivo con el nombre DCL.
Con INPUT BLOQ $ COL $ TRAT $ PROD; le indicamos que ingrese las variables Bloques y Tratamientos
(alfanuméricos), Columnas y Producción (numérico) en forma columnar.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos nuestros datos ordenados en forma de filas.
PROC ANOVA; le indica que realice el calculo de análisis de varianza.
TITLE’DISEÑO CUADRADO LATINO’; indica el nombre del titulo del trabajo.
CLASS BLOQ COL TRAT; le señala cuales variables estarán en estudio o de clasificación para nuestro
caso las variables son: Bloques, Columnas y Tratamientos.
MODEL PROD=BLOQ COL TRAT; este punto esta en directa relación con el modelo lineal de un diseño
bloques cuadrado latino (Yijk = μ + βj + θk + αi + εijk), donde se coloca como:
Yijk = μ + βj + θk + αi + εijk
Variable de respuesta = Variables de estudio
Producción de leche = Bloques Columna Tratamientos
Producción de leche = Periodos Vacas Dietas
No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del
modelo.
(10)
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
Los resultados que determinaremos serán:
Ing. Ramiro Raúl OCHOA TORREZ
65
DISEÑO CUADRADO LATINO
(1)
The ANOVA Procedure
Class Level Information
(2)
Class
BLOQ
COL
TRAT
Levels
3
3
3
Values
I II III
1 2 3
A B C
Number of observations
(3)
9
(4)
En un inicio nos presentara:
(1)
(2)
(3)
(4)
El titulo del trabajo DISEÑO CUADRADO LATINO
El procedimiento empleado ANOVA
La información sobre las variables de estudio y sus respectivos niveles (Bloque 3 niveles: I, II y III;
Columnas 3 niveles: 1, 2 y 3; y los Tratamientos 3 niveles: A, B y C)
El número de observaciones o datos analizados para nuestro ejercicio será 9.
Seguidamente la salida nos presenta el análisis de varianza para un diseño cuadrado latino:
DISEÑO CUADRADO LATINO
The ANOVA Procedure
Dependent Variable: PROD
Source
Model
Error
Corrected Total
(1)
DF
6
2
8
R-Square
0.984037
Source
BLOQ
COL
TRAT
(2)
Sum of
Squares
151683.3333
2460.6667
154144.0000
Coeff Var
4.215878
DF
2
2
2
Mean Square
25280.5556
1230.3333
Root MSE
35.07611
Anova SS
3078.00000
48764.66667
99840.66667
F Value
20.55
Pr > F
0.0471
PROD Mean
832.0000
Mean Square
1539.00000
24382.33333
49920.33333
F Value
1.25
19.82
40.57
Pr > F
0.4443
0.0480
0.0241
La salida del ANVA, en este caso nos presenta 2 partes:
(1)
(2)
La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación.
La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son: Bloques,
Columnas y Tratamientos.
Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2)
donde se tienen todas las fuentes de variación (Bloque, Columna y Tratamientos) en la primera parte (1) en vez de
los valores de Model:
(1)
Source
Model
66
DF
6
Sum of
Squares
151683.3333
Mean Square
25280.5556
F Value
20.55
Pr > F
0.0471
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO CUADRADO LATINO
Error
Corrected Total
2
8
R-Square
0.984037
Source
BLOQ
COL
TRAT
(2)
2460.6667
154144.0000
Coeff Var
4.215878
DF
2
2
2
1230.3333
Root MSE
35.07611
Anova SS
3078.00000
48764.66667
99840.66667
PROD Mean
832.0000
Mean Square
1539.00000
24382.33333
49920.33333
F Value
1.25
19.82
40.57
Pr > F
0.4443
0.0480
0.0241
F Value
1.25
19.82
40.57
Pr > F
0.4443ns
0.0480*
0.0241*
Dando como resultado final para su interpretación mediante las reglas de decisión:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQ
COL
TRAT
Error
Corrected Total
DF
2
2
2
2
8
R-Square
0.984037
Sum of
Squares
3078.00000
48764.66667
99840.66667
2460.6667
154144.0000
Coeff Var
4.215878
Mean Square
1539.00000
24382.33333
49920.33333
1230.3333
Root MSE
35.07611
PROD Mean
832.0000
Conclusión
Como conclusión podemos indicar que entre Bloques (BLOQ) no se tiene diferencias significativas por tenerse un
valor de probabilidad (Pr > F) mayor a 0.05 (0.4443), en tanto que entre Columnas y Tratamientos se tienen
diferencias significativas por que sus valores de probabilidad son inferiores a 0.05 (0.0480 y 0.0241 respectivamente)
de lo cual concluimos que las diferentes dietas (A, B y C) presentan diferencias significativas con relación a sus
valores de producción de leche. Teniéndose por otra parte un coeficiente de variación de 4.215878% mostrando un
alto grado de confiabilidad de los datos y un promedio general de 832.00 litros producción de leche
Por otra parte se puede agregar la sentencia MEANS BLOQ COL TRAT/DUNCAN; a todo el procedimiento y con
esto se pide la realización de la prueba de medias de Duncan para Bloques, Columna y Tratamientos.
Ing. Ramiro Raúl OCHOA TORREZ
67
OPTIONS NODATE NONUMBER;
DATA DCL;
INPUT BLOQ $ COL
TRAT $ PROD;
CARDS;
I
1
A
608
II
1
B
715
III
1
C
884
I
2
B
885
II
2
C
1087
III
2
A
771
I
3
C
940
II
3
A
766
III
3
B
832
;
PROC ANOVA;
TITLE'DISEÑO CUADRADO LATINO';
CLASS BLOQ COL TRAT;
MODEL PROD=BLOQ COL TRAT;
MEANS BLOQ COL TRAT/DUNCAN;
RUN;
(1)
Revisando la sentencia introducida tenemos:
(1)
MEANS BLOQ COL TRAT/DUNCAN; realizara la prueba de medias de Duncan para los bloques, columnas
y tratamientos.
Los resultados serán en este caso los mismos que se analizaron anteriormente, con la variante de que se
adicionaron en la parte final la prueba de Duncan para Bloques, Columna y Tratamientos.
La primera salida corresponde a los Bloques o Periodos:
DISEÑO CUADRADO LATINO
The ANOVA Procedure
Duncan's Multiple Range Test for PROD
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
2
Error Mean Square
1230.333
Number of Means
Critical Range
2
123.2
3
117.7
Means with the same letter are not significantly different.
Duncan Grouping
A
A
A
A
A
Mean
856.00
N
3
BLOQ
II
829.00
3
III
811.00
3
I
Conclusión
68
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO CUADRADO LATINO
En el caso de los bloques que vienen a ser en nuestro ejemplo los Periodos, se confirma la no significancia
encontrada en el análisis de varianza, observándose que ninguno de los bloques o periodos es estadísticamente
diferente (Presentan la misma letra “A”), pero si se tienen diferencias numéricas donde el Bloque II o Periodo II es el
que registra los valores más altos de producción de leche, siendo el Periodo I el que menor promedio de producción
de leche registro.
La siguiente salida corresponde a las Columnas o Vacas:
DISEÑO CUADRADO LATINO
The ANOVA Procedure
Duncan's Multiple Range Test for PROD
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
2
Error Mean Square
1230.333
Number of Means
Critical Range
2
123.2
3
117.7
Means with the same letter are not significantly different.
Duncan Grouping
A
A
B
A
B
B
Mean
914.33
N
3
COL
2
846.00
3
3
735.67
3
1
Conclusión
En el caso de las Columnas o Vacas se observa que estas son diferentes (Presentan diferentes letras A y B), donde
la Columna 2 o Vaca 2 es la es significativamente superior en producción de leche al resto de las Columnas o Vacas,
en tanto que la Columna 1 o Vaca 1 es la que presenta el menor promedio de producción de leche, siendo este valor
significativamente diferente al de las dos anteriores Columnas o Vacas.
Por ultimo se tiene la que corresponde a los Tratamientos:
Ing. Ramiro Raúl OCHOA TORREZ
69
DISEÑO CUADRADO LATINO
The ANOVA Procedure
Duncan's Multiple Range Test for PROD
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
2
Error Mean Square
1230.333
Number of Means
Critical Range
2
123.2
3
117.7
Means with the same letter are not significantly different.
Duncan Grouping
A
Mean
970.33
N
3
TRAT
C
B
B
B
810.67
3
B
715.00
3
A
Conclusión
En el caso de los tratamientos en estos se forman 2 grupos claramente diferenciados con letras diferentes (Duncan
Grouping), de estos el tratamiento C es el que mayor promedio de producción de leche obtuvo, siendo este valor
significativamente superior al de los tratamientos B y A, siendo que esos dos últimos tratamientos presentan
estadísticamente similares promedios de producción de leche.
También se puede pedir la realización de la prueba de Medias de Scheffe, esto se lo hace añadiendo el respectivo
comando a la parte de procedimiento:
OPTIONS NODATE NONUMBER;
DATA DCL;
INPUT BLOQ $ COL
TRAT $ PROD;
CARDS;
I
1
A
608
II
1
B
715
III
1
C
884
I
2
B
885
II
2
C
1087
III
2
A
771
I
3
C
940
II
3
A
766
III
3
B
832
;
PROC ANOVA;
TITLE'DISEÑO CUADRADO LATINO';
CLASS BLOQ COL TRAT;
MODEL PROD=BLOQ COL TRAT;
MEANS TRAT/SCHEFFE;
RUN;
(1)
Revisando la sentencia introducida tenemos:
(1)
MEANS TRAT/SCHEFFE; realizara la prueba de medias de Scheffe para tratamientos.
70
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑO CUADRADO LATINO
Los resultados del ANVA serán en este caso los mismos que se analizaron anteriormente, con la variante de que
solo se tendrá la prueba de medias para Tratamientos.
Siendo los resultados:
DISEÑO CUADRADO LATINO
The ANOVA Procedure
Scheffe's Test for PROD
NOTE: This test controls the Type I experimentwise error rate.
Alpha
0.05
Error Degrees of Freedom
2
Error Mean Square
1230.333
Critical Value of F
19.00000
Minimum Significant Difference
176.55
Means with the same letter are not significantly different.
Scheffe Grouping
Mean
N
TRAT
A
A
A
970.33
3
C
810.67
3
B
715.00
3
A
B
B
B
Conclusión
En el caso de los tratamientos en estos se forman 2 grupos claramente diferenciados con letras diferentes (Scheffe
Grouping), de estos el tratamiento C es el que mayor promedio de producción de leche obtuvo, siendo este valor
significativamente superior al de los tratamientos B y A, siendo que esos dos últimos tratamientos presentan
estadísticamente similares promedios de producción de leche.
En muchos de los ensayos solo es necesario realizar la prueba de medias (Duncan, Tukey, LSD, etc.) de los
tratamientos, para la realización de las pruebas de medias de los bloques y columnas, se deben tomar en cuenta que
el experimento es llevado a cabo en la parte agrícola o en la parte pecuaria.
En el caso anterior si se lleva a cabo en la parte pecuaria las fuentes de variación bloques y columnas pueden tener
otra significación, como se vio en el ejercicio anterior en el cual las columnas representan las vacas y los bloques los
periodos.
En el caso de un ensayo en la parte agrícola, se deben considerar que representa los bloques o columnas, o si se
tienen dos fuentes de variación en el terreno.
Ing. Ramiro Raúl OCHOA TORREZ
71
8. COMPARACIONES ORTOGONALES
8.1.
Comparaciones ortogonales de experimentos simples
Ejercicio
Los siguientes datos provenientes de rendimiento de kg/ha, corresponden a el cultivo de quinua, bajo la
incorporación de abonos orgánicos y fertilizantes químicos, el ensayo fue realizado bajo un diseño bloques al azar
con cuatro bloques (IBTA, 1988)
N°
T1 =
T2 =
T3 =
T4 =
T5 =
Bloque
I
II
III
IV
T1
233.20
182.57
231.97
340.23
Tratamiento
Testigo
4 t MO
8 t MO
12 t MO
46 – 00 – 00 (Urea)
T2
243.12
314.76
253.56
478.64
T3
300.71
209.06
375.17
476.44
T4
549.08
441.61
408.49
658.33
T5
562.36
506.91
554.16
520.40
En el caso de las comparaciones ortogonales, se debe considerar que los tratamientos puedan agruparse,
planeando comparaciones independientes con los totales de cada tratamiento. Para esto recurriremos al uso de
coeficientes para su desarrollo, respetando las reglas definidas para estos, donde el número de comparaciones
independientes se obtiene con la formula (t – 1), donde t es el numero de tratamientos. Siendo este valor igual al
número de GL de los tratamientos.
Los tratamientos deben estar hábilmente agrupados y seleccionados, cuando son independientes reciben el nombre
de ortogonales. La prueba es utilizada para comparar grupos de tratamientos y entre tratamientos.
La suma de los coeficientes debe ser igual a 0 (cero), y la suma de los productos de los coeficientes
correspondientes a las comparaciones cualesquiera debe ser necesariamente igual a cero.
Para nuestro ejercicio tenemos cinco tratamientos, y por tanto el número de comparaciones que tenemos será:
#C = t – 1
#C = 5 – 1
#C = 4 (4 comparaciones)
Formulando las comparaciones mediante los coeficientes y respetando las reglas para su formulacion tenemos:
# Comparación
C1
C2
C3
C4
72
Testigo
T1
4
0
0
0
4 t MO
T2
–1
1
2
0
8 t MO
T3
–1
1
–1
1
12 t MO
T4
–1
1
–1
–1
Urea
T5
–1
–3
0
0
Σ
0
0
0
0
Ing. Ramiro Raúl OCHOA TORREZ
COMPARACIONES ORTOGONALES
Este paso es importante para la realización de Comparaciones Ortogonales en el SAS, porque son los coeficientes
los que deben introducirse en el PROGRAM EDITOR del SAS, la opción de contrastes ortogonales solo esta
disponible cuando el procedimiento PROC es GLM:
OPTIONS NODATE NONUMBER;
DATA DBA;
INPUT BLOQ $ TRAT $ REND;
CARDS;
I
T1
233.2
II
T1
182.57
III
T1
231.97
IV
T1
340.23
I
T2
243.12
II
T2
314.76
III
T2
253.56
IV
T2
478.64
I
T3
300.71
II
T3
209.06
III
T3
375.17
IV
T3
476.44
I
T4
549.08
II
T4
441.61
III
T4
408.49
IV
T4
658.33
I
T5
562.36
II
T5
506.91
III
T5
554.16
IV
T5
520.4
;
PROC GLM;
TITLE'DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES';
CLASS BLOQ TRAT;
MODEL REND=BLOQ TRAT/SS3;
RUN;
*/TYPE-ORDER----------------------T1- T2- T3- T4- T5 */
CONTRAST'T1 VS T2 T3 T4 T5' TRAT 4
-1 -1 -1 -1;
CONTRAST'T1 VS T2 T3 T4 T5' TRAT 4
-1 -1 -1 -1;
CONTRAST'T2 T3 T4 VS T5'
TRAT 0
1
1
1
-3;
CONTRAST'T2 VS T3 T4'
TRAT 0
2
-1 -1 0;
CONTRAST'T3 VS T4'
TRAT 0
0
1
-1 0;
RUN;
(1)
(2)
(2)
(3)
(4)
(5)
(6)
Revisando la sentencia introducida tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
La primera parte es la que corresponde en este caso para un diseño bloques al azar, considerando bloques
y tratamientos en el modelo. Revisando tenemos a TRAT como variable de estudio.
CONTRAST’T1 VS T2 T3 T4 T5’ TRAT 4 –1 –1 –1 –1; Primer contraste ortogonal, considerando la variable
de estudio tratamientos con los coeficientes de la respectiva comparación.
CONTRAST’T2 VS T3 T4 T5’ TRAT 0 1 1 1 –3; Segundo contraste ortogonal, considerando la variable de
estudio tratamientos con los coeficientes de la respectiva comparación.
CONTRAST’T2 VS T3 T4’ TRAT 0 2 –1 –1 0; Tercer contraste ortogonal, considerando la variable de
estudio tratamientos con los coeficientes de la respectiva comparación.
CONTRAST’T3 VS T4’ TRAT 0 0 1 –1 0; Cuarto contraste ortogonal, considerando la variable de estudio
tratamientos con los coeficientes de la respectiva comparación.
RUN; ejecuta los comandos.
Ing. Ramiro Raúl OCHOA TORREZ
73
Lo que nos dará los siguientes resultados:
DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES
The GLM Procedure
Class Level Information
Class
Levels
Values
BLOQ
4
I II III IV
TRAT
5
T1 T2 T3 T4 T5
Number of observations
20
DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES
The GLM Procedure
Dependent Variable: REND
Sum of
Source
DF
Squares
Mean Square
F Value
Model
7
333112.8945
47587.5564
11.06
Error
12
51620.9708
4301.7476
Corrected Total
19
384733.8653
R-Square
0.865827
Source
BLOQ
TRAT
Coeff Var
16.72992
DF
3
4
Root MSE
65.58771
Type III SS
76221.3290
256891.5655
Pr > F
0.0002
REND Mean
392.0385
Mean Square
25407.1097
64222.8914
F Value
5.91
14.93
Pr > F
0.0103
0.0001
La primera parte corresponderá al análisis de varianza de un diseño bloques al azar, el cual lo organizamos como ya
mencionamos anteriormente.
La segunda parte corresponde al análisis de varianza de las comparaciones ortogonales:
DISEÑO BLOQUES AL AZAR-COMPARACIONES ORTOGONALES
The GLM Procedure
Dependent Variable: REND
Contrast
(1)
(2)
(3)
(4)
T1
T2
T2
T3
VS
T3
VS
VS
T2 T3 T4 T5
T4 VS T5
T3 T4
T4
DF
Contrast SS
Mean Square
F Value
Pr > F
1
1
1
1
105191.7106
61814.0656
29311.1672
60574.6221
105191.7106
61814.0656
29311.1672
60574.6221
24.45
14.37
6.81
14.08
0.0003
0.0026
0.0228
0.0028
La salida del ANVA de comparaciones ortogonales los interpretamos de la siguiente forma:
(1)
Como fuente de variación toma a la primera comparación T1 VS T2 T3 T4 T5.
(2)
Como fuente de variación toma a la segunda comparación T2 VS T3 T4 T5.
(3)
Como fuente de variación toma a la tercera comparación T2 VS T3 T4.
(4)
Como fuente de variación toma a la cuarta comparación T3 VS T4.
En función de las reglas de decisión similar a las del ANVA interpretamos y realizamos las conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
74
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Ing. Ramiro Raúl OCHOA TORREZ
COMPARACIONES ORTOGONALES
Dándonos finalmente:
T1
T2
T2
T3
VS
T3
VS
VS
T2 T3 T4 T5
T4 VS T5
T3 T4
T4
1
1
1
1
105191.7106
61814.0656
29311.1672
60574.6221
105191.7106
61814.0656
29311.1672
60574.6221
24.45
14.37
6.81
14.08
0.0003**
0.0026**
0.0228*
0.0028**
Conclusión
Como conclusión podemos indicar que entre la comparación del Testigo (T1) con el resto de los tratamientos con
aplicación (T2, T3, T4 y T5) existen diferencias altamente significativas en el rendimiento del cultivo de quinua, en el
caso de la segunda comparación tenemos que los abonos orgánicos (T2, T3 y T4) comparada con la Urea (T5)
presentan diferencias altamente significativas en el rendimiento de quinua, la comparación del tratamiento 2 (4 t MO)
con los tratamientos 3 y 4 (8 y 12 t MO) presentan significancia (Pr < 0.05) en los valores del rendimiento de quinua;
por ultimo en la comparación del tratamiento 3 (8 t MO) con el tratamiento 4 (12 t MO) presentan diferencias
altamente significativas (Pr < 0.01) en el rendimiento de quinua.
Ing. Ramiro Raúl OCHOA TORREZ
75
9. EXPERIMENTOS FACTORIALES
9.1.
DCA con arreglo factorial
9.1.1. DCA con arreglo factorial – dos factores
Ejercicio
En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta de
Kochia scoparia, bajo dos condiciones de cultivo y de cuatro alturas de corte (Rodríguez 1991).
Condiciones Altura de Corte (cm)
25
Invierno
50
75
100
25
Verano
50
75
100
Modelo lineal aditivo:
I
14.9
17.5
20.7
22.5
16.8
19.9
23.5
25.8
II
14.3
16.6
19.6
21.9
17.3
20.3
23.2
26.4
III
15.0
17.2
21.4
22.6
16.4
21.4
23.0
25.9
IV
14.3
16.3
20.3
21.8
17.1
20.8
24.1
27.1
Yijk = µ + αi + βj + αβij + εijk
Donde:
Yijk
µ
αi
βj
αβij
εijk
= Una observación
= Media poblacional
= Efecto del i – esimo nivel del factor A (Condiciones)
= Efecto del j – esimo nivel del factor B (Altura de corte)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Condicion x Altura de corte)
= Error experimental
A
B
Repetición
i…
j…
k…
a…
b…
r…
1…
1…
1…
2
4
4
Las hipótesis a probar serán:
Ho:
Invierno = Verano
(Condiciones)
25 = 50 = 75 = 100
(Altura de corte cm)
Invierno – 25 = … = Verano – 100
Ha:
Invierno ≠ Verano
(Condiciones)
25 ≠ 50 ≠ 75 ≠ 100
(Altura de corte cm)
Invierno – 25 ≠ … ≠ Verano – 100
Introduciendo los datos en el SAS tendremos:
76
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
OPTIONS NODATE NONUMBER;
DATA DCAFAC1;
INPUT CONDICION $
ALTURA FIBRA;
CARDS;
INVIERNO
25
14.9
INVIERNO
50
17.5
INVIERNO
75
20.7
INVIERNO
100
22.5
VERANO
25
16.8
VERANO
50
19.9
VERANO
75
23.5
VERANO
100
25.8
INVIERNO
25
14.3
INVIERNO
50
16.6
INVIERNO
75
19.6
INVIERNO
100
21.9
VERANO
25
17.3
VERANO
50
20.3
VERANO
75
23.2
VERANO
100
26.4
INVIERNO
25
15.0
INVIERNO
50
17.2
INVIERNO
75
21.4
INVIERNO
100
22.6
VERANO
25
16.4
VERANO
50
21.4
VERANO
75
23.0
VERANO
100
25.9
INVIERNO
25
14.3
INVIERNO
50
16.3
INVIERNO
75
20.3
INVIERNO
100
21.8
VERANO
25
17.1
VERANO
50
20.8
VERANO
75
24.1
VERANO
100
27.1
;
PROC GLM;
CLASS CONDICION ALTURA;
MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA;
MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN;
RUN;
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
Revisando las sentencias introducidas tenemos:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Con OPTIONS NODATE NONUMBER, le indicamos que no inserte la fecha y el número de página.
Con DATA DCAFAC; le indicamos que genere un archivo con el nombre DCAFAC.
Con INPUT CONDICION $ ALTURA FIBRA; le indicamos que ingrese las variables Condición, Altura y
Fibra.
CARDS; le señala que los datos vienen a continuación.
Seguidamente se ubican todos nuestros datos ordenados en forma de filas.
PROC GLM; le indica que realice el calculo de análisis de varianza considerando el modelo lineal.
CLASS CONDICION ALTURA; le señala cuales variables estarán en estudio o de clasificación para nuestro
caso las variables son: Condición y Altura.
Ing. Ramiro Raúl OCHOA TORREZ
77
(8)
MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA; este punto esta en directa relación con el
modelo lineal de un diseño completamente al azar con arreglo factorial (Yijk = µ + αi + βj + αβij + εijk),
donde se coloca como:
Yijk = µ + αi + βj + αβij + εijk
Variable de respuesta = Variables de estudio
Fibra = Condición Altura Condición*Altura
No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del
modelo.
(9)
(10)
MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN; le pedimos al SAS que realice la prueba
de medias de Duncan para los factores de estudio Condición y Altura, y también nos presente los promedios
de la interacción de ambos factores.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
Los resultados del SAS serán en la primera parte el análisis de varianza:
The SAS System
The GLM Procedure
Class Level Information
Class
Levels
Values
CONDICION
2
INVIERNO VERANO
ALTURA
4
25 50 75 100
Number of observations
The SAS System
The GLM Procedure
Dependent Variable: FIBRA
(1)
Source
Model
Error
Corrected Total
DF
7
24
31
R-Square
0.983594
(2)
Source
CONDICION
ALTURA
CONDICION*ALTURA
Sum of
Squares
419.5246875
6.9975000
426.5221875
Coeff Var
2.675165
DF
1
3
3
32
Mean Square
59.9320982
0.2915625
Root MSE
0.539965
Anova SS
84.8253125
330.7684375
3.9309375
F Value
205.55
Pr > F
<.0001
F Value
290.93
378.16
4.49
Pr > F
<.0001
<.0001
0.0122
FIBRA Mean
20.18438
Mean Square
84.8253125
110.2561458
1.3103125
La salida del ANVA, en este caso nos presenta 2 partes:
(1)
(2)
La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación.
La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son los dos factores en
estudio Condición, Altura y la interacción Condición*Altura.
Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2)
donde se tienen todos los factores de estudio Condición, Altura y la interacción Condición*Altura en la parte (1) en
vez de los valores de Model:
Sum of
78
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
Source
Model
Error
Corrected Total
(1)
DF
7
24
31
R-Square
0.983594
Source
CONDICION
ALTURA
CONDICION*ALTURA
(2)
Squares
419.5246875
6.9975000
426.5221875
Coeff Var
2.675165
DF
1
3
3
Mean Square
59.9320982
0.2915625
Root MSE
0.539965
Anova SS
84.8253125
330.7684375
3.9309375
F Value
205.55
Pr > F
<.0001
F Value
290.93
378.16
4.49
Pr > F
<.0001
<.0001
0.0122
FIBRA Mean
20.18438
Mean Square
84.8253125
110.2561458
1.3103125
Dando como resultado final para su interpretación y mediante las reglas de decisión tenemos:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
CONDICION
ALTURA
CONDICION*ALTURA
Error
Corrected Total
R-Square
0.983594
DF
1
3
3
24
31
Squares
84.8253125
330.7684375
3.9309375
6.9975000
426.5221875
Coeff Var
2.675165
Mean Square
84.8253125
110.2561458
1.3103125
0.2915625
Root MSE
0.539965
F Value
290.93
378.16
4.49
Pr > F
<.0001**
<.0001**
0.0122*
FIBRA Mean
20.18438
Conclusión
Como conclusión podemos indicar que los factores de estudio Condición y Altura presentan diferencias altamente
significativas (Pr < 0.01), por los que entre condición (Verano e Invierno) existen diferencias en el contenido de fibra,
así mismo entre alturas de corte (25, 50, 75 y 100 cm) existen diferencias en la altura de corte; en la interacción
Condición x Altura se tienen diferencias significativas (Pr < 0.05). Teniéndose por otra parte un coeficiente de
variación de 2.675165% mostrando un alto grado de confiabilidad de los datos y un promedio general de 20.18438 %
de contenido de fibra.
La siguiente parte de los resultados del SAS son la prueba de medias de Duncan, para ambos factores, la primera
prueba es la de Condición (Verano e Invierno):
Ing. Ramiro Raúl OCHOA TORREZ
79
The SAS System
The GLM Procedure
Duncan's Multiple Range Test for FIBRA
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
24
Error Mean Square
0.291562
Number of Means
2
Critical Range
.3940
Means with the same letter are not significantly different.
Duncan Grouping
A
Mean
21.8125
N
16
CONDICION
VERANO
B
18.5563
16
INVIERNO
Conclusión
En el caso de la Condición, la prueba de Duncan presenta diferencias significativas entre ambas (Distintas letras A y
B en el Duncan Grouping), siendo Verano la que presenta el valor más alto de porcentaje de fibra, siendo este
significativamente superior al valor de porcentaje de fibra de Invierno.
La siguiente parte corresponde al factor altura de corte (25, 50, 75 y 100 cm):
The SAS System
The GLM Procedure
Duncan's Multiple Range Test for FIBRA
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
24
Error Mean Square
0.291562
Number of Means
2
3
4
Critical Range
.5572
.5852
.6032
Means with the same letter are not significantly different.
Duncan Grouping
A
Mean
24.2500
N
8
ALTURA
100
B
21.9750
8
75
C
18.7500
8
50
D
15.7625
8
25
Conclusión
En el caso de altura de corte, la prueba de Duncan presenta diferencias significativas entre todas las altura de corte
(Letras distintas A, B, C y D en el Duncan Grouping), siendo la altura de corte de 100 cm la que mayor valor de
80
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
porcentaje de fibra registra, valor significativamente diferente al resto de las alturas, por otra parte la altura de corte
de 25 cm es la que presenta el valor más bajo de porcentaje de fibra.
Por ultimo se tiene la salida de los valores promedios de porcentaje de fibra, así como el desvió estándar del las
interacciones de ambos factores en estudio:
Level of
CONDICION
INVIERNO
INVIERNO
INVIERNO
INVIERNO
VERANO
VERANO
VERANO
VERANO
Level of
ALTURA
25
50
75
100
25
50
75
100
N
4
4
4
4
4
4
4
4
------------FIBRA-----------Mean
Std Dev
14.6250000
0.37749172
16.9000000
0.54772256
20.5000000
0.75277265
22.2000000
0.40824829
16.9000000
0.39157800
20.6000000
0.64807407
23.4500000
0.47958315
26.3000000
0.59441848
Los anteriores valores que nos dieron de resultado, no servirán posteriormente.
En el caso de que se tenga significanicia en el análisis de varianza para la interacción (A x B) o en nuestro caso
interacción de los factores Condición x Altura, se deberá proceder a la realización del análisis de Varianza de Efectos
Simples, tomando los valores originales, y los anteriores resultados nos servirán posteriormente para graficar los
efectos simples.
FV
B(a1)
B(a2)
A(b1)
A(b2)
A(b3)
A(b4)
EE
GL
b–1
b–1
a–1
a–1
a–1
a–1
ab(r –1)
SC
SCB(a1)
SCB(a2)
SCA(b1)
SCA(b2)
SCA(b3)
SCA(b4)
SCE
CM
SCB(a1)/GL B(a1)
SCB(a2)/GL B(a2)
SCA(b1)/GL A(b1)
SCA(b2)/GL A(b2)
SCA(b3)/GL A(b3)
SCA(b4)/GL A(b4)
SCE/GLE
Fc
CMB(a1)CME
CMB(a2)/CME
CMA(b1)/CME
CMA(b2)/CME
CMA(b3)/CME
CMA(b4)/CME
Ft
f(GL B(a1), GLE)
f(GL B(a2), GLE)
f(GL A(b1), GLE)
f(GL A(b2), GLE)
f(GL A(b3), GLE)
f(GL A(b4), GLE)
Para esto lo que debemos es agregar en el PROGRAM EDITOR, en la parte de procedimiento (PROC), los
comandos necesarios para que nos proporcione el respectivo análisis de efectos simples, los comandos a ser
agregados son:
LSMEANS CONDICION*ALTURA / SLICE=CONDICION SLICE=ALTURA;
RUN;
Quedando como datos:
Ing. Ramiro Raúl OCHOA TORREZ
81
OPTIONS NODATE NONUMBER;
DATA DCAFAC1;
INPUT CONDICION $
ALTURA FIBRA;
CARDS;
INVIERNO
25
14.9
INVIERNO
50
17.5
INVIERNO
75
20.7
INVIERNO
100
22.5
.
.
.
.
.
.
.
.
.
VERANO
25
17.1
VERANO
50
20.8
VERANO
75
24.1
VERANO
100
27.1
;
PROC GLM;
CLASS CONDICION ALTURA;
MODEL FIBRA=CONDICION ALTURA CONDICION*ALTURA;
MEANS CONDICION ALTURA CONDICION*ALTURA/DUNCAN;
LSMEANS CONDICION*ALTURA / SLICE=CONDICION SLICE=ALTURA;
RUN;
(1)
(2)
La primera parte de la introducción de datos ya se explico anteriormente, revisamos la segunda parte de las
sentencias introducidas tenemos:
(1)
(2)
Con LSMEANS CONDICION*ALTURA / SLICE=CONDICION SLICE=ALTURA; indicamos que realice el
análisis de varianza de efectos simples.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La salida del SAS para los efectos simples será la siguiente:
82
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
Sistema SAS
Procedimiento GLM
Medias de cuadrados mínimos
CONDICION
ALTURA
INVIERNO
INVIERNO
INVIERNO
INVIERNO
VERANO
VERANO
VERANO
VERANO
25
50
75
100
25
50
75
100
FIBRA LSMEAN
14.6250000
16.9000000
20.5000000
22.2000000
16.9000000
20.6000000
23.4500000
26.3000000
Sistema SAS
Procedimiento GLM
Medias de cuadrados mínimos
CONDICION*ALTURA Efecto dividido por CONDICION for FIBRA
(1)
CONDICION
INVIERNO
VERANO
DF
3
3
Suma de
cuadrados
141.011875
193.687500
Cuadrado de
la media
47.003958
64.562500
F-Valor
161.21
221.44
Pr > F
<.0001
<.0001
Sistema SAS
Procedimiento GLM
Medias de cuadrados mínimos
CONDICION*ALTURA Efecto dividido por ALTURA for FIBRA
ALTURA
(2)
25
50
75
100
DF
Suma de
cuadrados
Cuadrado de
la media
F-Valor
Pr > F
1
1
1
1
10.351250
27.380000
17.405000
33.620000
10.351250
27.380000
17.405000
33.620000
35.50
93.91
59.70
115.31
<.0001
<.0001
<.0001
<.0001
Analizando la salida del SAS tenemos:
(1)
(2)
Nos señala que la salida de cada una de las condiciones esta finfluencias por toda las alturas.
Nos señala que cada una de las altura esta influenciada por las dos condiciones.
La primera parte se la anotara de la siguiente forma:
CONDICION
DF
INVIERNO (ALTURA) 3
VERANO (ALTURA)
3
Suma de
cuadrados
141.011875
193.687500
La segunda parte se la anotara de la siguiente forma:
Suma de
Ing. Ramiro Raúl OCHOA TORREZ
Cuadrado de
la media
47.003958
64.562500
F-Valor
161.21
221.44
Pr > F
<.0001
<.0001
Cuadrado de
83
ALTURA
DF
25(CONDICION)
50(CONDICION)
75(CONDICION)
100(CONDICION)
1
1
1
1
cuadrados
la media
F-Valor
Pr > F
10.351250
27.380000
17.405000
33.620000
10.351250
27.380000
17.405000
33.620000
35.50
93.91
59.70
115.31
<.0001
<.0001
<.0001
<.0001
Agrupando la salida de los dos factores y en función de las reglas de decisión interpretamos y realizamos las
conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Lo que nos dará:
CONDICION
DF
INVIERNO (ALTURA) 3
VERANO (ALTURA)
3
25(CONDICION)
1
50(CONDICION)
1
75(CONDICION)
1
100(CONDICION)
1
Suma de
cuadrados
141.011875
193.687500
10.351250
27.380000
17.405000
33.620000
Cuadrado de
la media
47.003958
64.562500
10.351250
27.380000
17.405000
33.620000
F-Valor
161.21
221.44
35.50
93.91
59.70
115.31
Pr > F
<.0001
<.0001
<.0001
<.0001
<.0001
<.0001
**
**
**
**
**
**
Conclusión
El análisis de varianza de efectos simples nos indica que en el caso de la altura esta tiene un comportamiento
significativamente diferente por efecto de la condición invierno, al igual que en el caso de que el factor altura sea
afectado por la condición verano, en el caso del factor condición registran diferencias altamente significativas por
efecto de los diferentes niveles del factor altura.
9.1.2.
DCA con arreglo factorial – tres factores
Ejercicio
Los datos siguientes se refieren al consumo diario de alimento de pollos asaderos, distribuidos en grupos
homogéneos de 100. Los datos corresponden a la séptima semana, y se consideran como factores las siguientes
variables (Rodríguez 1991):
Saborizantes
(SA)
Forma Física
(FF)
Fuente Proteica (FP)
Saborizante
Zanahoria
Melaza
84
Forma
Molido
Rolado
Molido
Rolado
Harina
Soya
Pescado
Soya
Pescado
Soya
Pescado
Soya
Pescado
I
6.42
6.60
5.84
7.16
5.94
6.01
6.20
6.40
II
6.35
6.68
6.93
7.21
5.63
6.14
6.24
6.38
III
6.40
6.70
7.02
7.19
5.85
6.00
6.16
6.41
IV
6.38
6.65
6.95
7.22
5.74
6.04
6.29
6.39
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
El modelo aditivo lineal para un diseño completamente al azar con arreglo factorial de tres factores es el siguiente:
Yijkl = µ + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl
Donde:
Yijkl
µ
αi
δj
αδij
λk
αλik
δλjk
αδλijk
εijkl
= Una observación
= Media poblacional
= Efecto del i – esimo nivel del factor A (Saborizantes)
= Efecto del j – esimo nivel del factor B ((Forma)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Saborizantes x Forma)
= Efecto del k – esimo nivel del factor C (Harina)
= Efecto del i – esimo nivel del factor A, con el k – esimo nivel del factor (interacción A x C)
(Saborizantes x Harina)
= Efecto del j – esimo nivel del factor B, con el k – esimo nivel del factor C (interacción B x C)
(Forma x Harina)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B y el k – esimo nivel del
factor C (interacción A x B x C) (Saborizantes x Forma x Harina)
= Error experimental
A
B
C
i...
j...
k...
a...
b...
c...
1...
1...
1...
2
2
2
Las hipótesis a probar serán:
Ho:
Zanahoria = Melaza
(Saborizante)
Molido = Rolado
(Forma)
Soya = Pescado
(Harina)
Zanahoria – Molido – Soya = … = Melaza – Rolado – Pescado
Ha:
Zanahoria ≠ Melaza
(Saborizante)
Molido ≠ Rolado
(Forma)
Soya ≠ Pescado
(Harina)
Zanahoria – Molido – Soya ≠ … ≠ Melaza – Rolado – Pescado
Introduciendo los datos en el PROGRAM EDITOR del SAS tenemos:
Ing. Ramiro Raúl OCHOA TORREZ
85
OPTIONS NODATE NONUMBER;
DATA FACDCA2;
INPUT SABORIZANTE $
FORMA $ HARINA $
CONSUMO;
CARDS;
Zanahoria
Molido Soya
6.42
Zanahoria
Molido Pescado 6.60
Zanahoria
Rolado Soya
5.84
Zanahoria
Rolado Pescado 7.16
Melaza
Molido Soya
5.94
Melaza
Molido Pescado 6.01
Melaza
Rolado Soya
6.20
Melaza
Rolado Pescado 6.40
Zanahoria
Molido Soya
6.35
Zanahoria
Molido Pescado 6.68
Zanahoria
Rolado Soya
6.93
Zanahoria
Rolado Pescado 7.21
Melaza
Molido Soya
5.63
Melaza
Molido Pescado 6.14
Melaza
Rolado Soya
6.24
Melaza
Rolado Pescado 6.38
Zanahoria
Molido Soya
6.40
Zanahoria
Molido Pescado 6.70
Zanahoria
Rolado Soya
7.02
Zanahoria
Rolado Pescado 7.19
Melaza
Molido Soya
5.85
Melaza
Molido Pescado 6.00
Melaza
Rolado Soya
6.16
Melaza
Rolado Pescado 6.41
Zanahoria
Molido Soya
6.38
Zanahoria
Molido Pescado 6.65
Zanahoria
Rolado Soya
6.95
Zanahoria
Rolado Pescado 7.22
Melaza
Molido Soya
5.74
Melaza
Molido Pescado 6.04
Melaza
Rolado Soya
6.29
Melaza
Rolado Pescado 6.39
;
PROC GLM;
TITLE'DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)';
CLASS SABORIZANTE FORMA HARINA;
MODEL CONSUMO=SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA
FORMA*HARINA SABORIZANTE*FORMA*HARINA;
RUN;
(1)
(2)
(3)
(4)
(5)
La introducción de los datos y los comandos iniciales son los mismos para todos los casos, en este caso
analizaremos los comandos del procedimiento, después de introducidos los datos:
(1)
(2)
(3)
(4)
PROC GLM; le indica que realice el calculo de análisis de varianza considerando el modelo lineal.
TITLE’DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES); le indicamos
el titulo del trabajo.
CLASS SABORIZANTE FORMA HARINA; le indicamos cuales variables estarán en estudio o de
clasificación para nuestro caso las variables son: Saborizante, Forma y Harina.
MODEL CONSUMO=SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA
FORMA*HARINA SABORIZANTE*FORMA*HARINA; este punto esta en directa relación con el modelo
lineal de un diseño completamente al azar con arreglo factorial para tres factores (Yijkl = µ + αi + δj + αδij +
λk + αλik + δλjk + αδλijk + εijkl), donde se coloca como:
86
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
Yijkl = µ + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl
Variable de respuesta = Variables de estudio
Consumo = Saborizante Forma Saborizante*Forma Harina Saborizante*Harina Forma*Harina
Saborizante*Forma*Harina
(5)
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
Los resultados del SAS serán los siguientes:
DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)
The GLM Procedure
Class Level Information
Class
Levels
SABORIZANTE
FORMA
HARINA
Values
2
2
2
Melaza Zanahori
Molido Rolado
Pescado Soya
Number of observations
32
DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)
The GLM Procedure
Dependent Variable: CONSUMO
(1)
Source
Model
Error
Corrected Total
DF
7
24
31
R-Square
0.833285
(2)
Source
SABORIZANTE
FORMA
SABORIZANTE*FORMA
HARINA
SABORIZANTE*HARINA
FORMA*HARINA
SABORIZ*FORMA*HARINA
Sum of
Squares
5.21420000
1.04320000
6.25740000
Coeff Var
3.246191
DF
1
1
1
1
1
1
1
Mean Square
0.74488571
0.04346667
Root MSE
0.208487
Anova SS
3.05045000
1.30411250
0.00151250
0.73205000
0.06125000
0.01201250
0.05281250
F Value
17.14
Pr > F
<.0001
CONSUMO Mean
6.422500
Mean Square
3.05045000
1.30411250
0.00151250
0.73205000
0.06125000
0.01201250
0.05281250
F Value
70.18
30.00
0.03
16.84
1.41
0.28
1.22
Pr > F
<.0001
<.0001
0.8536
0.0004
0.2468
0.6039
0.2813
La salida del ANVA, en este caso nos presenta 2 partes:
(1)
(2)
La primera parte un análisis en función del modelo, sin considerar a las fuentes de variación.
La segunda en la que se toma en cuenta a las fuentes de variación del modelo como son los tres factores
en estudio: Saborizante, Forma, Saborizante*Forma, Harina, Saborizante*Harina, Forma*Harina y
Saborizante*Forma*Harina.
Estas dos se las tienen que organizar, para que nos de un ANVA general, esto se la hace, remplazando del punto (2)
donde se tienen todas las fuentes de variación en la parte (1) en vez de los valores de Model:
Ing. Ramiro Raúl OCHOA TORREZ
87
Source
Model
Error
Corrected Total
(1)
DF
7
24
31
R-Square
0.833285
Source
SABORIZANTE
FORMA
SABORIZANTE*FORMA
HARINA
SABORIZANTE*HARINA
FORMA*HARINA
SABORIZ*FORMA*HARINA
(2)
Sum of
Squares
5.21420000
1.04320000
6.25740000
Coeff Var
3.246191
DF
1
1
1
1
1
1
1
Mean Square
0.74488571
0.04346667
Root MSE
0.208487
Anova SS
3.05045000
1.30411250
0.00151250
0.73205000
0.06125000
0.01201250
0.05281250
F Value
17.14
Pr > F
<.0001
CONSUMO Mean
6.422500
Mean Square
3.05045000
1.30411250
0.00151250
0.73205000
0.06125000
0.01201250
0.05281250
F Value
70.18
30.00
0.03
16.84
1.41
0.28
1.22
Pr > F
<.0001
<.0001
0.8536
0.0004
0.2468
0.6039
0.2813
F Value
70.18
30.00
0.03
16.84
1.41
0.28
1.22
Pr > F
<.0001**
<.0001**
0.8536ns
0.0004**
0.2468ns
0.6039ns
0.2813ns
Dando como resultado final para su interpretación mediante las reglas de decisión:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
SABORIZANTE
FORMA
SABORIZANTE*FORMA
HARINA
SABORIZANTE*HARINA
FORMA*HARINA
SABORIZ*FORMA*HARINA
Error
Corrected Total
R-Square
0.833285
DF
1
1
1
1
1
1
1
24
31
Sum of
Squares
3.05045000
1.30411250
0.00151250
0.73205000
0.06125000
0.01201250
0.05281250
1.04320000
6.25740000
Coeff Var
3.246191
Mean Square
3.05045000
1.30411250
0.00151250
0.73205000
0.06125000
0.01201250
0.05281250
0.04346667
Root MSE
0.208487
CONSUMO Mean
6.422500
Conclusión
Como conclusión podemos indicar que los factores de estudio Saborizante, Forma y Harina presentan diferencias
altamente significativas (Pr < 0.01), existiendo diferencias altamente significativas en el consumo diario de pollos
asaderos, en tanto que en las interacciones de dos factores y de tres factores no presentan diferencia significativa en
sus valores de consumo diario. Teniéndose un coeficiente de variación de 3.246191% y un promedio general de
6.4225 de consumo de alimento.
En el presente ejercicio, después de la interpretación de los resultados observamos que se necesita realizar las
respectivas pruebas de medias, como son la de Duncan o Tukey, para este caso se deberá agregar los respectivos
comandos en la parte de procedimiento, la interpretación de los resultados de las pruebas de medias será la misma
que en los anteriores casos. Por otra parte observamos que no se requiere el análisis de efectos simples, toda vez
que no se presentaron significancias en las interacciones sean estas de dos y tres factores pero en este caso se
puede pedir una interpretación en función a los promedios y el desvió estándar que pudiera presentar cada una de
las interacciones.
La presentación de los procedimientos en el SAS será la siguiente:
88
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
OPTIONS NODATE NONUMBER;
DATA FACDCA2;
INPUT SABORIZANTE $
FORMA $ HARINA $
CONSUMO;
CARDS;
Zanahoria
Molido Soya
6.42
Zanahoria
Molido Pescado 6.60
Zanahoria
Rolado Soya
5.84
Zanahoria
Rolado Pescado 7.16
.
.
.
.
.
.
.
.
.
.
.
.
Melaza
Molido Soya
5.74
Melaza
Molido Pescado 6.04
Melaza
Rolado Soya
6.29
Melaza
Rolado Pescado 6.39
;
PROC GLM;
TITLE'DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)';
CLASS SABORIZANTE FORMA HARINA;
MODEL CONSUMO=SABORIZANTE FORMA SABORIZANTE*FORMA HARINA SABORIZANTE*HARINA
FORMA*HARINA SABORIZANTE*FORMA*HARINA;
MEANS SABORIZANTE FORMA HARINA/DUNCAN;
(1)
MEANS SABORIZANTE*FORMA SABORIZANTE*HARINA FORMA*HARINA SABORIZANTE*FORMA*HARINA;(2)
RUN;
(3)
La introducción de los datos y los comandos iniciales son los mismos para todos los casos, en este caso
analizaremos los comandos del procedimiento, después de introducidos la totalidad de los datos:
(1)
(2)
(3)
MEANS SABORIZANTE FORMA HARINA/DUNCAN; le indica que realice la prueba de Duncan para los tres
factores en estudio.
MEANS
SABORIZANTE*FORMA
SABORIZANTE*HARINA
FORMA*HARINA
SABORIZANTE*FORMA*HARINA; le pedimos al SAS que realice el calculo de los promedios y el desvió
estándar de todas las interacciones de dos factores y tres factores.
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
La primera parte de la salida del SAS corresponde al análisis de varianza siendo la misma que anteriormente se
analizo, posteriormente se presenta la salida la prueba de Duncan para los tres factores en estudio, y los promedios
y los desvió estándar de las interacciones, la primera corresponderá a la prueba de Duncan para el factor
Saborizante:
Ing. Ramiro Raúl OCHOA TORREZ
89
DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)
The GLM Procedure
Duncan's Multiple Range Test for CONSUMO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
24
Error Mean Square
0.043467
Number of Means
Critical Range
2
.1521
Means with the same letter are not significantly different.
Duncan Grouping
Mean
N
SABORIZANTE
A
6.73125
16
Zanahori
B
6.11375
16
Melaza
Conclusión
En el caso de Saborizante, la prueba de Duncan presenta diferencias significativas entre los dos saborizantes (Letras
distintas A y B en el Duncan Grouping), siendo la Zanahoria la que mayor consumo de alimento registro, valor
significativamente diferente y superior al presentado por la Melaza.
La siguiente es la presentación de la prueba de Duncan para el factor Forma física del alimento:
DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)
The GLM Procedure
Duncan's Multiple Range Test for CONSUMO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
24
Error Mean Square
0.043467
Number of Means
Critical Range
2
.1521
Means with the same letter are not significantly different.
Duncan Grouping
Mean
N
FORMA
A
6.62438
16
Rolado
B
6.22063
16
Molido
Conclusión
En el caso del factor Forma física del alimento, la prueba de Duncan a un nivel de significancia del 5% (α = 0.05)
presenta diferencias significativas entre las dos formas de alimentos (Letras distintas A y B en el Duncan Grouping),
90
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
siendo la forma física de Rolado la que mayor consumo de alimento registra, valor significativamente diferente y
superior al presentado por la forma física Molida.
La siguiente es la presentación de la prueba de Duncan para el factor Harina (Fuente proteica):
DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)
The GLM Procedure
Duncan's Multiple Range Test for CONSUMO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha
0.05
Error Degrees of Freedom
24
Error Mean Square
0.043467
Number of Means
Critical Range
2
.1521
Means with the same letter are not significantly different.
Duncan Grouping
Mean
N
HARINA
A
6.57375
16
Pescado
B
6.27125
16
Soya
Conclusión
En el caso del factor Harina o Fuente proteica, la prueba de Duncan a un nivel de significancia del 5% (α = 0.05)
presenta diferencias significativas entre las dos fuentes proteicas (Letras distintas A y B en el Duncan Grouping),
siendo la fuente proteica de Pescado la que mayor consumo de alimento registra, valor significativamente diferente y
superior al presentado por la fuente proteica de Soya.
Por ultimo se observa la salida de los promedios y los desvió estándar de las interacciones de los tres factores en
estudio:
SABORIZANTE*FORMA
SABORIZANTE*HARINA
FORMA*HARINA
SABORIZANTE*FORMA*HARINA
Siendo la presentación de los resultados en el mismo orden en el que se introdujo en los comandos en el SAS, la
interpretación de las mismas se hace de interacción en interacción, rescatando el valor máximo y mínimo presentado
por cada interacción.
Ing. Ramiro Raúl OCHOA TORREZ
91
DISEÑO COMPLETAMENTE AL AZAR CON ARREGLO FACTORIAL (3 FACTORES)
The GLM Procedure
Level of
SABORIZANTE
Melaza
Melaza
Zanahori
Zanahori
Level of
FORMA
Molido
Rolado
Molido
Rolado
N
8
8
8
8
-----------CONSUMO----------Mean
Std Dev
5.91875000
0.16864481
6.30875000
0.09948977
6.52250000
0.14839619
6.94000000
0.45962718
Level of
SABORIZANTE
Melaza
Melaza
Zanahori
Zanahori
Level of
HARINA
Pescado
Soya
Pescado
Soya
N
8
8
8
8
-----------CONSUMO----------Mean
Std Dev
6.22125000
0.19059587
6.00625000
0.25002500
6.92625000
0.28923236
6.53625000
0.40288026
Level of
FORMA
Molido
Molido
Rolado
Rolado
Level of
SABORIZANTE
Melaza
Melaza
Melaza
Melaza
Zanahori
Zanahori
Zanahori
Zanahori
Level of
HARINA
Pescado
Soya
Pescado
Soya
Level of
FORMA
Molido
Molido
Rolado
Rolado
Molido
Molido
Rolado
Rolado
N
8
8
8
8
Level of
HARINA
Pescado
Soya
Pescado
Soya
Pescado
Soya
Pescado
Soya
-----------CONSUMO----------Mean
Std Dev
6.35250000
0.32996753
6.08875000
0.33185356
6.79500000
0.42805207
6.45375000
0.44618822
N
4
4
4
4
4
4
4
4
-----------CONSUMO----------Mean
Std Dev
6.04750000
0.06396614
5.79000000
0.13441230
6.39500000
0.01290994
6.22250000
0.05560276
6.65750000
0.04349329
6.38750000
0.02986079
7.19500000
0.02645751
6.68500000
0.56465329
Conclusión
En el caso de la interacción Saborizante x Forma (Saborizante x Forma física), la interacción correspondiente a
Zanahoria – Rolado, es la que mayor valor de consumo de alimento registra con 6.94, en contraposición con Melaza
– Molido, que presenta el consumo mas bajo con 5.91875.
Con relación a la interacción de los factores Saborizante x Harina (Saborizante x Fuente Proteica), la combinación
correspondiente a Zanahoria – Pescado es la que mayor valor de consumo de alimento registra con 6.92625, siendo
la combinación de Melaza – Soya la que menor valor de consumo de alimento registro con 6.00.
Para el caso de la interacción de Forma x Harina (Forma física x Fuente Proteica), la combinación correspondiente a
Rolado – Molido es la que mayor consumo de alimento presenta, siendo el menor consumo el de la combinación de
Molido – Soya.
En el caso de la interacción de los tres factores, se tiene que la combinación correspondiente a Melaza – Molido –
Soya la que menor valor de consumo de alimento presenta con un valor de 5.79, siendo el tratamiento de Zanahoria
– Rolado – Molido la que mayor valor de consumo presenta con un valor de 7.195; el resto de los valores de
consumo de alimento de los demás tratamientos se encuentran dentro de esos rangos.
9.2. DBA con arreglo factorial
9.2.1.
DBA con arreglo factorial – dos factores
92
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
Ejercicio
En un experimento se estudio mediante el DBA con 3 repeticiones, se analizaron 3 laminas de riego en 3 variedades
de arroz, teniéndose los datos de rendimiento en kg/parcela (Padrón, 1996)
Lamina de Riego (mm)
5mm
5mm
5mm
10mm
10mm
10mm
15mm
15mm
15mm
Variedad de arroz
V1
V2
V3
V1
V2
V3
V1
V2
V3
I
28
32
33
21
40
50
36
38
52
II
36
30
36
28
42
51
50
49
50
III
38
29
37
27
44
50
48
51
53
El modelo lineal para un diseño bloques al azar con arreglo factorial de dos factores es el siguiente:
Yijk = µ + βk + αi + λj + αλij + εijk
Donde:
Yijk
µ
βk
αi
λj
αλij
εijk
= Una observación
= Media poblacional
= Efecto del k – esimo bloque
= Efecto del i – esimo nivel del factor A (Lamina de Riego)
= Efecto del j – esimo nivel del factor B (Variedad de arroz)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Lamina de riego x Variedad de Arroz)
= Error experimental
Lamina
Variedad
Bloque
i…
j…
k…
a…
b…
r…
1…
1…
1…
3
3
3
Las hipótesis a probar serán:
Ho:
Ha:
5mm = 10mm = 15 mm
V1 = V2 = V3
5mm – V1 = … = 15mm – V3
Bloque I = Bloque = Bloque III
(Lamina de riego)
(Variedad de arroz)
5mm ≠ 10mm ≠ 15 mm
V1 ≠ V2 ≠ V3
5mm – V1 ≠ … ≠ 15mm – V3
Bloque I ≠ Bloque ≠ Bloque III
(Lamina de riego)
(Variedad de arroz)
(Bloques)
(Bloques)
Introduciendo los datos en el SAS de forma lineal tendremos:
Ing. Ramiro Raúl OCHOA TORREZ
93
OPTIONS NODATE NONUMBER;
DATA FACDBA;
INPUT BLOQUE LAMINA $ VAR $ REND @@;
CARDS;
1 5mm V1 28 2 5mm V1 36 3 5mm V1 38
1 5mm V2 32 2 5mm V2 30 3 5mm V2 29
1 5mm V3 33 2 5mm V3 36 3 5mm V3 37
1 10mm V1 21 2 10mm V1 28 3 10mm V1 27
1 10mm V2 40 2 10mm V2 42 3 10mm V2 44
1 10mm V3 50 2 10mm V3 51 3 10mm V3 50
1 15mm V1 36 2 15mm V1 50 3 15mm V1 48
1 15mm V2 38 2 15mm V2 49 3 15mm V2 51
1 15mm V3 52 2 15mm V3 50 3 15mm V3 53
;
PROC ANOVA;
TITLE'DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES)';
CLASS BLOQUE LAMINA VAR;
MODEL REND=BLOQUE LAMINA VAR LAMINA*VAR;
RUN;
(1)
(2)
(3)
(4)
(5)
La introducción de los datos y los comandos iniciales son los mismos para todos los casos, en este caso
analizaremos los comandos del procedimiento, después de introducidos los datos:
(1)
(2)
(3)
(4)
PROC ANOVA; le indica que realice el calculo de análisis de varianza.
TITLE’DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES); le indicamos el titulo
del trabajo.
CLASS BLOQUE LAMINA VAR; le indicamos cuales variables estarán en estudio o de clasificación para
nuestro caso las variables son: Bloque, Lámina y Variedad.
MODEL REND=BLOQUE LAMINA VAR LAMINA*VAR; este punto esta en directa relación con el modelo
lineal de un diseño bloques al azar con arreglo factorial para dos (Yijk = µ + βk + αi + λj + αλij + εijk), donde
se coloca como:
Yijk = µ + βk + αi + λj + αλij + εijk
Variable de respuesta = Variables de estudio
Rendimiento = Bloque Lamina Variedad Lamina * Variedad
(5)
RUN; le señalamos que las sentencias anteriores son ejecutables.
Los resultados presentados serán similares a los que se registro en los anteriores ejercicios, presentándonos
primeramente el análisis de varianza para un diseño bloques al azar con arreglo factorial, posteriormente las pruebas
de medias de los factores en estudio (Lamina de riego y Variedad), posteriormente los valores de los promedios y el
desvió estándar de los tratamientos y por ultimo el análisis de varianza de efectos simples de la interacción de los
dos factores:
94
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES)
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQUE
3
1 2 3
LAMINA
3
10mm 15mm 5mm
VAR
3
V1 V2 V3
Number of observations
27
DISEÑO BLOQUES AL AZAR CON ARREGLO FACTORIAL (2 FACTORES)
The ANOVA Procedure
Dependent Variable: REND
Sum of
Source
DF
Squares
Mean Square
F Value
Model
10
2161.037037
216.103704
19.65
Error
16
175.925926
10.995370
Corrected Total
26
2336.962963
R-Square
0.924720
Source
BLOQUE
LAMINA
VAR
LAMINA*VAR
Coeff Var
8.297500
DF
2
2
2
4
Root MSE
3.315927
Anova SS
148.0740741
917.6296296
559.1851852
536.1481481
Pr > F
<.0001
REND Mean
39.96296
Mean Square
74.0370370
458.8148148
279.5925926
134.0370370
F Value
6.73
41.73
25.43
12.19
Pr > F
0.0076
<.0001
<.0001
<.0001
Organizando la salida de nuestros como se lo hizo anteriormente en los anteriores ejercicios, tenemos para el
análisis de varianza, y en función de las reglas de decisión interpretamos y realizamos las conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQUE
LAMINA
VAR
LAMINA*VAR
Error
Corrected Total
DF
2
2
2
4
16
26
R-Square
0.924720
Sum of
Squares
148.0740741
917.6296296
559.1851852
536.1481481
175.925926
2336.962963
Coeff Var
8.297500
Mean Square
74.0370370
458.8148148
279.5925926
134.0370370
10.995370
Root MSE
3.315927
F Value
6.73
41.73
25.43
12.19
Pr > F
0.0076**
<.0001**
<.0001**
<.0001**
REND Mean
39.96296
Conclusión
Como conclusión podemos indicar que en todas las fuentes de variación (Bloques, Lamina, Variedad y Lamina x
Variedad) se presentan diferencias altamente significativas (Pr < 0.01), en los valores de rendimiento. Teniéndose un
coeficiente de variación de 8.297500% y un promedio general de 39.96296 de rendimiento.
9.2.2.
DBA con arreglo factorial – tres factores
Ejercicio
Ing. Ramiro Raúl OCHOA TORREZ
95
El siguiente estudio se llevo a cabo con el fin de observar el consumo de alimento de gazapos en desarrollo,
destinados para engorde y reproducción. El experimento se efectuó con dos razas y dos dietas diferentes, durante
cuatro épocas del año (Rodríguez 1991)
Razas
Californiana
Californiana
Californiana
Californiana
Azul de Beveren
Azul de Beveren
Azul de Beveren
Azul de Beveren
Objetivo
Engorde
Engorde
Reproducción
Reproducción
Engorde
Engorde
Reproducción
Reproducción
Dieta
D1
D2
D1
D2
D1
D2
D1
D2
Verano
160
169
200
217
145
149
201
224
Otoño
170
176
210
224
156
161
230
232
Invierno
175
182
224
236
164
173
236
249
Primavera
163
171
202
206
150
154
221
230
El modelo aditivo lineal para un diseño bloques al azar con arreglo factorial de tres factores es el siguiente:
Yijkl = µ + βl + αi + δj + αδij + λk + αλik + δλjk + αδλijk + εijkl
Donde:
Yijkl
µ
βl
αi
δj
αδij
λk
αλik
δλjk
αδλijk
εijkl
= Una observación
= Media poblacional
= Efecto del l – esimo bloque
= Efecto del i – esimo nivel del factor A (Razas)
= Efecto del j – esimo nivel del factor B (Objetivo)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Razas x Objetivo)
= Efecto del k – esimo nivel del factor C (Dieta)
= Efecto del i – esimo nivel del factor A, con el k – esimo nivel del factor (interacción A x C) (Razas
x Dieta)
= Efecto del j – esimo nivel del factor B, con el k – esimo nivel del factor C (interacción B x C)
(Objetivo x Dieta)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B y el k – esimo nivel del
factor C (interacción A x B x C) (Razas x Objetivo x Dieta)
= Error experimental
A
B
C
Bloque
i...
j...
k...
l...
a...
b...
c...
r...
1...
1...
1...
1...
2
2
2
4
Las hipótesis a probar serán:
Ha:
Ha:
96
Californiana = Azul de Beveren
(Razas) (1: Californiana y 2: Azul de Beveren)
Engorde = Reproducción
(Objetivo) (1: Engorde y 2: Reproducción)
D1 = D2
(Dietas) (1: D1 y 2: D2)
Californiana – Engorde – D1 = … = Azul de Beveren – Reproducción – D2
Verano ≠ Otoño ≠ Invierno ≠ Primavera
(Bloques) (1: Verano, 2: Otoño, 3: Invierno y 4:
Primavera)
Californiana ≠ Azul de Beveren
(Razas) (1: Californiana y 2: Azul de Beveren)
Engorde ≠ Reproducción
(Objetivo) (1: Engorde y 2: Reproducción)
D1 ≠ D2
(Dietas) (1: D1 y 2: D2)
Californiana – Engorde – D1 ≠ … ≠ Azul de Beveren – Reproducción – D2
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
Verano ≠ Otoño ≠ Invierno ≠ Primavera
(Bloques) (1: Verano, 2: Otoño, 3: Invierno y 4:
Primavera)
Introduciendo los datos en el SAS tenemos:
OPTIONS NODATE NONUMBER;
DATA DBAFAC;
INPUT BLOQUES RAZAS OBJETIVO
DIETA CONSUMO;
CARDS;
1
1
1
1
160
1
1
1
2
169
1
1
2
1
200
1
1
2
2
217
1
2
1
1
145
1
2
1
2
149
1
2
2
1
201
1
2
2
2
224
2
1
1
1
170
2
1
1
2
176
2
1
2
1
210
2
1
2
2
224
2
2
1
1
156
2
2
1
2
161
2
2
2
1
230
2
2
2
2
232
3
1
1
1
175
3
1
1
2
182
3
1
2
1
224
3
1
2
2
236
3
2
1
1
164
3
2
1
2
173
3
2
2
1
236
3
2
2
2
249
4
1
1
1
163
4
1
1
2
171
4
1
2
1
202
4
1
2
2
206
4
2
1
1
150
4
2
1
2
154
4
2
2
1
221
4
2
2
2
230
;
PROC ANOVA;
CLASS BLOQUES RAZAS OBJETIVO DIETA;
MODEL CONSUMO=BLOQUES RAZAS OBJETIVO RAZAS*OBJETIVO DIETA RAZAS*DIETA OBJETIVO*DIETA
RAZAS*OBJETIVO*DIETA;
RUN;
Lo que nos dará como resultado:
Ing. Ramiro Raúl OCHOA TORREZ
97
The SAS System
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQUES
4
1 2 3 4
RAZAS
2
1 2
OBJETIVO
2
1 2
DIETA
2
1 2
Number of observations
32
The SAS System
The ANOVA Procedure
Dependent Variable: CONSUMO
Source
Model
Error
Corrected Total
DF
10
21
31
R-Square
0.986127
Source
BLOQUES
RAZAS
OBJETIVO
RAZAS*OBJETIVO
DIETA
RAZAS*DIETA
OBJETIVO*DIETA
RAZAS*OBJETIVO*DIETA
Sum of
Squares
31098.50000
437.50000
31536.00000
Coeff Var
2.371093
DF
3
1
1
1
1
1
1
1
Mean Square
3109.85000
20.83333
Root MSE
4.564355
Anova SS
2204.50000
3.12500
26680.50000
1485.12500
666.12500
2.00000
55.12500
2.00000
F Value
149.27
Pr > F
<.0001
CONSUMO Mean
192.5000
Mean Square
734.83333
3.12500
26680.50000
1485.12500
666.12500
2.00000
55.12500
2.00000
F Value
35.27
0.15
1280.66
71.29
31.97
0.10
2.65
0.10
Pr > F
<.0001
0.7024
<.0001
<.0001
<.0001
0.7597
0.1187
0.7597
Organizando los resultados de los tres factores y en función de las reglas de decisión interpretamos y realizamos las
conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Lo que nos dará:
Source
BLOQUES
RAZAS
OBJETIVO
RAZAS*OBJETIVO
DIETA
RAZAS*DIETA
OBJETIVO*DIETA
RAZAS*OBJETIVO*DIETA
Error
Corrected Total
R-Square
0.986127
98
DF
3
1
1
1
1
1
1
1
21
31
Sum of
Squares
2204.50000
3.12500
26680.50000
1485.12500
666.12500
2.00000
55.12500
2.00000
437.50000
31536.00000
Coeff Var
2.371093
Mean Square
734.83333
3.12500
26680.50000
1485.12500
666.12500
2.00000
55.12500
2.00000
20.83333
Root MSE
4.564355
F Value
35.27
0.15
1280.66
71.29
31.97
0.10
2.65
0.10
Pr > F
<.0001**
0.7024ns
<.0001**
<.0001**
<.0001**
0.7597ns
0.1187ns
0.7597ns
CONSUMO Mean
192.5000
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
CONCLUSIÓN
Como conclusión podemos indicar que en las fuentes de variación Bloques, Objetivo, Dieta y la interacción Razas x
Objetivo se tienen diferencias altamente significativas en cuanto al consumo de alimento, en tanto que en las fuentes
de variación Razas, las interacciones Razas x Dieta, Objetivo x Dieta y Razas x Objetivo x Dieta no se presentan
diferencias estadísticas. Teniéndose un coeficiente de variación de 2.371093% y un promedio general de consumo
de alimento de 192.50.
9.3. DCL con arreglo factorial
9.3.1.
DCL con arreglo factorial – dos factores
Ejercicio
En un experimento se estudiaron dos insecticidas, cada uno con tres dosis para el control del gusano bellotero en el
algodón (Reyes 1999):
Factor A: Insecticidas
a1= Insecticida de uso común
a2= Insecticida experimental
Combinación
Tratamiento
a1b1
A
a1b2
B
Factor B: Dosis
b1= 3 kg/ha de material técnico
b2= 6 kg/ha de material técnico
b3= 9 kg/ha de material técnico
a1b3
C
a2b1
D
a2b2
E
a2b3
F
Los valores a continuación representan el rendimiento de algodón en parcelas de 40 m2 distribuidos en el campo.
Bloque
VI
1
C
7
2
F
8
Columna
3
4
D
A
6
4
5
E
3
6
B
5
V
B
5
E
3
C
7
F
9
D
6
A
3
IV
A
4
D
7
B
5
E
4
C
6
F
8
III
F
9
C
7
A
4
D
7
B
6
E
4
II
E
3
B
6
F
9
C
8
A
3
D
6
I
D
7
A
3
E
4
B
5
F
8
C
7
El modelo lineal para un diseño cuadrado latino con arreglo factorial, es el siguiente:
Yijkl = µ + βk + θl+ αi + λj + αλij + εijkl
Donde:
Yijkl
= Una observación
Ing. Ramiro Raúl OCHOA TORREZ
99
µ
βk
θl
αi
λj
αλij
εijkl
= Media poblacional
= Efecto del k – esimo bloque
= Efecto de la l – esima columna
= Efecto del i – esimo nivel del factor A (Insecticida)
= Efecto del j – esimo nivel del factor B (Dosis)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Insecticida x Dosis)
= Error experimental
Insecticida
Dosis
Bloque
Columna
i...
j...
k...
l...
a...
b...
c...
r...
1...
1...
1...
1...
2
3
6
6
Las hipótesis a probar serán:
Ho:
a1 = a2
(Insecticidas)
b1 = b2 = b3
(Dosis)
a1b1 = a1b2 = a1b3 = a2b1 = a2b2 = a2b3
I = II = III = IV = V = VI
(Bloques)
1 = 2 = 3 = 4= 5 = 6
(Columnas)
Ha:
a1 ≠ a2
(Insecticidas)
b1 ≠ b2 ≠ b3
(Dosis)
a1b1 ≠ a1b2 ≠ a1b3 ≠ a2b1 ≠ a2b2 ≠ a2b3
I ≠ II ≠ III ≠ IV ≠ V ≠ VI (Bloques)
1 ≠ 2 ≠ 3 ≠ 4≠ 5 ≠ 6
(Columnas)
Introduciendo los datos en el SAS, respetando la distribución de cada tratamiento (combinación de los niveles de los
dos factores) en cada bloque y cada columna:
100
Ing. Ramiro Raúl OCHOA TORREZ
EXPERIMENTOS FACTORIALES
OPTIONS NODATE NONUMBER;
DATA DCLFAC;
INPUT BLOQUE $ COLUMNA INSEC $ DOSIS $ REND;
CARDS;
VI
1
a1
b3
7
VI
2
a2
b3
8
VI
3
a2
b1
6
VI
4
a1
b1
4
VI
5
a2
b2
3
VI
6
a1
b2
5
V
1
a1
b2
5
V
2
a2
b2
3
V
3
a1
b3
7
V
4
a2
b3
9
V
5
a2
b1
6
V
6
a1
b1
3
IV
1
a1
b1
4
IV
2
a2
b1
7
IV
3
a1
b2
5
IV
4
a2
b2
4
IV
5
a1
b3
6
IV
6
a2
b3
8
III
1
a2
b3
9
III
2
a1
b3
7
III
3
a1
b1
4
III
4
a2
b1
7
III
5
a1
b2
6
III
6
a2
b2
4
II
1
a2
b2
3
II
2
a1
b2
6
II
3
a2
b3
9
II
4
a1
b3
8
II
5
a1
b1
3
II
6
a2
b1
6
I
1
a2
b1
7
I
2
a1
b1
3
I
3
a2
b2
4
I
4
a1
b2
5
I
5
a2
b3
8
I
6
a1
b3
7
;
PROC ANOVA;
CLASS BLOQUE COLUMNA INSEC DOSIS;
MODEL REND=BLOQUE COLUMNA INSEC DOSIS INSEC*DOSIS;
RUN;
La salida de los resultados será la siguiente:
Ing. Ramiro Raúl OCHOA TORREZ
101
The SAS System
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQUE
6
I II III IV V VI
COLUMNA
6
1 2 3 4 5 6
INSEC
2
a1 a2
DOSIS
3
b1 b2 b3
Number of observations
36
The SAS System
The ANOVA Procedure
Dependent Variable: REND
Source
Model
Error
Corrected Total
DF
15
20
35
R-Square
0.962167
Source
BLOQUE
COLUMNA
INSEC
DOSIS
INSEC*DOSIS
Sum of
Squares
124.3333333
4.8888889
129.2222222
Coeff Var
8.640231
DF
5
5
1
2
2
Mean Square
8.2888889
0.2444444
Root MSE
0.494413
Anova SS
1.88888889
2.55555556
7.11111111
76.05555556
36.72222222
F Value
33.91
Pr > F
<.0001
REND Mean
5.722222
Mean Square
0.37777778
0.51111111
7.11111111
38.02777778
18.36111111
F Value
1.55
2.09
29.09
155.57
75.11
Pr > F
0.2209
0.1090
<.0001
<.0001
<.0001
Organizando los resultados y en función de las reglas de decisión interpretamos y realizamos las conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQUE
COLUMNA
INSEC
DOSIS
INSEC*DOSIS
Error
Corrected Total
DF
5
5
1
2
2
20
35
R-Square
0.962167
Sum of
Squares
1.88888889
2.55555556
7.11111111
76.05555556
36.72222222
4.8888889
129.2222222
Coeff Var
8.640231
Mean Square
0.37777778
0.51111111
7.11111111
38.02777778
18.36111111
0.2444444
Root MSE
0.494413
F Value
1.55
2.09
29.09
155.57
75.11
Pr > F
0.2209ns
0.1090ns
<.0001**
<.0001**
<.0001**
REND Mean
5.722222
CONCLUSIÓN
El análisis de varianza nos muestra que no se tienen diferencias estadísticas entre bloques y columnas, presentando
diferencias altamente significativas para Insecticidas, Dosis y la interacción Insecticidas x Dosis, teniéndose un
promedio general de 5.722 de rendimiento por parcela y un coeficiente de variación de 8.640231%.
102
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
10. PARCELAS DIVIDIDAS
10.1.DCA con arreglo en parcelas divididas
EJERCICIO
Los datos siguientes se refieren al aumento de peso diario en kilogramos, logrado por novillos criollos, en corral, bajo
una misma alimentación, pero en diferentes dosis de desparacitadores (ml/100 kg de peso) e implantados con
Sinovex y Revalor (Rodríguez 1991).
Dosis
10
10
12
12
14
14
Implante
Sinovex
Revalor
Sinovex
Revalor
Sinovex
Revalor
I
1.525
1.721
1.724
1.925
1.935
1.616
II
1.532
1.729
1.728
1.923
1.928
1.625
III
1.549
1.732
1.732
1.940
1.926
1.631
IV
1.562
1.744
1.740
1.952
1.941
1.623
El modelo lineal para un diseño completamente al azar con arreglo en parcelas divididas:
Yijk = µ + αi + εik + λj + αλij + εijk
Donde:
Yijk
µ
αi
εik
λj
αλij
εijk
= Una observación
= Media poblacional
= Efecto del i – esimo nivel del factor A (Dosis)
= Error experimental de la parcela mayor (Ea)
= Efecto del j – esimo nivel del factor B (Implante)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B) (Dosis
x Implante)
= Error experimental de la parcela menor (Eb)
A
B
Repetición
i…
j…
k…
a…
b…
r…
1…
1…
1…
3
2
4
Las hipótesis a probar serán:
Ho:
10 = 12 = 14
(Dosis)
Sinovex = Revalor
(Implante)
10 – Sinovex = … = 14 – Revalor
Ha:
a1 ≠ a2
(Insecticidas)
b1 ≠ b2 ≠ b3
(Dosis)
10 – Sinovex ≠ … ≠ 14 – Revalor
Introduciendo los datos de manera columnar tendremos:
Ing. Ramiro Raúl OCHOA TORREZ
103
OPTIONS NODATE NONUMBER;
DATA PDDCA;
INPUT REPETI DOSIS IMPLA $ PESO;
CARDS;
1 10 Sinovex 1.525
1 10 Revalor 1.721
1 12 Sinovex 1.724
1 12 Revalor 1.925
1 14 Sinovex 1.935
1 14 Revalor 1.616
2 10 Sinovex 1.532
2 10 Revalor 1.729
2 12 Sinovex 1.728
2 12 Revalor 1.923
2 14 Sinovex 1.928
2 14 Revalor 1.625
3 10 Sinovex 1.549
3 10 Revalor 1.732
3 12 Sinovex 1.732
3 12 Revalor 1.94
3 14 Sinovex 1.926
3 14 Revalor 1.631
4 10 Sinovex 1.562
4 10 Revalor 1.744
4 12 Sinovex 1.74
4 12 Revalor 1.952
4 14 Sinovex 1.941
4 14 Revalor 1.623
;
PROC ANOVA;
CLASS REPETI DOSIS IMPLA;
MODEL PESO=DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA;
TEST H=DOSIS E=REPETI*DOSIS;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
(4)
(5)
PROC ANOVA; le indica que realice el calculo de análisis de varianza.
CLASS REPETI DOSIS IMPLA; le señala cuales variables estarán en estudio o de clasificación para nuestro
caso las variables son: Repetición, Dosis e Implantación.
MODEL PESO=DOSIS REPETI*DOSIS IMPLA DOSIS*IMPLA; este punto esta en directa relación con el
modelo lineal de un diseño completamente al azar con arreglo en parcelas divididas (Yijk = µ + αi + εik + λj
+ αλij + εijk), donde se coloca como:
Yijk = µ + αi + εik + λj + αλij + εijk
Variable de respuesta = Variables de estudio
Peso = Dosis E(a) Implantación Dosis*Implantacion
No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del
modelo.
(4)
TEST H=DOSIS E=REPETI*DOSIS; este comando se incorpora con la finalidad de ajustar el valor de Fc
(Efe calculado) y Probabilidad, para las dosis, considerando que el CME (Cuadrado Medio del Error) para
dicho calculo será el CMEa (Cuadrado Medio del Error de A), esto se hace considerando las formulas del
ANVA, donde se observa que para el calculo del valor de Fc del factor A (en nuestro ejemplo Dosis), se
divide entre el CMEa, este para el análisis en el SAS esta conformado por la combinación de la
Repetición*Dosis:
104
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
FV
αi A
εik Ea
λj B
αλij AB
εijk Eb
Total
(5)
GL
a–1
a(r – 1)
b–1
(a – 1)(b – 1)
a(r – 1)(b – 1)
abr – 1
SC
CM
SCA / GLA
SCEa / GLEa
SCB / GLB
SCAB / GLAB
SCE / GLE
SCA
SCEa
SCB
SCAB
SCE
SCT
Fc
CMA / CME
Ft
f(GLA, GLEa)
CMB /CME
CMAB /CME
f(GLB, GLEb)
f(GLAB, GLEb)
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
Los resultados que nos proporcionara serán:
The SAS System
The ANOVA Procedure
Class Level Information
Class
Levels
Values
REPETI
4
1 2 3 4
DOSIS
3
10 12 14
IMPLA
2
Revalor Sinovex
Number of observations
24
The SAS System
The ANOVA Procedure
Dependent Variable: PESO
(1)
Source
Model
Error
Corrected Total
DF
14
9
23
R-Square
0.999238
(2)
(3)
Source
DOSIS
REPETI*DOSIS
IMPLA
DOSIS*IMPLA
Sum of
Squares
0.51141308
0.00038987
0.51180296
Coeff Var
0.376252
DF
2
9
1
2
Mean Square
0.03652951
0.00004332
Root MSE
0.006582
Anova SS
0.16403258
0.00167487
0.00478838
0.34091725
F Value
843.26
Pr > F
<.0001
PESO Mean
1.749292
Mean Square
0.08201629
0.00018610
0.00478838
0.17045862
F Value
1893.29
4.30
110.54
3934.92
Pr > F
<.0001
0.0204
<.0001
<.0001
Tests of Hypotheses Using the Anova MS for REPETI*DOSIS as an Error Term
Source
DF
Anova SS
Mean Square
F Value
Pr > F
DOSIS
2
0.16403258
0.08201629
440.72
<.0001
Los resultados encontrados deberán ordenarse para poder interpretarlos.
Primeramente se considera el punto (3):
(3)
DOSIS
(2)
Source
DOSIS
REPETI*DOSIS
2
0.16403258
0.08201629
440.72
<.0001
DF
2
9
Anova SS
0.16403258
0.00167487
Mean Square
0.08201629
0.00018610
F Value
1893.29
4.30
Pr > F
<.0001
0.0204
Los valores correspondientes a DOSIS, deberán ser remplazados en el punto (2), donde se encuentra las demás
fuentes de variación:
Ing. Ramiro Raúl OCHOA TORREZ
105
IMPLA
DOSIS*IMPLA
1
2
0.00478838
0.34091725
0.00478838
0.17045862
110.54
3934.92
<.0001
<.0001
DF
2
9
1
2
Anova SS
0.16403258
0.00167487
0.00478838
0.34091725
Mean Square
0.08201629
0.00018610
0.00478838
0.17045862
F Value
440.72
4.30
110.54
3934.92
Pr > F
<.0001
0.0204
<.0001
<.0001
Quedandonos:
Source
DOSIS
REPETI*DOSIS
IMPLA
DOSIS*IMPLA
Una vez remplazado este valor, se procede a remplazar todas las fuentes de variación en el punto (1) en remplazo
de Model:
Source
Model
Error
Corrected Total
(1)
DF
14
9
23
R-Square
0.999238
Squares
0.51141308
0.00038987
0.51180296
Coeff Var
0.376252
Mean Square
0.03652951
0.00004332
Root MSE
0.006582
F Value
843.26
Pr > F
<.0001
PESO Mean
1.749292
Lo que nos dará como resultado final, considerando a la interacción REPETI*DOSIS como el E(a):
Source
DOSIS
REPETI*DOSIS
IMPLA
DOSIS*IMPLA
Error
Corrected Total
DF
2
9
1
2
9
23
R-Square
0.999238
Squares
0.16403258
0.00167487
0.00478838
0.34091725
0.00038987
0.51180296
Coeff Var
0.376252
Mean Square
0.08201629
0.00018610
0.00478838
0.17045862
0.00004332
Root MSE
0.006582
F Value
440.72
4.30
110.54
3934.92
Pr > F
<.0001
0.0204
<.0001
<.0001
PESO Mean
1.749292
Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las
conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Source
DOSIS
E (a)
IMPLA
DOSIS*IMPLA
Error
Corrected Total
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
R-Square
0.999238
Sum of
DF
Squares
Mean Square
F Value
2
0.16403258
0.08201629
440.72
9
0.00167487
0.00018610
1
0.00478838
0.00478838
110.54
2
0.34091725
0.17045862
3934.92
9
0.00038987
0.00004332
23
0.51180296
Coeff Var
Root MSE
PESO Mean
0.376252
0.006582
1.749292
Pr > F
<.0001**
<.0001**
<.0001**
Conclusión
El análisis de varianza, nos presenta que entre los factores Dosis, Implantación y la interacción de Dosis x
Implantación, se tienen diferencias altamente significativas en los valores de aumento de peso, teniéndose un
promedio general de 1.749292 kilogramos de aumento de peso, con un coeficiente de variación de 0.376253%.
106
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
Como se observo se hace necesario el calculo de las pruebas de medias y el análisis de varianza de efectos
simples, el procedimiento es similar al descrito en los ejercicios de experimentos factoriales.
10.2.DBA con arreglo en parcelas divididas
Ejercicio
Se tiene la producción total de materia seca del pasto estrella africana, en tres frecuencias de corte (Parcela Grande)
y tres alturas de corte (Parcela Chica) (Padrón 1996):
Frecuencia de corte
20dias
20dias
20dias
40dias
40dias
40dias
Altura de corte
0cm
5cm
10cm
0cm
5cm
10cm
I
5.69
3.72
3.66
6.48
3.86
11.15
II
5.98
3.20
2.85
7.92
4.54
3.54
III
5.37
3.90
2.60
4.74
4.42
3.91
IV
6.30
4.51
3.83
6.30
5.06
3.66
El modelo lineal para un diseño bloques al azar con arreglo en parcelas divididas es el siguiente:
Yijk = µ + βk + αi + εik + λj + αλij + εijk
Donde:
Yijk
µ
βk
αi
εik
λj
αλij
εijk
A
B
Bloques
= Una observación
= Media poblacional
= Efecto del k – esimo bloque
= Efecto del i – esimo nivel del factor A (Frecuencia de corte)
= Error experimental de la parcela mayor (Ea)
= Efecto del j – esimo nivel del factor B (Altura de corte)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Frecuencia de corte x Altura de corte)
= Error experimental de la parcela menor (Eb)
i…
j…
k…
a…
b…
r…
1…
1…
1…
2
3
4
Las hipótesis a probar serán:
Ho:
20dias = 40dias
(Frecuencia de corte)
0cm = 5cm = 10cm
(Altura de corte)
20dias – 0cm = … = 40dias – 10cm
I = II = III = IV
(Bloques)
Ho:
20dias ≠ 40dias
(Frecuencia de corte)
0cm ≠ 5cm ≠ 10cm
(Altura de corte)
20dias – 0cm ≠ … ≠ 40dias – 10cm
I ≠ II ≠ III ≠ IV
(Bloques)
Introduciendo los datos de manera columnar tendremos:
Ing. Ramiro Raúl OCHOA TORREZ
107
OPTIONS NODATE NONUMBER;
DATA PD_DBA;
INPUT BLOQUE $ FREC $ ALTURA $
PROD;
CARDS;
I
20dias 0cm
5.69
I
20dias 5cm
3.72
I
20dias 10cm
3.66
I
40dias 0cm
6.48
I
40dias 5cm
3.86
I
40dias 10cm
11.15
II
20dias 0cm
5.98
II
20dias 5cm
3.2
II
20dias 10cm
2.85
II
40dias 0cm
7.92
II
40dias 5cm
4.54
II
40dias 10cm
3.54
III
20dias 0cm
5.37
III
20dias 5cm
3.9
III
20dias 10cm
2.6
III
40dias 0cm
4.74
III
40dias 5cm
4.42
III
40dias 10cm
3.91
IV
20dias 0cm
6.3
IV
20dias 5cm
4.51
IV
20dias 10cm
3.83
IV
40dias 0cm
6.3
IV
40dias 5cm
5.06
IV
40dias 10cm
3.66
;
PROC ANOVA;
CLASS BLOQUE FREC ALTURA;
MODEL PROD=BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA;
TEST H=BLOQUE FREC E=BLOQUE*FREC;
RUN;
(1)
(2)
(3)
(1)
(2)
(3)
(4)
(5)
PROC ANOVA; le indica que realice el calculo de análisis de varianza.
CLASS BLOQUE FREC ALTURA; le señala cuales variables estarán en estudio o de clasificación para
nuestro caso las variables son: Bloques, Frecuencia y Altura.
MODEL PROD=BLOQUE FREC BLOQUE*FREC ALTURA FREC*ALTURA; este punto esta en directa
relación con el modelo lineal de un diseño completamente al azar con arreglo en parcelas divididas (Yijk = µ
+ βk + αi + εik + λj + αλij + εijk), donde se coloca como:
Yijk = µ + βk + αi + εik + λj + αλij + εijk
Variable de respuesta = Variables de estudio
Producción = Bloque Frecuencia Bloque*Frecuencia Altura Frecuencia*Altura
Producción = Bloque Frecuencia E(a) Altura Frecuencia*Altura
No se incorpora el promedio como tampoco el error, el programa sobre entiende estos componentes del
modelo.
(4)
TEST H=BLOQUE FREC E=BLOQUE*FREC; este comando se incorpora con la finalidad de ajustar el valor
de Fc (Efe calculado) y Probabilidad, para los bloques y la frecuencia de corte, considerando que el CME
(Cuadrado Medio del Error) para dicho calculo será el CMEa (Cuadrado Medio del Error de A), esto se hace
considerando las formulas del ANVA, donde se observa que para el calculo del valor de Fc de bloques y el
108
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
factor A (Frecuencia de corte), se divide entre el CMEa, este para el análisis en el SAS esta conformado por
la combinación de Bloque*Frec:
FV
βk Bloque
αi A
εik Ea
λj B
αλij AB
εijk Eb
Total
(5)
GL
r–1
a–1
(r – 1)(a – 1)
b–1
(a – 1)(b – 1)
a(b – 1)(r – 1)
abr – 1
SC
SCBlo
SCA
SCEa
SCB
SCAB
SCE
SCT
CM
SCBlo / GLBlo
SCA / GLA
SCEa / GLEa
SCB / GLB
SCAB / GLAB
SCE / GLE
Fc
CMBlo / CME
CMA / CME
Ft
f(GLBlo, GLEa)
f(GLA, GLEa)
CMB /CME
CMAB /CME
f(GLB, GLEb)
f(GLAB, GLEb)
Con RUN; le señalamos que las sentencias anteriores son ejecutables.
Los resultados que nos proporciona el SAS, al igual que en el anterior ejercicio se deberan organizar como en el
anterior ejercicio, considerando las tres partes:
The SAS System
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQUE
4
I II III IV
FREC
2
20dias 40dias
ALTURA
3
0cm 10cm 5cm
Number of observations
24
The SAS System
The ANOVA Procedure
Dependent Variable: PROD
(1)
Source
Model
Error
Corrected Total
DF
11
12
23
R-Square
0.559701
(2)
Source
BLOQUE
FREC
BLOQUE*FREC
ALTURA
FREC*ALTURA
Sum of
Squares
44.81711250
35.25618333
80.07329583
Coeff Var
35.10328
DF
3
1
3
2
2
Mean Square
4.07428295
2.93801528
Root MSE
1.714064
Anova SS
8.06994583
8.13170417
6.57524583
17.95005833
4.09015833
F Value
1.39
Pr > F
0.2909
PROD Mean
4.882917
Mean Square
2.68998194
8.13170417
2.19174861
8.97502917
2.04507917
F Value
0.92
2.77
0.75
3.05
0.70
Pr > F
0.4626
0.1221
0.5452
0.0847
0.5176
Tests of Hypotheses Using the Anova MS for BLOQUE*FREC as an Error Term
(3)
Source
BLOQUE
FREC
DF
3
1
Anova SS
8.06994583
8.13170417
Mean Square
2.68998194
8.13170417
F Value
1.23
3.71
Pr > F
0.4351
0.1497
Para la ordenación se considera primeramente el punto (3), donde sus valores serán remplazados en las fuentes de
variación correspondientes en el punto (2):
Source
Ing. Ramiro Raúl OCHOA TORREZ
DF
Anova SS
Mean Square
F Value
Pr > F
109
(3)
BLOQUE
FREC
Source
BLOQUE
FREC
BLOQUE*FREC
ALTURA
FREC*ALTURA
(2)
3
1
8.06994583
8.13170417
2.68998194
8.13170417
1.23
3.71
0.4351
0.1497
DF
3
1
3
2
2
Anova SS
8.06994583
8.13170417
6.57524583
17.95005833
4.09015833
Mean Square
2.68998194
8.13170417
2.19174861
8.97502917
2.04507917
F Value
0.92
2.77
0.75
3.05
0.70
Pr > F
0.4626
0.1221
0.5452
0.0847
0.5176
Una vez remplazados el siguiente paso será remplazar estos en el punto (1) en el sitio que corresponde a Model:
(1)
Source
BLOQUE
FREC
BLOQUE*FREC
ALTURA
FREC*ALTURA
DF
3
1
3
2
2
Anova SS
8.06994583
8.13170417
6.57524583
17.95005833
4.09015833
Mean Square
2.68998194
8.13170417
2.19174861
8.97502917
2.04507917
F Value
1.23
3.71
0.75
3.05
0.70
Pr > F
0.4351
0.1497
0.5452
0.0847
0.5176
Source
Model
Error
Corrected Total
DF
11
12
23
Sum of
Squares
44.81711250
35.25618333
80.07329583
Mean Square
4.07428295
2.93801528
F Value
1.39
Pr > F
0.2909
R-Square
0.559701
Lo que nos dará como resultado:
Source
BLOQUE
FREC
BLOQUE*FREC
ALTURA
FREC*ALTURA
Error
Corrected Total
R-Square
0.559701
Coeff Var
35.10328
Root MSE
1.714064
PROD Mean
4.882917
Sum of
DF
Squares
Mean Square
F Value
3
8.06994583
2.68998194
1.23
1
8.13170417
8.13170417
3.71
3
6.57524583
2.19174861
0.75
2
17.95005833
8.97502917
3.05
2
4.09015833
2.04507917
0.70
12
35.25618333
2.93801528
23
80.07329583
Coeff Var
Root MSE
PROD Mean
35.10328
1.714064
4.882917
Pr > F
0.4351
0.1497
0.5452
0.0847
0.5176
Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las
conclusiones, corrigiendo el valor de BLOQUE*ALTURA el cual corresponde a E(a)
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Source
BLOQUE
FREC
E (a)
ALTURA
FREC*ALTURA
Error
Corrected Total
110
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
DF
3
1
3
2
2
12
23
Sum of
Squares
8.06994583
8.13170417
6.57524583
17.95005833
4.09015833
35.25618333
80.07329583
Mean Square
2.68998194
8.13170417
2.19174861
8.97502917
2.04507917
2.93801528
F Value
1.23
3.71
Pr > F
0.4351ns
0.1497ns
3.05
0.70
0.0847ns
0.5176ns
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
R-Square
0.559701
Coeff Var
35.10328
Root MSE
1.714064
PROD Mean
4.882917
Conclusión
El análisis de varianza, nos presenta que entre las diferentes fuentes de variación (Bloques, Frecuencia de riego,
Altura de corte y la interacción de Frecuencia x Altura de corte), no presentan diferencias significativas, el promedio
de producción de materia seca es de 4.882917 y un coeficiente de variación de 35.10328%.
En este ejercicio no es necesario realizar las pruebas de medias y el análisis de varianza de efectos simples, por
tenerse en la totalidad de fuentes de variación no significancia, pero si se puede realizar la presentación de
promedios y desvió estándar de cada fuente de variación (procedimiento ya indicado anteriormente).
10.3.DCL con arreglo en parcelas divididas
Ejercicio
En Apodaca N.L. se estudiaron cinco variedades de maíz, cada una sembrada a tres densidades de siembra (Reyes
1999).
Parcelas Grandes
Variedades (A)
1= N.L. H – 1
2= N.L. H – 2
3= N.L. H – 3
4= Sintético precoz
5= Sintético precoz selección por cuarteo
Parcelas Chicas
Densidades (B)
a= 55000 pl/ha
b= 65000 pl/ha
c= 75000 pl/ha
En el siguiente cuadro se muestran los siguientes datos:
Número de variedad de maíz:
Densidad de siembra:
Producción de cada parcela
1, 2, 3, 4 y 5
a, b y c
Experimento con arreglo en parcelas divididas y distribución en cuadrado latino 5 x 5, posición en el campo de
variedades de maíz, densidad de siembra, producción de grano de las parcelas grandes y producción de grano seco
por parcela útil en t/ha
Bloques
V
IV
III
II
b
5.0
1
5
c
4.9
a
4.9
b
5.5
3
a
4.9
c
5.8
1
b
5.9
c
5.5
Columnas
3
4
b
a
c
5.5 4.7 4.8
5
a
4.8
c
4.9
c
6.1
2
b
5.7
3
b
5.3
a
5.3
b
5.0
5
c
5.9
a
6.1
2
2
b
5.1
c
5.4
b
4.7
a
7.0
c
5.5
4
Ing. Ramiro Raúl OCHOA TORREZ
1
3
a
6.0
4
1
b
5.1
c
6.2
a
5.9
c
5.2
4
b
4.9
a
5.0
b
5.9
2
c
5.9
5
a
6.5
5
3
b
6.5
c
5.7
a
4.3
b
6.0
1
c
6.2
a
6.8
a
6.2
a
5.1
4
c
6.1
b
5.6
2
111
I
b
4.9
a
5.4
c
5.5
a
6.5
b
6.3
c
5.6
b
6.1
a
5.8
c
5.0
a
5.2
b
4.1
c
5.2
c
5.6
a
5.7
b
5.6
b
5.6
2
a
6.1
c
6.8
b
5.3
4
c
5.3
a
5.4
a
5.6
1
c
5.9
b
5.9
c
4.8
3
a
6.2
b
5.2
b
5.0
5
c
5.4
a
6.0
El modelo lineal para un diseño cuadrado latino con arreglo en parcelas divididas es el siguiente:
Yijkl = µ + βk + θl+ αi + εikl + λj + αλij + εijkl
Donde:
Yijkl
µ
βk
θl
αi
εikl
λj
αλij
εijkl
= Una observación
= Media poblacional
= Efecto del k – esimo bloque
= Efecto de la l – esima columna
= Efecto del i – esimo nivel del factor A (Variedades)
= Error experimental de la parcela mayor (Ea)
= Efecto del j – esimo nivel del factor B (Densidades)
= Efecto del i – esimo nivel del factor A, con el j – esimo nivel del factor B (interacción A x B)
(Variedades x Densidades)
= Error experimental de la parcela menor (Eb)
A
B
Bloques
Columnas
i…
j…
k…
l…
a…
b…
r…
r…
1…
1…
1…
1…
5
3
5
5
Las hipótesis a probar serán:
Ho:
Ho:
1=2=3=4=5
a=b=c
1a = 1b = … = 5c
I = II = III = IV = V
1=2=3=4=5
1≠2≠3≠4≠5
a≠b≠c
1a ≠ 1b ≠ … ≠ 5c
I ≠ II ≠ III ≠ IV ≠ V
1≠2≠3≠4≠5
(Variedades)
(Densidades de siembra)
(Bloques)
(Columnas)
(Variedades)
(Densidades de siembra)
(Bloques)
(Columnas)
Introduciendo los datos de manera columnar tendremos:
112
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
OPTIONS NODATE NONUMBER;
DATA PD_DCL;
INPUT BLOQUE $ COL
VAR
DENSI $ PROD;
CARDS;
I
1
5
b
5
I
1
5
c
4.9
I
1
5
a
4.9
I
2
2
a
6.1
I
2
2
b
5.1
I
2
2
c
5.5
I
3
4
b
5.5
I
3
4
a
4.7
I
3
4
c
4.8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
V
3
1
a
5.6
V
3
1
c
5.9
V
3
1
b
5.9
V
4
3
c
4.8
V
4
3
a
6.2
V
4
3
b
5.2
V
5
5
b
5
V
5
5
c
5.4
V
5
5
a
6
;
PROC ANOVA;
CLASS BLOQUE COL VAR DENSI;
MODEL PROD=BLOQUE COL VAR BLOQUE*COL*VAR DENSI VAR*DENSI;
TEST H=BLOQUE COL VAR E=BLOQUE*COL*VAR;
RUN;
Al igual que en el anterior caso se debe ajustar los valores de bloques, columna y del factor A (Variedades),
considerando para que para estos su CME, estará dado por la interacción de BLOQUE*COL*VAR que viene a ser el
E(a) Error de la parcela mayor en las fuentes de variación.
Ing. Ramiro Raúl OCHOA TORREZ
113
The SAS System
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQUE
5
I II III IV V
COL
5
1 2 3 4 5
VAR
5
1 2 3 4 5
DENSI
3
a b c
Number of observations
75
The SAS System
The ANOVA Procedure
Dependent Variable: PROD
Source
Model
Error
Corrected Total
(1)
DF
34
40
74
R-Square
0.752579
Source
BLOQUE
COL
VAR
BLOQUE*COL*VAR
DENSI
VAR*DENSI
(2)
Sum of
Squares
19.31680000
6.35066667
25.66746667
Coeff Var
7.178513
DF
4
4
4
12
2
8
Mean Square
0.56814118
0.15876667
Root MSE
0.398455
Anova SS
0.77013333
2.11946667
10.53546667
2.69573333
0.66106667
2.53493333
F Value
3.58
Pr > F
<.0001
PROD Mean
5.550667
Mean Square
0.19253333
0.52986667
2.63386667
0.22464444
0.33053333
0.31686667
F Value
1.21
3.34
16.59
1.41
2.08
2.00
Pr > F
0.3206
0.0189
<.0001
0.1995
0.1380
0.0720
Tests of Hypotheses Using the Anova MS for BLOQUE*COL*VAR as an Error Term
Source
BLOQUE
COL
VAR
(3)
DF
4
4
4
Anova SS
0.77013333
2.11946667
10.53546667
Mean Square
0.19253333
0.52986667
2.63386667
F Value
0.86
2.36
11.72
Pr > F
0.5166
0.1121
0.0004
Organizando los resultados, remplazamos los valores de Bloque, Columna y Variedades del punto (3), en el punto
(2), ya que los primeros consideran como CME a la interacción BLOQUE*COL*VAR.
(3)
(2)
Source
BLOQUE
COL
VAR
DF
4
4
4
Anova SS
0.77013333
2.11946667
10.53546667
Mean Square
0.19253333
0.52986667
2.63386667
F Value
0.86
2.36
11.72
Pr > F
0.5166
0.1121
0.0004
Source
BLOQUE
COL
VAR
BLOQUE*COL*VAR
DENSI
VAR*DENSI
DF
4
4
4
12
2
8
Anova SS
0.77013333
2.11946667
10.53546667
2.69573333
0.66106667
2.53493333
Mean Square
0.19253333
0.52986667
2.63386667
0.22464444
0.33053333
0.31686667
F Value
1.21
3.34
16.59
1.41
2.08
2.00
Pr > F
0.3206
0.0189
<.0001
0.1995
0.1380
0.0720
Una vez remplazado, los valores tenemos:
114
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS DIVIDIDAS
Source
BLOQUE
COL
VAR
BLOQUE*COL*VAR
DENSI
VAR*DENSI
DF
4
4
4
12
2
8
Anova SS
0.77013333
2.11946667
10.53546667
2.69573333
0.66106667
2.53493333
Mean Square
0.19253333
0.52986667
2.63386667
0.22464444
0.33053333
0.31686667
F Value
0.86
2.36
11.72
1.41
2.08
2.00
Pr > F
0.5166
0.1121
0.0004
0.1995
0.1380
0.0720
F Value
3.58
Pr > F
<.0001
Todos estos valores se remplazan en el punto (1) que corresponde a Model:
Source
Model
Error
Corrected Total
(1)
DF
34
40
74
Sum of
Squares
19.31680000
6.35066667
25.66746667
Mean Square
0.56814118
0.15876667
Teniéndose al final todo el ANVA de un Diseño Cuadrado Latino con arreglo en parcelas divididas:
Source
BLOQUE
COL
VAR
BLOQUE*COL*VAR
DENSI
VAR*DENSI
Error
Corrected Total
DF
4
4
4
12
2
8
40
74
Squares
0.77013333
2.11946667
10.53546667
2.69573333
0.66106667
2.53493333
6.35066667
25.66746667
Mean Square
0.19253333
0.52986667
2.63386667
0.22464444
0.33053333
0.31686667
0.15876667
F Value
0.86
2.36
11.72
1.41
2.08
2.00
Pr > F
0.5166
0.1121
0.0004
0.1995
0.1380
0.0720
El siguiente paso será remplazar el término BLOQUE*COL*VAR, como el E (a), y sacar las respectivas conclusiones
mediante la regla de decisión:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQUE
COL
VAR
E (a)
DENSI
VAR*DENSI
Error
Corrected Total
DF
4
4
4
12
2
8
40
74
R-Square
0.752579
Sum of
Squares
0.77013333
2.11946667
10.53546667
2.69573333
0.66106667
2.53493333
6.35066667
25.66746667
Coeff Var
7.178513
Mean Square
0.19253333
0.52986667
2.63386667
0.22464444
0.33053333
0.31686667
0.15876667
Root MSE
0.398455
F Value
0.86
2.36
11.72
Pr > F
0.5166ns
0.1121ns
0.0004**
2.08
2.00
0.1380ns
0.0720ns
PROD Mean
5.550667
Conclusión
El análisis de varianza no presenta diferencias significativas entre Bloques y Columna, en tanto que entre Variedades
se tienen diferencias altamente significativas en los valores de producción por t/ha, pero no se tienen diferencias en
el factor Densidades de siembra no se tienen diferencias estadísticas, como así también en la interacción de
Variedades x Densidades. Por otra parte se tiene un coeficiente de variación de 7.178513% y un promedio general
de producción de 5.550667 t/ha.
Ing. Ramiro Raúl OCHOA TORREZ
115
Se puede observar que en este ejercicio solo se tiene significancia entre variedades, y no así en las otras fuentes de
variación por lo que no será necesario realizar el análisis de varianza de efectos simples.
116
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS SUBDIVIDIDAS
11. PARCELAS SUBDIVIDIDAS
11.1.DBA con arreglo en parcelas subdivididas
Ejercicio
En la estación experimental INIAA, se ensayo el desarrollo de tecnología en oca, para esto se experimento en
parcelas subdivididas con tres bloques, evaluándose el factor A (parcela principal) con dos niveles: con estiércol y sin
estiércol, el factor B (sub parcela) con niveles de: tubérculo semilla con brote y semilla sin brotes y el factor C (sub
sub parcela) con niveles de: 1, 2 y 3 tubérculos/golpe. Los rendimientos fueron obtenidos en una parcela de 12.8 m2
con 4 surcos/parcela. La información se presenta a continuación (Ibáñez 1998).
a0 = Con estiércol 2 t/ha b0 = Tubérculo semilla con brotes c0 = 1 tubérculo/golpe (15 g)
a1 = Sin estiércol
b1 = Tubérculo semilla sin brote c1 = 2 tubérculo/golpe (10 g)
c2 = 3 tubérculo/golpe (8 g)
Bloques
I
II
II
c0
10
9
8
b0
c1
5
14
7
a0
c2
14
6
10
b1
c1
18
5
15
c0
15
7
13
c2
9
11
18
c0
7
6
7
b0
c1
6
19
12
a1
c2
6
13
12
c0
3
9
4
b1
c1
13
5
5
c2
12
10
4
El modelo lineal para un diseño bloques al azar con arreglo en parcelas subdivididas esta dado por:
Yijkl = µ + βl + αi + εil + δj + αδij + εijl + λk + αλik + δλjk + αδλijk + εijkl
Donde:
Yijkl
µ
βl
αi
εil
δj
αδij
εijl
λk
αλik
δλjk
αδλijk
εijkl
= Una observación
= Media poblacional
= Efecto del l – ésimo bloque
= Efecto del i – ésimo nivel del factor A
= Error experimental de la parcela mayor (Ea)
= Efecto del j – ésimo nivel del factor B
= Efecto del i – ésimo nivel del factor A, con el j – ésimo nivel del factor B (interacción A x B)
= Error experimental de la parcela mediana (Eb)
= Efecto del k – ésimo nivel del factor C (Potasio)
= Efecto del i – ésimo nivel del factor A, con el k – ésimo nivel del factor (interacción A x C)
= Efecto del j – ésimo nivel del factor B, con el k – ésimo nivel del factor C (interacción B x C)
= Efecto del i – ésimo nivel del factor A, con el j – ésimo nivel del factor B y el k – ésimo nivel del
factor C (interacción A x B x C)
= Error experimental de la parcela pequeña (Ec)
A
B
C
Bloque
i...
j...
k...
k...
a...
b...
c...
r...
1...
1...
1...
1...
2
2
3
3
Las hipótesis a probar serán:
Ho:
a0 = a1
b0 = b1
Ing. Ramiro Raúl OCHOA TORREZ
(A)
(B)
117
Ha:
c0 = c1 =c 2
I = II = III
(C)
(Bloques)
a0 ≠ a1
b0 ≠ b1
c0 ≠ c1 =c 2
I ≠ II ≠ III
(A)
(B)
(C)
(Bloques)
Introduciendo los datos de manera columnar tendremos:
OPTIONS NODATE NONUMBER;
DATA PSD_DBA;
INPUT BLOQUE $ A $
B $
CARDS;
I
a0
b0
c0
I
a0
b0
c1
I
a0
b0
c2
I
a0
b1
c0
I
a0
b1
c1
I
a0
b1
c2
I
a1
b0
c0
I
a1
b0
c1
I
a1
b0
c2
I
a1
b1
c0
I
a1
b1
c1
I
a1
b1
c2
.
.
.
.
.
.
.
.
.
.
.
.
III
a0
b0
c0
III
a0
b0
c1
III
a0
b0
c2
III
a0
b1
c0
III
a0
b1
c1
III
a0
b1
c2
III
a1
b0
c0
III
a1
b0
c1
III
a1
b0
c2
III
a1
b1
c0
III
a1
b1
c1
III
a1
b1
c2
;
PROC ANOVA;
CLASS BLOQUE A B C;
MODEL REND=BLOQUE A BLOQUE*A
TEST H=BLOQUE A E=BLOQUE*A;
TEST H=B A*B E=BLOQUE*A*B;
RUN;
C $
REND;
10
5
14
15
18
9
7
6
6
3
13
12
.
.
.
8
7
10
13
15
18
7
12
12
4
5
4
B A*B BLOQUE*A*B C A*C B*C A*B*C;
Al igual que en las parcelas divididas, se deben ajustar los valores de las parcelas grandes y subparcelas, en el
primer caso los bloques y el factor A se considera como CME (a) a la interacción BLOQUE*A; y para el factor B y la
interacción A*B los CME (b) será la interacción BLOQUE*A*B.
Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados:
118
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS SUBDIVIDIDAS
The SAS System
The ANOVA Procedure
Class Level Information
Class
Levels
Values
BLOQUE
3
I II III
A
2
a0 a1
B
2
b0 b1
C
3
c0 c1 c2
Number of observations
36
The SAS System
The ANOVA Procedure
Dependent Variable: REND
(1)
Source
Model
Error
Corrected Total
DF
19
16
35
R-Square
0.607727
(2)
Source
BLOQUE
A
BLOQUE*A
B
A*B
BLOQUE*A*B
C
A*C
B*C
A*B*C
Sum of
Squares
397.6388889
256.6666667
654.3055556
Coeff Var
41.55256
DF
2
1
2
1
1
4
2
2
2
2
Mean Square
20.9283626
16.0416667
Root MSE
4.005205
Anova SS
0.7222222
46.6944444
70.3888889
0.6944444
72.2500000
134.8888889
39.0555556
21.0555556
1.7222222
10.1666667
F Value
1.30
Pr > F
0.2982
F Value
0.02
2.91
2.19
0.04
4.50
2.10
1.22
0.66
0.05
0.32
Pr > F
0.9778
0.1073
0.1439
0.8378
0.0498
0.1280
0.3220
0.5322
0.9479
0.7329
REND Mean
9.638889
Mean Square
0.3611111
46.6944444
35.1944444
0.6944444
72.2500000
33.7222222
19.5277778
10.5277778
0.8611111
5.0833333
Tests of Hypotheses Using the Anova MS for BLOQUE*A as an Error Term
(3)
Source
BLOQUE
A
DF
2
1
Anova SS
0.72222222
46.69444444
Mean Square
0.36111111
46.69444444
F Value
0.01
1.33
Pr > F
0.9898
0.3685
Tests of Hypotheses Using the Anova MS for BLOQUE*A*B as an Error Term
(4)
Source
B
A*B
DF
1
1
Anova SS
0.69444444
72.25000000
Mean Square
0.69444444
72.25000000
F Value
0.02
2.14
Pr > F
0.8928
0.2171
Remplazando los valores de los puntos (4) correspondientes al factor B y la interacción A*B y (3) correspondientes a
BLOQUE y el factor A en el punto (2) tenemos, en los valores que corresponde a Bloque y el factor A; y los valores
del factor B y la interacción A*B:
(3)
Tests of Hypotheses Using the Anova MS for BLOQUE*A*B as an Error Term
Source
DF
Anova SS
Mean Square
F Value
Pr > F
BLOQUE
2
0.72222222
0.36111111
0.01
0.9898
A
1
46.69444444
46.69444444
1.33
0.3685
Tests of Hypotheses Using the Anova MS for BLOQUE*A*B as an Error Term
Ing. Ramiro Raúl OCHOA TORREZ
119
(4)
(2)
Source
B
A*B
DF
1
1
Anova SS
0.69444444
72.25000000
Mean Square
0.69444444
72.25000000
F Value
0.02
2.14
Pr > F
0.8928
0.2171
Source
BLOQUE
A
BLOQUE*A
B
A*B
BLOQUE*A*B
C
A*C
B*C
A*B*C
DF
2
1
2
1
1
4
2
2
2
2
Anova SS
0.7222222
46.6944444
70.3888889
0.6944444
72.2500000
134.8888889
39.0555556
21.0555556
1.7222222
10.1666667
Mean Square
0.3611111
46.6944444
35.1944444
0.6944444
72.2500000
33.7222222
19.5277778
10.5277778
0.8611111
5.0833333
F Value
0.02
2.91
2.19
0.04
4.50
2.10
1.22
0.66
0.05
0.32
Pr > F
0.9778
0.1073
0.1439
0.8378
0.0498
0.1280
0.3220
0.5322
0.9479
0.7329
Quedandonos todas las fuentes de variación, estas se remplazaran en el punto (1) en reemplazo de los valores que
corresponden a Model:
(1)
Source
BLOQUE
A
BLOQUE*A
B
A*B
BLOQUE*A*B
C
A*C
B*C
A*B*C
DF
2
1
2
1
1
4
2
2
2
2
Anova SS
0.72222222
46.69444444
70.3888889
0.69444444
72.25000000
134.8888889
39.0555556
21.0555556
1.7222222
10.1666667
Mean Square
0.36111111
46.69444444
35.1944444
0.69444444
72.25000000
33.7222222
19.5277778
10.5277778
0.8611111
5.0833333
F Value
0.01
1.33
2.19
0.02
2.14
2.10
1.22
0.66
0.05
0.32
Pr > F
0.9898
0.3685
0.1439
0.8928
0.2171
0.1280
0.3220
0.5322
0.9479
0.7329
Source
Model
Error
Corrected Total
DF
19
16
35
Sum of
Squares
397.6388889
256.6666667
654.3055556
Mean Square
20.9283626
16.0416667
F Value
1.30
Pr > F
0.2982
F Value
0.01
1.33
2.19
0.02
2.14
2.10
1.22
0.66
0.05
0.32
Pr > F
0.9898
0.3685
0.1439
0.8928
0.2171
0.1280
0.3220
0.5322
0.9479
0.7329
R-Square
0.607727
Coeff Var
41.55256
Root MSE
4.005205
REND Mean
9.638889
Una vez remplazado todos los valores nos queda el análisis de varianza completo:
Source
BLOQUE
A
BLOQUE*A
B
A*B
BLOQUE*A*B
C
A*C
B*C
A*B*C
Error
Corrected Total
DF
2
1
2
1
1
4
2
2
2
2
16
35
R-Square
0.607727
120
Sum of
Squares
0.72222222
46.69444444
70.3888889
0.69444444
72.25000000
134.8888889
39.0555556
21.0555556
1.7222222
10.1666667
256.6666667
654.3055556
Coeff Var
41.55256
Mean Square
0.36111111
46.69444444
35.1944444
0.69444444
72.25000000
33.7222222
19.5277778
10.5277778
0.8611111
5.0833333
16.0416667
Root MSE
4.005205
REND Mean
9.638889
Ing. Ramiro Raúl OCHOA TORREZ
PARCELAS SUBDIVIDIDAS
Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las
conclusiones, corrigiendo el valor de BLOQUE*ALTURA el cual corresponde a E(a), y la interacción de
BLOQUE*A*B corresponde E (b):
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQUE
A
E (a)
B
A*B
E (b)
C
A*C
B*C
A*B*C
Error
Corrected Total
DF
2
1
2
1
1
4
2
2
2
2
16
35
R-Square
0.607727
Sum of
Squares
0.72222222
46.69444444
70.3888889
0.69444444
72.25000000
134.8888889
39.0555556
21.0555556
1.7222222
10.1666667
256.6666667
654.3055556
Coeff Var
41.55256
Mean Square
0.36111111
46.69444444
35.1944444
0.69444444
72.25000000
33.7222222
19.5277778
10.5277778
0.8611111
5.0833333
16.0416667
Root MSE
4.005205
F Value
0.01
1.33
Pr > F
0.9898ns
0.3685ns
0.02
2.14
0.8928ns
0.2171ns
1.22
0.66
0.05
0.32
0.3220ns
0.5322ns
0.9479ns
0.7329ns
REND Mean
9.638889
Conclusión
El análisis de varianza no presenta en las diferentes fuentes de variación no presenta diferencias estadísticas, tanto
en el factor A y Bloques (Parcela Grande); así también el factor B y la interacción A*B no se presentan diferencias
significativas (Sub Parcela); así también el factor C, las interacciones simples A*C y B*C, así también en la
interacción triple A*B*C. el valor de rendimiento promedio encontrado en todo el experimento fue de 9.638889,
teniéndose por otra parte un coeficiente de variación de 41.55256%.
Se puede observar que en este ejercicio no se tienen significancias en ninguna de las fuentes de variación del
análisis de varianza, por lo que no es necesario realizar pruebas de medias, pero si se pueden analizar los valores
promedios de cada factor, como así también de las interacciones, revisando y analizando las variaciones numéricas
de cada uno de estos.
Ing. Ramiro Raúl OCHOA TORREZ
121
12. ARREGLO EN FRANJAS
12.1.Arreglo en franjas
Ejercicio
Los siguientes datos son de producciones de remolacha azucarera (t/acre) organizadas por tratamientos en un DBA
con arreglo en franjas (Little & Hills, 1991)
Libras de N/acre
0
0
0
0
120
120
120
120
Abono vegetal
Barbecho
Cebada
Vicia
Cebada+Vicia
Barbecho
Cebada
Vicia
Cebada+Vicia
I
13.8
15.5
21.0
18.9
19.3
22.2
25.3
25.9
II
13.5
15.0
22.7
18.3
18.0
24.2
24.8
26.7
III
13.2
15.2
22.3
19.6
20.5
25.4
28.4
27.6
El modelo lineal aditivo para un diseño bloques al azar con arreglo en franjas esta dado por:
Yijk = µ + βk + αi + εik + λj + εjk + αλij + εijk
Donde:
Yijk
µ
βk
αi
εik
λj
εjk
αλij
εijk
= Una observación
= Media poblacional
= Efecto del k – ésimo bloque
= Efecto del i – ésimo nivel del factor A
= Error experimental de la parcela mayor del factor A (Ea)
= Efecto del j – ésimo nivel del factor B
= Error experimental de la parcela mayor del factor B (Eb)
= Efecto del i – ésimo nivel del factor A, con el j – ésimo nivel del factor B (interacción A x B)
= Error experimental de la parcela menor (Ec)
A
B
Bloque
i…
j…
k…
a…
b…
r…
1…
1…
1…
2
4
3
Las hipótesis a probar serán:
Ho:
0 = 120
Barbecho = Cebada = Vicia = Cebada+Vicia
I = II = III
(Libras de N/acre)
(Abono Vegetal)
(Bloques)
Ho:
0 ≠ 120
Barbecho ≠ Cebada ≠ Vicia ≠ Cebada+Vicia
I ≠ II ≠ III
(Libras de N/acre)
(Abono Vegetal)
(Bloques)
Introduciendo los datos de manera columnar tendremos:
122
Ing. Ramiro Raúl OCHOA TORREZ
ARREGLO EN FRANJAS
OPTIONS NODATE NONUMBER;
DATA FRANJAS;
INPUT BLOQUE LIBRAS ABONO $ PROD;
CARDS;
1
0
BARBEC 13.8
1
0
CEBADA 15.5
1
0
CICIA
21
1
0
CEB_VIC 18.9
1
120
BARBEC 19.3
1
120
CEBADA 22.2
1
120
CICIA
25.3
1
120
CEB_VIC 25.9
2
0
BARBEC 13.5
2
0
CEBADA 15
2
0
CICIA
22.7
2
0
CEB_VIC 18.3
2
120
BARBEC 18
2
120
CEBADA 24.2
2
120
CICIA
24.8
2
120
CEB_VIC 26.7
3
0
BARBEC 13.2
3
0
CEBADA 15.2
3
0
CICIA
22.3
3
0
CEB_VIC 19.6
3
120
BARBEC 20.5
3
120
CEBADA 25.4
3
120
CICIA
28.4
3
120
CEB_VIC 27.6
;
PROC GLM;
CLASS BLOQUE LIBRAS ABONO;
MODEL PROD=BLOQUE LIBRAS BLOQUE*LIBRAS ABONO BLOQUE*ABONO LIBRAS*ABONO/SS3;
TEST H=BLOQUE LIBRAS E=BLOQUE*LIBRAS;
TEST H=ABONO E=BLOQUE*ABONO;
RUN;
Al igual que en las parcelas divididas o las parcelas subdivididas, se debe ajustar los valores de los dos factores
donde los dos están ubicados en parcelas grandes, por lo que ambos tendrán sus respectivos errores E(a) y E(b).
Para el factor A (Libras) y bloques su valor de CMEa estará conformado por la interacción BLOQUE*LIBRAS:
TEST H=BLOQUE LIBRAS E=BLOQUE*LIBRAS;
Para el factor B (Abono), su valor de CMEb estará conformado por la interacción BLOQUE*ABONO:
TEST H=ABONO E=BLOQUE*ABONO;
Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados:
Ing. Ramiro Raúl OCHOA TORREZ
123
Class
BLOQUE
LIBRAS
ABONO
The SAS System
The ANOVA Procedure
Class Level Information
Levels
Values
3
1 2 3
2
0 120
4
BARBEC CEBADA CEB_VIC CICIA
Number of observations
24
The SAS System
The ANOVA Procedure
Dependent Variable: PROD
(1)
Source
Model
Error
Corrected Total
DF
17
6
23
R-Square
0.990776
(2)
Source
BLOQUE
LIBRAS
BLOQUE*LIBRAS
ABONO
BLOQUE*ABONO
LIBRAS*ABONO
Sum of
Squares
511.3587500
4.7608333
516.1195833
Coeff Var
4.298913
DF
2
1
2
3
6
3
Mean Square
30.0799265
0.7934722
Root MSE
0.890771
Anova SS
7.8658333
262.0204167
5.0358333
215.2612500
2.4775000
18.6979167
F Value
37.91
Pr > F
0.0001
F Value
4.96
330.22
3.17
90.43
0.52
7.85
Pr > F
0.0536
<.0001
0.1148
<.0001
0.7767
0.0168
PROD Mean
20.72083
Mean Square
3.9329167
262.0204167
2.5179167
71.7537500
0.4129167
6.2326389
Tests of Hypotheses Using the Anova MS for BLOQUE*LIBRAS as an Error Term
(3)
(4)
Source
BLOQUE
LIBRAS
DF
2
1
Anova SS
7.8658333
262.0204167
Mean Square
3.9329167
262.0204167
F Value
1.56
104.06
Pr > F
0.3903
0.0095
Tests of Hypotheses Using the Anova MS for BLOQUE*ABONO as an Error Term
Source
DF
Anova SS
Mean Square
F Value
Pr > F
ABONO
3
215.2612500
71.7537500
173.77
<.0001
Remplazando los valores de los puntos (4) correspondiente a ABONO y (3) correspondientes a BLOQUES Y LIBRAS
en los respectivos lugares de las variables de respuesta ya mencionados, tenemos:
Source
BLOQUE
LIBRAS
BLOQUE*LIBRAS
ABONO
BLOQUE*ABONO
LIBRAS*ABONO
DF
2
1
2
3
6
3
Anova SS
7.8658333
262.0204167
5.0358333
215.2612500
2.4775000
18.6979167
Mean Square
3.9329167
262.0204167
2.5179167
71.7537500
0.4129167
6.2326389
F Value
1.56
104.06
3.17
173.77
0.52
7.85
Pr > F
0.3903
0.0095
0.1148
<.0001
0.7767
0.0168
Una vez remplazados estos se remplazan el punto (1) todas las fuentes de variación en reemplazo de Model, lo que
nos dará:
Source
BLOQUE
124
DF
2
Sum of
Squares
7.8658333
Mean Square
3.9329167
F Value
1.56
Pr > F
0.3903
Ing. Ramiro Raúl OCHOA TORREZ
ARREGLO EN FRANJAS
LIBRAS
BLOQUE*LIBRAS
ABONO
BLOQUE*ABONO
LIBRAS*ABONO
Error
Corrected Total
1
2
3
6
3
6
23
R-Square
0.990776
262.0204167
5.0358333
215.2612500
2.4775000
18.6979167
4.7608333
516.1195833
Coeff Var
4.298913
262.0204167
2.5179167
71.7537500
0.4129167
6.2326389
0.7934722
Root MSE
0.890771
104.06
3.17
173.77
0.52
7.85
0.0095
0.1148
<.0001
0.7767
0.0168
PROD Mean
20.72083
Organizando los valores de análisis de varianza y en función de las reglas de decisión interpretamos y realizamos las
conclusiones, corrigiendo el valor de BLOQUE*LIBRAS el cual corresponde a E(a), y la interacción de
BLOQUE*ABONO corresponde E (b):
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Source
BLOQUE
LIBRAS
E (a)
ABONO
E (B)
LIBRAS*ABONO
Error
Corrected Total
DF
2
1
2
3
6
3
6
23
R-Square
0.990776
Sum of
Squares
7.8658333
262.0204167
5.0358333
215.2612500
2.4775000
18.6979167
4.7608333
516.1195833
Coeff Var
4.298913
Mean Square
3.9329167
262.0204167
2.5179167
71.7537500
0.4129167
6.2326389
0.7934722
Root MSE
0.890771
F Value
1.56
104.06
Pr > F
0.3903ns
0.0095**
173.77
<.0001**
7.85
0.0168*
PROD Mean
20.72083
Conclusión
El análisis de varianza presenta diferencias altamente significativas (α = 0.01) en los dos factores de estudio para la
variable producción de remolacha (t/acre), en tanto que solo es significativa (α = 0.05) para la interacción de Libras x
Abono. Teniéndose un coeficiente de variación de 4.298913% y un promedio general de 20.72083 t/ha de
producción.
En este ejercicio será necesario realizar la prueba de medias (Duncan, Tukey, etc.) mediante la adición de los
respectivos comandos y el análisis de varianza de efectos simples para completar el análisis y la posterior
interpretación.
Ing. Ramiro Raúl OCHOA TORREZ
125
13. DISEÑOS JERÁRQUICOS O ANIDADOS
13.1.Jerarquicos o anidados
Ejercicio
En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta Kochia
scorparia, bajo dos condiciones de cultivo en cuatro alturas de corte (Rodríguez 1991).
Como en el presente se tienen que analizar los bloques anidados en las localidades el mismo ejercicio tenemos:
Factor A
Factor B
Factor C
Localidades
Tratamientos
Bloques
Cruzado A
Cruzado B
Anidado C(A)
El modelo lineal para esta relación estará dado por:
Yijk = µ + αi + β(α)k(i) + τ j + ατ (ij)+ ε k(ij)
Donde:
Yijk
µ
αi
β(α)k(i)
τj
ατ (ij)
εk(ij)
= Una observación
= Media poblacional
= Efecto de la i – esima condición (factor A)
= Efecto del k – esimo bloque anidado en la i – esima condición (B(A))
= Efecto de la j – esima altura de corte (factor B)
= Efecto de la i – esima condición, con la j – esima altura de corte (interacción A x B)
= Error experimental
Condición
Invierno
Verano
A
B
Bloque
Altura de
corte (cm)
25
50
75
100
25
50
75
100
i…
j…
k…
a…
b…
r…
I
II
III
IV
14.9
17.5
20.7
22.5
16.8
19.9
23.5
25.8
14.3
16.9
19.6
21.9
17.3
20.3
23.2
26.4
15
17.2
21.4
22.6
16.4
21.4
23
25.9
14.3
16.4
20.3
21.8
17.1
20.8
24.1
27.1
1…
1…
1…
Las hipótesis a probar serán:
Ho:
Invierno = Verano
25 = 50 = 75 = 100
Invierno – 25 = … = Verano – 100
Bloque (Invierno) =…= Bloque (Verano)
Ho:
Invierno ≠ Verano
25 ≠ 50 ≠ 75 ≠ 100
Invierno – 25 ≠ … ≠ Verano – 100
126
2
4
4
(Condicion)
(Altura de corte)
(Interacción Condicion x Altura de corte)
(Bloque anidado en Condicion)
(Condicion)
(Altura de corte)
(Interacción Condicion x Altura de corte)
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑOS JERARQUICOS O ANIDADOS
Bloque (Invierno) ≠…≠ Bloque (Verano)
(Bloque anidado en Condicion)
Introduciendo los datos de manera columnar tendremos:
OPTIONS NODATE NONUMBER;
DATA ANIDADO;
INPUT BLOQUE $ CONDI $ ALT_COR CON_FIB;
CARDS;
I
INVIER 25
14.9
I
INVIER 50
17.5
I
INVIER 75
20.7
I
INVIER 100
22.5
I
VERANO 25
16.8
I
VERANO 50
19.9
I
VERANO 75
23.5
I
VERANO 100
25.8
II
INVIER 25
14.3
II
INVIER 50
16.9
II
INVIER 75
19.6
II
INVIER 100
21.9
II
VERANO 25
17.3
II
VERANO 50
20.3
II
VERANO 75
23.2
II
VERANO 100
26.4
III
INVIER 25
15
III
INVIER 50
17.2
III
INVIER 75
21.4
III
INVIER 100
22.6
III
VERANO 25
16.4
III
VERANO 50
21.4
III
VERANO 75
23
III
VERANO 100
25.9
IV
INVIER 25
14.3
IV
INVIER 50
16.4
IV
INVIER 75
20.3
IV
INVIER 100
21.8
IV
VERANO 25
17.1
IV
VERANO 50
20.8
IV
VERANO 75
24.1
IV
VERANO 100
27.1
;
PROC ANOVA;
CLASS BLOQUE CONDI ALT_COR;
MODEL CON_FIB=CONDI BLOQUE(CONDI) ALT_COR CONDI*ALT_COR;
TEST H=CONDI ALT_COR E=CONDI*ALT_COR;
RUN;
Al igual que en los anteriores casos se tiene que ajustar los valores de los dos factores Condicion y Altura de Corte,
donde el valor del Cuadrado Medio del Error para ambos estara dado por la interacción de ambos factores
(CONDI*ALT_COR).
TEST H=CONDI ALT_COR E=CONDI*ALT_COR;
Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados:
Ing. Ramiro Raúl OCHOA TORREZ
127
Sistema SAS
Procedimiento ANOVA
Variable dependiente: CON_FIB
(1)
Fuente
Modelo
Error
Total correcto
DF
13
18
31
R-cuadrado
0.993136
(2)
Fuente
CONDI
BLOQUE(CONDI)
ALT_COR
CONDI*ALT_COR
Suma de
cuadrados
420.7815625
2.9081250
423.6896875
Coef Var
1.990151
DF
1
6
3
3
Cuadrado de
la media
32.3678125
0.1615625
Raiz MSE
0.401948
Pr > F
<.0001
CON_FIB Media
20.19688
Cuadrado de
la media
83.5278125
0.6415625
109.8786458
1.2561458
Anova SS
83.5278125
3.8493750
329.6359375
3.7684375
F-Valor
200.34
F-Valor
517.00
3.97
680.10
7.77
Pr > F
<.0001
0.0105
<.0001
0.0015
Tests de hipótesis usando el MS Anova para CONDI*ALT_COR como un término de error
(3)
Fuente
CONDI
ALT_COR
DF
1
3
Cuadrado de
la media
83.5278125
109.8786458
Anova SS
83.5278125
329.6359375
F-Valor
66.50
87.47
Pr > F
0.0039
0.0020
Remplazando los valores del punto (3) correspondiente a CONDI y ALT_COR en el punto (2) en los respectivos
lugares de las variables de respuesta ya mencionados, tenemos:
Fuente
CONDI
BLOQUE(CONDI)
ALT_COR
CONDI*ALT_COR
DF
1
6
3
3
Anova SS
83.5278125
3.8493750
329.6359375
3.7684375
Cuadrado de
la media
83.5278125
0.6415625
109.8786458
1.2561458
F-Valor
66.50
3.97
87.47
7.77
Pr > F
0.0039
0.0105
0.0020
0.0015
Una vez remplazados estos se remplazan el punto (1) todas las fuentes de variación en reemplazo de Model, lo que
nos dará:
Fuente
CONDI
BLOQUE(CONDI)
ALT_COR
CONDI*ALT_COR
Error
Total correcto
DF
1
6
3
3
18
31
R-cuadrado
0.993136
Suma de
cuadrados
83.5278125
3.8493750
329.6359375
3.7684375
2.9081250
423.6896875
Coef Var
1.990151
Cuadrado de
la media
83.5278125
0.6415625
109.8786458
1.2561458
0.1615625
Raiz MSE
0.401948
F-Valor
66.50
3.97
87.47
7.77
Pr > F
0.0039
0.0105
0.0020
0.0015
CON_FIB Media
20.19688
Organizando los valores del análisis de varianza y en función de las reglas de decisión interpretamos y realizamos
las conclusiones:
•
Si el valor de:
128
Pr > 0.05 → ns (No significativo)
Ing. Ramiro Raúl OCHOA TORREZ
DISEÑOS JERARQUICOS O ANIDADOS
•
•
Si el valor de:
Si el valor de:
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
Fuente
CONDI
BLOQUE(CONDI)
ALT_COR
CONDI*ALT_COR
Error
Total correcto
R-cuadrado
0.993136
DF
1
6
3
3
18
31
Suma de
cuadrados
83.5278125
3.8493750
329.6359375
3.7684375
2.9081250
423.6896875
Coef Var
1.990151
Cuadrado de
la media
83.5278125
0.6415625
109.8786458
1.2561458
0.1615625
Raiz MSE
0.401948
F-Valor
66.50
3.97
87.47
7.77
Pr > F
0.0039
0.0105
0.0020
0.0015
**
*
**
**
CON_FIB Media
20.19688
Conclusión
El análisis de varianza presenta diferencias altamente significativas (P < 0.01) en las fuentes de variación Condicion,
Altura de Corte y la interacción Condicion x Altura de Corte y significativa (P < 0.05) para los Bloques anidados en el
factor Condición. Teniéndose un coeficiente de variación de 1.990151% y un promedio general de 20.19688 % de
contenido de Fibra Cruda.
Como se puede apreciar se tiene que realizar las pruebas de medias (Duncan, Tukey, etc.) mediante la adición de
los respectivos comandos y el análisis de varianza de efectos simples para completar el análisis y la posterior
interpretación.
Ing. Ramiro Raúl OCHOA TORREZ
129
TRANSFORMACIÓN DE DATOS
14. EXPERIMENTOS EN SERIE O REPETIDOS
14.1.Serie de experimentos
Ejercicio
En este experimento se estableció como parámetro de medición el contenido de fibra cruda (%) para la planta Kochia
scorparia, bajo dos condiciones de cultivo en cuatro alturas de corte (Rodríguez, 1991).
Condición
Invierno
Verano
Altura de
corte (cm)
25
50
75
100
25
50
75
100
Condición
Altura de corte
Bloque
A
B
R
I
II
III
IV
14.9
17.5
20.7
22.5
16.8
19.9
23.5
25.8
14.3
16.9
19.6
21.9
17.3
20.3
23.2
26.4
15.0
17.2
21.4
22.6
16.4
21.4
23.0
25.9
14.3
16.4
20.3
21.8
17.1
20.8
24.1
27.1
i…
j…
k…
a…
b…
r…
1…
1…
1…
2
4
4
Teniendo el modelo lineal:
Yijk = µ + αi + βj + αβ(ij) + εk(ij)
Donde:
Yijk
µ
αi
βj
αβ(ij)
εk(ij)
= Una observación
= Media poblacional
= Efecto de la i – esima condición (factor A)
= Efecto de la j – esima altura de corte (factor B)
= Efecto de la i – esima condición, con la j – esima altura de corte (interacción A x B)
= Error experimental
Las hipótesis que nos formulamos serán:
Ho:
Invierno = Verano
25 = 50 = 75 = 100
Invierno – 25 = … = Verano – 100
Ho:
Invierno ≠ Verano
25 ≠ 50 ≠ 75 ≠ 100
Invierno – 25 ≠ … ≠ Verano – 100
(Condicion)
(Altura de corte)
(Interacción Condicion x Altura de corte)
(Condicion)
(Altura de corte)
(Interacción Condicion x Altura de corte)
Introduciendo los datos de manera columnar tendremos:
Ing. Ramiro Raúl OCHOA TORREZ
131
OPTIONS NODATE NONUMBER;
DATA SERIE;
INPUT BLOQUE $ CONDI $ ALT_COR CON_FIB;
CARDS;
I
INVIER 25
14.9
I
INVIER 50
17.5
I
INVIER 75
20.7
I
INVIER 100
22.5
I
VERANO 25
16.8
I
VERANO 50
19.9
I
VERANO 75
23.5
I
VERANO 100
25.8
II
INVIER 25
14.3
II
INVIER 50
16.9
II
INVIER 75
19.6
II
INVIER 100
21.9
II
VERANO 25
17.3
II
VERANO 50
20.3
II
VERANO 75
23.2
II
VERANO 100
26.4
III
INVIER 25
15
III
INVIER 50
17.2
III
INVIER 75
21.4
III
INVIER 100
22.6
III
VERANO 25
16.4
III
VERANO 50
21.4
III
VERANO 75
23
III
VERANO 100
25.9
IV
INVIER 25
14.3
IV
INVIER 50
16.4
IV
INVIER 75
20.3
IV
INVIER 100
21.8
IV
VERANO 25
17.1
IV
VERANO 50
20.8
IV
VERANO 75
24.1
IV
VERANO 100
27.1
;
PROC ANOVA;
CLASS BLOQUE CONDI ALT_COR;
MODEL CON_FIB=CONDI ALT_COR CONDI*ALT_COR;
TEST H=CONDI ALT_COR E=CONDI*ALT_COR;
RUN;
Al igual que en los anteriores casos se tiene que ajustar los valores de los dos factores Condicion y Altura de Corte,
donde el valor del Cuadrado Medio del Error para ambos estara dado por la interacción de ambos factores
(CONDI*ALT_COR).
TEST H=CONDI ALT_COR E=CONDI*ALT_COR;
Tenga muy en cuenta que en este caso en particular no se considera los bloques en el análisis según lo que sujiere
Cochran (1997).
Los resultados se deben organizar de manera que se puedan interpretar conforme los ajustes ya mencionados:
132
Ing. Ramiro Raúl OCHOA TORREZ
TRANSFORMACIÓN DE DATOS
Sistema SAS
Procedimiento ANOVA
Variable dependiente: CON_FIB
(1)
Fuente
Modelo
Error
Total correcto
DF
7
24
31
R-cuadrado
0.984051
(2)
(3)
Fuente
CONDI
ALT_COR
CONDI*ALT_COR
Suma de
cuadrados
416.9321875
6.7575000
423.6896875
Coef Var
2.627261
DF
1
3
3
Cuadrado de
la media
59.5617411
0.2815625
Raiz MSE
0.530625
Pr > F
<.0001
CON_FIB Media
20.19688
Cuadrado de
la media
83.5278125
109.8786458
1.2561458
Anova SS
83.5278125
329.6359375
3.7684375
F-Valor
211.54
F-Valor
296.66
390.25
4.46
Pr > F
<.0001
<.0001
0.0126
Tests de hipótesis usando el MS Anova para CONDI*ALT_COR como un término de error
Cuadrado de
Fuente
DF
Anova SS
la media
F-Valor
Pr > F
CONDI
1
83.5278125
83.5278125
66.50
0.0039
ALT_COR
3
329.6359375
109.8786458
87.47
0.0020
Remplazando los valores del punto (3) correspondiente a CONDI y ALT_COR en el punto (2) en los respectivos
lugares de las variables de respuesta ya mencionados, tenemos:
Fuente
CONDI
ALT_COR
CONDI*ALT_COR
DF
1
3
3
Anova SS
83.5278125
329.6359375
3.7684375
Cuadrado de
la media
83.5278125
109.8786458
1.2561458
F-Valor
66.50
87.47
4.46
Pr > F
0.0039
0.0020
0.0126
Una vez remplazados estos se remplazan el punto (1) todas las fuentes de variación en reemplazo de Model, lo que
nos dará:
Fuente
CONDI
ALT_COR
CONDI*ALT_COR
Error
Total correcto
DF
1
3
3
24
31
R-cuadrado
0.984051
Suma de
cuadrados
83.5278125
329.6359375
3.7684375
6.7575000
423.6896875
Coef Var
2.627261
Cuadrado de
la media
83.5278125
109.8786458
1.2561458
0.2815625
Raiz MSE
0.530625
F-Valor
66.50
87.47
4.46
Pr > F
0.0039
0.0020
0.0126
CON_FIB Media
20.19688
Organizando los valores del análisis de varianza y en función de las reglas de decisión interpretamos y realizamos
las conclusiones:
•
•
•
Si el valor de:
Si el valor de:
Si el valor de:
Ing. Ramiro Raúl OCHOA TORREZ
Pr > 0.05 → ns (No significativo)
Pr ≤ 0.05 → * (Significativo al 5% )
Pr ≤ 0.01 → ** (Altamente significativo al 1%)
133
Fuente
CONDI
ALT_COR
CONDI*ALT_COR
Error
Total correcto
R-cuadrado
0.984051
DF
1
3
3
24
31
Suma de
cuadrados
83.5278125
329.6359375
3.7684375
6.7575000
423.6896875
Coef Var
2.627261
Cuadrado de
la media
83.5278125
109.8786458
1.2561458
0.2815625
Raiz MSE
0.530625
F-Valor
66.50
87.47
4.46
Pr > F
0.0039 **
0.0020 **
0.0126 *
CON_FIB Media
20.19688
Conclusión
El análisis de varianza presenta diferencias altamente significativas (P < 0.01) en las fuentes de variación Condicion,
Altura de Corte y significativas (P < 0.05) para la interacción Condicion x Altura de Corte. Teniéndose un coeficiente
de variación de 2.627261% y un promedio general de 20.19688 % de contenido de Fibra Cruda.
Como se puede apreciar se tiene que realizar las pruebas de medias (Duncan, Tukey, etc.) mediante la adición de
los respectivos comandos y el análisis de varianza de efectos simples para completar el análisis y la posterior
interpretación.
134
Ing. Ramiro Raúl OCHOA TORREZ
BIBLIOGRAFIA
15. BIBLIOGRAFIA
Calzada B., J 1982. Métodos Estadísticos para la Investigación. Ed. Universidad Nacional Agraria La Molina. LimaPerú.
Cochran, W. y Cox, G. 1997. Diseños experimentales. 2ª. Ed. Trillas. México.
De la Loma, J. 1980. Experimentación Agrícola. Ed. Hispanoamericana. México.
Eduardo, E. 2003. Estadistica 1. La Paz, Bolivia.
Freese, F. 1970. Métodos estadísticos elementales para técnicos forestales. Agencia para el Desarrollo Internacional
(AID). México.
Ibáñez. V., Zea, W. y Paredes, R. 1998. Aplicaciones con el sistema de análisis estadístico (S.A.S.).Facultad de
Ingeniería Estadística e Informática, Universidad Nacional del Altiplano. Perú.
IBTA (Instituto Boliviano de Tecnología Agropecuaria). 1988. Informe Anual 1998 – 1989. IBTA. La Paz, Bolivia.
Little, T. y Hills, J. 1981. Métodos Estadísticos para la Investigación en la Agricultura. Ed. Trillas. México.
López, G. y López, J. 1993. Introducción al Micro SAS: Aplicación al Análisis de Experimentos Agrícolas. Centro
Agronómico Tropical de Investigación y Enseñanza C.A.T.I.E. Turrialba-Costa Rica.
Martínez, A. 1981. Diseños Experimentales. CEC Colegio de Postgrados. Chapingo-México.
Miller, R., Freund, J. y Jonson, R. 1992. Probabilidad y Estadística para Ingenieros. Ed. Hispanoamericana S.A.
México.
Montgomery, D. 1990. Diseño y Análisis de Experimentos. Ed. Iberoamericana. México.
Ochoa, R. 2000. Diseños Experimentales. Universidad Mayor de San Andrés. La Paz, Bolivia.
________. 2006. Diseños Experimentales. Unidad Academica Campesina Carmen Pampa. La Paz, Bolivia.
Padrón, E. 1996. Diseños Experimentales con Aplicación a la Agricultura y la Ganadería. Ed. Trillas. México.
Panse, V. y Shukatme, P. 1963. Métodos Estadísticos para Investigadores Agrícolas. Ed. Fondo de Cultura
Económica. México.
Perez, C. 2001. El sistema estadistico SAS. Prentice Hall. Madrid, España.
Quispe, V., Zea, W. y Paredes, R. 1998. Aplicaciones con el Sistema de Análisis Estadístico (S.A.S.). Ed. Facultad
de Ingeniería Estadística e Informática. Puno-Perú.
Reyes, P. 1978. Diseño de Experimentos Agrícolas. Ed. Trillas. México.
Rodríguez, J. 1991. Métodos de Investigación Pecuaria. Ed. Trillas. México.
Steel, R. y Torrie, J. 1996. Bioestadística: Principios y Procedimientos. Ed. Mc Graw – Hill. México.
Ing. Ramiro Raúl OCHOA TORREZ
135
Descargar