Cursos InfoStat – 2002 - Facultad de Ciencias Agropecuarias

Anuncio
Estadística y Biometría – 2003
Guía de
Ejercitación 2
La ejercitación propuesta en esta guía tiene como objetivo estudiar la distribución de la media y
de la varianza muestrales a través del uso del software estadístico InfoStat. Las salidas
obtenidas desde el computador se discutirán en clase destacando cómo analizar los resultados y
la importancia de los mismos en el contexto de las situaciones planteadas a continuación y de
otras situaciones problemáticas similares, comunes en el ámbito de las ciencias agropecuarias.
Para realizar los ejercicios lea atentamente los enunciados y consignas. Recuerde que el
programa estadístico posee una versión electrónica del Manual de usuario en donde se explican y
detallan todos los procedimientos estadísticos disponibles.
Distribución de estadísticos muestrales
En la realidad acceder a todos los valores de una población es generalmente impracticable y sólo
se trabaja con los datos provenientes de una muestra. No obstante, para el tratamiento de los
datos extraídos de una muestra es necesario conocer propiedades distribucionales. Por ejemplo,
sabiendo que la altura del plantín es una característica relacionada a la sobrevida del mismo
después del trasplante, podría ser de interés conocer la probabilidad de obtener plantines de
tomate con altura promedio mayor que 170mm, trabajando con muestras de tamaño 50. En este
caso para calcular dicha probabilidad sería necesario conocer la distribución de las medias de
muestras de tamaño 50.
La actividad básica aquí propuesta es llevar a cabo un experimento estadístico mediante el cual
se puedan estudiar características distribucionales de medidas resumen como lo son la media y la
varianza muestral.
EXPERIMENTO ESTADÍSTICO 1:
Usando una rutina de simulación realice un muestreo aleatorio simple sin reposición a un
conjunto finito de datos, para obtener todas las muestras posibles de tamaño 3. Para cada
muestra se obtendrán la media y la composición de cada muestra. El objetivo es estudiar la
distribución de las medias.
Para conducir el experimento realice la ejercitación propuesta a continuación, trabajando sobre
el archivo Medias.idb (que se encuentra en la carpeta Datos de InfoStat), El archivo contiene 30
registros de rendimientos de un híbrido de maíz, en qq/ha. Para fines prácticos sólo el conjunto
de los primeros 15 datos de este archivo será considerado como la población de rendimientos
posibles de obtener cuando se usa el híbrido. Para lograr este conjunto de 15 datos, se deberán
desactivar los casos del 16 al 30. Para ello seleccione dichos casos, presione el botón derecho
del ratón y en el menú que aparece active la opción Desactivar caso. Los casos desactivados
mostrarán el número de caso (columna Caso) entre paréntesis.
Ejercicio 1: Utilizando el menú Aplicaciones  Didácticas  Todas las muestras posibles obtenga la
composición de cada muestra posible de tamaño 3. Para ello:
1
Estadística y Biometría – 2003
Guía de
Ejercitación 2
a) En la ventana Todas las muestras posibles, en el campo Valores en la población, seleccione el
nombre de la columna que contiene los datos, en este caso “columna1”.
b) En la subsiguiente ventana ingrese la información correspondiente en el campo Tamaño muestral
(3). Observe que en el campo Muestras posibles aparece el número total de muestras que se
pueden obtener con el tamaño muestral ingresado y que en los campos Media poblacional y
Varianza poblacional, aparecen los valores de estos parámetros.
c) Active la opción Valores observados en la muestra. Presione el botón Obtener muestras. Al
finalizar el proceso se obtendrá una tabla llamada Valores observados en la muestra con tantas
columnas como el tamaño muestral usado para hacer el muestreo; en este caso habrá 3 columnas las
cuales contienen, respectivamente, el primero, el segundo y el tercer dato que componen la
muestra, siendo cada fila de la tabla una muestra.
d) Teniendo en cuenta los resultados anteriores, ¿qué datos (3) componen las siguientes muestras:
muestra 1, muestra 20, muestra 105, muestra 210, muestra 328 y muestra 455?
Ejercicio 2: Trabajando con la tabla Medias.idb (que contiene los datos poblacionales):
a) Realice nuevamente el muestreo usando como tamaño de muestra 3 (n=3) pero ahora active la
opción Media muestral para obtener la media de cada una de las muestras que se generarán.
b) En los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros,
registre los mismos.
c) Presione el botón Obtener muestras. Al finalizar el proceso, aparecerá una nueva tabla llamada
Media muestral con una columna Media(n=3) que contendrá en cada fila la media de la
correspondiente muestra (en esa columna se indica entre paréntesis el tamaño muestral usado en el
muestreo).
Nota: Ud. podría verificar los resultados anteriores calculando la media de cada fila de la tabla Valores
observados en la muestra. Para ello podría usar la opción Fórmulas del menú Datos o la calculadora.
Ejercicio 3: Para visualizar la distribución de las medias muestrales obtenidas realice un histograma de
frecuencias relativas. Para ello, use el menú Gráficos  Histograma.
Ejercicio 4: obtenido el histograma:
a)
Solicite un ajuste Normal.
b)
Ajuste el eje X usando 1 decimal.
c)
Copie el gráfico y péguelo en un documento Word.
d)
Use Estadísticas  Medidas Resumen y calcule la media y la varianza de las medias
muestrales. Compárelos con los valores correspondientes en la población desde la que se extrajeron
las muestras. Redacte sus hallazgos.
Nota: para verificar los valores paramétricos calculando la media de las medias muestrales y la varianza de
las medias muestrales, tenga en cuenta que cuando se hace un muestreo sin reposición desde una población
2
Estadística y Biometría – 2003
Guía de
Ejercitación 2
finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son las
siguientes:
x  
y
 
2
x
2  N n


n  N 1 
donde μ y σ2 son, respectivamente, la esperanza y la varianza de los datos poblacionales, N es el
tamaño de la población (en este caso N=15) y n el tamaño de muestra con el que se obtuvieron las
medias muestrales (n=3).
e)
En base al histograma y los valores de los parámetros, caracterice la distribución de las
medias muestrales. Redacte sus hallazgos.
EXPERIMENTO ESTADÍSTICO 2:
Mediante el proceso de simulación usado en el Experimento 1 ahora se realizará un muestreo aleatorio
simple sin reposición desde el mismo archivo (Medias.idb), para obtener todas las muestras posibles de
tamaño 12.
Ejercicio 1: Trabajando con la tabla Medias.idb, es decir la que tiene los 15 datos considerados como
población de partida, obtenga las medias muestrales de todas las muestras posibles de tamaño 12. Para
ello, utilice el menú Aplicaciones  Didácticas  Todas las muestras posibles. En los campos Media
poblacional y Varianza poblacional, aparecen los valores de estos parámetros, registre los mismos. Al
finalizar el proceso se deberá tener un archivo con una columna llamada Media(n=12).
Ejercicio 2: Para visualizar la distribución de las medias muestrales obtenidas realizar un histograma de
frecuencias relativas. Para ello, use el menú Gráficos  Histograma.
Ejercicio 3: obtenido el histograma:
a)
Solicite un Ajuste Normal.
b)
Ajuste el eje X usando 1 decimal.
c)
Copie el gráfico y péguelo en un documento Word.
d)
Use Estadísticas  Medidas Resumen y calcule la media y la varianza de las medias
muestrales. Compárelos con los valores correspondientes en la población desde la que se extrajeron
las muestras. Redacte sus hallazgos.
Nota: para verificar los valores paramétricos calculando la media de las medias muestrales y la varianza de
las medias muestrales, tenga en cuenta que cuando se hace un muestreo sin reposición desde una población
finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son las
siguientes:
x  
y
 
2
x
2  N n


n  N 1 
3
Estadística y Biometría – 2003
Guía de
Ejercitación 2
donde μ y σ2 son, respectivamente, la esperanza y la varianza de los datos poblacionales, N es el
tamaño de la población (en este caso N=15) y n el tamaño de muestra con el que se obtuvieron las
medias muestrales (n=12).
e)
En base al histograma y los valores de los parámetros, caracterice la distribución de las
medias muestrales. Redacte sus hallazgos.
EXPERIMENTO ESTADÍSTICO 3:
En forma similar a las indicaciones dadas en el Experimento 1, estudie la distribución de las varianzas
muestrales para muestras de tamaño 3. Para ello tenga presente requerir, en el muestreo, la obtención de
las varianzas muestrales en el campo Varianza muestral corregida.
Ejercicio 1: Trabajando con la tabla Medias.idb, es decir la que tiene los 15 datos considerados como
población de partida, obtenga las varianzas muestrales corregidas de todas las muestras posibles de
tamaño 3. Para ello, utilice el menú Aplicaciones  Didácticas  Todas las muestras posibles. Al finalizar
el proceso Ud. deberá tener un archivo con una columna llamada VarianzaC(n=3).
Ejercicio 2: Para visualizar la distribución de las varianzas muestrales obtenidas en el ejercicio anterior
realice un histograma de frecuencias relativas. Para ello, use el menú Gráficos  Histograma.
a) Copie el gráfico y péguelo en un documento Word. Redacte sus hallazgos.
b) Comparar la forma de la distribución de las medias muestrales y la correspondiente a las varianzas
muestrales para muestras de igual tamaño.
Ejercicio 3: Usando el archivo Varianza muestral corregida, generado en el ejercicio anterior, que contiene
la columna VarianzaC(n=3), realice el siguiente procedimiento:
a) Active Datos  Fórmulas, aparecerá una ventana Calcular, para escribir una fórmula.
b) Cambie el nombre de la columna VarianzaC(n=3) por VarianzaC para poder utilizarlo en la fórmula.
c) Escriba: c=VarianzaC*2/44.67. Esto es: multiplicar las varianzas muestrales obtenidas por n-1 y
dividirlas por la varianza poblacional. Esta transformación será adicionada en una nueva columna
denominada “c”. Los valores que constituyan la columna “c” se ajustarán a una distribución Chi
cuadrado.
d) Para visualizarlo realice un histograma de frecuencias para la columna “c” y luego pida un Ajuste Chi
cuadrado.
4
Documentos relacionados
Descargar