Estadística y Biometría 2006 Laboratorio 2

Anuncio
Estadística y Biometría 2006
Laboratorio 2
A continuación se proponen ejercicios para explorar funciones de distribución usadas para variables
aleatorias de distinta naturaleza. Se sugiere realizar la ejercitación utilizando el submenú
Probabilidades y cuantiles del menú Estadísticas y adicionalmente para los problemas del Caso
3, los submenús Didácticas y Gráficos de funciones de densidad continua del menú
Aplicaciones, del programa estadístico InfoStat.
Caso 1: Aplicación de la Distribución Binomial
En algunas situaciones experimentales la variable respuesta es de naturaleza dicotómica, es decir la
variable puede asumir solo dos valores posibles. Por ejemplo, si se tiene un conjunto de semillas y
se observa la textura el valor de la variable en cada semilla puede ser registrado como lisa o
rugosa. Si se estudia la sanidad de los animales de un rodeo, la condición de cada animal puede ser
sano o enfermo. Generalmente, uno de los valores es considerado “éxito” y el otro”fracaso”. Por
ejemplo, podríamos considerar el valor sano como “éxito” y enfermo como “fracaso”. Como se
supone que la variable en estudio es aleatoria, cada resultado (éxito o fracaso), tendrá una
probabilidad de ocurrencia. Cuando se examina un conjunto “n” de unidades muestrales o
experimentales el número total de éxitos en esa muestra (o experimento) puede ser cualquier
número entre 0 y n, siendo este resultado aleatorio. Luego el número de éxitos en una muestra de
tamaño n es una variable aleatoria y se conoce como variable binomial.
Si la probabilidad de que ocurra un éxito es muy pequeña, entonces obtener muchos éxitos en la
muestra también será un evento poco probable, en cambio si la probabilidad de éxito es muy alta,
será muy fácil observar muestras en las que todos sus elementos presenten un resultado exitoso.
Luego una variable binominal X no solo está caracterizada por “n” (este parámetro determina el
valor máximo de X) sino también por “p”, la probabilidad de éxito, que se supone constante para
todos los elementos en la muestra. Si una variable sigue distribución binomial la denotamos como
X~ Bin(n,p) y los valores posibles para X son 0, 1, 2, 3, …, n.
Problema 1.1: En un programa de monitoreo se muestrean tambos y en cada uno se toma una
muestra al azar de 10 vaquillonas y se registra el evento preñada o vacía, al realizar el tacto.
Considerando como éxito a la preñez y que la probabilidad de éxito para cada vaquillona es 0.75,
realice las siguientes actividades:
1. Construya la función de probabilidad y la función de distribución o probabilidad acumulada
para la variable número de vacas preñadas.
2. Grafique ambas funciones.
3. ¿Cuál es la probabilidad de que 3 de las 10 vaquillonas estén preñadas?
4. ¿Cuál es la probabilidad de que a lo sumo 5 de las 10 vaquillonas estén preñadas?
5. ¿Cuál es la probabilidad de que al menos 7 de las 10 vaquillonas estén preñadas?
Caso 2: Aplicación de la Distribución Poisson
En un plan de monitoreo de insectos plaga se revisan muchas unidades muestrales (plantas, hojas) y
en cada una de ella se cuenta el número de insectos presentes. Estos pueden ser 0, 1, 2, ….. En una
variable Binomial también se obtiene una variable de conteo pero a diferencia estas, el número de
insectos por unidad muestral (plantas por ejemplo) no esta acotado (no hay un máximo). Cuando el
conteo no está acotado y además el promedio del número de “eventos” por unidad muestral es
proporcional al tamaño de la misma, entonces se dice que el número de eventos por unidad
muestral es una variable aleatoria de tipo Poisson. Ejemplos de variables Poissson son el número de
pulgones por planta o la cantidad de malezas por m2. Las variables Poisson están caracterizadas un
1
Estadística y Biometría 2006
Laboratorio 2
único parámetro denotado con la letra griega λ (lambda) y corresponde al promedio del número de
eventos por unidad.
Problema 2.1: Supongamos que estamos interesados en la variable: número de chinches por metro
lineal de surco en un cultivo de soja. Por la naturaleza de la variable (variable discreta que proviene
de un conteo y que no está acotada), usaremos el modelo Poisson para modelar su distribución de
frecuencia y calcular probabilidades para distintos eventos de interés. Experiencias previas en la
zona y para la época en que se hace el muestreo, sugieren que el número promedio de chinches por
metro cuadrado es 0.2 (λ=0.2).
A partir del modelo Poisson con λ=0.2, calcule las siguientes probabilidades:
1. ¿Cuál es la probabilidad que en un metro de surco tomado al azar del cultivo, no haya
ninguna chinche?
2. ¿Cuál es la probabilidad que en un metro de surco tomado al azar del cultivo, haya 1
chinche?
3. ¿Cuál es la probabilidad que en un metro de surco tomado al azar del cultivo, haya 2 o más
chinches?
Caso 3: Aplicación de la Distribución Normal
Resuelva los ejercicios y problemas dados a continuación utilizando el calculador de
probabilidades y cuantiles y, utilizando el graficador de funciones de densidad continuas, visualice
las distribuciones bajo el modelo normal, a las que hacen referencia, y las áreas correspondientes a
la probabilidad de los eventos de interés.
Problema 3.1: La altura de plantas de soja de la variedad Hood se distribuye aproximadamente normal
con media 55 cm y desviación estándar de 5.8 cm. Por otro lado, la altura de plantas de yuyo colorado
(Amaranthus sp.) invasora de este cultivo, también se distribuye en forma normal con media 62 cm y
desviación estándar de 3 cm. Si se decide aplicar un herbicida usando un equipo a sogas:
a) ¿A qué altura debe disponerse la soga para eliminar el 90% de la maleza en este cultivo?
b) ¿Suponiendo que el herbicida no es selectivo, es decir mata por igual a toda planta que toma
contacto con la soga, ¿qué porcentaje de plantas de soja se perderá a la altura de soga encontrada en
el punto anterior?
Problema 3.2: El día de floración de una hortaliza (en escala juliana:1-365 días) se puede modelar con una
distribución normal centrada en el 18 de agosto (día 230) y con desviación estándar de 10 días. Si desde la
fecha de la floración hasta la cosecha hay un lapso de 25 días:
a) ¿Qué proporción de la cosecha se habrá realizado para el 16 de septiembre (día 259)?
b) Si se considera primicia a los frutos obtenidos antes del 1 de septiembre (día 244): ¿qué proporción
de la cosecha se espera que sea primicia?
c) Si la ganancia es de 2 pesos por cajón y se espera una producción total de 1500 cajones, ¿cuál es la
ganancia esperada con los cajones primicia, son un 30% más caros?
d) La aplicación de un regulador del crecimiento permite adelantar 3 días la fecha de floración y reduce
la desviación estándar de 10 a 6 días. Si la ganancia por cajón se reduce en 5 centavos debido al
costo del regulador: ¿produce su aplicación un aumento del porcentaje de frutos primicia?
2
Descargar