Distribuciones Muestrales (Guía 2)

Anuncio
GUIA PREPARADA POR LA PROF OLATZ ERMINA.
MÉTODOS ESTADÍSTICOS I
DISTISTRIBUCIONES MUESTRALES
1. distribuciones de medias muéstrales ( X)
2. Distribución de “t” student (t)
3. Distribución de las varianzas muéstrales ji cuadrado (X2)
Distribución de Medias Muestrales (X)
Infiere medias poblacionales. Es una distribución de probabilidad de todas las
medias posibles de las muestran de un tamaño dado n, de una población. Es una
distribución probabilística que consta de todas las medias maestrales posibles de un tamaño
de muestra dado de una población y la probabilidad de ocurrencia asociada a cada media
muestral.
Teorema del limite central (TLC)
“Si se seleccionan de cualquier población todas las muestras de un tamaño determinado, la
distribución de las medias maestrales se acercara a una del tipo normal, esta aproximación
aumenta en el caso de muestras mas grandes.”
N ≥ 30
También es definido:
“Resultado que asegura que la distribución de muestra de la media se acerca a la
normalidad cuando el tamaño de la muestra se incrementa, sin importar la forma de la
distribución de la población de la que se selecciona la muestra.
𝑥̄1 =
𝑥̄2 =
∑(𝑋𝑖 )
𝑁1
∑(Xi )
N2
𝑥̄𝑛𝑚 =
n=00
∑(Xi )
N𝑚
Si
tomamos muestras de variables aleatorias de una población. Con
parámetro μ y σ2 las distribuciones medias serán una distribución normal pero con
propiedades.
𝜇𝑥̄ = µ
(Media muestral = Media poblacional)
σ 𝑥̄ =
σ
√𝑥̄
Error estándar de la
distrib de la muestra
Existe menos dispersión en la
Distrib. Muestral de medias que
En la poblacional
A mayor N menor
>N<
𝜎2
𝜎2
Conforme n ⟹ 00
Cuando no es Estándar
N(0,1)
µ=0
𝜎= 1
Estándar
𝑥̄ − µ
𝑥̄ − µ𝑥̄
𝑍= σ
=
σ𝑥̄
⁄ 𝑛
√
𝑥̄ =
Donde
𝑥̄ = media de las muestras
𝜇𝑥̄ = media de la población
𝜎𝑥̄ = error muestral
∑ 𝑥̄ 𝑖
𝑥̄ 1 + 𝑥̄ 2 + 𝑥̄ 3 + 𝑥̄ 𝑛
=
𝑛
𝑛
𝜇+𝜇+𝜇
𝜇𝑥̄ =
= 𝜇
𝑛
Ejm
Una compañía de electrónica fabrica resistores que tienen una resistencia promedio de
100Ώ y una σ de10Ώ. La distribución de la resistencia es normal. Encuéntrese la
probabilidad de que al tomar una muestra de 25 resistores, la resistencia promedio de estos
será menor que 95 Ώ
Nótese que la distribución de muestreo de es normal con media
ESTIMACION
Un estimador es un estadístico de la muestra utilizado para estimar un parámetro
poblacional. Es un valor específico observado de un estadístico.
Existen 2 tipos de estimaciones:
Estimaciones puntuales e intervalos de confianza.
Estimación puntual: es un solo número que se utiliza para estimar un parámetro de
población desconocida. Ejm
X = media de la muestra, es un estimación puntual de la media de la población µx
S2= varianza de la muestra es un estimación puntual de la varianza poblacional σ2
Estimación de un intervalo de confianza:
Es un rango de valores que se utiliza para estimar un parámetro de la población.
Una estimación de este tipo indica el error de dos maneras por la extensión del
intervalo y por la probabilidad de que el verdadero parámetro poblacional se encuentre
dentro del intervalo.
Los intervalos de confianza son denotados de la siguiente manera generalizada
P (θi ≤ θ ≤ θs) = 1 – α
Donde
Θi = limite inferior de confianza
Θs = limite superior de confianza
1 – α= coeficiente de confianza
α = nivel de significancia
Intervalo de Confianza de µ (para la media
muestral)
Conociendo σ2 (n≥30)
𝑥̄ − 𝜇
“𝑍 = σ
⁄ 𝑛
√
”
𝑃 (−𝑍𝛼⁄2 < 𝑍 < 𝑍𝛼⁄2 ) = 1 − 𝛼
Sustituimos Z en la ecuacion y luego despejamos µ
𝑥̄ − 𝜇
𝑃 (−𝑍𝛼⁄2 < σ
< 𝑍𝛼⁄2 ) = 1 − 𝛼
⁄ 𝑛
√
σ
σ
𝑃 (−𝑍𝛼⁄2
< 𝑥̄ − 𝜇 < 𝑍𝛼⁄2 ) = 1 − 𝛼
√𝑛
√𝑛
σ
σ
𝑃 (−𝑥̄ − 𝑍𝛼⁄2
< − 𝜇 < −𝑥̄ +𝑍𝛼⁄2 ) = 1 − 𝛼
√𝑛
√𝑛
σ
σ
𝑃 (𝑥̄ +𝑍𝛼⁄2
> 𝜇 > 𝑥̄ −𝑍𝛼⁄2 ) = 1 − 𝛼
√𝑛
√𝑛
σ
σ
𝑃 (𝑥̄ −𝑍𝛼⁄2
< 𝜇 < 𝑥̄ +𝑍𝛼⁄2 ) = 1 − 𝛼
√𝑛
√𝑛
𝑍𝛼⁄2 σ 2
𝐸𝑟𝑟𝑜𝑟 = е = ±𝑍𝛼⁄2
⟹ 𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = (
)
𝑒
√𝑛
σ
Distribución t Student
Sirve para inferir medias poblacionales.
Si X y n < 30 se aplica t student.
Siendo su estadístico de prueba:
𝑥̄ −𝜇
𝑡=𝑠
⁄ 𝑛
√
Siendo:
X= media
muestral
µ=
media
poblacional
S = desv de la
muestra
N= tamaño de la muestra
Si queremos determinar el valor
t
standarizado para un nivel de confianza se
necesitan los siguientes parámetros, estos valores están tabulados en la tabla t student
t α, γ
Donde
nivel de significancia= error o probabilidad de rechazar algo bueno
α=
γ = n- 1 = grado de libertad= el numero de valores que se pueden escoger libremente
t
Z
n < 30 se aplica t student.
n ≥30 se aplica normal
Se utilizan para inferencias de medias poblacionales.
Ejercicios
1) N= 7 , 1 –α = 0.95
2) N= 10 , 1 –α = 0.80
α = 0.025
N= 6 , α = 0.15
3) N= 8 ,
4)
Intervalo de Confianza de µ (para media
poblacional)
Con parametros
σ2 = 𝐷𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑜
𝑛 < 30
𝑥−𝜇
“𝑡 = 𝑠
⁄ 𝑛
√
”
𝑝𝑎𝑟𝑎 𝑟𝑒𝑐𝑜𝑟𝑑𝑎𝑟:
𝑠2 =
∑(𝑥̄ − 𝑥𝑖 )2
𝑠
⁄ 𝑛
√
𝑥̄
=
∑ 𝑥𝑖
𝑛
𝑃 (−𝑡𝛼⁄2 1ϒ < 𝑡 < 𝑡𝛼⁄2 1ϒ) = 1 − 𝛼
Sustituimos t en la ecuacion y luego despejamos µ
𝑥− 𝜇
𝑃 (−𝑡𝛼⁄2 1ϒ < s
< 𝑡𝛼⁄2 1ϒ) = 1 − 𝛼
⁄ 𝑛
√
Repetimos el proceso anterior:
𝑃 (𝑥̄ − 𝑡𝛼⁄2 1ϒ
s
√𝑛
Valor en
la tabla
𝑒 = ± 𝑡𝛼⁄2 1ϒ
error
< 𝜇 < 𝑥̄ + 𝑡𝛼⁄2 1ϒ
Valor en
la tabla
s
√𝑛
s
√𝑛
)=1− 𝛼
Distribución ji cuadrado (X2)
Si S2 es la varianza de una muestra aleatoria de tamaño n tomada de una
población normal con parámetro µ y σ 2
La ji cuadrado mide las diferencias entre frecuencias reales y estimadas.
Sirve para inferir varianzas poblacionales.
Siendo su estadístico de prueba:
2
𝜒 =
(𝑛 − 1) 𝑆 2
σ2
Siendo : S2 = varianza muestral
σ 2 = varianza poblacional
Si se quiere tomar el valor de X2 standarizado para un nivel de confianza
X2 α, γ
para identificar los valores tabulado en la tabla X2
Donde
Parámetros
α=
nivel de significancia : error o probabilidad de rechazar algo bueno
γ = n- 1 : grado de libertad: el numero de valores que se pueden escoger libremente
Ejercicios
1) N= 21 , 1 - α = 0.95
2) N= 11 , 1-α = 0.90
3) N= 17 ,
α = 0.025
Intervalo de
poblacional)
Confianza
de
σ𝟐
“χ2 =
𝑃 (𝜒𝛼2⁄
2 1ϒ
2
< 𝜒 2 < 𝜒1−𝛼
⁄
2 1ϒ
(varianza
(n−1) S2
)=1−𝛼
Sustituimos 𝜒 2 y luego despejamos σ2
𝑃 (𝜒𝛼2⁄ 1ϒ
2
(𝑛 − 1) 𝑆 2
2
<
< 𝜒1−𝛼
)=1−𝛼
2
⁄2 1ϒ
𝜎
𝑃 (𝜒𝛼2⁄ 1ϒ
2
(𝑛 − 1) 𝑆 2
2
<
< 𝜒1−𝛼
)=1−𝛼
⁄2 1ϒ
𝜎2
1
𝑃( 2
𝜒𝛼⁄
2 1ϒ
σ2
1
<
< 2
2
(𝑛 − 1)𝑆
𝜒1−𝛼⁄
)=1−𝛼
2 1ϒ
(𝑛 − 1) 𝑆 2
(𝑛 − 1) 𝑆 2
σ2
𝑃( 2
>
> 2
)=1−𝛼
(𝑛 − 1)𝑆 2
𝜒𝛼⁄ 1ϒ
𝜒1−𝛼⁄ 1ϒ
2
2
(𝑛 − 1) 𝑆 2
(𝑛 − 1) 𝑆 2
2
𝑃( 2
<σ <
) = 1 − 𝛼 (𝐼𝐶 𝑝𝑎𝑟𝑎 σ2 )
2
𝜒1−𝛼⁄ 1ϒ
𝜒𝛼⁄ 1ϒ
2
2
(𝑛 − 1) 𝑆 2
(𝑛 − 1) 𝑆 2
𝑃 (√ 2
<𝜎<√ 2
) = 1 − 𝛼 (𝐼𝐶 𝑝𝑎𝑟𝑎 σ)
𝜒1−𝛼⁄ 1ϒ
𝜒𝛼⁄ 1ϒ
2
2
σ2
”
Intervalo De Confianza Para Una Porcion De La
Poblacion.
Para muestras grandes ≥30
Donde:
𝑥𝑖
𝑃𝑠 =
𝑛
Y:
Resultados Favorables.
Espacio Muestral.
σ𝑝 = √
𝑃𝑠 (1−𝑃𝑠 )
𝑛
Sabiendo todo esto, para calcular el IC para la proporcionalidad:
P(𝑃𝑠 − 𝑍𝛼 √
𝑃𝑠 (1−𝑃𝑠 )
𝑛
≤ 𝑃 ≤ 𝑃𝑠 + 𝑍𝛼 √
Siendo P la proporción de la muestra.
𝑃𝑠 (1−𝑃𝑠 )
𝑛
)1 − 𝛼
EJERCICIOS DE
DISTRIBUCIÓN DE LA MEDIA MUESTRAL Y ESTIMACIÓN DE
INTERVALOS DE CONFIANZA
Prof: Ing Olatz Ermina.
1. De una población que se distribuye en forma normal con media 50 y desviación
estándar 5 se obtiene una muestra aleatoria de tamaño 16. ¿Cuál es la probabilidad
de que la media de esa muestra (X) Caiga en el intervalo?
(μ x – 1.9 σ x y μ x – 0.4 σ x )
2. De una población se obtiene una muestra aleatoria de tamaño 36 dando un error
estándar de la media igual a 2. Se desea reducir ese error estándar de la muestra a
1.2 ¿Cuál debería ser el tamaño de la muestra?
3. La desviación estándar de una población es 5.6, calcular el error estándar de la
media muestral para un n= 64 y luego para n=195 ¿disminuye o aumenta el error
estándar de la muestra?
4. La duración promedio de cierto equipo es de 5 años con una desviación estándar de
1 año. Encuentre:
a) la probabilidad de que la vida promedio de una muestra de 9 tales equipos caiga
entre 4.4 y 5.2 años
b) el valor k a la derecha del cual caería el 15% de las muestras aleatorias de tamaño 9
5. El ingreso mensual promedio de 10000 trabajadores es de $ 5oo con una desviación
estándar de $ 100. ¿Cuál es la probabilidad de seleccionar una muestra aleatoria de
400 trabajadores con un promedio de $510 o mas por mes?
6. El periodo de tiempo que un cajero de banco atiende a una cliente es una variable
aleatoria con una media de 3.2 minutos y una desviación estándar de 1.3 minutos. Se
observa una muestra aleatoria de 64 clientes, encuentre la probabilidad de que el tiempo
promedio de esa muestra sea:
a) cuando mucho 2.7minutos.
b) mas de 3.5 minutos.
c) entre 3.2 y 3.4 minutos
7. El promedio de los depósitos de los 15000 depositantes de un banco en una fecha dada es
de $325 con una desviación estándar de $ 20. ¿Cuál es la probabilidad de seleccionar una
muestra aleatoria de 200 depósitos con una media entre $ 323 y $ 328?
8. Se sabe que el contenido de fructosa de cierto alimento sigue una distribución normal,
cuya varianza es conocida, teniendo un valor de 0,25. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiéndose un error máximo
de 0,2 con una confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra?
9. Se ha tomado una muestra aleatoria de 100 individuos a los que se ha medido el nivel de
glucosa en sangre, obteniéndose una media muestral de 110 mg/cc. Se sabe que la
desviación típica de la población es de 20 mg/cc.
a) Obtén un intervalo de confianza, al 90%, para el nivel de glucosa en sangre en la
población
b) ¿Qué error máximo se comete con la estimación anterior?
10. Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas,
hechos por una determinada máquina, dieron una media de 2 cm y una desviación típica de
0,1 cm. Hallar los intervalos de confianza del :



68,26%
95,44%
99,73%
para el diámetro de todos los cojinetes
11. Se desea estudiar el gasto semanal de fotocopias, en miles de bolívares, de los
estudiantes de bachillerato de Ciudad Guayana. Para ello, se ha elegido una muestra
aleatoria de 9 de estos estudiantes, resultando los valores siguientes para estos gastos:
100 150 90 70 75 105 200 120 80
Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de
media desconocida y de desviación típica igual a 12. Determine un intervalo de confianza
del 95% para la media del gasto semanal en fotocopias por estudiante
12. La media de edad de los alumnos que se presentan a pruebas de acceso a la Universidad
es
de
18,1
años,
y
la
desviación
típica
0,6
años.
a) De los alumnos anteriores se elige, al azar, una muestra de 100. ¿ Cuál es la probabilidad
de que la media de la edad de la muestra esté comprendida entre 17,9 y 18,2 años?.
b) ¿Qué tamaño debe tener una muestra de dicha población para que su media esté
comprendida entre 17,9 y 18,3 años, con una confianza del 99,5%?
13. La media de las medidas de los diámetros de una muestra aleatoria de 200 bolas de
rodamiento fabricadas por cierta máquina fue de 0,824 cm y la desviación típica fue de
0,042 cm. Halla los límites de confianza al 95% para el diámetro medio de las bolas
fabricadas por esa máquina
14. En los folletos de propaganda, una empresa asegura que las bombillas que fabrica
tienen una duración media de 1600 horas. A fin de contrastar este dato, se tomó una
muestra aleatoria de 100 bombillas, obteniéndose una duración media de 1.570 horas, con
una desviación típica de 120 horas. ¿Puede aceptarse la información de los folletos con un
nivel de confianza del 95%?
15. En una gran ciudad venezolana, la altura media de sus habitantes tiene una desviación
típica de 8 cm. Se pide :


Si la altura media de dichos habitantes fuera de 175 cm. ¿cuál sería la probabilidad
de que la altura media de una muestra de 100 individuos tomada al azar fuera
superior a 176 cm? Explica los pasos seguidos para obtener la respuesta.
Si se considera una muestra aleatoria de 100 individuos de esta ciudad, se obtiene
una altura media de 178 cm. Determina un intervalo de confianza del 95% para la
altura media de los habitantes de esta ciudad. Explica los pasos seguidos para
obtener la respuesta.
16. En un determinado barrio se seleccionó al azar una muestra de 100 personas cuya media
de ingresos semanales resultaba igual a 106.000 Bs. con una desviación típica de 20.000 Bs
a)Si se toma un nivel de confianza del 95%, ¿cuál es el intervalo de confianza para
la media de los ingresos mensuales de toda la población?
b) Si se toma un nivel de significación igual a 0,01, ¿cuál es el tamaño muestral
necesario para estimar la media de ingresos mensuales con un error menor de 3.000 Bs.?
17. Se administra un test a 100 estudiantes dando una media de 75 puntos. Asumiendo una
varianza poblacional de las puntuaciones de 2500 puntos. Hallar un intervalo de confianza
del 99% para la verdadera puntuación media poblacional.
¿Cuál debería ser el tamaño de muestra en el ejercicio anterior si se desea que la media
muestral no difiera de la verdadera media en 5 puntos?
18. Una muestra aleatoria de 50 llantas da un promedio de vida útil (en millas9 de 30000
millas. Asumiendo una desviación poblacional de 4000 millas. Hallar el intervalo de
confianza del 95% para la media. Hallar el tamaño de muestra adecuado de manera que la
media muestral ni difiera en mas de 1000 millas de la media poblacional.
19. Se sabe que la duración en horas de un bombillo de 75 watts tiene una duración que se
distribuye normalmente con una desviación estándar de 25 horas. Se toma una muestra
aleatoria de 20 bombillos, la cual da una duración promedio de 1014 horas.
a) construya un intervalo de confianza del 90% para la duración promedio.
b) Calcule el tamaño de muestra adecuado tal que el error de estimación no sobrepase
las 300 horas.
20. La media y las desviación típicas de las cargas máximas soportadas por 60 cables son
de 11.09 toneladas y una desviación estándar de 0.73 toneladas. Hallar los límites de
confianza del 95% y 99% para la media de las cargas máximas de todos los cables
producidos por la compañía.
21. Una muestra de 10 fusibles producidos por una empresa dio una duración media de
1200 horas y una desviación típica de 100 horas. Calcule un intervalo de confianza del 90%
para la media y la varianza poblacional.
22. Un ingeniero analiza la resistencia a la comprensión del concreto la cual esta distribuida
aproximadamente de manera normal con una varianza poblacional de 1000 psi2. Al tomar
una muestra aleatoria de 12 especimenes, se tiene que la media es de 3250 psi. Con una
desviación estándar de 800 psi
a) construya un intervalo de confianza del 99 % para la resistencia a la comprensión
promedio. Construya un intervalo de confianza del 95% y compare el ancho de
ambos intervalos.
b) Construya un intervalo de confianza del 99% para la varianza poblacional de todas
las resistencias a las compresiones del concreto
23. Un fabricante produce focos que tienen un promedio de vida con una distribución
aproximadamente normal y una desviación estándar de 40 horas. Si una muestra de 30
focos tiene una vida promedio de 780 horas, encuentre un intervalo de confianza del 96%
para la media poblacional de todos los focos que produce esta empresa.
24. Una maquina de refrescos esta ajustada de tal manera que la cantidad de liquido
despachada de distribuye aproximadamente en forma normal con una desviación estándar
igual que 0.15 decilitros. Encuentre un intervalo de confianza del 95% para la media de
todos los r3efrescos que sirve esta maquina si una muestra aleatoria de 36 refrescos tiene un
contenido promedio de 2.25 decilitros. Y si la muestra es de 18 refrescos?
25. Una maquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de
piezas cuyos diámetros son 1.01 0.97 1.03 1.04 0.99
0.98 0.99 1.01 y 1.03
centímetros. Encuentre un intervalo de confianza del 99% para el diámetro promedio de
piezas de esta maquina, si supone una distribución aproximadamente normal. También
encuentre un intervalo de confianza del 99% para la varianza poblacional.
26. Una muestral aleatoria de 8 cigarrillos de una marca determinada tiene un contenido
promedio de nicotina de 2.6 miligramos y una desviación estándar de 0.9 miligramos.
Determina un intervalo del 99% de confianza para el contenido promedio real de nicotina
de esta marca de cigarros en particular, asumiendo que la distribución de los contenidos de
nicotina es aproximadamente normal.
27. Se registraron las siguientes mediciones del tiempo de secado en horas de una marca de
pintura látex.
3.4
4.0
4.2
2.5
3.7
5.2
4.2
3.5
4.9
4.8
3.6
4.7
Encuentre un intervalo de confianza del 99% para la media del tiempo de secado en horas,
asumiendo que la distribución del tiempo de secado para esa marca de pintura látex es
aproximadamente normal.
28. Los siguientes son los pesos en decagramos de 10 paquetes de semillas de pasto
distribuidos por determinada compañía: 46.4 46.1 45.8 47.0 46.1 45.9 45.8
46.9
45.2 y 46.0. Encuéntrese un intervalo de confianza de 95% para la varianza de
todos los paquetes de semillas de pasto que distribuyo por esta compañía, suponiendo una
población normal.
29. Un fabricante de baterías para automóvil asegura que sus baterías duran en promedio 3
años con una varianza de 1 año. Si 5 de estas baterías tienes duraciones de 1.9 2.4 3.0
3.5 y 4.2 años, determine un intervalo de confianza de 95% para la varianza poblacional e
indique si es valida la afirmación del fabricante de que la varianza poblacional es igual a 1.
Suponga que la población de las duraciones de las baterías se distribuye aproximadamente
en forma normal.
30. Las medidas de los diámetros de una muestra tomada al azar, de 20 cojinetes de bolas,
hechos por una determinada máquina, dieron una media de 2 cm y una desviación típica de
0,1 cm. Hallar los intervalos de confianza del :



90%
95%
99 %
para el diámetro de todos los cojinetes
31. María Wilson considera ser candidata para la alcaldía de la ciudad de Bear Gulch,
Montana. Antes de presentar su candidatura, decide realizar un sondeo de electores en
dicho lugar. Una muestra de 400 revelo que 300 ciudadanos la apoyarían en la elección de
noviembre.
a) que proporción de la población de electores en Bear Gulch calcula que apoyarían a la
candidata Wilson?
b)Especifique un intervalo de confianza de 99% para la proporción de votantes en la
población que apoyarían a la Sra Wilson.
32. Suponga que una cadena de televisión planea sustituir uno de sus programas que se
transmite en el horario con mayor numero de telespectadores, con una nueva comedia
dirigida al publico familiar. Antes de que se tome una decisión final, se elige una muestra
aleatoria de 400 televidentes que acostumbran presenciar la televisión durante dicho
horario. Después de ver un preprograma de la comedia, 250 de las personas indicaron que
si la verían.
a) ¿Cual es su estimación de la proporción de telespectadores en la población, que vera el
nuevo programa?
b)Defina un intervalo de confianza de 95% para la proporción de publico que vera el nuevo
espectáculo.
33. un impresor de serigrafías compra vasos de plástico para estampar logotipos para
encuentros deportivos y otras ocasiones especiales. El impresor recibe una remesa grande
esta mañana y quiere estimar el porcentaje de artículos defectuosos. Una muestra de 200
vasos revelo que 30 de los mismos resultaron con defectos.
a) ¿que proporción del embarque se estima que este defectuosa?
b) Establezca un intervalo de confianza de 95% para la proporción de vasos con
desperfectos.
Descargar