Subido por Giovani Butron Borda

290897237-6-Modulo-3-Inferencia-Estaditica

Anuncio
BENEMÉRITA UNIVERSIDAD
AUTÓNOMA DE PUEBLA
DIPLOMADO DE
ESTADÍSTICA AVANZADA
ME Lucia Linares Manzano
MÓDULO 2
Inferencia
Estadística
ME Lucia Linares Manzano
ESTIMADORES


Indica como calcular el valor de una estimación
con base en las mediciones contenidas en nuestra
muestra
Insesgados
𝐸 𝜃 =𝜃

Cuando el valor estimado es igual a valor real
Sesgados
𝐸 𝜃 >𝜃
Cuando el valor estimado es superior o mayor al
valor real
SESGO DE UN ESTIMADOR

El sesgo de un estimador esta dado por
Parámetro objetivo
𝐵 𝜃 =𝐸 𝜃 −𝜃
Estimador
ALGUNOS ESTIMADORES PUNTUALES
INSESGADOS COMUNES

Media muestral 𝜃

Media poblacional 𝜇

Proporción de una muestra 𝑝

Los estimadores tienen errores "𝜀“ y es la
distancia de un estimador y su parámetro
objetivo
𝜀=
𝜃−𝜃
EJEMPLO

Una muestra n= 1000 votantes, seleccionados al
azar en una ciudad, mostró y=560 a favor del
candidato Jones. Estime p, la fracción de
votantes de la población que están a favor de
Jones y precise un limite de error estándar de 2
Referido a 2 sigma
en el error de estimación.
𝑝 = y/n

¿Qué tan confiable es este valor ?
ERROR ESTÁNDAR

El error estándar para el estimador p esta dado
por:
𝑝𝑞
𝑏=2
𝑛
p Es el estimador
q omplemento
EJERCICIO
Una comparación de la durabilidad de dos tipos
de llantas para un automóvil se obtuvo de
muestras de prueba en carretera de n1=n2=100
llantas de cada tipo. Se registró el número de
millas hasta quedar inútiles , el desgaste se
definió como el número de millas hasta que la
cantidad restante de la superficie de rodamiento
llego a un valor pequeño especificado
previamente. Las mediciones de los dos tipos de
llantas se obtuvieron de manera independiente y
se calcularon las siguientes medias y varianzas.
 𝑦1 = 26400 𝑦2 = 25100
2
 𝑠1 = 1440000
𝑠22 = 1960000

EJERCICIO 1

Un investigador esta interesado en la
probabilidad de unir aptitudes de televisión e
internet. Una muestra aleatoria de n=50
usuarios de internet dio que el tiempo medio
semanal empleado en ver televisión era de 11.5
horas. y que la desviación estándar es de 3.5
horas. Estime el tiempo medio poblacional que los
usuarios de internet pasan viendo televisión i fije
un limite para el error de estimación.
EJERCICIO 2

Una agencia de protección ambiental en
conjunto con la universidad de Florida
recientemente realizó un amplio estudio de los
posibles efectos de trazas de elementos en el
agua potable sobre la formación de cálculos
renales. En la tabla siguiente se muestran los
resultados. Los datos de estos individuos son de
los diferentes lugares estudiados
a) Estime la concentración promedio de calcio en el agua
potable para pacientes con cálculos renales en Carolina.
Establecer un límite El error es 0.7681 con 2 sigma es +-1.53
b)Calcule la diferencia en edades medias para pacientes
con cálculos renales en Carolina y en las rocallosas.
Establecer un límite El error es 0.8518 con 2 sigma es +-1.7036
Carolina
Rocallosas
Tamaño
muestral
467
191
Edad promedio
45.1
46.4
Desviación
estándar de la
edad
10.2
9.8
Componente
medio de calcio
(ppm)
11.3
40.1
Desviación
estándar de
calcio
16.6
28.4
Proporción de
fumadores en el
estudio
.78
.66
INTERVALO DE CONFIANZA
Es un rango de valores creado a partir de los datos
de la muestra, de modo que el parámetro
poblacional es probable que ocurra dentro de este
rango en probabilidad específica. Que es el nivel de
confianza.
INTERVALOS DE CONFIANZA
𝑃 𝜃𝐿 ≤ 𝜃 ≤ 𝜃𝑈 = 1 − 𝛼
Si sabemos que la media de la muestra sigue
una distribución normal. Podemos utilizar la
distribución normal estándar.
 Para calcular intervalos de confianza
𝜇 ± 𝑧𝜎

Nivel de
confianza
Probabilidad
más cercana
Valor z
80%
0.3997
1.28
94%
0.4699
1.88
96%
0.4798
2.05
TODO DEPENDE DEL NIVEL DE CONFIANZA

Encontrar el valor z de un nivel de confianza del
92%.
Es 1.75 el valor de Z
EJERCICIO

Una empresa quiere tener informacion sobre el
ingreso medio de los gerentes intermedios en la
industria detallista. Una muestra aleatoria de
256 gerentes revela una media de la muestra de
$45 420. La desviacion estandar de esta muestra
es de $ 2050. La empresa busca las respuestas a
las preguntas siguientes.
¿Cuál es la media de la población? Igual que la media muestral
 ¿Cuál es un rango de valores racionales para la
media poblacional? Con un NS=90% el valor Z=1.64 P(42058<=M<=48782)
 ¿Qué significa estos resultados?

EJEMPLO

Tras varios años de participar en el negocio de la
renta de autos, Town Bank, sabe que la distancia
media conocida en una renta durante 4 años es
de 50 000 millas y la desviación estándar es de
5 000. Se quiere encontrar la proporción de los
intervalos de confianza de 95% que van a incluir
la media de la población de 50. Para facilitar los
cálculos, realizaremos los cálculos en miles de
millas y no en millas. Seleccionamos 60 muestras
aleatorias de 30 de una población con una media
de 50 y una desviación estándar de 5
CALCULANDO EN MINITAB

Seleccionar Calc, Random DataNormal
SELECCIONES STAT, BASIC STATISTICS
1-SAMPLE-Z
DESVIACIÓN ESTÁNDAR DE UNA POBLACIÓN
DESCONOCIDA Y UNA MUESTRA PEQUEÑA


Cuando se tiene una muestra < a 30 se remplaza
la distribución por una distribución t
La distribución t es mas plana esto se debe a que
la desviación estándar es mayor a la desviación
estándar normal
Es una distribución continua
 Es simétrica y con forma de campana
 No hay una sola sino una familia de
distribuciones t

INTERVALO DE CONFIANZA PARA LA MEDIA DE
LA POBLACIÓN, CON DESVIACIÓN ESTÁNDAR
DESCONOCIDA
𝜇 ± 𝑡𝜎
𝑠
𝜎=
𝑛
Solo tomar en cuenta que ahora se utiliza la
distribución t (tablas)
Descargar