INFERENCIA ESTADÍSTICA Notas de clase. Profesores A. Leonardo Bañuelos S. Nayelli Manzanarez Gómez

Anuncio
INFERENCIA ESTADÍSTICA
Notas de clase
Profesores:
A. Leonardo Bañuelos S.
Nayelli Manzanarez Gómez
TEMA III
ESTIMACIÓN DE PARÁMETROS
POR INTERVALOS DE CONFIANZA
En donde a partir de una condición se ha generado un intervalo aleatorio,
en el cual, la constante que ha quedado dentro del intervalo puede ser el valor de
un parámetro objetivo
.
Definición 3.1
Intervalo de confianza
Un intervalo de confianza para el parámetro poblacional
al
nivel de confianza 100
, siendo
un valor en el
intervalo
, se define como un intervalo de la forma
cuyos extremos son estadísticos y tiene la
La estimación puntual es útil pues proporciona el valor más representativo para
el parámetro que se desea estimar; sin embargo, la probabilidad de que el
estimador tome el valor del parámetro es prácticamente cero, por lo que en
algunos problemas es mucho más útil un intervalo para el cual la probabilidad de
que el parámetro se encuentre en dicho intervalo sea alta.
La estimación por intervalos parte de construir intervalos aleatorios.
Un intervalo aleatorio es un intervalo en donde al menos uno de sus límites es
una v.a. En general, un intervalo aleatorio se construye a través de los
estadísticos
y
tales que
donde
recibe el nombre de nivel o coeficiente de confianza,
y
se denominan límites de confianza inferior y superior, respectivamente y
se
llama nivel de significación o nivel de significancia o simplemente significancia.
propiedad de que
Para obtener el intervalo de confianza se utiliza el método del pivote.
método del pivote se basa en la determinación de una expresión pivote que
función de las mediciones de la muestra y del parámetro desconocido
,
donde
es la única cantidad desconocida y el pivote tiene una distribución
probabilidad que no depende del parámetro
.
Por ejemplo, si el estadístico
tiene una distribución normal, tal que
entonces se puede calcular
despejando
y
Fig. 3.1
Considérese que se tiene una variable aleatoria
contenida en un
intervalo dado, por ejemplo:
(Intervalo determinístico)
y
, y
se obtiene:
son los estadísticos del intervalo de confianza.
INTERVALO DE CONFIANZA PARA LA MEDIA
En los capítulos anteriores se estudió el estadístico
como estimador de la media poblacional
, y si se considera una muestra grande
, extraída de una población con
conocida, entonces del teorema del
el cual se podría escribir como:
límite central
(Intervalo aleatorio)
El
es
en
de
y en consecuencia
, donde
INFERENCIA ESTADÍSTICA
Tema III
Pág. 2
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
por lo que
El denotar a
como
, es una notación común en estadística, pero no
está completamente generalizada.
se obtiene de
Cuando la muestra es pequeña
y la población tiene una
distribución normal con variancia conocida, entonces puede emplearse (3.1), como
se ilustra en el siguiente ejemplo
))))))))))))))))))))))))))))))))))))
Ejemplo 3.1
Construir un intervalo del 95% de confianza para la media de una
población normal con variancia , y
. Además, utilizando los
datos:
y
obtener una estimación.
De donde el intervalo de confianza de dos lados para la media con un nivel de
confianza de
, cuando la muestra es grande es:
Resolución
Puesto que se desea un intervalo para la media, la variancia es conocida
y la distribución de la población es normal, de la expresión (3.1) se tiene
. . . (3.1)
donde
y los límites son:
el valor
se obtiene de tablas de distribución normal estándar de forma que
y de tablas
El intervalo aleatorio es
y sustituyendo
Fig. 3.2
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
por
se obtiene la estimación
Estimación
))))))))))))))))))))))))))))))))))))
El último intervalo no es aleatorio, es decir, la estimación no es un
intervalo de probabilidad 0.95, puesto que la probabilidad de que la media
poblacional esté contenida en el intervalo es
ó , lo que significa que la media
está o no contenida en el intervalo.
INFERENCIA ESTADÍSTICA
Tema III
Pág. 3
S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
La interpretación del intervalo aleatorio es, que en repetidas utilizaciones
de la fórmula, el 95% de las veces el intervalo generado (estimación) contendrá
a la media.
A pesar de que la estimación contiene o no a la media de la población,
es común decir que se tiene una confianza del 95% de que sí lo contenga.
En muchos casos no se conoce la variancia de la población, la cual se
puede aproximar puntualmente mediante el estimador insesgado
sustituirlo en lugar de
y
en la expresión (3.1).
))))))))))))))))))))))))))))))))))))
Ejemplo 3.2
En una escuela de ingeniería, se seleccionaron 50 alumnos y se
determinó el promedio de horas que estudian a la semana, el cual fue de
con una desviación estándar de los datos igual a
Fig. 3.3
y sustituyendo por los valores de la muestra
. Con estos datos, estimar las horas que estudiaron en
promedio los alumnos con un coeficiente de confianza igual a 95%.
Resolución
Se desea un intervalo para la media de las horas de estudio
.
Y sustituyendo en el intervalo se tiene:
Puesto que la muestra es grande entonces:
operando
como el valor de
estimador insesgado
se desconoce se puede aproximar mediante el
de donde la expresión (3.1) se reescribe
como:
))))))))))))))))))))))))))))))))))))
Cuando el tamaño de la muestra es pequeño,
, la muestra se
extrae de una población con distribución normal y la variancia se desconoce,
entonces se utiliza el estadístico
. . . (3.2)
al considerar un intervalo simétrico y centrado en
y puesto que
entonces, de tablas
el cual tiene una distribución
confianza del
con
es:
grados de libertad, y el intervalo de
. . . (3.3)
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
INFERENCIA ESTADÍSTICA
Tema III
Pág. 4
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
donde
se obtiene de tablas con distribución
de Student de forma
operando
que
))))))))))))))))))))))))))))))))))))
Ejemplo 3.4
Un fabricante produce anillos de pistón para un motor de automóvil, se
sabe que el diámetro de los anillos se distribuye aproximadamente en
forma normal y con una desviación estándar
. Una
muestra aleatoria de 15 anillos tiene media de
.
a)
Construir un intervalo de confianza de dos lados del 95% con
respecto al diámetro medio de los anillos de pistón.
b)
Construir un límite de confianza inferior del 95% respecto al
diámetro medio de los anillos de pistón.
Fig. 3.4
))))))))))))))))))))))))))))))))))))
Ejemplo 3.3
Diez ejes de precisión fabricados en cierto proceso tienen un diámetro
promedio de 0.908 cm, con una desviación estándar de 0.004 cm.
Considerando que los datos provienen de una muestra aleatoria con
distribución normal, construir un intervalo de confianza del 95% para el
diámetro promedio real de los ejes fabricados.
Resolución
a)
Puesto que la población tiene distribución normal, el intervalo
de dos lados está dado por:
De tablas se obtiene que
se satisface con
Resolución
Puesto que la muestra es pequeña, los datos provienen de una población
con distribución normal y la variancia es desconocida, entonces el
intervalo de confianza para la media está dado por (3.3), de donde
Sustituyendo
,
,
y sustituyendo los valores obtenidos en la muestra
b)
Un límite de confianza inferior es de la forma
por lo que
y de tablas
...
donde
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
se obtiene de
(3.2a)
INFERENCIA ESTADÍSTICA
Tema III
Pág. 5
S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Definición 3.2
Cuando la muestra es grande el estadístico para la diferencia de
medias está dado por
Por lo que el intervalo de confianza de dos lados para la diferencia
de medias con un nivel de confianza de
centrado
en
es
Fig. 3.5
De tablas
sustituyendo
donde
se obtiene de tablas con distribución normal estándar
de forma que
))))))))))))))))))))))))))))))))))))
Como se observó en el ejemplo, es posible obtener intervalos
unilaterales, tanto inferiores como superiores, procediendo de una manera muy
similar que para los intervalos de dos lados.
Si se desconocen las variancias de las poblaciones
y
y la
muestra es grande, entonces se pueden sustituir por sus estimadores puntuales
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS
Al igual que el intervalo de confianza para la media, para el intervalo de
confianza para la diferencia de medias pueden distinguirse dos casos: muestras
grandes (variancia conocida o que se puede aproximar) y muestras pequeñas
(distribución normal y variancia desconocida).
y
.
))))))))))))))))))))))))))))))))))))
Ejemplo 3.5
La resistencia del caucho a la abrasión aumenta si se agrega una carga de
sílice y un agente de acoplamiento para enlazar químicamente a la carga
con las cadenas de polímero del caucho. Cincuenta muestras de caucho
con el agente de acoplamiento tipo I dieron una resistencia promedio de
92 y la variancia de las mediciones fue de 20. Cuarenta muestras de
caucho con el agente de acoplamiento tipo II dieron un promedio de 98
y una variancia de 30 en sus mediciones. Estimar la diferencia verdadera
entre las resistencias promedio a la abrasión en un intervalo de confianza
del 95% .
Resolución
Puesto que las muestras son grandes y aproximando puntualmente las
variancias, se tiene:
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
INFERENCIA ESTADÍSTICA
Tema III
Pág. 6
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
...(3.4)
Sustituyendo:
))))))))))))))))))))))))))))))))))))
Ejemplo 3.6
Para dos muestras extraídas de distribuciones normales se obtuvieron los
siguientes resultados
operando
))))))))))))))))))))))))))))))))))))
Cuando la variancia de la población es desconocida y la muestra es
pequeña, se puede utilizar la distribución
para obtener el intervalo de
confianza.
Obtener un intervalo de confianza para la diferencia de medias con un
coeficiente de confianza igual a
, considerando igualdad de
variancias poblacionales.
Resolución
Definición 3.3
Cuando las muestras son pequeñas y provienen de poblaciones
normales con variancias desconocidas pero iguales, entonces el
estadístico para la diferencia entre dos medias está dado por
Puesto que la muestra proviene de una distribución normal y las muestras
son pequeñas con variancias desconocidas
donde
el valor de
y
El intervalo es:
Por lo que el intervalo de confianza de dos lados para la diferencia de
medias con un nivel de confianza de
centrado en
es
valuando
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
con
grados de libertad para
INFERENCIA ESTADÍSTICA
Tema III
Pág. 7
S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
))))))))))))))))))))))))))))))))))))
Ejemplo 3.7
Considérense los siguientes datos:
8.2
8.28
8.23
8.21
8.24
8.23
8.25
8.2
8.19
8.23
Obtener:
Finalmente
))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA LA VARIANCIA
8.24
8.25
8.24
8.26
8.26
a) Un intervalo de confianza de dos lados del 95% para
Definición 3.4
Si
es una v.a. con distribución normal con media
variancia
y
desconocidas, entonces el estadístico empleado es
b) Un intervalo de confianza inferior del 95% para
.
c) Un intervalo de confianza superior de 95% para
Resolución
De los datos de la tabla se obtiene
.
donde
a) Sustituyendo en
Utilizando el estadístico
se obtiene el intervalo de
confianza de dos lados con un coeficiente de confianza de
, el cual es
para
De tablas
...(3.5)
Por lo que
b) Para un intervalo inferior
De tablas
Fig. 3.6
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
entonces
.
INFERENCIA ESTADÍSTICA
Tema III
Pág. 8
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Utilizando el estadístico
se obtiene el intervalo de confianza de
dos lados con un coeficiente de confianza de
para la relación de
c) Para un intervalo superior
las variancias
, el cual es
De tablas
...(3.6)
entonces
))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA LA RAZÓN DE
VARIANCIAS
Definición 3.5
Si y
son vv.aa. independientes con distribuciones normales
con medias
y
desconocidas y variancias
y
desconocidas, respectivamente, entonces el estadístico empleado
es
Fig. 3.7
))))))))))))))))))))))))))))))))))))
Ejemplo 3.8
Se extraen dos muestras independientes de poblaciones normales
obteniéndose los siguientes datos
Construir un intervalo de confianza de dos lados del 95 % con respecto
donde
a la relación de las variancias
Resolución
El intervalo está dado por
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
.
INFERENCIA ESTADÍSTICA
Tema III
Pág. 9
S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Utilizando el estadístico
y aproximando la cantidad
De tablas e interpolando
mediante su estimador puntual
confianza de dos lados con un coeficiente
es
sustituyendo
.....(3.7)
))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN
Definición 3.6
Si se toma una muestra de tamaño de una población muy
grande ( o infinita), y
observaciones pertenecen a la clase de
interés, entonces
))))))))))))))))))))))))))))))))))))
Ejemplo 3.9
En una muestra al azar de 60 secciones de tubo en una planta química, 8
de ellos mostraron señales de corrosión seria. Construir un intervalo de
confianza del 95 % para la proporción de los tramos de tubo con
corrosión seria.
Resolución
Utilizando la fórmula (3.7), con
de tablas, y
recordando que
, se tiene:
es un estimador puntual de la
proporción de la población que pertenece a la clase en cuestión, y
la distribución de muestreo es
donde
y
y
se obtiene el intervalo de
para la proporción
son los parámetros de la distribución binomial.
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
Finalmente:
))))))))))))))))))))))))))))))))))))
INFERENCIA ESTADÍSTICA
Tema III
Pág. 10
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
PROPORCIONES
Definición 3.8
Si dos muestras independientes de tamaño
y
Y
de tablas, se tiene
se extraen de
poblaciones infinitas con distribuciones binomiales,
representa el número de observaciones de la primera muestra que
corresponden a la clase de interés, y representa el número de
observaciones de la segunda muestra que corresponden a la clase
en cuestión, entonces la distribución de muestreo para la
diferencia de proporciones está dada por
operando
))))))))))))))))))))))))))))))))))))
donde
De la definición (3.8) se obtiene el intervalo de confianza de dos lados
para la diferencia de proporciones, con un nivel de confianza de
,
el cual es
...(3.8)
))))))))))))))))))))))))))))))))))))
Ejemplo 3.10
Dos grupos de 80 pacientes tomaron parte en un experimento en el cual
un grupo recibió píldoras que contenían un antialérgico, mientras que al
otro grupo se le administró un placebo, es decir, una píldora sin droga
alguna. En el grupo que recibió el medicamento 23 exhibieron síntomas
alérgicos, mientras que en el otro grupo 41 los exhibieron. Obtener un
intervalo de confianza del 99 % para la diferencia entre las
proporciones.
Resolución
Sustituyendo en la fórmula (3.8) con
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
TÓPICOS ESPECIALES:
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS, CASOS ESPECIALES
Existen algunos casos especiales para los intervalos de confianza de diferencia de
medias. El primero de ellos es cuando se tienen datos apareados, o en pares, es
decir, las muestras aleatorias no son independientes y tienen el mismo tamaño. El
segundo de ellos, que queda un poco más allá del objetivo del presente curso, se
tiene cuando las muestras son pequeñas, independientes, con distribuciones
aproximadamente normales con variancias desconocidas y diferentes.
DATOS EN PARES
Cuando se observan datos en pares y se espera que exista una fuerte correlación
entre cada pareja de datos, se debe generar una nueva variable aleatoria para
construir el intervalo de confianza.
Sea la variable aleatoria
, donde
,
entonces:
,
y el intervalo se puede generar mediante:
INFERENCIA ESTADÍSTICA
Tema III
Pág. 11
S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
utilizando un intervalo de confianza para
con observaciones
apareadas, se tiene :
donde
y
son la media y la desviación estándar muestrales, que se calculan
mediante:
La afirmación es válida.
S))))))))))))))))))))))))))))))))))))Q
S))))))))))))))))))))))))))))))))))))Q
Ejemplo 3.11
Un gimnasio afirma que un nuevo programa de ejercicios reduce la talla
de la cintura de una persona dos centímetros en promedio en un periodo
de cinco días. Se indicó la talla de la cintura de seis hombres que
participaron en este programa de ejercicios antes y después del periodo
de cinco días y las cifras resultantes se registraron en la tabla:
VARIANCIAS DIFERENTES MUESTRAS PEQUEÑAS
Cuando el problema consiste en encontrar una estimación por intervalos para la
diferencia de medias
, las muestras son pequeñas, las poblaciones son
aproximadamente normales y las variancias desconocidas no pueden considerarse
iguales, entonces no existe un estadístico exacto para el problema; sin embargo,
algunos autores han encontrado muy buenas aproximaciones utilizando el
estadístico:
H O M B R E S
Talla
anterior
de la
cintura
Talla
posterior
de la
cintura
1
2
3
4
5
6
90.4
95.5
98.7
115.9
104.0
85.6
el cual tiene una distribución aproximadamente
cuales se aproximan mediante:
91.7
93.9
97.4
112.8
101.3
84.0
Determinar si la afirmación de este gimnasio es cierta, calculando un
intervalo de confianza del
para la reducción promedio de la talla
de la cintura. Asumir que la distribución de las diferencias de las tallas
antes y después del programa es aproximadamente normal.
Resolución
Si
es la talla anterior y
,
,
la talla posterior,
,
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
o bien mediante
, con
grados de libertad, los
INFERENCIA ESTADÍSTICA
Tema III
Pág. 12
S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
BIBLIOGRAFÍA
Hines, William W. y Montgomery, Douglas C., et al .- Probabilidad y Estadística para
Ingeniería y Administración, Cuarta Edición..- CECSA.- México, 2004.
Wackerly, Dennis D., Mendenhall, William, y Scheaffer, Richard L.- Estadística
Matemática con Aplicaciones, Sexta edición.- Editorial Thomson.- México, 2002.
Milton, Susan J. y Arnold, Jesse C.- Introduction to probability and statistics, Fourth
Edition.- McGraw-Hill, 2003.
puesto que
difícilmente es entero se aproxima al entero más cercano.
El intervalo de confianza de dos lados queda entonces:
Walpole, Ronald E., et al..- Probabilidad y Estadística para Ingenieros.- Prentice Hall.Sexta Edición.- México, 1999.
Scheaffer, Richard L y McClave, James T.- Probabilidad y Estadística para Ingeniería.Grupo Editorial Iberoamérica.- México 1993.
Canavos, George C.- Probabilidad y Estadística Aplicaciones y Métodos.- McGraw-Hill.México, 1988.
Devore, Jay L.- Probability and Statistics for Engineering and the Sciences.- Sixth Edition.Canada 2004.
Borras García, Hugo E., et al.- Apuntes de Probabilidad y Estadística.-Facultad de
Ingeniería, México 1985.
Rosenkrantz, Walter A.- Introduction to Probability and Statistics for Scientists and
Engineers.- McGraw-Hill.- EE.UU. 1997.
)))))))))))))))))))))))))))))))))))))))))))))))))))
A.L.B.S./ N.M .G.
Descargar