Intervalos de confianza. Introducción

Anuncio
Intervalos de confianza. Introducción
Los estimadores de parámetros suelen llamarse ESTIMADORES PUNTUALES, pues con un solo valor
calculado a partir de la muestra estimamos el valor del parámetro.
Es cierto que la precisión de un estimador puntual se incrementa con muestras grandes, o sea, el valor que
tome el estimador puntual para una muestra de tamaño n dado, sería más confiable, de estar más cerca del
parámetro a estimar, que el que tome para una muestra de tamaño menor a n.
Sin embargo, aún cuando se use para cada parámetro, el mejor estimador puntual que existe (o sea, que
cumpla con todas o la mayoría de las propiedades) no hay razón para esperar que la estimación obtenida de
la muestra, deba coincidir exactamente con el valor del parámetro que se está estimando (debido a que se
trabaja con muestras y no con la población).
La mayor desventaja de los estimadores puntuales es que la estimación puntual calculada de la muestra no
dice nada, por sí sola, del grado de incertidumbre de tal estimación, o sea, sobre qué tan probable es que la
estimación esté cerca del parámetro y de qué tan cerca esté.
Los estimadores puntuales brindan una información incompleta si no están acompañadas del grado de
incertidumbre de la estimación puntual obtenida..
La manera más frecuente de expresar tal incertidumbre, consiste en construir un intervalo dentro del cual se
esperaría, con alta probabilidad, encontrar el valor del parámetro. Tal intervalo se conoce con el nombre de
INTERVALO DE CONFIANZA.
Es imposible construir un intervalo de confianza del cual se espere que haya una probabilidad del 100% de
obtener al verdadero y desconocido valor del parámetro debido a que, ya sabemos que a partir de una
muestra no podemos llegar a conclusiones acerca de la población que sean 100% verdaderas.
Luego, deberemos ser más modestos y construir el intervalo de confianza de la siguiente manera:
Primer Paso: Escoger de antemano un valor de probabilidad cercano a 1 (los valores más usados son 99, 95 y
90) que simbolizaremos con 1- . Tal valor de probabilidad preasignando se conoce con el nombre de
Coeficiente, Grado o Nivel de Confianza representa la probabilidad de que el intervalo construído contenga
el valor del parámetro. El valor  suele llamarse riesgo y representa la probabilidad de que el intervalo
construído no contenga el valor del parámetro.
Segundo Paso: Hallar, para una muestra de tamaño n dado, una estimación del parámetro de interés.
Tercer Paso: Para determinar la incertidumbre de la estimación puntual, se construye un intervalo de valores
en torno a la estimación puntual, de modo que se obtenga el deseado grado de confianza. Para ello, se hace
uso de la distribución de probabilidad del estimador empleado para estimar el parámetro.
Si el intervalo construido presenta la forma (a,b), los extremos a y b se conocen con el nombre de Limites de
Confianza .
Podemos concluir que mientras los estimadores puntuales y los intervalos de confianza representan
diferentes métodos para obtener información acerca de un parámetro, ambos se relacionan en el sentido
de que los intervalos de confianza se basan en los estimadores puntuales.
Dicho de otra manera, un intervalo de confianza es tan sólo una ampliación de la estimación puntual para
considerar la precisión de la misma.
1
INTERVALOS DE CONFIANZA PARA ESTIMAR  DE UNA POBLACION NORMAL CON
CONOCIDA.
VARIANCIA  2
Recordemos de la sección anterior que, el primer paso para la construcción de un intervalo era fijar el nivel
de confianza deseado 1- .
z
Como:
x

~ N (0,1)
n
La P( z/2 < z < z1-/2) = 1-
P(z/2 <
x

reemplazo a z por su igual
< z1-/2) = 1-.
n
Luego despejando:
P( x - z/2 /n <  < x + z1-/2 /n) = 1-.
Esto significa que el intervalo de confianza para  con  conocida es x  z/2 /n . Este intervalo tiene una
confianza del 100(1-)% de cubrir el verdadero valor del parámetro.
INTERVALOS DE CONFIANZA PARA ESTIMAR  DE UNA POBLACION NORMAL CON
DESCONOCIDA.
Sabemos que:
Entonces
t
VARIANCIA  2
x
~ t n-1
S
n
P( -t/2 < t < t/2 )= 1-. Reemplazo por t y me queda
P( -t/2 <
x
< t/2 )= 1-.
S
n
Despejando:
P( x - t n-1;/2 S/n <  < x + t n-1;/2 S/n) = 1-.
Esto significa que el intervalo de confianza para  con  desconocida es x  t n-1;/2 S/n . Este intervalo tiene
una confianza del 100(1-)% de cubrir el verdadero valor del parámetro.
Síntesis
x ± z1-/2 /n
con sigma conocida
x ± t n-1;/2 S/n com sigma desconocida
Los valores de t y z se sacan de la tabla.........................1,64, 1 ,96 y 2,58
2
INTERVALO DE CONFIANZA PARA P PROPORCIÓN DE ÉXITOS (DEFEITUOSOS, GERMINADOS, ETC)
Primero desarrollaré la teoría que corresponde a la pregunta tórica 5 de la Unidad 2 ¿Cómo se genera la
distribución del p (proporción muestral) cuando las muestras son menores que 30 y mayores que 30?
Como X=cantidad de éxitos en n ensayos sigue una distribución binomial con parámetros E(x)=nP y Var(x)=nP(1P), luego la variable p=x/n también sigue una distribución binomial, solo que ahora sus parámetros son E(x)=P y
Var(x)=P(1-P)/n
Ejemplo: la probabilidad de encontrar 5 en 20 es igual a la probabilidad de encontrar 2,5%. La probabilidad de
encontrar 4 defectuosos en 8 observaciones es igual a encontrar a una proporción muestral de 0,50
Luego si X~ Bi (n,p) la variable proporción muestral p~ Bi (n,p) solo que cambia su esperanza y variancia.
Como la binomial tiende a la normal con n grande, es decir con n mayor que 30 entonces p~ N (P, P(1-P)/n),
luego es posible estandarizarla.
z
pP
~ N (0,1)
P( 1  P )
n
Luego de igual manera que para la µ . el intervalo de confianza es:
p ± z1-/2 p(1-p)/n
Ejemplo
Recorro un campo de cítricos, deseo estimar la “proporción de plantas afectadas” por las cochinillas.
De un total de 50 plantas revisadas 15 están afectadas.
Estimación puntual : 15/50=0.3
Estimación por intervalo de confianza del 95%. p ± z1-/2 p(1-p)/n
0,3 ± 1,960,3(1-0,3)/50
de aquí obtengo el LI y el LS del intervalo.
(0,17-0,42) tengo una probabilidad del 95% que este intervalo encierre al verdadero P
Interpretación de cualquier intervalo……
EXISTE UNA PROBABILIDAD (1-α) DE QUE EL INTERVALO ENCIERRE AL VERDADERO VALOR DEL PARAMETRO
DESCONOCIDO.
En general se dice que tengo una probabilidad p de que el parámetro esté entre los límites del intervalo pero
no es correcto, ya que un parámetro no tiene distribución de probabilidad.
3
Descargar