Subido por Metodologia I USAL

apunte-de-la-materia intervalos-de-confianza

Anuncio
APUNTE DE LA MATERIA: CONCEPTO DE INTERVALO DE CONFIANZA
Y NIVEL DE CONFIANZA
Supongamos que se desea estimar el valor medio de la colesterolemia en una población.
Se escoge una muestra de 80 sujetos en los que se observa una media de 180 mg/100
ml, con una desviación estándar de 20 mg/100 ml. Si se hubiera estudiado una muestra
diferente, seguramente se habrían obtenido cifras distintas aunque los criterios de
selección hubiesen sido los mismos, si bien es probable que el valor observado en esta
segunda muestra hubiera estado alrededor de 180 mg/100 ml. Por lo tanto, a partir del
valor observado en una única muestra no puede conocerse exactamente el verdadero
valor en la población de origen, ya que es tan sólo una aproximación (estimación
puntual). Para conocer entre qué límites es más probable que se sitúe este verdadero
valor, debe calcularse el intervalo de confianza (IC).
La amplitud del IC, es decir, la precisión de la estimación, depende del grado de
confianza, la variabilidad del parámetro de interés y el número de sujetos estudiados.
Cuanto menor sea la variabilidad del parámetro y mayor el número de sujetos, mayor
precisión existirá en la estimación para un grado de confianza determinado. Cuanta más
confianza se desee obtener, más amplio será el IC, y menor la precisión obtenida.
En resumen: un intervalo de confianza es un rango de valores, derivado de los datos de
la muestra, que posiblemente incluya el valor de un parámetro de población
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de
una población en particular generen intervalos de confianza idénticos. Sin embargo, si
usted repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de
confianza resultantes incluiría el parámetro de población desconocido.
Recuerde: la letra griega µ representa el verdadero valor de la media de la población,
solamente se puede conocer si se analiza a la población completa, que no ocurre en los
estudios experimentales. Los verdaderos valores de la población es lo que quisiéramos
poder conocer, y se denominan PARAMETROS POBLACIONALES.
Para representar la media de la muestra se utiliza el símbolo x (que se lee: x media),
que es el valor que se calcula como el promedio de los valores que obtuvimos del
estudio. A través de los estudios experimentales, lo que podemos llegar a conocer es la
media muestral, que se denominan genéricamente Estimadores, ya que a través de la
media muestral estimamos la media poblacional.
1
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida
de la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la
línea horizontal contienen el valor de la media de la población. El intervalo de confianza
rojo que está completamente por debajo de la línea horizontal no lo contiene. Un
intervalo de confianza de 95% indica que 19 de 20 muestras (95%) de la misma
población generarán intervalos de confianza que contendrán el parámetro de población.
El intervalo de confianza se utilizar para evaluar la estimación del parámetro de
población.
Por ejemplo, un fabricante desea saber si la longitud media de los lápices que produce
es diferente de la longitud objetivo. El fabricante toma una muestra aleatoria de lápices
y determina que la longitud media de la muestra es 52 milímetros y el intervalo de
confianza de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la
longitud media de todos los lápices se encuentra entre 50 y 54 milímetros.
Otro ejemplo: una encuesta política podría indicar que el nivel de popularidad de un
candidato es de 55% con un margen de error de 5%. Esto significa que el nivel de
popularidad real es +/- 5% y, por lo tanto, se ubica entre 50% y 60%.
Para un intervalo de confianza bilateral, el margen de error es la distancia desde el
estadístico estimado hasta el valor de cada intervalo de confianza. Cuando un intervalo
de confianza es simétrico, el margen de error es la mitad del ancho del intervalo de
confianza. Por ejemplo, la longitud media estimada de un árbol de levas es 600 mm y el
intervalo de confianza oscila entre 599 y 601. El margen de error es 1.
El intervalo de confianza se determina calculando una estimación de punto (por
ejemplo, el valor de la media de la muestra si se trata de una variable continua, o la
frecuencia de un evento para una variable dicotómica) y luego determinando su margen
de error.
¿Qué es un nivel de confianza?
El nivel de confianza indica qué tan probable es que el parámetro de población, como
por ejemplo la media, esté dentro del intervalo de confianza.
Un nivel de confianza de 95% por lo general es adecuado. Esto indica que 19 de 20
muestras (95%) de la misma población generarán intervalos de confianza que
contendrán el parámetro de población.
El nivel de confianza representa el porcentaje de intervalos que incluirían el parámetro
de población si usted tomara muestras de la misma población una y otra vez. Por lo
tanto, si usted recogió cien muestras y creó cien intervalos de confianza de 95%, cabría
esperar que aproximadamente 95 de los intervalos incluyeran el parámetro de población,
como se muestra en la siguiente figura.
2
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida
de la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la
línea horizontal contienen el valor de la media de la población. El intervalo de confianza
rojo que está completamente por debajo de la línea horizontal no lo contiene. Un nivel
de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población
generarán intervalos de confianza que incluirán el parámetro de población.
¡Qué es lo que NO significa el intervalo de confianza!
No significa que el 95 % de los valores de la población están dentro de esos límites.
Ahora otro concepto importante:
Como tiene µ un valor real, una vez que la muestra fue tomada y los intervalos
calculados está dentro del intervalo o no lo está (¡Nunca lo sabremos!). En este
caso, si justo nuestra muestra era una muestra que NO contenía a la media
poblacional el valor real de la media de la población no hubiera estado en nuestro
intervalo de confianza del 95% (y nosotros no lo sabríamos).¡Esto ocurrirá en el
5% de los muestras que podríamos utilizar! Por este motivo nunca tenemos la
certeza absoluta de conocer cuál es el valor de la media poblacional.
3
Descargar