Los parientes pobres - Ciencia sin seso…locura doble

Anuncio
Los parientes pobres
Esto de los parientes pobres me recuerda un antiguo chiste de colegio
sobre un marqués que tiene un sobrino de clase baja y con el que tiene que
compartir mesa con toda la aristocracia con la que se codea el marqués.
Éste, muy preocupado, le insiste muchas veces que tiene que ser muy educado
con sus invitados. Así que, en mitad de la cena, el sobrino se levanta y
anuncia: señoras y señores, excúsenme pero tengo que ir a hacer mis
necesidades fisiológicas. El chico se levanta y comienza a caminar hacia el
cuarto de baño. Pero a mitad de camino se detiene bruscamente, se queda
pensando, se vuelve y exclama: ¡bueno, a lo mejor también cago!.
Por fortuna, la familia no siempre te da problemas de este tipo, ni es
frecuente que se mezclen las clases sociales y, desde luego, un marqués de
la vida real tampoco invitaría a la misma mesa a un sobrino como este,
aunque fuese de la familia.
Y hay familias muy bien avenidas, a pesar de que siempre alguno de sus
miembros se lleve gran parte de la fama. Este es el caso de la familia de
los intervalos. El más conocido por todos es nuestro intervalo de
confianza, pero éste tiene dos primos mucho menos célebres pero que también
contribuyen dignamente a la lucha contra la incertidumbre en la inferencia
estadística: el intervalo de predicción y el intervalo de tolerancia.
Todos somos conscientes de la imposibilidad, la mayor parte de las
veces, de acceder a toda la población cuando queremos conocer alguno de sus
parámetros. Por este motivo se desarrollan técnicas de inferencia para
tratar de estimar los valores inaccesibles de la población a partir de
valores obtenidos de muestras de esa población.
El problema es que estas estimaciones tienen siempre una probabilidad de
error. Y aquí es donde entra en juego nuestra familia de intervalos.
El primero es el intervalo de confianza que nos permite, una vez
calculado el parámetro en la muestra, estimar entre qué límites se
encuentra el valor real e inaccesible en la población, siempre con una
probabilidad de error. Por convenio suele fijarse el nivel de confianza en
el 95%, de tal forma que el intervalo se calcula según la siguiente
expresión:
IC95% = parámetro ± 2 veces el error estándar del parámetro.
En el caso sencillo de cálculo del intervalo para la media el error
estándar es igual a la desviación estándar dividida por la raíz cuadrada
del tamaño de la muestra, pero con otros estadísticos esto puede
complicarse un poco.
De todas formas, el intervalo de confianza siempre representará el
margen que probablemente contiene el valor verdadero y desconocido en la
población. La probabilidad de contención (la confianza) no se aplica al
intervalo sino, en realidad, a la proporción de todos los intervalos que
incluirían el parámetro real si repitiésemos la medida un número grande de
veces.
Aunque los intervalos de confianza dan para hablar mucho rato, no nos
vamos a entretener más por ahora. Para el que esté interesado, recomiendo
un artículo de la Revista de Pediatría de Atención Primaria donde se trata
todo esto con más detenimiento.
El segundo miembro de esta familia es el intervalo de predicción. El
concepto de intervalo predictivo es muy similar al de intervalo de
confianza. En este caso, una vez que hemos estimado el valor de la
población a partir de una muestra, el intervalo predictivo nos dirá entre
que límites estará una proporción de sujetos elegidos al azar de esa
población, con un grado de probabilidad determinada.
Si la variable que estamos midiendo sigue una distribución normal
(generalmente podemos aproximar a una normal si el tamaño de la muestra es
grande), el valor del 95% de los sujetos estará entre la media ± dos veces
la desviación típica. Bastante parecido al intervalo de confianza, pero con
dos diferencias claras.
Primero, el predictivo utiliza la desviación estándar en lugar del error
estándar del intervalo de confianza. Como la desviación típica es siempre
mayor que el error estándar, los intervalos predictivos serán siempre más
amplios que los de confianza para el mismo nivel de incertidumbre. Segundo,
para calcular el intervalo de confianza tenemos que medir previamente el
valor en una o varias muestras, mientras que el intervalo predictivo se
calcula a priori, antes de extraer el sujeto o sujetos de la población.
El tercer primo en discordia
similar al intervalo predictivo.
varias muestras y nos dice
observaciones que hagamos en
probabilidad que elijamos.
es el intervalo de tolerancia. Este es muy
Se elabora con una serie de datos de una o
entre que límites se encontrarán las
el futuro con el nivel de confianza o
Al igual que el predictivo, el intervalo de tolerancia se hace después
de hacer la estimación en la población. Su utilidad será conocer la
proporción de todas las observaciones futuras que estarán dentro de unos
márgenes determinados con una cierta probabilidad.
Como es lógico, todas estas muestras deben escogerse de la misma
población, en las mismas condiciones y de forma aleatoria.
En teoría, el intervalo de tolerancia solo es válido si se calcula a
partir de la media y desviación típicas reales de la población pero, como
estos valores suelen ser desconocidos, se usan los promedios estimados,
introduciendo así un grado de incertidumbre que será mayor cuanto menor sea
el tamaño de la muestra.
Esta incertidumbre es la que controla el intervalo de tolerancia: nos
dirá, con una confianza determinada, la proporción de la población que se
encontrará dentro de unos límites dados. Para calcularlo se utiliza la
siguiente expresión:
IT95% = parámetro ± k DS
Donde DS es la desviación estándar del parámetro y k es una función que
tiene en consideración el tamaño de la muestra, el nivel de confianza y la
proporción de la población que se mide. La matemática es compleja, así que
no intentéis calcularlo sin ayuda de aplicaciones informáticas.
Para ir terminando, comentaros que, tanto el predictivo como el de
tolerancia, pueden ser bilaterales o unilaterales. Los unilaterales nos
dirán el valor mínimo o máximo que tendrán los valores de la población con
el grado de confianza que especifiquemos.
Y esto es todo, amigos. No hemos dicho nada de otro intervalo predictivo
mucho menos amigable, pero que tiene también gran utilidad. Y es que los
intervalos predictivos tienen su papel en los modelos de regresión. Pero
esa es otra historia…
Descargar