Estimación puntual y por intervalos

Anuncio
213
4
Cuarta
Unidad Didáctica
"ESTADÍSTICA INFERENCIAL"
4.1 Parte básica
214
4.1.1 Introducción y motivación
La principal razón de que el Método Estadístico se haya desarrollado ampliamente en
los últimos años dentro de las Ciencias Experimentales es que éstas están sujetas a
razonamientos de tipo inductivo que van de lo particular a lo general. Sacaremos
conclusiones sobre un grupo de individuos a partir de la información que nos
proporciona un subconjunto más o menos amplio de los mismos. De acuerdo con
MARTIN ANDRES y LUNA CASTILLO (1990), “El único método científico para
validar tales extensiones es el Método Estadístico, pues precisamente esa es la causa de
su existencia”.
La expansión del Método Estadístico es tal que, de todas las disciplinas que nuestros
alumnos han de estudiar a lo largo de toda la enseñanza secundaría, la Estadística es
prácticamente la única que tendrán como asignatura en la mayor parte de las carreras
universitarias que puedan elegir en el futuro; desde las típicamente consideradas
experimentales, como la Medicina o la Biología, hasta carreras consideradas como de
letras como la Psicología, la Sociología o incluso la Geografía. Aquellos que decidan no
tomar el camino de la Universidad se encontrarán cada vez más frecuentemente con
conceptos procedentes de la Ciencia Estadística como por ejemplo el de error máximo
admisible o el de nivel de confianza en cualquier encuesta sociológica de las que
habitualmente aparecen en la prensa.
El primer concepto importante que hemos de transmitir a nuestros alumnos es la
diferencia existente entre lo que son las estadísticas como meras colecciones de datos y
lo que es el Método Estadístico considerado como una disciplina científica con entidad
propia.
Es común escuchar la frase “No creo en las estadísticas”, incluso entre profesionales
cercanos a la disciplina. Efectivamente las “estadísticas” como posible ayuda a la toma
de decisiones dependen de quién y como se hayan tomado los datos y de si las
respuestas que dan los encuestados se ajustan a su opinión real. En este sentido los datos
pueden ser susceptibles de creencia puesto que uno puede dudar de la intención del
215
encuestado. El Método Estadístico, tal y como está concebido en la actualidad, forma
parte del saber científico y es aceptado lo mismo que lo es, por ejemplo, la Teoría de la
Relatividad en Física; no es, por tanto, terreno de las creencias y seguirá siendo
aceptado como válido hasta que alguien proponga una nueva teoría que lo modifique.
Recapitulando sobre lo expuesto, la Estadística se configura como la tecnología del
método científico que proporciona instrumentos para la toma de decisiones cuando estas
se adoptan en ambientes de incertidumbre, siempre que esta incertidumbre pueda ser
cuantficada en términos de probabilidad. (MARTIN PLIEGO, 1994).
El procedimiento de toma de decisiones, o de aprendizaje, en el ámbito científico se
resume en la figura 1, y consiste básicamente en plantear una hipótesis, contrastarla
mediante datos experimentales y modificarla si no puede ser aceptada. Es precisamente
en el paso de contraste en el que el Método Estadístico juega un papel fundamental y
aunque cualquier científico puede realizar una investigación sin estadística, sin embargo
es mucho más fiable si el resultado está basado en métodos estadísticos. No se concibe
la investigación aplicada actual sin la utilización de la Estadística en el proceso de
inducción.
Figura 1: El proceso de aprendizaje.
El cuadro 1 muestra los pasos fundamentales del método científico en relación con el
método estadístico.
216
Figura 4.1: El Método Estadístico es una parte importante de la investigación científica
actual.
MÉTODO CIENTÍFICO
1.- PLANTEAR UNA IDEA (HIPOTESIS)
2.- CONTRASTAR LA IDEA
a) Establecer la población o poblaciones a estudiar.
b) Decidir el método para la recolección de los datos.
c) Suponer un modelo, especificando las distribuciones de las
poblaciones en estudio.
d) Formular las hipótesis de interés en términos de los parámetros del
modelo.
e) Calcular el tamaño muestral necesario para conseguir los objetivos
tan eficientemente como sea posible. El cálculo requiere el conocimiento
de la mínima diferencia en la que el investigador está interesado, así
como un estimador de la variabilidad subyacente.
f) Recoger los datos.
g) Revisar si el modelo supuesto puede considerarse una
aproximación razonable.
h) Revisión del análisis si las suposiciones de partida del modelo no
son ciertas.
i) Analizar los datos.
j)Escribir las conclusiones en lenguaje simple (no estadístico).
3.- REVISAR LA IDEA SI NO SE ACEPTA A PARTIR DEL PROCEDIMIENTO
EXPERIMENTAL.
Cuadro 4.1: El método científico y su relación con la Estadística.Se han señalado en
cursiva los pasos del método directamente relacionados con la Estadística, que van
desde la recogida de los datos hasta el análisis de los mismos.
217
Estudiaremos cada uno de los apartados mencionados aunque no necesariamente en el
orden en el que aparecen en el cuadro anterior.
Se plantea ahora un problema que suscita polémica entre los profesionales de las
Estadística, el enfoque que debe darse a la explicación de los conceptos fundamentales.
Trataremos de exponer nuestro punto de vista al respecto antes de comenzar con la
explicación propiamente dicha. Dos son los enfoque predominantes, si bien pueden
considerarse posturas intermedias; el primer bloque estaría formado por aquellos que
consideran la Estadística como una especialidad más de las Matemáticas sin
características diferenciales claras con respecto al resto de las disciplinas; el segundo
bloque estaría formado por aquellos que piensan que la Estadística tiene entidad propia
como disciplina científica en la que las Matemáticas han de entenderse simplemente
como una herramienta.
Como profesionales de la Estadística Aplicada, nos inclinamos por la segunda de las
posibilidades si bien no se debe olvidar el fondo teórico de la disciplina y las
herramientas matemáticas básicas, que se entenderán como un medio y no como un fin
en si mismas. Trataremos de explicar esta postura más ampliamente en los párrafos que
siguen.
La Estadística como disciplina tiene fundamentalmente un carácter inductivo en
contraposición al carácter deductivo de las Matemáticas, el objeto último de la misma es
sacar conclusiones sobre una población a partir de la información que proporciona una
muestra de la misma, y no el desarrollo de los teoremas propiamente dichos que sería
objeto de la denominada Estadística Matemática. Un ejemplo similar sería el de la
Física, con un campo propio, y el de los métodos matemáticos aplicados a la Física que
forman parte de las Matemáticas.
El objeto de la Estadística Aplicada son los Métodos Estadísticos, los resultados y su
aplicación en otras disciplinas científicas; la obtención teórica de dichos métodos utiliza
218
herramientas matemáticas (Cálculo, Algebra o Geometría) o conceptos de Cálculo de
Probabilidades. Siguiendo a WOLFOWITZ (1969)1:
Excepto quizás unos pocos de los más profundos teoremas, y quizás ni
siquiera esos, la mayor parte de los teoremas de la Estadística no
sobrevivirían en las Matemáticas si el sujeto de la propia estadística (la
aplicación) desapareciera. Para sobrevivir al sujeto deben responder más
a las necesidades de aplicación.
De lo que debemos protegernos es del desarrollo de una teoría que, por
una parte, tiene poca o ninguna relación con los problemas reales de la
Estadística, y que, por otra parte, cuando se ve como Matemática pura, no
es lo suficientemente interesante, por si misma, ni para sobrevivir.
También en este sentido TUKEY (1962)2, que podría ser considerado como el padre de
la aproximación exploratoria del análisis de datos, apunta lo siguiente:
La máxima más importante a la que el análisis de datos debe prestar
atención, y una de las que muchos estadísticos parecen haber olvidado, es
ésta: “Mucho mejor una respuesta aproximada a una pregunta correcta,
que es a menudo vaga, que una respuesta exacta a la pregunta errónea,
que puede hacerse siempre de forma precisa.” El análisis de datos debe
progresar aproximando respuestas, en el mejor de los casos, ya que su
conocimiento de lo que es realmente el problema será en el mejor de los
casos aproximado.
Todo lo dicho pone de manifiesto que hay distintas formas de entender las cosas
probablemente debido a la conjunción de la parte inductiva en la esencia de la disciplina
y la parte deductiva en su desarrollo. Es la parte deductiva (matemáticas) la que ha
situado a la Estadística, hasta hace pocos años, como una especialidad de la licenciatura
1
-WOLFOWITZ, J. (1969): 'Reflections on the future of mathematical statistics'. en R.
c. Bose et al. (eds.) "Essays in Probability and Sraristics". University of North
Carolina Press. Chapel Hill.
2 -TUKEY, J.W. (1962): 'The future of Data Analysis'. Annals of Mathematical
Statistics, 33, 1-67.
219
de Matemáticas, y es probablemente la parte inductiva la que ha hecho que en esas
mismas facultades fuera considerada como la hermana pobre, o cuando menos, como
algo extraño y diferente, por los matemáticos tradicionales.
El proceso futuro que seguirá la Estadística como disciplina científica pasará, sin duda,
por la separación de las Matemáticas, como lo hizo en su momento la Física, que tiene
su propia entidad aunque utilice el método matemático como herramienta. De hecho, ya
es posible cursar estudios de Estadística (tanto de primer como de segundo ciclo) en
Facultades de Estadística separadas de las de Matemáticas. (Aunque desgraciadamente
en la mayoría de los casos siguen controlados por los matemáticos).
Es esta misma disyuntiva es la que ha colocado los conceptos de Estadística necesarios
en las Enseñanzas Medias dentro de la asignatura de Matemáticas, y la que ha hecho
que muchos de los profesores, con formación matemática tradicional, prefieran relegarla
a un segundo plano cuando, en realidad, es la única parte del programa que
prácticamente todos los que tomen el camino universitario van a estudiar.
En Facultades Aplicadas (Medicina, Biología, Economía, Psicología, Geografía,
Derecho, Biblioteconomía, Traducción y documentación, etc ... ) enseñamos Estadística
Aplicada, es decir, los resultados más relevantes que permiten al alumno resolver
problemas que se encontrará en su ejercicio profesional, aprendiendo el lenguaje y las
técnicas básicas que le permitan comprender no sólo las situaciones que se le plantean
en el curso sino también posibles situaciones futuras.
No es necesario enseñar la parte deductiva completamente, ya que se trata de usuarios
de los métodos, y no es preciso profundizar en aspectos meramente técnicos que
pertenecen exclusivamente al mundo de las Matemáticas. De alguna manera, el rigor
conceptual para transmitir la filosofía básica de trabajo dentro del método científico,
sustituye al rigor matemático en la presentación de resultados ya que los alumnos han
de resolver problemas de investigación en su propia rama y no en Matemáticas..
En Facultades de Matemáticas y Estadística el enfoque estará más dirigido al aspecto
técnico-matemático, especialmente en las primeras. En las nuevas facultades de
220
Estadística tendrán que aprender que el objeto es la aplicación y que los resultados
matemáticos necesarios para el desarrollo deductivo de los "Métodos Estadísticos" son
sólo una herramienta y no el objeto en si mismos.
La mayor parte de nuestros alumnos cursará estudios en Facultades Aplicadas por lo
que trataremos de centrar nuestra atención en el "Método Estadístico" y no en su
deducción técnica, si bien puede realizarse algún ejercicio para aplicar, en este contexto,
los conceptos aprendidos en el resto de la asignatura de Matemáticas. Es posible,
también utilizar ejercicios en conexión con los profesores de otras asignaturas como
Biología, Geografía Económica, etc.
INFERENCIA Y MUESTRAS
La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de
sacar conclusiones de una población en estudio, a partir de la información que
proporciona una muestra representativa de la misma. También es denominada
Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar
nuevo conocimiento científico.
La muestra se obtiene por observación o experimentación. La necesidad de obtener un
subconjunto reducido de la población es obvia si tenemos en cuenta los costes
económicos de la experimentación o el hecho de que muchos de los métodos de medida
son destructivos.
Toda inferencia inductiva exacta es imposible ya que disponemos de información
parcial, sin embargo es posible realizar inferencias inseguras y medir el grado de
inseguridad si el experimento se ha realizado de acuerdo con determinados principios.
Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para hacer
inferencias inductivas y medir el grado de incertidumbre de tales inferencias. La medida
de la incertidumbre se realiza en términos de probabilidad.
221
Figura 4.2: Esquema de Inferencia Estadística.
El primer concepto importante es el de población, que es el conjunto de individuos
sobre los que se desea información. La población ha de estar perfectamente definida a la
hora de comenzar el estudio. (paso 2-a de la descripción del método científico en el
Cuadro 1). Por ejemplo, en un ensayo clínico en el que se pretende demostrar la
efectividad de un tratamiento han de estar muy claros cuales son los criterios de
inclusión de un paciente en la población (muestra) a estudiar.
De la población se extrae un subconjunto que se denomina muestra. La muestra ha de
ser representativa de la población, en el sentido de que debe tener una composición
similar en cuanto a la proporción de distintas características. Por ejemplo, una muestra
para un estudio de estaturas no incluirá solamente individuos bajos o altos, sino
individuos de ambas clases en proporciones similares a las de la población. La
representatividad de la muestra queda garantizada con la elección correcta del método
de muestreo, que se estudiarán en el punto siguiente.
Sobre cada uno de los individuos medimos una o varias características que
denominamos variables. Así a cada población le corresponde una variable aleatoria
que denotaremos con X. En la teoría de la Estadística quedan identificadas Población y
variable aleatoria asociada. Así en toda la teoría de la Inferencia población significará el
conjunto de individuos a estudiar, pero también la variable aleatoria asociada a la
característica que medimos sobre los individuos.
En general, trataremos con poblaciones infinitas, entendiendo que en la práctica
222
"población infinita" significa lo mismo que "población muy grande" ya que
conceptualmente la mayor parte de las poblaciones no pueden ser consideradas infinitas.
En general, supondremos un modelo de distribución de probabilidad para la variable
aleatoria en estudio que resuma las características de la misma (apartado 2c del método
científico en el Cuadro 1), aunque desconocemos los parámetros que trataremos de
estimar a partir de una muestra. Por ejemplo suponemos que X es N(µ, σ) donde los dos
parámetros, o uno de ellos, son desconocidos. En algunos casos no es necesario
especificar tales distribuciones y las inferencias se hacen sobre características de la
distribución que no son necesariamente parámetros.
La inferencia Estadística puede dividirse en dos apartados de acuerdo con el
conocimiento sobre la distribución en la población.
Inferencia Paramétrica:
Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc .... ) pero se
desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos
de la distribución conocida.
Inferencia No Parámetrica:
Forma y parámetros desconocidos. Se realizan inferencias sobre características que no
tienen porque ser parámetros de una distribución conocida (Mediana, Estadísticos de
Orden).
De acuerdo con la forma en que se estudian los parámetros o características
desconocidas, la inferencia puede dividirse en dos apartados:
Estimación:
Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas
sobre posibles valores de los mismos.
Estimación puntual: Un único valor para cada parámetro.
Estimación por intervalos: Intervalo de valores probables para el parámetro.
Contraste de Hipótesis:
Se realizan hipótesis sobre los parámetros desconocidos y se desarrolla un
procedimiento para comprobar la verosimilitud de la hipótesis planteada.
Veamos los conceptos con un ejemplo concreto tomado de un estudio de investigación
real. El estudio pertenece a otro más amplio llevado a cabo en colaboración por los
223
Departamentos de Química Analítica, Nutrición y Bromatología , y Estadística y
Matemática Aplicada.
El objetivo original del trabajo consiste en estudiar los vinos jóvenes embotellados de dos
denominaciones de origen, Ribera de Duero y Toro, mediante técnicas de laboratorio
objetivas, con el fin de buscar las características que los diferencian y evitar los posibles
fraudes producidos por el intercambio debido a la proximidad geográfica de ambas
denominaciones. Por el momento nos centraremos en una sola variable, el grado
alcohólico, y en una sola de las poblaciones, la de Ribera de Duero. Fijaremos además un
momento del tiempo, la cosecha del año 1986.
El primer paso de cualquier investigación, la definición clara de la población en estudio,
se obtiene de los propios objetivos del mismo. Estudiaremos vinos jóvenes embotellados
de la denominación de origen "Ribera de Duero" en la cosecha de 1986. La variable a
medir es el grado alcohólico.
Seguramente todos hemos observado que en las botellas de vino aparece el grado
alcohólico de las mismas, que suele ser entre 12 y 12,5 grados. Es obvio que este valor
no es el contenido exacto de cada una de las botellas, sino que se trata de un contenido
medio. Supongamos que desconocemos ese contenido medio para la población y
deseamos averiguarlo, para lo cual hemos de seleccionar una muestra de la población. La
necesidad de seleccionar una muestra es clara ya que el análisis del contenido alcohólico
implica la destrucción del individuo, la botella de vino.
Aunque la población no puede ser infinita supondremos que lo es ya que el número de
botellas es muy grande y supondremos que la variable aleatoria sigue una distribución
normal. La hipótesis sobre la distribución de probabilidad ha de hacerse a priori,
teniendo en cuenta las características conocidas de la población en estudio (hay que
tener en cuenta que se trata solamente de un modelo para ajustar la realidad.) El
ejemplo parece lógico utilizar una distribución normal ya que es posible suponer que los
posibles valores del grado alcohólico se concentran de forma simétrica en torno a un
valor medio, y que la probabilidad de encontrar valores decrece a medida que aumenta la
distancia a dicho valor medio. (Figura 4).
224
Figura 4.3: Distribución poblacional del grado alcohólico de
los vinos de Ribera de Duero.
Si tuviéramos, por ejemplo, la distribución de los salarios de los empleados de una
Empresa dedicada a la fabricación de automóviles, en principio no podemos suponer la
distribución normal ya la distribución es probablemente asimétrica con una cola hacia
los salarios altos determinada por los salarios de los ejecutivos.
Figura 4.4: Distribución poblacional de los salarios de una empresa.
En la mayor parte de las investigaciones reales suponemos que las variables o
transformaciones de las mismas (logaritmos,
aproximadamente normales.
etc, ...) tienen
distribuciones
225
El paso siguiente consiste en determinar posibles valores para los parámetros
desconocidos, para lo cual hemos de obtener una muestra representativa de la población.
La obtención de una muestra representativa se trata en el punto siguiente.
4.1.2 Estadisticos y distribuciones
muestrales
Todo lo que veremos a continuación está pensado para poblaciones infinitas (muy
grandes) y con muestreo aleatorio simple. El muestreo aleatorio simple garantiza una
muestra representativa de la población y la obtención de observaciones independientes.
Dada una población X, el proceso de muestreo consiste en obtener, al azar, un valor de
la variable X, x1; El valor obtenido puede ser cualquiera de los de la población, luego
los posibles valores para x1 son todos los de X, y por tanto x1 puede considerarse como
una realización particular (observación) de una variable aleatoria X1 con la misma
distribución que X.
A continuación obtenemos, independientemente de la primera observación, un valor x2
que puede considerarse como una realización particular de una variable aleatoria X2 con
la misma distribución que X e independiente de X1. Obsérvese que la población no se
modifica al extraer uno de sus individuos ya que es infinita. (Si la población es finita
podría utilizarse un muestreo con reemplazamiento).
El proceso continúa hasta obtener una muestra de tamaño n, n observaciones x1, x2, ... ,
xn de n variables aleatorias X1, X2, ... , Xn independientes e idénticamente distribuidas.
Definición: Sea X una variable aleatoria con f.d.p F, y sean X1, X2, ... , Xn , n variables
aleatorias independientes con la misma f.d.p F que X. Se dice que X1, X2, ... , Xn , son
una muestra aleatoria de tamaño n de F o bien n observaciones independientes de X.
Hemos utilizado letras minúsculas, como en descriptiva, para denotar las observaciones
226
particulares de una muestra, y letras mayúsculas para denotar las variables aleatorias de
las que se han tomado. A lo largo de la exposición teórica ambas serán intercambiables
y serán utilizadas indistintamente para representar a las correspondientes variables
aleatorias.
Otra forma de ver la muestra es como una variable aleatoria multivariante con función
de densidad de probabilidad es el producto de las funciones de densidad de cada una de
las componentes (ya que son independientes)
f(X1, X2, ... , Xn) = f(X1) f(X2) ... f(Xn)
donde las funciones de densidad son iguales a la de X. Esta forma de entender la
muestra supera el ámbito de un curso introductorio.
Una vez obtenida la muestra la describimos en términos de algunas de sus
características fundamentales como la media, la desviación típica, etc ... A tales
características las solemos denominar estadísticos.
Definición: Un estadístico es una función de los valores muestrales que no depende de
ningún parámetro poblacional desconocido.
Un estadístico es también una variable aleatoria ya que es una función de variables
aleatorias. Por ejemplo la media muestral
n
X=
!X
i
i=1
n
es una variable aleatoria de la que tenemos una sola observación
n
x=
!x
i
i=1
n
Cuando el contexto esté claro, identificaremos la variable con sus observaciones, es
decir utilizaremos también letras minúsculas para la representación de la variable.
A continuación ilustraremos, con un ejemplo sencillo, el concepto de distribución
227
muestral de un estadístico.
Supongamos que disponemos de una población finita en la que disponemos de 4
individuos que toman los valores {1, 2, 3, 4}.
Supongamos que obtenemos una muestra sin reemplazamiento de tamaño 2. Las
distintas posibilidades son
{1, 2} {1, 3} {1, 4} {2, 3} {2, 4}
Obtendremos,
dependiendo
de
la
muestra
elegida,
{3, 4}
las
siguientes
medias
respectivamente:
1.5
2
2.5
2.5
3
3.5
Es claro que la media muestral no es un valor fijo sino que puede considerarse también
como una variable aleatoria de la que tenemos una sola observación, la media de la
muestra concreta seleccionada.
Dicha variable tendrá una distribución de probabilidad asociada. (En este caso una
distribución discreta que toma los valores 1.5, 2, 2.5, 3 y 3.5 con probabilidades 1/6,
1/6, 2/6, 1/6, 1/6, respectivamente.
Definición: A la distribución de un estadístico calculado a partir de los valores tomados
de una muestra se la denomina distribución muestral del estadístico.
En la mayor parte de los casos supondremos que nuestra población tiene distribución
normal y que los estadísticos que vamos a utilizar son la media y la desviación típica (o
la cuasi desviación típica).
228
4.1.3 Distribuciones muestrales de la
media y la desviación típica.
Sea X1, X2, ... , Xn , una muestra aleatoria de una población X en la que
E(X) = µ Var(X)= σ2
Entonces el valor esperado (media) y la varianza del estadístico "media muestral" son
E(X) = µ
Var(X) =
Desv(X) =
!2
n
!
n
La comprobación del resultado es obvia si tenemos en cuenta que la esperanza de la
suma de varias variables aleatorias independientes es la suma de las esperanzas, y que la
varianza es la suma de las varianzas, y además que si multiplicamos una variable por
una constante, la varianza queda multiplicada por la constante al cuadrado. Entonces
"1 n
% 1 n
1
E(X) = E $ ! X i ' = ! E(X i ) = n µ = µ
n
# n i=1 & n i=1
n
" n Xi %
1
(2 (2
Var(X) = Var $ ! ' = ! 2 Var X i = n 2 =
n
n
# i=1 n & i=1 n
( )
Si además, la población es normal, es decir, X ! N( µ , " ) entonces la media muestral
es también normal X ! N( µ , " ) .
Basta tener en cuenta las propiedades de la normal que ya se vieron en su momento.
El resultado es importante en estimación ya que, aunque la media poblacional y la
media muestral no coincidan, los posibles valores de la media muestral se concentran de
forma simétrica alrededor de la media poblacional, además, la dispersión es menor a
medida que aumenta el tamaño muestral.
229
Figura 4.5: Distribución muestral de las medias.
La distribución muestral asociada a varianzas y cuasivarianzas es un poco más compleja
y su obtención supera los objetivos del curso, de forma que nos limitaremos a
exponerlas.
Sea X1, X2, ... , Xn , una muestra aleatoria simple de una población X ≡ N(µ, σ2),
entonces la variable aleatoria
n
" (X
i
! X)2
i=1
#2
sigue una ji-cuadrado con n-1 grados de libertad.
Del resultado anterior se deduce que las variables
n S2
!2
y
(n " 1) Ŝ2
!2
donde siguen ambas una ji-cuadrado con n-1 grados de libertad.
230
4.1.4 El teorema central del limite.
Lo que hemos visto hasta el momento parece bastante restrictivo ya que hemos
supuesto, de entrada, que la distribución en la población es normal, pero existen muchos
casos en los que no es posible suponer distribución Normal. El siguiente resultado
permite trabajar con la normal para la distribución muestral de medias aunque la
población no lo sea, y es conocido como Teorema Central del Límite.
Sea X1, X2, ... , Xn , una muestra aleatoria de una población X con una distribución de
probabilidad no especificada para la que la media es E(X) = µ y la varianza Var(X)=
σ2 finita. La media muestral tiene una distribución con media µ y varianza σ2 /n que
tiende a una distribución normal cuando n tiende a infinito.
La demostración del resultado excede los límites de un curso introductorio.
La aproximación a la distribución normal es mejor para n grande ya que se trata de una
aproximación y no de una distribución exacta como en el caso de poblaciones normales.
En Estadística consideramos n grande cuando es mayor de 30.
Una consecuencia directa del teorema es que la suma de los valores muestrales sigue
una distribución normal de media nµ y varianza nσ2.
El teorema de De Moivre que se explicó en el apartado de la normal puede entenderse
también como un caso particular del Teorema Central del Límite.
Sea una población en la que se mide una v.a. X con distribución binomial B(1,p), es
decir, toma el valor 1 con probabilidad p y el valor 0 con probabilidad q, tiene una
media p y una varianza pq. Una distribución B(n,p) puede entenderse como la suma de
n binomiales B(1,p), luego aplicando el TCL, si n es grande la distribución B(n,p) se
puede aproximar por una normal que tiene como media a np y como varianza npq.
231
4.1.5 Estimación puntual
4.1.5.1 Ideas generales
Llamaremos Estimación puntual de un determinado parámetro de una población,
al proceso que nos permite, a partir de la información suministrada por una muestra
aleatoria de la misma, determinar un solo valor numérico que se sea un buen indicador
de dicho parámetro poblacional.
El estadístico muestral tomado para estimar el parámetro poblacional recibe el
nombre de estimador puntual. Por ejemplo, para estimar la media aritmética de una
población se utiliza como estimador puntual la media aritmética muestral.
Dado que el valor del estimador depende de la muestra tomada, pues puede tomar
valores diferentes sobre muestras diferentes, es claro que se trata de una variable
estadística aleatoria y como tal, seguirá una determinada distribución en el muestreo,
hecho que se utiliza para determinar la bondad de dicho estimador; es decir, para
conocer en qué medida sirve para estimar el parámetro poblacional considerado.
Todo buen estimador ha de tener dos cualidades básicas, a saber:
1 Ser insesgado, es decir, la esperanza matemática del estimador ha de
coincidir con el parámetro a estimar.
2 Ser estable en el muestreo, es decir, tener varianza mínima.
Cuando un estimador cumple estas dos condiciones se dice que es eficiente.
Por ejemplo, la media muestral x basada en muestras aleatorias de tamaño n, de
una distribución Normal, de media µ y varianza σ2, es un estimador eficiente de µ; por
su parte, la cuasi-varianza muestral s2, lo es de σ2.
4.5.1.2 Estimadores y propiedades deseables de los
estimadores.
Supongamos ahora que disponemos de una población en la que se mide una variable X
con distribución de forma conocida y parámetros desconocidos, por ejemplo una normal
232
con media y varianzas desconocidas como en el caso práctico que planteábamos
anteriormente.
De la población se extrae una muestra aleatoria simple de tamaño n, X1, X2, ... , Xn. Se
trata de calcular, a partir de los valores muestrales, una función de los mismos que
proporcione un valor !ˆ = u(X2, ... , Xn) que sustituya al parámetro desconocido de la
población θ, de forma que ambos sean lo más parecidos en algún sentido. A tal valor
obtenido de la muestra se le denomina estimador.
Un estimador es también una variable aleatoria. Se trata básicamente de buscar
estimadores centrados alrededor del verdadero valor del parámetro y con la menor
varianza posible.
Por ejemplo, por simple analogía, si la distribución en la población es normal, la media
muestral puede considerase como un estimador de la media poblacional.
La distancia entre el estimador y el parámetro a estimar puede medirse mediante los que
se denomina el error cuadrático medio, que se define como el valor esperado de la
diferencia entre el estimador y el verdadero parámetro.
ECM(!ˆ ) = E(!ˆ " ! )
El ECM es importante ya que puede escribirse como
ECM(!ˆ ) = Var(!ˆ ) + [! " E(!ˆ )]2
una es la varianza del estimador y otra el cuadrado del sesgo (concepto que veremos
posteriormente).
Consideraremos criterios adicionales para seleccionar estimadores. Las propiedades
deseables que ha de tener un estimador para considerarse adecuado son las siguientes:
-Ausencia de sesgoSe dice que un estimador es insesgado (o centrado) si la esperanza del estimador
coincide con el parámetro a estimar. E(!ˆ ) = ! . En caso contrario se dice que es sesgado
y a la cantidad b(! ) = [! " E(!ˆ )] se la denomina sesgo.
La propiedad es importante ya que los posibles valores del estimador fluctúan alrededor
del verdadero parámetro. Por ejemplo, si utilizamos la media muestral como estimador
233
de la media poblacional en una distribución normal, se trata de un estimador insesgado
ya que la esperanza de su distribución muestral es la media poblacional µ. El hecho de
que además, tenga distribución normal, es importante en la práctica, ya que aunque la
media muestral y la poblacional no coinciden exactamente, los valores de aquella
fluctúan de forma simétrica alrededor de esta, son valores próximos con probabilidad
alta y la dispersión disminuye cuando aumenta el tamaño muestral.
-ConsistenciaSe dice que un estimador !ˆ es consistente si se aproxima cada vez más al verdadero
valor del parámetro a medida que se aumenta el tamaño muestral. Más formalmente, un
estimador es consistente si Pr $ !ˆ " ! > # & ( 0 cuando n ! " , para ! > 0 . o dicho de
%
'
otra forma la distribución del estimador se concentra más alrededor del verdadero
parámetro cuando el tamaño muestral aumenta.
La media muestral es un estimador consistente de la media poblacional en una
!2
distribución normal, ya que, la varianza de la misma
tiende a cero para n ! " , de
n
forma que la distribución se concentra alrededor del verdadero valor µ cuando n crece.
-EficienciaEs claro que un estimador será tanto mejor cuanto menor sea su varianza, ya que se
concentra más alrededor del verdadero valor del parámetro. Se dice que un estimador
insesgado es eficiente si tiene varianza mínima.
Una cota inferior para la varianza viene dada por la denominada cota de Cramer-Rao.
Sea X1, X2, ... , Xn. una muestra aleatoria simple de una distribución con densidad
f(x; θ). Sujeto a ciertas condiciones de regularidad en la función de densidad, cualquier
estimador insesgado verifica que
Var(!ˆ ) "
1
*$ # ln f (X;! ) ' 2 nE ,&
)( /
#!
,+%
/.
)# " ln f (X;! ) & 2 ,
A la cantidad I n (! ) = nE +%
(' .. se la denomina cantidad de información de
"!
+*$
-
Fisher asociada a una muestra aleatoria simple de tamaño n.
234
4.1.5.3 Métodos de estimación
Método de los Momentos
-Consiste en igualar los momentos muestrales y los poblacionales. Prácticamente no se
usa en la investigación actual.
Método de los Mínimos Cuadrados
-Consiste en minimizar la suma de cuadrados de los errores (diferencias entre valores
observados y esperados tras suponer que las observaciones se obtienen como la suma de
una parte sistemática o controlada y una parte aleatoria no controlada o fuente de error).
El método es ampliamente utilizado cuando se trabaja con modelos de regresión y
técnicas relacionadas.
Ejemplo: Estimación de la media de una población normal.
Cada observación experimental xi puede suponerse como la suma de una constante (la
media µ) y un error experimental aleatorio (εi)
xi = µ + ε i
con εi = xi - µ con distribución N(0, σ).
El método de los mínimos cuadrados consiste en minimizar la suma de cuadrados de los
errores (Diferencias entre valores observados y esperados)
n
n
i=1
i=1
D = " ! i2 = " (x i # µ )2
Derivando con respecto a µ e igualando la derivada a cero
235
!D n
= # 2(x i " µ )("1) = 0
!µ i=1
n
# (x
i
" µ) = 0
i=1
n
µ̂ =
#x
i
i=1
n
=x
obtenemos la media muestral como estimador de la poblacional.
Método de la Máxima Verosimilitud
- Consiste en sustituir los parámetros por aquellos valores que maximizan el logaritmo
de la función de verosimilitud de la muestra (función de densidad conjunta de todos los
valores muestrales en el supuesto de que son independientes).
Ejemplo: Media y varianza de una población normal
Los valores muestrales
X1, ... , Xn
se supone que son variables aleatorias
independientes y todas con distribución N(µ, σ). La función de densidad conjunta será
el producto de las funciones de densidad de cada una de ellas.
n
1
i=1
! 2"
L(x1 , … , x n / µ , ! ) = $
%
='
&
1
! 2"
(
*)
e
#
n
1 ( xi # µ )
2 !2
n
e
=
1 ( xi # µ )
+#2
i=1
2
!
2
2
Tomando logaritmos
2
1 (x i ! µ )
ln L = !n ln(" 2# ) + $ !
i=1 2
"2
n
Derivando con respecto a µ y σ y resolviendo el sistema se obtienen como estimadores
para la media y la varianza
236
n
µ̂ = x =
! xi
i=1
n
n
"ˆ 2 = S2 =
! (x
i
# x)2
i=1
n
Propiedades de los estimadores Máximo-verosímiles
Los estimadores máximo-verosímiles juegan un papel importante en Estadística debido
a que se obtienen mediante un método simple y tienen buenas propiedades con respecto
a sesgo eficiencia y consistencia.
Bajo ciertas condiciones de regularidad se verifica:
-Si existe un estimador insesgado y de varianza mínima, cuya varianza alcance la cota
de Cramer-Rao, este estimador es máximo verosímil y es la única solución de la
ecuación de verosimilitud.
-Si el estimador es sesgado, su sesgo tiende a cero al aumentar el tamaño de la muestra,
además es asintóticamente eficiente (Eficiente para n grande).
- Existe una solución de la ecuación de verosimilitud que proporciona un estimador
consistente y asintóticamente normal. N(! ,
1
1
) . Donde
I n (! )
I n (! )
es la varianza
mínima o cota de Cramer-Rao.
4.1.2.2 Principales estimadores puntuales
En la Unidad Didáctica nº 3 se han estudiado, entre otras, las distribuciones
Binomial, de Poisson y Normal. Tal y como se vio entonces, cada una de ellas viene
determinada por unos parámetros, así, la Binomial B(n,p) está determinada por n
(número de pruebas realizadas de un experimento aleatorio con solo dos resultados
posibles A y A ), y p (probabilidad de que ocurra el suceso A al llevar a cabo una
prueba del experimento); por su parte, la distribución de Poisson P(λ), es la forma límite
de la Binomial cuando n ! " y p ! 0 , de parámetro λ = np, distribuciones -ambas- de
237
variable aleatoria discreta, y la distribución Normal N(µ,σ), de variable aleatoria
continua.
Así pues, y dado que las distribuciones anteriores vienen determinadas por sus
parámetros, podremos hacer inferencias sobre la población haciendo inferencias acerca
de éstos; veamos a continuación cuáles son los estimadores ˆp, !ˆ , µˆ y "ˆ para los
parámetros p, λ, µ y σ, respectivamente.
ESTIMADOR DEL PARÁMETRO p DE UNA DISTRIBUCIÓN
BINOMIAL B(n,p)
Consideremos un experimento aleatorio cuyos resultados son dos sucesos A, A ,
mutuamente excluyentes, de probabilidades p y q=1-p, respectivamente.
Sabemos que la variable aleatoria ligada a un experimento con las características
anteriores sigue una distribución Binomial B(n,p); pues bien, como estimador puntual
de p, que llamaremos ˆp , tomaremos la frecuencia relativa del suceso A, al realizar n
pruebas, es decir: p = (nº de veces que ocurre A)/(nº de pruebas).
Este estimador es eficiente, pues la distribución de ˆp tiene de media p, y su
pq
varianza, que vale n es mínima; además, para un tamaño de muestra n
!
suficientemente grande, ˆp se distribuye según una distribución Normal N p, pq n # .
"
$
238
ESTIMADOR DEL PARÁMETRO λ DE UNA DISTRIBUCIÓN DE
POISSON P(λ)
Consideremos una determinada población en la cual estudiamos una
característica que sigue una distribución de Poisson P(λ), y sea x1, ... , xn una muestra
genérica aleatoria de dicha población; en estas condiciones se verifica que un buen
n x
estimador de λ es la media muestral !ˆ = " i .
i=1 n
El estimador !ˆ es insesgado ya que su distribución en el muestreo tiene de media
λ, y como su varianza es mínima, resulta ser un estimador eficiente; además, para n
"
! %'
suficientemente grande, !ˆ sigue una distribución Normal N$ !,
.
#
n&
ESTIMACIÓN DE LOS PARÁMETROS µ Y σ DE UNA
DISTRIBUCIÓN NORMAL N(µ,σ)
Consideremos una población en la que estudiamos una determinada característica
que se distribuye según una distribución Normal N(µ,σ), y sea x1, ... , xn una muestra
tomada al azar de dicha población.
n x
En estas condiciones se verifica que un estimador eficiente de µ es µˆ = ! i = x
i=1 n
(media
muestral);
n ( x " x )2
i
!ˆ 2 = #
i=1
n "1
además,
puesto
que
= s2 es un buen estimador de !
la
2
cuasi-varianza
muestral:
como estimador de σ tomaremos
!ˆ = s (cuasi-desviación típica muestral).
2
Tanto µˆ como !ˆ son estimadores eficientes, verificándose además, que µˆ sigue
(n ! 1)s2
" ! $
! 2 con n-1 grados
una distribución N µ,
y que
sigue
una
distribución
#
n%
"2
de libertad.
Para un estudio más detallado de estos apartados consultar, por ejemplo, MOOD
& GRAYBILL (1978).
239
4.1.6 Estimación por intervalos
4.1.6.1 Ideas generales
Cuando hacemos una estimación puntual del valor de un determinado parámetro
poblacional nos encontramos con un doble problema: por un lado el valor obtenido
solamente da una idea aproximada del verdadero valor del parámetro a estimar, por
otro, no sabemos el grado de bondad de la aproximación, es decir, ignoramos en qué
medida el valor obtenido se aproxima al verdadero valor del parámetro estimado.
Además, dado que en ciertas situaciones es prácticamente imposible conocer con
exactitud el valor de un determinado parámetro poblacional (¿cómo conocer con
exactitud, por ejemplo, la altura media de los españoles?), lo que se hace en realidad es
determinar su valor aproximadamente, indicando entre qué dos valores reales a y b se
encuentra comprendido, con un cierto grado de "seguridad" o "confianza".
Los valores a y b, extremos de un intervalo de la recta real, no son sino los valores
tomados por dos funciones L1 , L2 que dependen de la muestra x1, ... , xn elegida al
azar, es decir, L1 (x1,…, x n ) y L 2 (x1,…, x n ) toman uno u otro valor dependiendo de
cuáles sean los valores que las variables tomen sobre los n elementos de una muestra
aleatoria cualquiera de la población en estudio.
Así pues, el problema consiste en determinar cuáles son las funciones
L1 (x1,…, x n ) y L 2 (x1,…, x n ) , que nos permitan afirmar que el parámetro µ verifica,
con una cierta "seguridad" que a ≤ µ ≤ b , siendo a y b los valores tomados por las
funciones L1 (x1,…, x n ) y L 2 (x1,…, x n ) sobre la muestra x1, ... , xn.
En este sentido podemos afirmar que
Intervalo de confianza de un parámetro poblacional es un par ordenado de
funciones reales L1 (x1,…, x n ) , L 2 ( x1,…, xn ) que dependen de las n
medidas de una muestra aleatoria de la población en cuestión.
Cada muestra concreta dará lugar, a partir de L1 y L2, a un intervalo de confianza,
por lo que podemos entender que un estimador por intervalos es una variable aleatoria
bidimensional y, en consecuencia, tendrá sentido hablar de P( a ≤ µ ≤ b ) (probabilidad
240
de que el estimador "cubra" el verdadero valor del parámetro µ), probabilidad que
recibe el nombre de nivel de confianza y que denotaremos por 1-α.
Teniendo en cuenta lo anterior también podemos definir un intervalo de
confianza de un parámetro poblacional µ , al nivel de confianza 1-α, como
un intervalo para el que se verifica que la probabilidad de que sus extremos
tomen valores a, b tales que el parámetro poblacional µ esté comprendido
entre ellos es 1-α, es decir:
P( a ≤ µ ≤ b ) = 1-α
α se llama nivel de error del intervalo o nivel crítico.
Nótese que lo que afirmamos es que si se repitiera muchas veces el experimento
con muestras extraídas al azar, se verificaría que en el 100(1-α)% de las ocasiones
obtendríamos extremos a y b de los intervalos de confianza correspondientes que
contendrían al verdadero valor del parámetro µ, mientras que el 100α% restante, no lo
contendrían, tal y como indica la figura 4.1 siguiente
Figura 4.6: Figura que muestra el concepto de nivel de confianza
241
En consecuencia, y dado que para una muestra en particular obtendríamos valores
concretos a y b para los que se verifica o no que a ≤ µ ≤ b es una clara incorrección
afirmar que "el parámetro µ pertenece al intervalo de confianza de extremos a, b con
probabilidad 1-α ", toda vez que la probabilidad de que tal cosa suceda es 1 si se
verifica que a ≤ µ ≤ b, ó 0 en caso contrario. ¡Nótese que el valor µ es fijo, mientras que
a y b, por el contrario, son variables aleatorias!.
Es claro que, para una muestra concreta, es imposible saber si el intervalo de
confianza correspondiente contiene, o, no al parámetro µ.
Veamos ahora cómo obtener intervalos de confianza para los parámetros más
importantes.
4.1.7 Obtención de los intervalos de
confianza más utilizados
4.1.7.1 Intervalo de confianza para la media µ de una
distribución Normal de varianza conocida
Sea X una variable aleatoria que sigue una distribución Normal N(µ,σ) de la que
conocemos la varianza pero desconocemos la media µ.
Por lo visto anteriormente, podemos estimar µ a partir de la media muestral x ,
que como sabemos es una variable aleatoria (depende de cada muestra) que, para n
" ! $
suficientemente grande, sigue una distribución Normal N µ,
independientemente
#
n%
de cómo se distribuya la población de partida. Sabemos también que la variable
x !µ
aleatoria tipificada Z =
sigue una distribución N(0,1).
" n
A partir de lo anterior, para encontrar los límites entre los que, con probabilidad
1- α , se encuentra µ procederemos de la siguiente manera:
Supongamos que Zp es el 100p percentil de la distribución Normal N(0,1); en
particular, Z ! 2 representará el 1002 ! percentil, verificándose que
242
%
x!µ
(
P' !Z " 2 #
# Z " 2 = 1! "
&
)
$ n
Figura 4.7: Selección de los puntos críticos para el cálculo del intervalo de confianza.
o lo que es igual:
%
#
# '
P !x ! Z " 2
$ !µ $ !x + Z" 2
= 1! "
&
n
n(
es decir:
%
#
# '
P x ! Z" 2
$ µ $ x + Z" 2
=1!"
&
n
n(
Así pues, el intervalo aleatorio de confianza para la media poblacional µ es:
#
# &
$
I1!"
; x + Z" 2
µ = x ! Z" 2
%
n
n'
que es un entorno de centro x y radio Z ! 2
"
.
n
Es conveniente aclarar que, dado que la media muestral x es una variable
aleatoria, para una muestra concreta y un valor α fijado, obtendríamos un intervalo de
#
# &
$
;x0 + Z " 2
confianza concreto x0 ! Z " 2
que contendrá, o no, a µ, sin que
%
n
n'
tengamos medio de saberlo a ciencia cierta; lo que afirmamos es que con un nivel de
confianza 1-α, dicho intervalo contendrá a µ, es decir, de cada 100 intervalos
correspondientes a 100 muestras tomadas, 100-α contendrán a µ, mientras que los α
restantes no lo contendrán.
243
La importancia del intervalo de confianza para la estimación está en el hecho de que el
intervalo contiene información sobre el estimador puntual (valor central del intervalo) y
sobre el posible error en la estimación a través de la dispersión y de la distribución
muestral del estimador. Una estimación será tanto más precisa cuanto menor sea la
amplitud del intervalo de confianza, es decir, cuanto menor sea el error de estimación.
Obsérvese que el error en la estimación está directamente relacionado con la
distribución muestral del estimador y con la varianza poblacional, e inversamente
relacionado con el tamaño muestral.
El gráfico siguiente ilustra la interpretación del nivel de confianza para el intervalo de
confianza para la media de una distribución normal con varianza conocida. Para los
distintos posibles valores de la media, representados mediante su distribución muestral,
obtenemos distintos intervalos de confianza. La mayor parte incluye al verdadero valor
del parámetro, pero el resto no. Concretamente el 95% lo incluye y el 5% no, si el nivel
de confianza es del 95%.
En la práctica disponemos de una única repetición del experimento, y por tanto de un
único intervalo de confianza, el señalado en negro en el gráfico, por ejemplo.
Confiamos en que nuestro intervalo sea de la mayoría que con tiene al verdadero valor
objetivo aunque no tenemos la seguridad de que sea así, tenemos concretamente un
riesgo del 5% de equivocarnos.
95%
2.5%
2.5%
x
Figura 4.8: Interpretación del nivel de confianza en el intervalo para la media de una
distribución normal.
El procedimiento anterior para determinar el intervalo de confianza para la media
poblacional, supuesta conocida la varianza, es válido aún en el caso de que la población
244
de partida no sea Normal, con solo tomar un tamaño de la muestra suficientemente
grande n≥30.
Es claro que cuanto mayor sea el nivel de confianza, mayor será la amplitud del
intervalo resultante (nótese que el intervalo (!", +") seguro que contiene a µ, es
decir, contiene a µ, con probabilidad 1), así como que en las condiciones presentes, los
intervalos resultantes para cada muestra concreta difieren en su centro x0 , pero tienen
"
igual amplitud Z ! 2
.
n
Así mismo, cuanto menor sea σ menor será la amplitud y cuanto mayor sea n,
tamaño de la muestra, menor será la amplitud del intervalo (para n = tamaño de la
población, el intervalo resultante sería un solo punto µ, es decir, no tendríamos que
hacer estimación alguna ).
De acuerdo con lo anterior, para reducir la longitud del intervalo podemos
optar por:
1.- Reducir el nivel de confianza.
2.- Reducir la varianza restringiendo la población, eliminando
casos extremos.
3.- Aumentar el tamaño de la muestra.
4.1.7.2 Intervalo de confianza para la media µ de una
población Normal de varianza desconocida.
En el caso anterior hemos supuesto conocida la varianza población, cosa que no
suele ser frecuente, toda vez que en su cálculo interviene µ, y ésta es desconocida (¡por
eso se desea estimar!).
2
En el caso de desconocer ! , lo lógico será sustituirla en el razonamiento anterior
2
por su estimador ˆs (cuasi-varianza muestral), de tal modo que el estadígrafo que
x !µ
usaremos para determinar el intervalo de confianza será
, estadígrafo que,
ˆs n ! 1
como variable aleatoria que es, para muestras pequeñas sigue una distribución t de
Student con n-1 grados de libertad (siendo n = tamaño de la muestra ).
245
La distribución muestral asociada a la cuasi-varianza es la siguiente:
(n ! 1) Sˆ 2
# $ 2n!1
2
"
Teniendo en cuenta la distribución normal asociada a las medias y combinándola con la
ji-cuadrado, obtenemos una distribución t de Student:
X "µ
t=
N (0,1)
! 2n"1
n "1
=
#
n
(n"1) Sˆ 2
#2
=
X "µ
$ t n"1
Sˆ
n
n "1
Se verificará, siguiendo los pasos del razonamiento anterior, que
$
x!µ
'
P& !t " #
# t = 1! "
%
ˆs n ! 1 " (
de donde se deduce:
#
I1!"
µ = x ! t"
$
ˆs
sˆ %
;x + t "
n !1
n !1 &
Obsérvese la similitud con el intervalo calculado para la distribución normal,
salvo en el valor crítico y en que la varianza ha sido estimada a partir de la muestra.
Figura 4.9: Diferencia entre la distribución normal y la t de Student.
Desde el punto de vista práctico esto implica que los valores críticos son un poco más
grandes y, por tanto el intervalo tiene mayor longitud, este es el precio que debemos
pagar a cambio de no conocer la varianza de la población.
Si la muestra es grande n>30 sabemos que la distribución de Student se aproxima a una
Normal; en consecuencia, en el caso de muestras grandes, aunque la varianza sea
246
desconocida, podemos considerar que el estadígrafo sigue una distribución Normal para
calcular el intervalo de confianza.
4.1.7.3 Intervalo de confianza para la varianza y la
desviación típica de una población Normal
2
Dado que la cuasi-varianza muestral ˆs es un estimador eficiente de la varianza
poblacional σ2, parece lógico estima ésta a partir de aquélla.
(n ! 1)ˆs2
2
Sabemos que el estadígrafo
sigue una distribución ! con n-1 grados de
2
"
libertad, así pues, se verificará que:
$
'
(n " 1)ˆs2
2
P& !2$ #
*
*
!
2
$& # ,n "1') ) = 1" #
& 1" ,n"1')
+
% % 2
(
%2
((
y dividiendo entre (n-1)s2 obtenemos que
$ !2
'
! 2$ #
$& 1" # ,n"1')
')
&
,n"1
& % 2
1
(
%2
()
P&
*
*
=1"#
2
+ 2 (n " 1)ˆs2 ))
& (n " 1)sˆ
%
(
así pues, tomando los respectivos inversos, se verificará que
$
'
2
2
& (n ! 1)sˆ
(n ! 1)ˆs )
P& 2
* +2 * 2
=1!#
)
"
"
& $& # ,n!1')
$&1! # ,n!1') )
% %2
(
% 2
((
es decir, la expresión del intervalo de confianza para la varianza poblacional será:
247
%
(
2
2
' (n " 1)ˆs
(n " 1)sˆ *
I1"#
2 =
,
2
!
'$
*
$ 2% #
' %' #
*
(*
' 1" ,n"1(*
,n"1
& &2
)
& 2
))
En consecuencia, para la desviación típica poblacional, tendremos el siguiente
intervalo de confianza:
%
' (n " 1)ˆs2
(n " 1)ˆs2
I1"#
=
,
!
' $2
2
' %' # ,n"1(* $ %'1" # ,n"1(*
& &2
)
& 2
)
(
*
*
*
)
4.1.7.4 Intervalo de confianza para el parámetro p de
una distribución Binomial B(n,p)
Dada una variable aleatoria X que sigue una distribución Binomial B(n,p),
trataremos en este apartado de determinar un intervalo de confianza para p.
Como sabemos, en el caso de tamaños de muestras grandes, la distribución
Binomial B(n,p) se aproxima a una Normal N( np, npq ) .
Como estimador puntual de p tomaremos ˆp = f n , siendo f el número de veces en
las que se obtiene el éxito en n pruebas, y como estimador de q tomaremos qˆ = 1 ! f n .
En estas condiciones, si la variable aleatoria X sigue una distribución Binomial
!
pq $&
B(n,p), la variable X/n seguirá, aproximadamente, una Normal N# p,
; así pues,
"
n %
X !p
x
tipificando la variable ˆp =
obtenemos que Z = n
sigue una Normal N(0,1) y
pq
n
n
según lo visto en puntos anteriores, será:
248
$
&
pˆ ! p
P !Z " 2 #
# Z"
&
pq
%
n
Dado que desconocemos p y q, estimaremos
'
)
2 = 1! "
)
(
pq
mediante
n
pˆ qˆ
, con lo que el
n
intervalo de confianza para p será de la forma:
#
pˆ qˆ
pˆ qˆ &
I1!"
= pˆ ! Z " 2
, ˆp + Z " 2
p
%$
n
n ('
4.1.7.5 Intervalo de confianza para el parámetro p de
una distribución Hipergeométrica H(N,n,p)
Dada una variable aleatoria X que sigue una distribución Hipergeométrica
H(N,n,p), sabemos que se puede obtener una aproximación mediante el modelo Normal:
"
N ! n %'
N !n
N$ np, npq
, donde
es el término de corrección para poblaciones finitas.
#
N !1 &
N !1
Siguiendo un razonamiento análogo al caso del intervalo para el parámetro p de la
Binomial, obtendremos el correspondiente intervalo para el parámetro p de una
población que se distribuye según un modelo Hipergeométrico:
#
"
I1!
= % p̂ ± Z"
p
%$
2
p̂q̂ N ! n &
(
n N ! 1 ('
249
4.1.8 Cálculo del tamaño muestral para
estimar la media de una población
con una determinada precisión
Supóngase que un investigador está interesado en estimar la media de una población
normal de forma que la diferencia existente entre la media muestral que obtendrá del
experimento y la media poblacional verdadera, esté por debajo de un error prefijado de
antemano.
x!µ "E
x!E"µ" x+E
Teniendo en cuenta el intervalo de confianza
P(x ! z" /2
#
#
$ µ $ x + z" /2
) =1!"
n
n
podemos escribir
E = z! /2
"
n
Despejando n de la igualdad
obtenemos la expresión deseada para el tamaño muestral.
Obsérvese que n ha sido calculado en el supuesto de que la variabilidad es conocida. Si
no es así, la variabilidad aproximada puede obtenerse de trabajos bibliográficos o
experimentos previos o a partir una muestra piloto con unas pocas observaciones.
Obsérvese que en el cálculo del tamaño muestral se han igualado el error fijado a priori
con el error en la estimación obtenido del intervalo de confianza y que este último
incluye el nivel de confianza. En este apartado un nivel de confianza del 95%, por
ejemplo, implicaría que en el 95% de las veces que repitiéramos el experimento con el
tamaño muestral calculado, obtendríamos un error por debajo del prefijado, mientras
que en el 5% restante obtendríamos un error superior.
250
Cuadro-resumen de los intervalos de confianza hallados
1.- Intervalo de confianza para la media de una distribución Normal de
varianza conocida.
#
# &
$
I1!"
; x + Z" 2
µ = x ! Z" 2
%
n
n'
2.- Intervalo de confianza para la media de una distribución Normal de
varianza desconocida.
#
I1!"
µ = x ! t"
$
ˆs
sˆ %
;x + t "
n !1
n !1 &
3.- Intervalo de confianza para la varianza y la desviación típica de una
distribución Normal.
%
(
2
2
' (n " 1)ˆs
(n " 1)sˆ *
I1"#
2 =
,
2
!
' $2
*
' %' # ,n"1(* $ %' 1" # ,n"1(* *
& &2
)
& 2
))
%
' (n " 1)ˆs2
(n " 1)ˆs2
1"#
I! = ' 2
, 2
' $ %' # ,n"1(* $ %'1" # ,n"1(*
& &2
)
& 2
)
(
*
*
*
)
4.- Intervalo de confianza para el parámetro p de una distribución Binomial
B(n,p)
#
pˆ qˆ
pˆ qˆ &
I1!"
= pˆ ! Z " 2
, ˆp + Z " 2
p
%$
n
n ('
5.- Intervalo de confianza para el parámetro p de una distribución H(N,n,p)
#
ˆpqˆ N ! n &
pˆ qˆ N ! n
I1!"
= pˆ ! Z " 2
; pˆ + Z " 2
p
%$
n N !1
n N ! 1 ('
251
"DISEÑO Y ANÁLISIS ESTADÍSTICO
DE ENCUESTAS"
4.2 Ampliación
252
4.2.1 Introducción
El objetivo de una encuesta por muestreo es hacer inferencia acerca de la
población, en base a la información contenida en una muestra.
En la mayoría de los casos la inferencia se llevará acabo en forma de estimación
de parámetros de la población (una media, un total, una proporción, etc.), con un límite
prefijado para el error de estimación.
La información obtenida de las encuestas por muestreo afecta a casi todos los
aspectos de la vida cotidiana, por ejemplo:
Sirven como base para el cálculo del IPC, a partir del cual las empresas
calculan las tasas de salarios y las tasas de jubilación, se actualizan las cláusulas de
contratos para rentas e hipotecas, etc.
Es la base del análisis de mercado, para decidir qué productos se deben
comercializar, donde hacerlo, cómo anunciarlos, etc.
Es la base de muchas de las noticias que divulgan los medios de comunicación
y por supuesto, la forma más común de obtener datos de interés sociológico ya que
hace posible que la investigación social se extienda a los aspectos subjetivos de los
miembros de la sociedad.
Cada observación contiene cierta cantidad de información en relación al
parámetro poblacional, pero la información cuesta dinero. Por esta razón, debemos
determinar cuidadosamente la "cantidad de información" que hemos de maneja: poca
información impide buenas estimaciones, y mucha supone un despilfarro de dinero.
Para llevar a cabo un estudio fiable es necesario realizar una encuesta a una
muestra representativa. Dos son, por tanto los puntos a tratar en adelante: el cuestionario
base de la encuesta y la selección de la muestra.
A su vez, para la selección de una muestra representativa tendremos que
especificar el tipo de muestreo que se va a llevar a cabo, y el tamaño de muestra
necesario para conseguir esa representatividad.
253
Desarrollaremos los tres apartados a continuación: métodos de recolección de
datos, tipos de muestreo y tamaño de muestra.
4.2.2 Métodos de recolección de datos
Los datos que intervienen en una investigación pueden ser obtenidos por
observación directa o a través de respuestas a un cuestionario preestablecido.
4.2.2.1 El cuestionario
El instrumento básico de la información por encuesta es el cuestionario. Este
consiste en una serie de preguntas preparadas cuidadosamente, sobre los hechos y
aspectos que interesan en la investigación las cuales deben ser contestadas por la
población, o más generalmente, por la muestra seleccionada para llevar a cabo el
estudio.
La finalidad del cuestionario es obtener de una forma sistemática y ordenada,
información sobre la población objeto de estudio.
Traduce los objetivos de la investigación en preguntas concretas y debe suscitar
en los encuestados respuestas sinceras y claras a cada pregunta.
Juega, pues, un papel central en la investigación por encuesta.
Hemos de distinguir entre dos tipos de cuestionarios: el cuestionario simple y la
entrevista.
El cuestionario simple es aquél en el que los encuestados, previa lectura del
mismo, contestan por escrito, sin intervención alguna de las personas que llevan a cabo
la investigación.
En las entrevistas, el cuestionario es aplicado por personas especializadas en
estas tareas, que son los que formulan las preguntas y los que anotan en él sus
respuestas.
Una situación intermedia, también muy frecuente, consiste en la contestación
254
individual, por escrito, de los encuestados los cuales han sido reunidos en un mismo
lugar, bajo la supervisión del investigador.
Este procedimiento es el que se utiliza para hacer la valoración de la actividad
docente del los profesores universitarios, por parte del alumnado al que imparten
docencia.
Una forma frecuente consiste en enviar las preguntas por correo. Este
procedimiento suele ser barato ya que no precisa entrevistadores, pero generalmente el
nivel de respuesta obtenido es muy bajo.
La no respuesta puede sesgar la información, por lo que generalmente se establece
un contacto posterior con los que no respondieron a las cartas, a través de entrevista
telefónica, o personal.
Obviamente las preguntas deben estar redactadas de forma que no precisen
ningún tipo de aclaración.
Con la instalación de líneas de servicio telefónico (STAA), el entrevistador puede
hacer cualquier número de llamadas en áreas muy amplias por una cuota fija mensual.
este hecho ha facilitado la encuesta telefónica, por su bajo costo y por la rapidez en
obtener la respuesta.
El inconveniente clave está en conseguir representatividad de la población:
muchos números de teléfono no pertenecen a hogares, muchos hogares no tienen
teléfono, etc.
Se aconseja marcar los números aleatoriamente para paliar en lo posible este
problema: Se selecciona un número de área al azar y los últimos dígitos son marcados
aleatoriamente hasta que se obtienen un número determinado de hogares del tipo
establecido.
La entrevista personal, en la cual el entrevistador realiza preguntas ya preparadas
y registra las respuestas es, probablemente, la forma más interesante de obtener datos
sociológicos, epidemiológicos, etc.
Es obvio que esta forma de recoger información aumenta el porcentaje de
respuesta y evita interpretaciones incorrectas; los inconvenientes son el costo y la
255
necesidad de que los entrevistadores sean personal convenientemente adiestradas al
afecto. Cualquier aseveración, gesto, etc., puede modificar la respuesta.
Evidentemente, no es lo mismo preguntar ¿A qué partido político vota?, que
preguntar ¿Ud., tampoco vota al PSOE...?
4.2.2.2. Diseño del cuestionario
Dada la importancia central del cuestionario, la construcción del mismo es una
operación muy delicada y difícil, que generalmente es llevada a cabo en equipo.
La investigación por encuesta debe traducir las variables empíricas sobre las que
se desea obtener información, en preguntas concretas sobre la realidad a investigar.
Siguiendo a Sierra Bravo* , podemos afirmar que las etapas en las que
generalmente se lleva a cabo la elaboración de un cuestionario son:
Formulación de las hipótesis.
Determinación de las variables a observar.
Planificación del contenido del cuestionario:
Deben estar perfectamente especificadas, el tipo de preguntas, sus categorías, el
número de preguntas, el orden en que se efectuarán, etc., y todas las preguntas sobre un
determinado aspecto deben aparecer juntas en el cuestionario, guardando un orden
temporal o lógico.
No se debe comenzar con preguntas difíciles y embarazosas; se debe evitar poner
juntas aquellas preguntas que puedan tener influencia, unas en otras, ya que el individuo
trata de ser consistente en sus respuestas y esto puede modificar considerablemente el
resultado.
Si preguntamos, por ejemplo, ¿Es Ud. partidario de que se aumenten los
impuestos? Muy probablemente la respuesta será no.
*
R. Sierra Bravo. (Técnicas de investigación social). 1994. Ed. Paraninfo.
256
Si a continuación le preguntamos ¿Es partidario de que se aumenten los
impuestos para educación?. Aunque considere que sí, la respuesta probablemente será
no, ya que la afirmación sería inconsistente con la respuesta anterior.
No solo es importante el orden de las preguntas sino también el orden de las
respuestas; está comprobado que tras una larga lista de respuestas, hay una tendencia a
marcar las últimas respuestas propuestas.
La redacción de las preguntas, es el elemento esencial. Es bien conocido que
mínimas modificaciones en la redacción, proporcionan cambios sustanciales en los
porcentajes de respuesta.
4.2.2.3. Tipos de preguntas
Las preguntas se pueden clasificar en diferentes categorías, según estén
relacionadas con información de tipo personal, datos objetivos, actitudes, motivaciones
y sentimientos, nivel de conocimientos, etc.
Las respuestas que se ofrecen a las preguntas del cuestionario deben ser
exhaustivas y excluyentes; es decir, las posibles respuestas a cada pregunta deben
abarcar todos los casos que pueden darse, de modo que ningún encuestado deje de
responder por no encontrar su categoría.
En este sentido resulta práctico añadir la categoría "otros"
Serán excluyentes siempre que el encuestado no pueda dar dos respuestas a una
misma pregunta.
Las preguntas se pueden clasificar de distintas formas:
Según el tipo de respuesta que pueda dar el encuestado, se
dividen en preguntas abiertas, preguntas cerradas, y
preguntas categorizadas.
Según la naturaleza del contenido de las preguntas.
257
TIPO DE RESPUESTA QUE PUEDE DAR EL ENCUESTADO
Las preguntas estrictamente cerradas son las que sólo ofrecen dos posibles
respuestas; generalmente: SI o NO.
Las categorizadas también son cerradas pero el encuestado puede elegir
entre varias alternativas o categorías.
Las preguntas abiertas solo contienen la pregunta y no establecen ningún
tipo de respuesta, dejando ésta completamente al arbitrio del encuestado.
Las preguntas abiertas permiten más matices en la respuesta, pero dificultan los
análisis posteriores.
Se suelen utilizar en las fases previas a la encuesta definitiva, cuando no se tiene
un conocimiento exhaustivo del problema en el que se pretende trabajar ya que son
esenciales para conocer el marco de referencia del encuestado y para redactar después
las alternativas que deben aparecer en las preguntas categorizadas.
En cuanto a las preguntas cerradas, con solo dos alternativas de respuesta,
debemos prestar atención a la influencia que puede tener el presentar la pregunta
referida a una sola de las alternativas. Por ejemplo, no es lo mismo preguntar ¿Está Ud.
a favor del divorcio? con posibles respuestas (Si , No), que decir ¿Está a favor o en
contra del aborto? con posibles respuestas (A favor, En contra)
EN RELACIÓN A LA NATURALEZA DEL CONTENIDO DE LAS
PREGUNTAS:
Podemos distinguir:
Variables de identificación, que son las que se refieren a características
básicas de la unidad de investigación. Si son personas, este apartado
contemplaría, edad, sexo, estado civil, residencia, profesión, estudios,
ingresos. religión, filiación política, nacionalidad, etc.
Preguntas filtro cuya función es eliminar un grupo de preguntas del
cuestionario en aquellos encuestados que no le afecten.
Por ejemplo, ¿piensa comprase un piso? La respuesta puede ser No por
258
varias razones pero una de ellas, es que ya tenga piso. Por eso debe ponerse
previamente una pregunta filtro del tipo ¿Tiene piso propio?.
Preguntas de control cuya finalidad es asegurarse del interés y buena fe
del encuestado, o de la veracidad y fiabilidad de sus respuestas. A veces
incluyen preguntas trampa para ver si el encuestado cae en ellas, porque en
ese caso debe desestimarse su información, o preguntas de control para
valorar la consistencia de la respuesta.
Preguntas introductoras, cuya finalidad es tomar contacto y ganarse la
confianza del entrevistado, o pasar de un tema otro.
Preguntas muelle, que anteceden a preguntas escabrosas.
etc., etc.
A veces las preguntas del cuestionario son tan embarazosas que se sabe de
antemano que el resultado va a estar sesgado; si eso ocurre puede hacerse
imprescindible el recurrir a preguntas indirectas.
Un curioso ejemplo puede ser el siguiente:
Supongamos que una empresa desea conocer la incidencia del consumo de drogas
entre sus empleados.
Si realizase la pregunta directamente, es posible que muchos empleados se
nieguen o no contesten la verdad por miedo a represalias, a pesar de la promesa de que
la encuesta es anónima.
Un método recogido de la literatura consiste en lo siguiente: Se plantean dos
preguntas, una inocua, como por ejemplo, ¿Es el helado de vainilla, su favorito?* y otra
que es la pregunta en la que estamos realmente interesados, en este caso podría ser ¿Ha
tomado marihuana, cocaína o heroína en los últimos 15 días?.
Se le pide al sujeto que lance una moneda al aire y conteste a la primera cuestión
si salió cara y a la segunda si en la moneda salió cruz.
*
Evidentemente cualquier pregunta inocua valdría con tal de que se conoca la proporción de posibles
respuestas afirmativas en la población.
259
De esta forma, aún con los cuestionarios marcados, nadie puede saber a cuál de
las preguntas se ha respondido.
De este modo es posible estimar el porcentaje de individuos de la empresa que
consumen drogas.
Veamos:
Consideremos un ejemplo ficticio en el que suponemos que participan 100
empleados, elegidos al azar.
Supongamos que conocemos que el 60% de los individuos de la población
prefieren el sabor vainilla a cualquier otro sabor de helado y que en 50 cuestionarios
aparecía la respuesta SI.
Suponiendo que las monedas que emplean los empleados no están trucadas (y que
la teoría de la probabilidad funciona), aproximadamente el 50% de los encuestados
habrá respondido a la pregunta del helado de vainilla y la otra mitad a la pregunta sobre
el consumo de droga.
Así, de los 50 que contestaron a la pregunta del helado, el 60%, es decir, 30,
contestarían afirmativamente. Si 50 personas contestaron SI a la pregunta conflictiva
cabe esperar, pues, que 20 lo están haciendo a la pregunta sobre las drogas. Por tanto, la
estimación del porcentaje de empleados que consume algún tipo de droga sería: 20/50=
40%
4.2.3 Fuentes de error en las encuestas
Los errores que se pueden producir se pueden clasificar en dos tipos:
Errores de muestreo, que son los que se producen debido a la elección de
un muestreo inadecuado.
260
Errores "No de muestreo", estos últimos pueden ser debidos a la No
respuesta, a respuestas inexactas y a sesgos de selección.
4.2.3.1. Los cuestionarios no cumplimentados: la no
respuesta
En toda investigación nos encontraremos con formularios no devuelto si se han
enviado por correo, o con preguntas no contestadas si la entrevista es personal.
La literatura especializada habla de que aproximadamente el 40% de los
cuestionarios enviados por correo nunca son devueltos.
El sesgo que introduce este hecho se trata de evitar, a menudo, aumentando
considerablemente el tamaño de la muestra; pero ésta no es una solución correcta: Los
que no contestan son probablemente gente diferente, que si hubiera contestado, es
probable que lo hubiese hecho de manera diferente.
El único procedimiento que se considera válido para solucionar este problema es
el envío de nuevos cuestionarios a los que no contestaron, o nuevas visitas a los que se
debía entrevistar. "Insistir hasta conseguirlo"
El problema de la NO RESPUESTA es diferente. Incluye a los que contestan NO
SE y a los que no dan respuesta alguna a la pregunta.
Existe una tendencia a pasar por alto la no respuesta y restarle importancia, pero
sin duda, el "no contesta" demuestra una actitud de neutralidad o indiferencia hacia el
tema que transmite la pregunta, o simplemente, el encuestado prefiere reservarse su
opinión.
4.2.3.2 Respuesta inexacta
Este tipo de respuestas se produce frecuentemente por defecto en la definición de
las preguntas de la encuesta.
Los aspectos considerados deben ser definidos con precisión y han de ser
susceptibles de ser medidos sin ambigüedad.
261
En una pregunta sobre empleo ¿Qué significa exactamente desempleado?
Incluiremos a los adolescentes que no pueden encontrar trabajo en vacaciones?
¿Debemos incluir a los que trabajan por su cuenta pero están apuntados al paro?. etc.
4.2.3.3. Sesgo de selección
Este tipo de sesgo se produce cuando se produce un cambio arbitrario en los
elementos muestrales seleccionados de acuerdo al diseño.
Es un error importante sustituir a un individuo por su vecino más próximo. El
primero puede ser un padre con hijos casados y el segundo un padre con hijos en la
guardería; es obvio que para determinados contextos, la problemática no tiene porqué
ser similar.
4.2.4 Selección de la muestra: muestreo
y tamaño
Hay muchas formas diferentes de obtener una muestra representativa, El diseño
básico es el muestreo aleatorio simple* en el cual todos los individuos tienen la misma
probabilidad de ser elegidos.
4.2.4.1. Muestreo aleatorio simple
La muestra debe ser típica, es decir a de ser homogénea a la población a la que
representa, manteniendo las mismas proporciones que ésta en todos aquellos caracteres
que tengan influencia en el análisis. Por ejemplo, un estudio de opinión sobre
anovulatorios debe tener la misma proporción hombre/mujer que en la población, sin
embargo, para un estudio sobre agudeza visual este punto puede no ser importante.
*
El indice de TV de Nielsen (ITN) es el servicio más ampliamente usado para medir la
audiencia. Se basa en una muestra aleatoria de 1200 hogares que tienen conectado un
audiómetro de almacenaje automático al televisor, el cual registra si funciona o no el
televisor, qué canal se ve, y los cambios que se producen.
* Datos tomados de la Tesis Doctoral: "Estudios sobre el nivel de salud en la población
salmantina" del que es autor D. Rafael Gonzalez Celador. Universidad de Salamanca.
Facultad de Medicina. Cátedra de medicina Preventiva y Social. 1985.
262
La selección aleatoria de los individuos debe llevarse a cabo por un procedimiento
riguroso; generalmente se utiliza una tabla de números aleatorios.
Debe tenerse en cuenta que este tipo de muestreo requiere disponer de un listado
completo de los elementos de la población para poder asignarles, consecutivamente,
números desde 1 hasta n.
4.2.4.2. Muestreo aleatorio sistemático
A veces resulta más económico seleccionar un primer individuo al azar y
seleccionar el resto de forma sistemática.
Este tipo de muestreo puede tener problemas asociados importantes.
La literatura recoge casos curiosos, citaremos algunos de ellos.
El ejercito británico enviaba a las colonias a los soldados cuyo apellido empezara
por una letra determinada. Cuando las letras eran la M o la O, la isla se llenaba de
irlandeses o de escoceses (O’ , Mc)
Los resultados de un estudio epidemiológico sobre condiciones higiénicas de las
viviendas, en uno de los barrios periféricos de una gran ciudad, tuvieron que ser
desechados por haber tomado como procedimiento de muestreo, el seleccionar uno de
cada cinco portales de la calle. Coincidió que en una mayor proporción de lo habitual,
uno de cada cinco portales correspondía al extremo de una manzana, por lo que las
viviendas daban a dos calles y por tanto tenían mejor orientación, más sol, más
ventilación, etc.
4.2.4.3. Muestreo aleatorio estratificado
Una muestra aleatoria estratificada se obtiene mediante la clasificación de los
elementos de la población en grupos homogéneos llamados estratos y seleccionando
una muestra aleatoria en cada uno de ellos.
263
La muestra estratificada reduce la variación de los resultados de la muestra
respecto a la población total y proporciona una mayor precisión en las estimaciones.
El muestreo estratificado será constante o proporcional, según que los estratos
tengan, o no, el mismo tamaño.
La selección de los estratos no es siempre sencilla, sin embargo, debe estar
perfectamente especificada al comenzar el estudio, ya que cada unidad muestral tiene
que pertenecer claramente a un único estrato.
¿Por ejemplo, los hogares de Santa Marta, o los de Valdelagua, deben ser
considerados rurales o urbanos?
Si no se puede formar una base de la muestra por estratos, pero sabemos la
composición por estratos del universo en tantos por ciento, y la encuesta se realiza por
entrevista, se recurre al muestreo por cuotas el cual consiste en asignar a cada
entrevistador un número de entrevistas a realizar, indicándole las que tienen que
corresponder a cada estrato, y dejando a su arbitrio la elección concreta de la población
a entrevistar.
El error que se comete es mayor que el que se obtendría con un muestreo
estratificado; se ha estimado que el tamaño de la muestra realizado por cuotas debe ser
mayor, en un 50%, al de la muestra elegida al azar, para que los errores sean
equivalentes.
Los inconvenientes fundamentales de este tipo de muestreo están en el hecho de
que no pueden aplicarse las fórmulas estadísticas típicas para estimar el error, aunque
también puede ser importante el hecho de que los entrevistadores opten por elegir
personas de su entorno más próximo, hecho éste que contribuirá aun más a incrementar
el error de muestreo.
Para obviar en cierta medida estos problemas, se ha ideado el muestreo por rutas
que consiste en fijar a cada entrevistador un itinerario definido en todos sus detalles,
indicándole exactamente en qué puntos debe realizar la entrevista.
A veces es necesario estratificar en todos aquellos caracteres con influencia en los
resultados de la investigación: sexo, edad, nivel socioeconómico, etc.
264
4.2.4.4. Muestreo por conglomerados
Un procedimiento similar al muestreo estratificado pero que puede resultar
bastante más económico es el muestreo por conglomerados.
Cada conglomerado debe tener representadas todas las características de la
población. El muestreo consiste en seleccionar al azar determinados conglomerados y
analizar a todos y cada uno de los elementos del conglomerado.
Resulta muy cómodo cuando se llevan a cabo estudios en áreas urbanas donde el
procedimiento consiste en seleccionar familias específicas, edificios o manzanas de la
ciudad y considerar todos los individuos de la familia, el edificio o la manzana.
Conviene tener en cuenta la diferencia fundamental que existe en relación al
muestreo estratificado. En un muestreo estratificado se consideran todos los estratos y
en cada uno se considera una muestra de individuos aleatoria.
En el muestreo por conglomerados, se seleccionan, al azar los conglomerados que
serán considerados y una vez elegidos se estudian todos los individuos de cada
conglomerado.
4.2.4.5. Muestreo polietápico
Se refiere al caso en el que las unidades de la muestra no son simples sino
colectivas. El muestreo de los conjuntos se puede realizar por cualquiera de los
procedimientos básicos descritos y una vez obtenidos los conjuntos a observar, se
seleccionan muestras con referencia a cada colectivo que serán los individuos que
representen los respectivos clusters y será sobre ellos, sobre los que se llevará a cabo el
estudio.
Por ejemplo, en un estudio clínico multicéntrico se seleccionan los hospitales que
formarán parte del estudio en una primera etapa y en etapas posteriores se seleccionarán
los servicios, plantas, médicos, camas, etc. que intervendrán en la investigación.
265
4.2.4.6 Otros tipos de muestreo
Hay muestreos no probabilísticos que en determinadas fases de una investigación
pueden resultar interesantes, aunque no gozan de las propiedades de los muestreos
clásicos. Entre estos están los muestreos estratégicos en los cuales en lugar de realizar la
elección de las unidades de muestreo al azar, se realiza intencionadamente por los
investigadores.
Son prácticos, pero menos interesantes desde el punto de vista estadístico.
4.2.5 Determinación del tamaño de la
muestra en una encuesta
El otro gran apartado dentro del diseño y análisis de encuestas es el estudio del
tamaño de la muestra para que ésta sea representativa.
Para determinar el tamaño de la muestra es necesario que precisemos el error de
estimación E, con el que estamos dispuestos a trabajar; es decir la máxima diferencia
admitida entre el verdadero valor del parámetro θ (media, proporción, etc.) y el valor
estimado, !ˆ .
Error de estimación = !ˆ " !
Además debemos especificar la proporción de veces que, en un muestreo repetido,
se requerirá que el error de estimación sea menor que la cantidad prefijada E.
Generalmente esta información se expresa en términos probabilísticos, se conoce
como nivel de confianza, y se denota como 1 - α; es decir,
(
)
P !ˆ " ! < E = 1" #
El valor más comúnmente aceptado por la comunidad científica para 1 - α es el 95
o el 99%, y el error de estimación se acostumbra a fijar en aproximadamente dos veces
el valor del error estándar del estimador utilizado.
Si el parámetro que se pretende estudiar es la media poblacional, el estimador que
266
se utiliza es el correspondiente estimador eficiente (insesgado y de varianza mínima); es
decir, la media muestral.
Si el parámetro que se pretende estudiar es la proporción de éxitos en la
población, el estimador que se utiliza es la proporción muestral cuyo error estándar es
pq N ! n
pq
en el caso de poblaciones finitas y
si la población no es finita.
n n !1
n
A continuación se resuelve detalladamente un ejemplo real que ayudará al lector
en la comprensión de los conceptos expuestos.
267
"DISEÑO Y ANÁLISIS ESTADÍSTICO
DE ENCUESTAS"
4.3 Trabajo de investigación
268
4.3.1 Determinación del tamaño de la
muestra en una encuesta por muestreo
Supongamos que queremos realizar un estudio para valorar el nivel
socioeconómico en la ciudad de Salamanca.
El censo, según datos de 1983, es de 48069 familias; se llevará a cabo un
muestreo aleatorio estratificado, (cada uno de los 11 barrios será un estrato) en el cual
se entrevistará un determinado número de familias salmantinas* .
La encuesta, evidentemente, constará de muchas preguntas, composición familiar,
características de la vivienda, características laborales etc., pero centraremos nuestra
atención en una cualquiera, por ejemplo: ¿Las familias salmantinas tienen hijos?.
Consideremos la respuesta afirmativa como éxito y definamos una variable
aleatoria X' como el número de éxitos en n pruebas.
Dado que pretendemos hacer un muestreo en una población finita, X' es una
variable aleatoria hipergeométrica
X' = H(N, n, p)
N es el tamaño de la población
n el número de pruebas
p la probabilidad de éxito.
El siguiente problema a resolver será la estimación del tamaño adecuado de la
muestra para que ésta sea representativa.
La forma más rápida y más frecuente de resolverlo es escribir directamente la
expresión matemática para estimar el tamaño en un modelo hipergeométrico.
269
4.3.1.1 Estimación del tamaño de muestra adecuado

1. El primer problema a resolver será la estimación del tamaño
adecuado de la muestra para que ésta sea representativa.
1.- ¿Cual es la esperanza matemática de la variable
X'= H (N,n,p)?
E[X' ] = n p
2.- ¿Cual es la varianza de esa variable aleatoria?
V[X' ] = n pq
N! n
N !1
3.- Teniendo en cuenta el Teorema de De-MOIVRE, X' puede
aproximarse por un modelo normal , ¿de qué parámetros?.
X' = N(n p, n pq
4.- Teniendo en cuenta las propiedades de la esperanza
matemática y de la varianza, si definimos una nueva variable
aleatoria X=X'/n, podemos asegurar que esta nueva variable
sigue un modelo normal, ¿de qué parámetros?.
N! n
)
N !1
270
X'
pq N" n
= pˆ ! N(p ,
)
n
n N "1
X'
( )"p
n
! N(0 , 1)
pq N " n
n N "1
pˆ " p
P("z #/ 2 $
$ z #/ 2 ) = 1" #
pq N "n
n N "1
X=
5.- Teniendo en cuenta la respuesta anterior el intervalo
aleatorio de confianza para el parámetro 'p' de la distribución
hipergeométrica es:
$
pq N ! n
P& ˆp ! z "/ 2
%
n N !1
# p#
ˆp + z "/ 2
pq N ! n ')
= 1! "
n N !1 (
*
pq N ! n I1!"
= pˆ ± z "/ 2
p
,+
n N ! 1 /.
6.- A partir de la respuesta anterior, la expresión que nos
permite calcular el tamaño de la muestra, sabiendo que la
diferencia entre el estimador insesgado y de varianza mínima y
el verdadero valor del parámetro 'p' en la población es una
cantidad prefijada E, es:
pˆ ! p " E
pˆ ! E " p " pˆ + E
pq
n
pq
E 2 = z 2#/ 2
n
E = z #/ 2
N !n
N !1
N!n
N !1
z 2#/ 2 N p q
n= 2
E (N ! 1) + z 2#/ 2 p q
271
7.- Dado el valor del error en función de 'n' y de 'p' , el valor de
'p' que hace lo máximo, fijado un valor de 'n' es:
1
1
#% N " n & 2
E = z !/ 2
( p(1 " p)) 2
$ n(N " 1)'
1
1
# N" n &2
(E
( p(1 " p)) " 2
= z !/ 2 %
$ n(N " 1)'
(p
(1" 2p) = 0
1
p=
2
(1" 2p) = 0
8.- Con un error prefijado del 4%, un nivel de confianza elegido
del 95.44 %, y tomando como valor de 'p' el obtenido en el
apartado anterior; Para los datos del censo de la ciudad de
Salamanca, el número de entrevistas necesario para llevar a
cabo la investigación propuesta es:
1! " = 0, 9544
z "/ 2 = 2
p = 0, 5
E = 0, 04
N
z 2"/ 2 pq = 1
n= 2
E (N ! 1) + 1
48069
n=
= 617
2
0, 04 48068 + 1
4.3.1.2 Estimación del tamaño de cada estrato

2. El segundo problema es estimar el tamaño de cada estrato
Supongamos un muestreo estratificado aleatorio proporcional; es decir el
número de entrevistas a realizar en cada barrio será proporcional al número de familias
que habitan en ellos.
272
Calcule el tamaño de muestra, por estratos, teniendo en cuenta
que la distribución de familias por barrios es la siguiente.
Barrio
Nº de familias
% del total
Entrevistas
Centro-Mercado San Juan
Gran Via-Canalejas
Antiguo
Prosperidad-Rollo
Salas Pombo
Carmelitas-Oeste
Pizarrales
Vidal
Garrido
Tejares
San Jose-La Vega
6632
3539
856
5561
3318
4330
3786
3104
13690
976
2285
13.79
7.34
1.77
11.56
6.90
9.00
7.87
6.45
28.47
2.02
4.75
85
45
11
71
43
56
49
40
176
12
29
TOTAL
48069
100.00
617
4.3.1.3 Estimación del verdadero error en cada estrato
 3. El tercer problema, dado que el error está en función del tamaño
de la muestra, es estimar el verdadero error con el que se trabaja en cada
estrato (barrio)
Calcule el verdadero error para los siguientes barrios:
Centro-San Juan, Antiguo, Garrido y Tejares.
¿Es realmente del 4%, como habíamos previsto al principio?
E i = z !/ 2
p i q i Ni " n i
ni N i " 1
273
Barrio
Ni
ni
Error (%)
Centro-Mercado San Juan
Gran Via-Canalejas
Antiguo
Prosperidad-Rollo
Salas Pombo
Carmelitas-Oeste
Pizarrales
Vidal
Garrido
Tejares
San Jose-La Vega
6632
3539
856
5561
3318
4330
3786
3104
13690
976
2285
85
45
11
71
43
56
49
40
176
12
29
10,78
14,80
29,01
11,80
15,24
13,35
14,27
15,80
7,50
29,00
18,56
TOTAL
48069
617
4,00
4.3.1.4 Calculo del intervalo de confianza en cada
estrato

4. Fijemos de nuevo nuestra atención en la pregunta particular
que habíamos enunciado al principio sobre si tienen o no hijos las familias
salmantinas.
Supongamos que el análisis de la muestra correspondiente al barrio Antiguo
nos da una estimación puntual para la probabilidad de éxito del 20%
(p=0.20); es decir, el 20% de las familias encuestadas en el Barrio Antiguo
tienen hijos
a) Teniendo en cuenta la respuesta a la pregunta anterior,
díganos los valores de los extremos del intervalo de confianza
aleatorio para la verdadera proporción de familias con hijos del
B. Antiguo.
#
pˆ ba qˆ ba N ba ! n ba &
ˆ
I1!"
=
p
±
z
p
"/ 2
%$ ba
n ba
N ba ! 1 ('
1!"
Ip
= [0,20 ! 0,2397 # p # 0,20 ! 0,2397]=
=[-0,039
; 0,4397]
274
Supongamos que ese valor para el estimador puntual se hubiera obtenido
para el estudio global de la ciudad de Salamanca; es decir, el 20% de los
encuestados tiene hijos.
b) Calcule los extremos del intervalo aleatorio de confianza
para la proporción de familias con hijos, en toda la ciudad de
Salamanca y compare el resultado con el anterior.
#
ˆp qˆ N ! n &
I1!"
p = % pˆ ± z "/ 2
n N ! 1 ('
$
I1!"
= [0,20 ! 0, 032 # p # 0,20 + 0, 032]=
p
=[0,168 ; 0, 232]
4.3.1.5 Estimación de errores en función de los
valores de p y q

5. Analicemos, en último lugar, las implicaciones de estimar el
tamaño de la muestra bajo el supuesto de que 'p' es igual a 'q' ( es la forma en
que usualmente los investigadores llevan a cabo la estimación de la muestra)
Evidentemente, no es lógico suponer que en la población salmantina, es
igualmente probable que las familias tengan o no hijos.
Fijemos, de nuevo, un error del 4%, el nivel de confianza en 95.44% y teniendo
en cuenta que el censo supuesto es de 48069 familias
a) Estime 'n' para p=0.1, p=0.2, p=0.3, p=0.4, p=0.5
p
0,1
0,2
0,3
0,4
0,5
n
224
397
519
592
617
275
0,6
0,7
0,8
0,9
592
519
397
224
b) Represente en unos ejes cartesianos la variación de 'n' en
función de los valores de p.
700
600
500
400
300
200
100
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
c) Si suponemos que en la población salmantina la probabilidad
de tener hijos es del 80% (p=0.8) ¿Qué tamaño de muestra es
realmente necesario para detectar un error del 4%?
(397)
d) ¿Cuantas entrevistas resultarían innecesarias?
(220)
Descargar