Distribución Normal

Anuncio
UNIDAD Nº 3
POBLACION Y MUESTRA
1.1 Población y muestra
Se entiende por población al conjunto de elementos sobre los que se realiza una
investigación estadística, y para los cuales se desea sean válidos sus conclusiones, en
otras palabras es la totalidad de elementos o cosas bajo consideración. Se la simboliza
con la letra N (mayúscula).
Una muestra, es una parte de esa población que ha sido seleccionada de manera
que cada elemento de la población haya tenido igual probabilidad de ser elegido, es
decir, es la porción de la población que se selecciona para su análisis.
Finita: Cuando tiene un límite.
Población
Infinita: no tiene límite.
La muestra siempre es finita. Al número de elementos de una muestra se lo
denomina tamaño de la muestra y se lo simboliza con la letra n (minúscula).
Se debe tener en cuanta también que tipos de datos se toman en una muestra:
Cualitativos: ¿ Usted tiene cabras? La respuesta puede ser SI o NO. Es decir, se
obtiene por conteo.
Cuantitativos: ¿Cuánto mide su estancia? En este caso se obtiene por mediciones, las
cuales pueden ser: discretas que también se realizan por conteo o continuas que se
realizan más por un proceso de medición
Parámetros: son valores representativos de la población.
Estadísticos: son valores representativos de la muestra.
Parámetro
(no siempre se conocen)
E
Estadísticos (siempre se conocen)
Ejemplos: sea la población formada por el conjunto de estudiantes que en el año 2000
cursaron Estadística en la Carrera de Ingeniería y llenaron la encuesta que se realizó al
comenzar las clases (1049 estudiantes - N=1049). .
Una muestra aleatoria es un subconjunto de esos estudiantes (n) seleccionado de
manera que cada uno de los 1049 tenga igual probabilidad de ser elegido.
Población y muestra
1
(Posibles formas de selección serían numerar los 1049 estudiantes de la población y
mediante una tabla de números aleatorios elegir números de 4 cifras menores a 1050
en forma sucesiva y hasta completar el tamaño deseado de la muestra o mediante una
computadora con un programa destinado a ese efecto).
Tipos de muestras
Existen básicamente dos tipos de muestra: la probabilidad no probabilística y
la muestra de probabilidad.
Para muchos estudios sólo se dispone de una muestra no probabilística como
una muestra de juicio. En estos casos, la opinión de un experto en la materia objeto de
un estudio es crucial para poder usar los resultados obtenidos con el fin de hacer
cambios en un proceso. Algunos otros procedimientos típicos del muestreo no
probabilístico son el muestreo de cuota y el muestreo de parte grande; éstos se analizan
con detalle en libros especializados sobre métodos de muestreo.
En un estudio enumerativo, la única forma de que hagamos inferencias
estadísticas correctas de una muestra a una población es mediante el uso de una
muestra de probabilidad.
Una muestra de probabilidad es aquélla en la que los sujetos de la muestra se
eligen sobre la base de probabilidades conocidas.
Los cuatro tipos de muestras de probabilidad de uso más común son la muestra
aleatoria simple, la muestra sistemática, la muestra estratificada y la muestra de
agrupación.
En una muestra aleatoria simple cada individuo o elemento tiene la misma
oportunidad de selección que cualquier otro, y la selección de un individuo o elemento
en particular no afecta la probabilidad de que se elija cualquier otro. Además, una
muestra aleatoria simple también puede interpretarse como aquélla en la que cada
posible muestra extraída tiene la misma probabilidad de selección que cualquier otra
muestra que se pueda extraer.
Un análisis detallado de los procedimientos de muestreo sistemático,
estratificado y de agrupación puede encontrarse en libros más especializados.
_________________________________
Extracción de la muestra aleatoria simple
En esta parte se expone el proceso de selección de una muestra aleatoria simple.
Aunque no necesariamente es el más económico o eficiente de los procedimientos de
muestreo de probabilidad, proporciona la base a partir de la cual han evolucionado los
procedimientos más complejos.
La clave de la selección de muestras apropiada es obtener y mantener una lista
actualizada de todos los individuos o elementos de los cuales se extraerá la muestra.
Tal lista se conoce como el marco de población. Este listado de población servirá
como la población objetivo, de tal manera que si se extrajeran muchas muestras de
probabilidad diferentes de tal lista, en el mejor de los casos, cada muestra sería una
representación en miniatura de la población y produciría estimaciones razonables de
sus características. Si el listado es inadecuado porque ciertos grupos de individuos o
elementos de la población no estuvieran incluidos apropiadamente, las muestras de
Población y muestra
2
probabilidad aleatoria sólo proporcionarían estimaciones de las características de la
población objetivo, no de la población real, y ocurrirían sesgos en los resultados.
__________________________________________
Muestreo con o sin reemplazo de poblaciones finitas
Para seleccionar la muestra pueden usarse dos métodos básicos: la muestra
podría obtenerse con reemplazo o sin reemplazo de la población finita. El método
empleado debe ser establecido claramente por el estadístico de la encuesta, puesto que
varias de las fórmulas usadas posteriormente con propósitos de inferencia estadística
dependen del método de selección.
Digamos que N representa el tamaño de la población y n representa el tamaño de la
muestra. Para extraer una muestra aleatoria simple de tamaño n uno podrían registrarse
los nombres de los N miembros individuales de la población en fichas separadas del
mismo tamaño, colocar estas fichas en una gran pecera, mezclar a fondo las fichas y
luego seleccionar aleatoriamente los n sujetos de la muestra de la pecera.
Al seleccionar con reemplazo, la probabilidad de que cualquier miembro
particular de la población, digamos Tomás Matus, sea seleccionado en la primera
extracción de la pecera es 1/N. Sin importar quién sea realmente seleccionado en la
primera extracción, la información pertinente se registra en un archivo maestro y
después la ficha particular se reemplaza en la pecera (muestreo con reemplazo).
Después, las N fichas de la pecera se revuelven bien y se extrae la segunda ficha.
Puesto que la primera ficha se reemplazó, la probabilidad de selección de cualquier
miembro o en particular, incluyendo a Tomás Matus en la segunda extracción, sin
importar si ese individuo ha sido o no seleccionado anteriormente, sigue siendo 1/N.
Nuevamente la información pertinente se registra en un archivo maestro y la ficha se
reemplaza con el fin de preparar la tercera extracción. Este proceso se repite hasta que
se obtiene n, el tamaño de muestra deseado. Por tanto, al muestrear con reemplazo,
cada individuo o elemento en cada extracción siempre tendrá una oportunidad entre N
de ser seleccionado.
¿Pero, desearíamos seleccionar posiblemente el mismo individuo o elemento más de
una vez? Al muestrear poblaciones humanas, generalmente se considera más
apropiado tener una muestra de personas diferentes que permitir mediciones repetidas
de la misma persona. Así pues, emplearíamos el método de muestreo sin reemplazo,
mediante el cual una vez que se extrae un individuo o en particular, la misma persona
no puede volver a seleccionarse. Como antes, al muestrear sin reemplazo, la
probabilidad que cualquier miembro particular de la población, digamos Tomás Matus,
sea seleccionado en la primera extracción de la pecera es 1/N. Sea quien sea el
seleccionado, la información pertinente se registra en un archivo maestro y después la
ficha particular se aparta en lugar de reemplazarse en la pecera (muestreo sin
reemplazo). Las restantes N-1 fichas de la pecera se revuelven bien y se extrae la
segunda ficha. La probabilidad que cualquier individuo no seleccionado previamente
sea seleccionado en la segunda extracción ahora es 1 entre N-1. Este proceso de
seleccionar una ficha, registrar la información en un archivo maestro, revolver las
fichas restantes y después extraer nuevamente continúa hasta que se obtenga la
muestra deseada de tamaño n.
Población y muestra
3
No importando si muestreamos con o sin reemplazo, tales métodos de “pecera"
para la selección demuestras tienen una importante desventaja: nuestro habilidad para
mezclar a fondo las fichas y extraer aleatoriamente la muestra. Ésto se convirtió en un
importante asunto de controversia en 1969 cuando la Comisión de Servicio Selectivo
desarrolló un sistema de lotería para elegir hombres que se alistaran en el servicio
militar de Estados Unidos debido a la guerra de Vietnam
Los métodos de "pecera" para muestrear que acabamos de describir, aunque de fácil
comprensión, no son muy útiles. Es deseable contar con métodos de selección menos
engorrosos y más científicos para asegurar lo aleatorio del proceso de selección. Uno
de estos métodos utiliza una tabla de números aleatorios (véase la tabla 2.1) para
obtener la muestra.
________________________________
Uso de una tabla de números aleatorios
Una tabla de números aleatorios consiste en una serie de dígitos aleatoriamente
generados y enumerados en el orden en el que se generaron. Puesto que nuestro
sistema numérico usa 10 dígitos (0,1,2,...9), la probabilidad de generar aleatoriamente
cualquier dígito en particular es igual a la probabilidad de generar cualquier otro
dígito. Esta probabilidad es 1 entre 10. Por tanto, si se generara una secuencia de 500
dígitos esperaríamos que aproximadamente 50 de ellos fueran el dígito 0, 50 el dígito
1, etc. De hecho, los investigadores que usan tablas de números aleatorios
generalmente prueban la aleatoriedad de tales dígitos generados antes de emplearlos.
La tabla 2.l cumple con todos esos criterios de aleatoriedad. Puesto que cada dígito o
secuencia de la tabla es aleatorio, podemos usar la tabla leyendo ya sea horizontal o
verticalmente. Los márgenes de la tabla designan números de fila y números de
columna. Los dígitos mismos se agrupan en secuencias de cinco con el único propósito
de facilitar la visión de la tabla.
Para usar una tabla de éstas en lugar de una pecera para seleccionar la muestra,
primero es necesario asignar números de código a los miembros individuales de la
población. Después, obtenemos nuestra muestra aleatoria leyendo la tabla de números
aleatorios y seleccionando a aquellos individuos del marco de población cuyos
números de código asignados concuerden con los dígitos encontrados en la tabla en las
siguientes páginas.
_______________
Error de muestreo
Existen tres razones principales para extraer una muestra en vez de tomar un
censo completo: es más conveniente, menos costosa y más eficiente. Sin embargo, al
seleccionar los sujetos usando una muestra de probabilidad aleatoria, dependiendo de
dónde se comienza en la tabla de números aleatorios, el azar dicta quién del marco de
población será incluido o no. Aunque realmente sólo se selecciona una muestra, si se
tuvieran que extraer muchas muestras diferentes, óptimamente cada muestra sería una
representación en miniatura de la población y produciría estimaciones razonables de
sus características. El error de muestreo refleja la heterogeneidad o las "diferencias de
oportunidad" de muestra a muestra basándose en la probabilidad de los sujetos que
están siendo seleccionados en las muestras particulares.
Población y muestra
4
Tabla 2.1
Población y muestra
5
Cuando leemos acerca de los resultados de encuestas o sondeos en periódicos o
revistas, a menudo hay una declaración respecto al margen de error o precisión, por
ejemplo, se espera que los resultados de este sondeo estén dentro de ± 4 puntos
porcentuales del valor real. El error de muestreo puede reducirse tomando tamaños de
muestra mayores, aunque esto incrementará el costo de aplicación de la encuesta.
_______________
Error de medición
En la práctica de una buena investigación de encuestas, se diseña un
cuestionario con la intención que permita la recolección de información significativa.
Población y muestra
6
Los datos obtenidos deben ser válidos; es decir, deben evaluarse las respuestas
"buenas" y esto debe hacerse de una manera que se obtengan mediciones
significativas.
Pero aquí hay un dilema: la obtención de mediciones significativas es a menudo más
fácil de decir que de hacer. Considere el siguiente proverbio.
El hombre que tiene un reloj siempre sabe la hora;
el hombre que tiene dos relojes siempre busca identificar el que está correcto;
el hombre que tiene diez relojes siempre recuerda la dificultad de medir el tiempo.
Desafortunadamente, el proceso para obtener una medición a menudo está regulado
por lo que es conveniente, no por lo que se necesita y las mediciones obtenidas son a
menudo sólo un sustituto de las realmente deseadas.
El error de medición se refiere a inexactitudes en las respuestas registradas que
ocurren debido a una mala formulación de las preguntas, el efecto de un entrevistador
sobre el encuestado o el esfuerzo hecho por el encuestado.
Se ha puesto mucha atención al error de medición que ocurre debido a una mala
formulación de las preguntas. Una pregunta debe ser clara, no ambigua. Además, debe
presentarse objetivamente de una manera neutral; las "preguntas sugerentes" deben
evitarse.
Como un ejemplo, en noviembre de 1993 el Departamento del Trabajo de
Estados Unidos informó que la tasa de desempleo en ese país se había subestimado
durante más de una década debido a una formulación errónea del cuestionario en la
encuesta de población actual. En particular, la formulación conducía a un subconteo
significativo de mujeres en la fuerza laboral. Dado que las tasas de desempleo están
vinculadas con los programas de beneficios como los sistemas de compensación de
desempleo estatal, era imperativo que los investigadores de encuestas gubernamentales
rectificaran la situación ajustando la formulación del cuestionario.
Podemos demostrar el impacto de la formulación de preguntas sobre las respuestas
obtenidas refiriéndonos a las dos versiones siguientes de una pregunta hecha por
Yankelovich & Partners en encuestas nacionales aplicadas durante la campaña
presidencial de 1992:
¿Piensa que por cada dólar de incremento de impuestos debería haber $2 de reducción
de gastos, destinando los ahorros a una reducción del déficit y la deuda?
¿Estaría a favor o en contra de una propuesta de reducir el gasto en $2 por cada dólar
de nuevos impuestos, destinando los ahorros a una reducción del déficit, incluso si esto
significa reducciones en programas sociales como atención médica y educación?
Las respuestas a la primera versión de la pregunta fueron las siguientes: 67% dijo "sí",
18% dijo "no" y 15% dijo "no sé". Por otra parte, las respuestas a la versión alternativa
de la pregunta fueron completamente opuestas: 33% dijo estar "a favor", 61% dijo
estar “en contra” y 6% dijo "no sé". ¿Qué pasó aquí? ¿Por qué hubo tal cambio de una
postura más positiva hacia una posición más negativa sobre esta cuestión? Tal vez
podamos atribuir el cambio al hecho que en la segunda versión de la pregunta se usó
un tono alternativo en su formulación y se proporcionó más información referente al
resultado potencial.
Una segunda fuente de medición de error aparece en las entrevistas personales y en las
telefónicas; un "efecto hola" en el que el encuestado se siente obligado a complacer al
Población y muestra
7
entrevistador. Este tipo de error puede minimizarse mediante un adecuado
entrenamiento del entrevistador.
Una tercera fuente de medición de error ocurre debido al esfuerzo (o falta de
éste) de parte del encuestado. Algunas veces las mediciones obtenidas son grandes
exageraciones, ya sea deliberadas o debidas a la falta de memoria por parte del
encuestado. De cualquier forma, esto obstaculiza la utilidad de la encuesta. Este tipo
de error puede minimizarse de dos maneras:
(1) analizando cuidadosamente los datos y volviendo a llamar a aquellos
individuos cuyas respuestas parecen inusuales y
(2) estableciendo un programa de nuevas llamadas aleatorias para comprobar la
confiabilidad de las respuestas.
1.2 Variable aleatoria poblacional y muestral
Para los elementos de la población, se desea estudiar alguna característica, esa es la
variable, que puede ser cualitativa o cuantitativa, discreta o continua. Por ejemp1o: el
peso de los estudiantes, la condición de que trabajen o no.
Se puede definir como “una variable aleatoria (v.a.) es una función cuyos
valores son números reales, definida en un espacio muestral” y “una distribución de
probabilidades es una tabla, gráfico o fórmula que proporciona la probabilidad
asociada a cada valor de la v.a.”.
La variable aleatoria puede ser discreta cuando la variable toma valores finitos o
infinito numerable, y puede ser continua cuando la variable toma todos los posibles
valores de un intervalo.
La distribución de la variable en la población, o distribución poblacional, puede
entenderse como la distribución de frecuencias de la variable para toda la población y
su distribución de frecuencias re1ativas como una distribución de probabi1idad. Esta
distribución, en muchos casos es posible aproximarla a una distribución teórica
conocida, como la normal, binomial, Poisson. etc. ,
______________________
Variable Aleatoria Discreta
Y es una v.a. discreta, su distribución de probabilidad deberá verificar:
1) f(Y) > o = para todo valor del recorrido
2) Σy f(Y) = 1
“f es cuantía cuando la variable es discreta.”
_____________________________
Distribuciones Discretas Especiales
La distribución de probabilidad para una variable aleatoria discreta puede ser
1. Un listado teórico de resultados y probabilidades, que pueden obtenerse de un
modelo matemático que represente algún fenómeno de interés.
Población y muestra
8
2. Un listado empírico de resultados y sus frecuencias relativas observadas.
3.Un listado subjetivo de resultados asociados con sus probabilidades subjetivas que
representan el grado de convicción del tomador de decisiones respecto a la
probabilidad de los resultados posibles.
En esta unidad se expone principalmente en el primer tipo de distribución de
probabilidad, el listado obtenido de un modelo matemático que representa algunos
fenómenos de interés.
Un modelo se considera una representación en miniatura de algún fenómeno
subyacente. En particular, un modelo matemático es una expresión matemática que
representa cierto fenómeno subyacente. Para variables aleatorias discretas, esta
expresión matemática se conoce como función de distribución de probabilidad.
Cuando se dispone de tales expresiones matemáticas, puede calcularse la probabilidad
exacta de ocurrencia de cualquier resultado particular de la variable aleatoria. En tales
casos, entonces, toda la distribución de probabilidad puede obtenerse y enumerarse.
Por ejemplo, en la función de distribución de probabilidad representada en la tabla 3.1,
se dice que la variable aleatoria discreta de interés sigue la distribución de
probabilidad uniforme. La característica esencial de la distribución uniforme es que
es igualmente posible que ocurran todos los resultados de la variable aleatoria. Por
tanto, la probabilidad de que aparezca la cara del 5 del dado no cargado es la misma
que para cualquier otro resultado, 1/6, puesto que hay seis resultados posibles.
Además, se han desarrollado otros tipos de modelos matemáticos para representar
diversos fenómenos discretos que ocurren en la ciencias sociales y naturales, en
investigación médica y en los negocios. Los más útiles representan datos
caracterizados por la distribución de probabilidad binomial y la distribución de
probabilidad de Poisson. Ahora se desarrollaran estas dos distribuciones.
Distribución Binomial
La distribución binomial es una distribución de probabilidad discreta que es
extremadamente útil para describir muchos fenómenos. Una v.a. discreta X tiene una
distribución binomial si el experimento presenta las siguientes características:
1. Las observaciones posibles pueden obtenerse mediante dos métodos de muestreo
distintos. Cada observación puede considerarse como seleccionada de una población
infinita sin reemplazo o de una población finita con reemplazo.
2. Cada observación puede clasificarse en una de dos categorías mutuamente
excluyentes y colectivamente exhaustivas, usualmente denominadas éxito y fracaso.
3. La probabilidad de que una observación se clasifique como éxito, p, es constante de
observación a observación. Por tanto, la probabilidad de que una observación se
clasifique como fracaso, 1 - p, es constante sobre todas las observaciones.
4. El resultado (es decir, el éxito o fracaso) de cualquier observación es independiente
del resultado de cualquier observación.
Población y muestra
9
La variable aleatoria discreta o fenómeno de interés que sigue a la distribución
binomial es el número de éxitos obtenidos en una muestra de n observaciones. Así
pues, la distribución binomial ha gozado de numerosas aplicaciones:
En juegos de azar:
¿Cuál es la probabilidad de que el rojo salga 15 o más veces en 19 giros de la rueda de
la ruleta?
En el control de calidad de productos:
¿Cuál es la probabilidad de que en una muestra de 20 llantas del mismo tipo, ninguna
salga defectuosa si 8% de tales llantas producidas en una planta particular son
defectuosas?
En educación:
¿Cuál es la probabilidad de que un estudiante pueda pasar un examen de diez
preguntas de opción múltiple (cada pregunta conteniendo cuatro opciones) si el
estudiante adivina en cada pregunta? (Pasar se define como obtener 60% de los puntos
correctos, es decir, obtener al menos seis de diez puntos correctos.)
.En finanzas:
¿ Cuál es la probabilidad de que un valor particular muestre un incremento en su
precio de cierre diariamente durante las siguientes diez sesiones de negocios
(consecutivas), si el precio del mercado de valores realmente cambia aleatoriamente?
En cada una de estos cuatro ejemplos, las cuatro propiedades de la distribución
binomial se satisfacen claramente. Para el ejemplo de la ruleta, se puede construir un
conjunto particular de giros como muestra tomada de un conjunto particular de giros
sin reemplazo. Al girar la rueda de la ruleta, cada observación se clasifica como rojo
(éxito) o no rojo (fracaso). La probabilidad de girar en rojo, p, en una rueda de ruleta
es de 18/37 y se supone que permanece estable durante todas las observaciones. Por
tanto, la probabilidad de fracaso (girar negro o verde), 1 -p, es 19/37 cada vez que la
rueda de la ruleta gira. Además, la rueda de la ruleta no tiene memoria, el resultado de
cualquier giro es independiente de los giros precedentes o siguientes, así que, para el
ejemplo, la probabilidad de obtener rojo en el 320, giro, dado que los 31 giros
anteriores fueron todos rojos, siguen siendo igual a p, 18/37, si la rueda de la ruleta
está bien calibrada.
En el ejemplo del control de calidad, la muestra de llantas también se
selecciona sin reemplazo de un proceso de producción continuo, una población infinita
de llantas fabricadas.1 Al inspeccionar cada llanta, se clasifica como defectuosa o no
defectuosa de acuerdo con la definición operacional de las especificaciones que se han
desarrollado previamente. En toda la muestra de llantas, la probabilidad de que
cualquier llanta se clasifique como defectuosa, p, es 0.08, así que la probabilidad de
que cualquier llanta se clasifique como no defectuosa, p, es 0.92. (Observe que cuando
buscamos llantas defectuosas, el descubrimiento de tal evento se considera como éxito.
Éste es uno de los casos a los que hicimos anteriormente referencia en los que, por
propósitos estadísticos, el término "éxito" puede referirse a fracasos comerciales,
Población y muestra
10
decesos debidos a una enfermedad particular y otros fenómenos que, en terminología
no estadística, se considerarían fracasos.) El proceso de producción se supone estable.
Además, para tal proceso de producción, la probabilidad de que una llanta se clasifique
como defectuosa o no defectuosa es independiente de la clasificación de cualquier otra
llanta.
También se pueden hacer afirmaciones similares referentes a las características
de la distribución binomial en el ejemplo de educación y en el ejemplo de finanzas.
Los cuatro ejemplos de modelos de probabilidad binomial anteriormente
descritos se distinguen por los parámetros n y p. Cada vez que se especifica un
conjunto de parámetros, el número de observaciones en la muestra, n, y la probabilidad
de éxito, p, puede generarse una distribución de probabilidad binomial particular.
____________________________
Desarrollo del modelo matemático
Como otro ejemplo de un fenómeno que satisface las condiciones de la
distribución binomial y que es conveniente para inferir intuitivamente una expresión
para las probabilidades que surgen en problemas binomidales, tomando en cuanta al
tiro de un dado no cargado, se considera que el éxito es la cara del 5 y el fracaso
cualquier otro resultado. Suponga que ahora estamos interesados en tres tiros de este
mismo dado con el fin de determinar la frecuencia con la que se obtiene la cara del 5.
¿Qué podría ocurrir? Ninguno de los tiros podría caer en 5; uno de los tiros podría caer
en 5; dos de los tiros podría caer en 5; o los tres tiros podrían caer en 5. ¿Puede la
variable aleatoria binomial, el número de caras 5 que ocurren en tres tiros de un dado
no cargado, tomar cualquier otro valor? Eso sería imposible, puesto que si tiramos el
mismo dado tres veces y estamos interesados en la frecuencia con la que ocurre un
valor particular (la cara 5 ) ese valor no puede exceder el mismo númro de tiros n, y
tampoco puede ser menor que cero. Por tanto, el alcance de una variable aleatoria
binomial va de O a n.
Suponga entonces, por ejemplo, que arrojamos un dado no cargado tres veces y
observamos el siguiente resultado:
Primer tiro
5
Segundo tiro
no 5
Tercer tiro
5
Ahora deseamos determinar la probabilidad de esta ocurrencia; es decir, ¿cuál es la
probabilidad de obtener dos éxitos (cara 5 ) en tres tiros en la anterior secuencia
particular? Puesto que puede suponerse que arrojar dados es un proceso estable, la
probabilidad de que cada tiro ocurra de la manera anterior es
Primer tiro
p = 1/6
Segundo tiro
1- p = 5/6
Tercer tiro
p = 1/6
Puesto que cada resultado es independiente de los otros, la probabilidad de obtener la
secuencia dada es
p (1 -p)p = p2 (1- p)l ; p2 (1- p) = (1/6)2 (5/6) = 5/216
Población y muestra
11
Así, de 216 resultados posibles e igualmente probables de arrojar un dado no cargado
tres veces, cinco tendrán la cara 5 como primer y último tiro, con una cara distinta de 5
(es decir, 1, 2, 3, 4 ó 6) como tiro medio, y se obtendrá la secuencia particular anterior.
Ahora, sin embargo, podemos preguntamos cuentas secuencias diferentes hay
para obtener dos caras 5, de n = 3 tiros del dado, usando la regla de combinaciones
dada por la ecuación siguiente, tenemos
n
n!
X
( n – X)!
=
3!
= 3
2! (3 –2)!
de tales secuencias. Estas tres secuencias posibles son:
Secuencia 1 = 5; No 5; 5 con probabilidad p (1 -p)p = p2 (1- p)l = 5/216
Secuencia 2 = 5; 5; No 5 con probabilidad pp (1 -p) = p2 (1- p)l = 5/216
Secuencia 3 = No 5; 5; 5 con probabilidad (1 -p) pp = p2 (1- p)l = 5/216
Por consiguiente, la probabilidad de obtener exactamente dos caras de 5 de tres tiros
de un dado es igual a
(número de secuencias posibles) x (probabilidad de una secuencia particular)
(3) x (5/216)= 15/216 = 0.0694
Puede obtenerse una inferencia intuitiva similar para los otros tres resultados posibles
de la variable aleatoria, ninguna cara 5 una cara 5, las tres caras 5. Sin embargo, al
crecer n, el número de observaciones, este tipo de enfoque intuitivo se vuelve bastante
laborioso, y es más apropiado un modelo matemático. En general, el siguiente modelo
matemático representa la distribución de probabilidad binomial para obtener el número
de éxitos (X), dado un conocimiento de los parámetros n y p:
donde P ( X = x/n, p) = la probabilidad de que X = x, dado un conocimiento de n y p.
n = tamaño de muestra
p = probabilidad de éxito
1- p = probabilidad de fracaso
x = número de éxitos en la muestra (X = 0, 1,2; ..., n) !
Observamos, sin embargo, que la forma generalizada mostrada en la ecuación
es simplemente una reformulación de lo que habíamos inferido intuitivamente.
La variable aleatoria binomial X puede tener cualquier valor entero de O a n.
En la ecuación anterior el producto
px (1 -p)n-x
Población y muestra
12
nos dice la probabilidad de obtener exactamente x éxitos de n observaciones en una
secuencia particular, mientras que el término
n!
x!(n- x)!
nos dice cuántas secuencias de arreglos (es decir, combinaciones) de los x éxitos de n
observaciones son posibles. Por tanto, dado el número de observaciones n y la
probabilidad de éxito p, podemos determinar la probabilidad de x éxitos:
p ( X = x/n, p) = (número de posibles secuencias)
x (probabilidad de una secuencia particular)
=
px ( 1 – p)n-x
n!
x! (n -x)!
sustituyendo los valores deseados para n, p y x y calculando el resultado.
Por tanto, como se mostró anteriormente, la probabilidad de obtener
exactamente dos caras de 5 de tres tiros en un dado es
P ( X = 2/n = 3, p = 1/6) =
(1/6)2 (1 – 1/6)3-2
3!
2! (3 – 2)!
=
3!
(1/6)2 (5/6)1
2! 1!
= 3 (1/6) (1/6) (5/6) = 15/216
= 0.0694
Tales cálculos pueden ser bastante tediosos, especialmente al crecer n. Sin embargo,
podemos obtener las probabilidades directamente de la tabla de probabilidades
binomial o usar software estadístico, evitando así cualquier complicación de cálculo.
La tabla citada proporciona, para diversas combinaciones seleccionadas de los
parámetros n y p, las probabilidades de que la variable aleatoria binomial tome los
valores de X = 0,1,2, ..., n. Sin embargo, el lector debe advertir que los valores para p
en la tabla se toman con sólo dos lugares decimales; por lo que, en algunas
circunstancias, debido a errores de redondeo, las probabilidades sólo serán
aproximaciones del resultado verdadero. En relación con esto, en nuestro experimento
de tiro de dados, primero encontramos en la tabla, la combinación n = 3 con p
redondeada a 0.17. Para obtener la probabilidad aproximada de exactamente dos
éxitos, leemos la probabilidad correspondiente a la fila X = 2, y el resultado es 0.0720
(como se demuestra en la tabla). Por tanto, la tabla nos ha dado una respuesta
aproximada a la probabilidad real, 0.0694, obtenida de la ecuación usando la fracción
1/6 =p, en vez del valor decimal redondeado 0.17.
Población y muestra
13
Muestra de tabla de probabilidad binomial.
Características de la distribución binomial
Cada vez que se especifica un conjunto de parámetros, n y p, puede generarse
una distribución de probabilidad binomial particular. Esto puede verse fácilmente
examinando la tabla para diversas combinaciones de n y p.
Forma: Observamos que una distribución binomial puede ser simétrica o sesgada.
Siempre que p = .S, la distribución binomial será simétrica sin importar qué tan grande
o pequeño sea el valor de n. Sin embargo, cuando p  0.5, la distribución estará
sesgada. Mientras más cercana esté p de 0.5 y mayor sea el número de observaciones,
n, menos sesgada será la distribución.
Así, la distribución del número de ocurrencias de rojo en 19 giros de la rueda de la
ruleta sólo está ligeramente sesgada a la derecha, puesto que p = 18/37. Por otra parte,
con una p pequeña, la distribución estará ligeramente sesgada a la derecha, como se
observa en la distribución del número de llantas defectuosas en una muestra de 20,
donde p = 0.08. Para p muy grandes, la distribución sería altamente sesgada a la
izquierda.
El lector podrá verificar el efecto de n y p en la forma de la distribución
graficando el histograma en el problema 3.3 al final de la unidad. Sin embargo, para
resumir las anteriores características, se describen tres distribuciones binomiales en la
figura 3.1 siguiente. El panel A representa la probabilidad de obtener la cara 5 en tres
tiros de un dado no cargado; el panel B representa la probabilidad de obtener "caras"
en tres lanzamientos de una moneda no cargada; y el panel C representa la
probabilidad de obtener "caras" en cuatro lanzamientos de una moneda no cargada.
Por tanto, una comparación del panel A con el B demuestra el efecto en la forma
cuando los tamaños de muestras son iguales pero las probabilidades de éxito difieren.
Además, una comparación del panel B con el C muestra el efecto de la forma cuando
las probabilidades de éxitos son iguales pero los tamaños de las muestras difieren.
La media: La media de la distribución binomial puede obtenerse fácilmente como el
producto de sus dos parámetros, n y p. Es decir, en vez de usarla ecuación que se
expuso primeramente, que se cumple para todas las distribuciones de probabilidad
discreta, para los datos que se distribuyen binomialmente sólo calculamos
Población y muestra
14
Figura 3.1
Intuitivamente, esto tiene sentido. Por ejemplo, si giramos la rueda de la ruleta
19 veces, ¿con qué frecuencia debemos "esperar" que salga el color rojo? En
promedio, a la larga, teóricamente esperaríamos
μ x = E(X) = np = (19) 18/37 = 9.24
ocurrencias de rojo en 19 giros, el mismo resultado que obtendríamos de la expresión
más general mostrada en la ecuación
N
μ x = E(X) = Σ
Xi P( Xi)
i=1
La desviación: están dar La desviación están dar de la distribución binomial, se
calcula usando la fórmula
refiriéndose al ejemplo de la ruleta, se calcula
Población y muestra
15
σx = √ (19) (18/37) (19/37) = √ 4.75 = 2.18
Distribución de Poisson
La Distribución de Poisson es otra función de distribución de probabilidad
que tiene muchas aplicaciones prácticas importantes. Un proceso de Poisson no sólo
representa numerosos fenómenos discretos, sino que el modelo de Poisson también se
usa para proporcionar aproximaciones a la distribución binomial.
Los siguientes son algunos ejemplos de fenómenos con distribución de Poisson:
 Número de llamadas por hora que llegan al conmutador de una central de
policía.
 Número de llegadas de autos al día en un puente de peaje
 Número de huelgas industriales importantes al año en el Reino Unido.
 Número de chispas por galleta en un paquete de galletas de chispas de chocolate
 Número de manchas en una metro de tela.
 Número de defectos por lote en un proceso de producción.
En cada uno de los casos anteriores, la variable aleatoria discreta, número de
"éxitos" por unidad (es decir, por intervalo de tiempo, longitud, área, etc.) es
representante de un proceso de Poisson.
Se dice que un proceso de Poisson existe si podemos observar eventos
discretos en un área de oportunidad, un intervalo continuo (de tiempo, longitud, área,
etc.), de tal manera que si acortamos el área de oportunidad o intervalo de manera
suficiente
1) La probabilidad de observar exactamente un éxito en el intervalo es estable.
2) La probabilidad de observar exactamente más de un éxito en el intervalo es o.
3) La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente
de aquella en cualquier otro intervalo.
Para comprender mejor el proceso de Poisson, suponga que examinamos el
número de clientes que llegan durante la hora del almuerzo de 12 a 13 Hs. a un banco
localizado en el distrito comercial central de una ciudad grande. Cualquier llegada de
un cliente es un evento discreto en un punto particular sobre el intervalo continuo de
una hora. Durante tal intervalo de tiempo puede haber un promedio de 180 llegadas.
Ahora, si tuviéramos que dividir el intervalo de una hora en 3600 intervalos
consecutivos de un segundo,
1) El número (o promedio) esperado de clientes que llegan en cualquier intervalo de
segundos sería .05.
2) La probabilidad de que más de un cliente llegue en cualquier intervalo de un
segundo es 0.
3) La llegada de un cliente en cualquier intervalo de un segundo no tiene efecto sobre
(es decir, es estadísticamente independiente de) la llegada de cualquier otro cliente en
cualquier otro intervalo de un segundo.
__________________
Población y muestra
16
El modelo matemático
Es interesante observar que la distribución de Poisson ha introducido un
parámetro, que denominaremos λ (la letra minúscula griega lambda). Mientras que la
variable aleatoria de Poisson X se refiere al número de éxitos por unidad, el parámetro
λ se refiere al promedio o número esperado de éxitos por unidad, Además,
observamos que en teoría la variable aleatoria de Poisson varía en rangos de 0 a ∞.
La expresión matemática para la distribución de Poisson para obtener X éxitos, dado
que se esperan λ éxitos, es
P (X = x | λ) = e-λ λx
x!
donde P (X =x | λ) = la probabilidad de que X = x dado que se conoce λ
λ = número esperado de éxitos
e = constante matemática aproximada por 2.71828
x = número de éxitos por unidad
____________
Características
Forma: Cada vez que se especifica el parámetro A, puede generarse una distribución
de probabilidad de Poisson específica. Una distribución de Poisson estará sesgada a la
derecha cuando λ es pequeña, y se aproximará a la simetría (con un pico en el centro)
al crecer λ.
La media y la desviación estándar Una propiedad interesante de la distribución de
Poisson es que la media μx y la varianza σ2 son cada una iguales al parámetro λ. Por
tanto,
y
Aplicaciones del modelo de Poisson
Para demostrar las aplicaciones del modelo de Poisson, regresemos al ejemplo de la
llegada de clientes al banco a la hora del almuerzo: si, en promedio, .OS clientes'
llegan por segundo, ¿cuál es la probabilidad de que en un minuto dado lleguen exac.
tamente dos clientes? ¿Cuál es la probabilidad de que más de dos clientes lleguen en
un minuto dado?
Para resolver esto debemos convertir los segundos en minutos.
Población y muestra
17
Llegadas
por segundo
0.05
Conversiones
Llegadas
Llegadas
por minuto
por hora
3.0
180.0
Llegadas
por día
4.320,0
λ, el número esperado de llegadas por minuto, es 3.0. Ahora, usando la ecuación
matemática del modelo, tenemos, para la primera pregunta
P (X = 2 | λ = 3.0) =
e-3.0 (3.0)2 =
2!
9
= 0.2240
(2.17828)3 (2)
Afortunadamente, los cálculos manuales no son necesarios aquí. Refiriéndose a la
tabla de distribución de Poisson, puede obtenerse el resultado. Como se muestra en la
tabla siguiente, sólo se necesitan los valores de λ y x. Por tanto, la probabilidad de que
lleguen exacta- mente dos clientes, dado que se esperan 3.0, es 0.2240.
Tabla para obtención de una probabilidad de Poisson.
Para responder la segunda pregunta, la probabilidad de que en cualquier minuto dado
lleguen más de dos clientes, tenemos
P(X >2 | λ = 3.0) = P(X = 3 | λ = 3:0)+ P(X = 4 | λ = 3.0)+ L + P(x = ∞ | λ = 3.0)
Puesto que todas las probabilidades en una distribución de probabilidad deben sumar
1, los términos a la derecha de la ecuación pueden expresarse como
1- P(X ~ 2 | λ = 3.0)
Por tanto,
P(X >2 | λ = 3.0) = 1- {P(X =0 | λ = 3.0) + P(X = 1 | λ = 3.0) + P(X =2 | λ =3:0)}
Población y muestra
18
Ahora, usando la ecuación de poisson tenemos
De la tabla de probabilidad podemos obtener fácilmente las probabilidades de 0, 1 o 2
éxitos, dada una media de 3.0 éxitos. Así,
P(X > 2 | λ = 3.0) = 1- {0.0498 + 0.1494 + 0.2240} =
= 1 - 0.4232
= 0.5768
Por consiguiente, vemos que existe apenas un 42.3% de probabilidad de que dos o
menos clientes lleguen al banco por minuto. Así pues, existe un 57.7% de que lleguen
tres o más clientes.
Uso de la distribución de Poisson para aproxima la distribución binomidal
Para aquellas situaciones en las que n es grande ( 20 ) y p es muy pequeña
( 0.05), la distribución de Poisson puede usarse para aproximar la distribución
binomial; En la ecuación de la distribución binomial se ve claramente que al crecer n,
los cálculos para la distribución binomial se hacen tediosos. Sin embargo, en las
situaciones en las que p también es muy pequeña, puede usarse la siguiente expresión
matemática para el modelo de Poisson a fin de aproximar el resultado (binomial)
verdadero:
P(X = x\n ,p) 
e-np (np)x
X!
donde p (X = x\n, p) = la probabilidad de que X =x dado que se conoce n y p
n = tamaño de muestra
p = probabilidad verdadera de éxito
e = base del sistema Neperiano (natural), una constante matemática aproximada
por 2.71828
x = número de éxitos en la muestra
Se observó que la variable aleatoria de Poisson puede variar teóricamente de O
a ∞, Sin embargo, cuando se usa como una aproximación a la distribución binomial, la
variable aleatoria de Poisson, el número de éxitos de n observaciones, claramente no
puede exceder el tamaño de muestra n. Además, con una gran n y una pequeña p, la
ecuación, implica que la probabilidad de observar un gran número de éxitos se hace
pequeña y se aproxima a cero bastante rápido. Debido al severo grado de sesgo a la
derecha en esta distribución de probabilidad, no surge ninguna dificultad al aplicar la
aproximación de Poisson a la binomial.
Población y muestra
19
Características: Como se mencionó previamente, una característica interesante sobre
la distribución de Poisson es que la media μx y la varianza σ2; son cada una iguales a λ.
Por tanto, al usar la distribución de Poisson para aproximar la distribución binomial,
podemos calcular la media:
y podemos aproximar la desviación estándar
Distribución Normal
Importancia de la distribución normal
La distribución normal es de vital importancia en estadística por tres razones
principales:
1. Numerosos fenómenos continuos parecen seguirla o pueden aproximarse mediante
ésta.
2. Podemos usarla para aproximar diversas distribuciones de probabilidad discreta y
evitar así pesados cálculos.
3. Proporciona la base de la inferencia estadística clásica debido a su relación con el
teorema del límite central.
Propiedades de la distribución normal
La distribución normal tiene varias propiedades teóricas importantes. Entre éstas están
1. Tiene forma de campana y es simétrica en apariencia.
2. Sus mediciones de tendencia central (media, mediana, moda, alcance ~ medio y eje
medio) son todas idénticas.
3. Su "dispersión media" es igual a 1.33 desviaciones estándar. Es decir, el alcance
intercuartil está contenido dentro de un intervalo de dos tercios de una desviación
estándar por debajo de la media a dos tercios de una desviación estándar por encima de
la media.
4. Su variable aleatoria asociada tiene un alcance infinito ( -∞ < X < + ∞).
En la práctica, algunas de las variables que observamos sólo pueden aproximar estas
propiedades teóricas. Esto ocurre por dos razones: (1) la distribución de población
subyacente sólo puede ser aproximadamente normal y (2) cualquier muestra real puede
desviarse de las características teóricamente esperadas. Para algún fenómeno que
puede aproximarse mediante el modelo de distribución normal:
1. Su polígono sólo puede ser aproximadamente de forma de campana y simétrico en
apariencia.
2. Sus mediciones de tendencia central pueden diferir ligeramente entre Sí.
Población y muestra
20
3. El valor de su alcance intercuartil puede diferir ligeramente de 1.33 , desviaciones
estándar.
4. Su alcance práctico no será infinito pero generalmente caerá dentro de 3
desviaciones estándar por encima y por debajo de la media. (Es decir, alcance ≈ 6
desviaciones estándar.)
A este respecto, la figura siguiente, que describe el polígono e Histograma de
frecuencia relativa para la distribución del grosor de 10000 lavadoras de metal. Para
estos datos, las primeras tres propiedades teóricas de la distribución normal parecen
haberse satisfecho; sin embargo, la cuarta no se cumple. La variable aleatoria de
interés, el grosor, no puede tomar los valores de cero o menores, y una lavadora
tampoco j puede ser tan gruesa que se vuelva inutilizable. Se observa que sólo 48 de
cada 10000 lavadoras de metal fabricadas puede esperarse que tengan un grosor de
0.0202 pulgadas o más, mientras que puede esperarse que un número igual tenga un
grosor por debajo de 0.0180 pulgadas. Por tanto, la probabilidad de obtener
aleatoriamente una lavadora tan delgada o tan gruesa es de 0.0048 + 0.0048 = 0.0096,
o casi 1 en 100.
Se deja al lector verificar que puede esperarse que 99.04% de estas lavadoras
fabricadas tengan un grosor de entre 0.0180 y 0.0202 pulgadas, es decir, 2.59
desviaciones estándar (distancias) por encima y por debajo de la media.
El modelo matemático
El modelo o expresión matemática que representa una función de densidad de
probabilidad se denota mediante el símbolo f(X). Para la distribución normal, el
modelo usado para obtener las probabilidades deseadas es
donde
Población y muestra
21
e es la constante matemática aproximada por 2.71828
π es la constante matemática aproximada por 3.14159
μx es la media de población
σx es la desviación estándar de población
X es cualquier valor de la variable aleatoria continua, donde -∞<x<+ ∞
Examinemos los componentes de la función de densidad de probabilidad
normal de la ecuación Puesto que e y π son constantes matemáticas, las
probabilidades de la variable aleatoria X dependen sólo de dos parámetros de la
distribución normal, la media de la población μx y la desviación estándar de la
población σx.. Cada vez que especificamos una combinación particular de μx y σx, se
generará una distribución de probabilidad diferente. Se ilustra esto en la figura
acontinuación, donde se describen tres distribuciones normales diferentes. Las
distribuciones A y B tienen la misma media ( μx ) pero tienen diferentes desviaciones
estándar. Por otra parte, las distribuciones A y C tienen la misma desviación estándar
(σx), pero tienen diferentes medias. Además, las distribuciones B y C describen dos
funciones de densidad de probabilidad normal que difieren tanto de μx como de σx.
Desafortunadamente, la expresión matemática de la ecuación es tediosa en
cuanto a su cálculo. Para evitar tener que hacer tales cálculos, sería útil disponer de un
conjunto de tablas que proporcionaran las probabilidades deseadas. Sin embargo,
como existe un número infinito de combinaciones de los parámetros μx y σx se
requeriría un número infinito de estas tablas.
Tres distribuciones normales con parámetros diferentes.
Estandarización de la distribución normal
Afortunadamente, al estandarizar los datos, sólo se necesitaría una tabla de
distribución normal. Al usar la formula de transformación:
cualquier variable aleatoria normal X se convierte en una variable aleatoria normal
estandarizada Z. Mientras los datos originales para la variable aleatoria X tenían una
media μx y una desviación estándar σx , la variable aleatoria estandarizada Z siempre
tendrá una media μx = 0 y una desviación estándar σx = 1.
Población y muestra
22
Una distribución normal estandarizada es una distribución cuya variable aleatoria Z
siempre tiene una media μx = 0 y una desviación estándar σx = 1.
Sustituyendo en la primera ecuación , vemos que la función de densidad de
probabilidad de una variable normal estándar Z es
Por eso, siempre podemos convertir cualquier conjunto de datos normalmente
distribuidos a su forma estandarizada y después determinar cualquier probabilidad
deseada a partir de una tabla de la distribución normal estandarizada.
Ejemplos Básicos
a) Distribución del peso de 1os estudiantes varones.
(En este caso la población está constituida solo por los estudiantes varones,
porque con respecto a la variable pesos 'se distinguen dos poblaciones diferentes por
sexo. Tanto es asi que si se observa la distribución de los pesos para el total, ésta
resulta claramente bi-modal, circunstancia que induce a pensar en una mezcla de dos
poblaciones diferentes, con distinta forma, distinta media, varianza, etc. ).
Intervalo
48
52
52
56
56
60
60
64
64
68
68
72
72
76
76
80
80
84
84
88
88
92
92
96
Frecuencia
6
9
22
72
101
123
110
52
61
41
9
6
 = 71.2 kg
 = 8.40 kq
Mediana = 70 kg
Población y muestra
Frec. relativa
0.01
0.015
0.036
0.117
0.165
0.201
0.180
0.085
0.100
0.066
0.015
0.010
n = 612
Max = 95 kg
Min = 50 kg
23
Modo = 70 kg
Ql = 65 kg
Q3 = 77 kg
(Las medidas de posición y dispersión fueron calculadas con la serie simple de
los originales, de allí las pequeñas diferencias que pueden surgir si se las calcula con
los datos agrupados)
Distribución de Frecuencia
Frecuencia
150
100
50
0
48 52 56 60 64 68 72 76 80 84 88 92
Peso
Se puede estar de acuerdo en afirmar que la variable "peso de los estudiantes varones"
tiene aproximadamente una distribución normal con media igual a 71.2 y desviación
estándar igual a 8.4? (Recuerde las características de la distribución normal, su gráfica,
sus medidas de asimetría, la distribución de probabilidades alrededor de la media...) y
que podría describirse con una función como la siguiente:
(x-71.2)2
- 2(8.4)2
f(x)=
1
e
X ~ N(71.2,8.4)
8.4 √2π
b) Distribución de los estudiantes según trabajen o no.
Condición
No trabajan
Trabajan
Población y muestra
Variable
0
1
Frecuencia
528
521
1049
Frecuencia relativa
0.503
0.497
100
24
Variable
Distribución de Frecuencias
1
0
0,48
0,5
0,52
Frecuencia
Y la condición de trabajar puede describirse para una variable bipuntual.
En el caso de la variable aleatoria muestral, si en esas poblaciones se selecciona
una observación al azar, se genera una "observación muestral", que es una variable
aleatoria (puede asumir diferentes valores, con sus respectivas probabilidades). ¿Cuál
es la distribución de probabilidades de esta observación muestral? Esta tiene
naturalmente las mismas características que la variable aleatoria poblacional, de la
población de donde proviene. Por ejemplo un estudiante seleccionado al azar (entre los
varones), tendrá probabilidades referidas al peso distribuidas igual que las de la
población de la cual proviene.
¿Cuál es la probabilidad de que su peso esté comprendido entre 68 y 72 kg?
Mediante la distribución de frecuencias de su población, podemos responder que esta
probabilidad es igual a 0.20. Si aceptamos que la distribución normal (71.2, 8.4) es una
buena aproximación, calculamos la probabilidad teórica:
P(68 < x < 72) = P(-0.38 < z < 0.095) = 0.19.
Es decir. la población estudiada tiene 123 estudiantes con un peso en el intervalo
mencionado. De acuerdo a la distribución teórica aproximada se podría esperar 116
estudiantes en el mismo intervalo.
Seleccionado al azar un estudiante en la población total (1049), ¿Cuál es la
probabilidad de que trabaje?
P (trabaje) = P( Y=1) = 0.497
Podría llamarse x1 o y1 a la variable aleatoria correspondiente a esa primera
observación muestral. Si luego de reponerse ésta, se efectúa otra elección, se llamará
x2 (o Y2) a esa segunda observación muestral, y así sucesivamente hasta obtener n
observaciones muestrales. La distribución de cada una de estas variables aleatorias,
será también idéntica a la de la variable poblacional.
Población y muestra
25
1.3 Estimadores de medidas de posición y dispersión
Como cada una de las observaciones muestrales es una variable aleatoria,
resulta evidente que una función de esas observaciones, también será. Estas funciones
de las variables aleatorias muestrales se llaman estadísticos o también estimadores y
también tienen su distribución de probabilidad, su esperanza, su varianza, etc.
Los estimadores más comúnmente usados son la media muestral, la varianza
muestral, la proporción muestral. Recuérdese que los conceptos equivalentes pero
referidos a toda la población, se llaman parámetros poblacionales (media poblacional,
varianza poblacional, proporción poblacional).
N
Σ
X1
K
i=1
N
( X1 - µ)
2
p=
σ = Σ
2
µ=
N
i=1
N
N
estos con constantes para una poblaci6n determinada.
En cambio los estimadores o estadísticos correspondientes:
n
Σ
_
X=
X1
_
i=1
n
( X1 - X)2
S = Σ
2
n
i=1
x
ˆp =
n
n-1
son variables aleatorias para una población, ya que su valor dependerá de cual sea la
muestra seleccionada. Las xi que intervienen en estas fórmulas son variables aleatorias
muestrales, sus funciones también lo son. (En el caso de la proporción X también es
una variable aleatoria muestral, suma de las Yi).
Consideraciones acerca de las distribuciones en el muestreo
Desigualdad de Chebychev y su aplicación a la media muestral y proporción muestral
Se trata de un hallazgo muy importante en la teoría estadística, que estudia la
variabilidad de las observaciones alrededor de la media en cualquier tipo de
distribución. Puede enunciarse como sigue:
“Sea una variable aleatoria X, cualquiera sea si distribución de probabilidad,
con media (µ) y varianza (σ2) finitas, entonces puede afirmarse que la probabilidad
que se presenten valores de la variable que se alejen de su media en más de una
magnitud arbitraria e, no supera a la varianza por e2”
Población y muestra
26
En símbolos:
P( | x - µ |  e) 
σ2 / e2
La zona sombreada representa la P( | x - µ |  e)
Esto significa que, aún sin conocer la distribución de probabilidad de una
variable, si se conoce su varianza es posible acotar la probabilidad de que ocurran
desvíos con respecto a la media mayores que e. Esa probabilidad disminuye al
disminuir la v(x).
Es fácil advertir que la desigualdad también puede expresarse referida al evento
complementario: que se produzcan desviaciones con respecto a la media a lo sumo
iguales a e:
P( | x - µ | < e)  1 - σ2 / e2
Y si e se expresa en unidades de desviación estándar (por ejemplo 2 veces σ ó 1.5
veces σ, o una vez σ) se tendrá:
P( | x - µ | < Kσ )  1 - σ2 / K 2 σ2
ó
P( | x - µ | < Kσ )  1 - 1 / K 2
Es decir: “La probabilidad que ocurran desvíos con respecto a la media
menores que k veces la desviación estándar, es por lo menos iguala 1 – 1/K2,
cualquiera sea la distribución de la variable.”
Gráficamente P( | x - µ | < Kσ ) se representa con la zona sombreada:
Población y muestra
27
Por ejemplo si k=2
P( | x - µ | < 2σ )  1 - 1 / 2 2 = 0.75
Cualquiera sea la forma de la distribución de una variable, en el intervalo µ  2σ se
encuentra por lo menos el 75% de las observaciones ( o probabilidades). Recuérdese
que, si a variable tiene distribución normal, se calcula exactamente que en el intervalo
µ  2σ se encuentra el 95.45% de las observaciones.
De acuerdo a la desigualdad de Chebychev, se establece que esa probabilidad no será
inferior al 0.75 cualquiera sea la distribución en la población.
Población y muestra
28
Descargar