Apuntes Estadistica Inferencial

Anuncio
UNIDADES TECNOLÓGICAS DE SANTANDER
APUNTES DOCENTES
ASIGNATURA: ESTADISTICA INFERENCIAL
PROFESOR: CARMENSOLANGE LUGO BUITRAGO
Ing. De Sistemas Especialista en Estadística
TP 68255125305STD
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
PRIMER CAPÍTULO: PROBABILIDADES
1. CONCEPTOS
ALEATORIOS
DE
SUCESOS
DETERMINÍSTICOSY
SUCESOS
Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de altura, velocidad, etc.,
sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc. Esta es una EXPERIENCIA
DETERMINISTA.
Si al contrario lanzamos un dado sobre una mesa, ignoramos qué cara quedará arriba. El resultado depende
del azar. Esta una EXPERIENCIA ALEATORIA.
En general los experimentos o fenómenos aleatorios son los que no se puede predecir el resultado final,
hablamos pueden dar lugar a varios resultados, sin que pueda ser previsible enunciar con certeza cuál de
éstos va a ser observado en la realización del experimento.
2. LA INCERTIDUMBRE Y EL EXPERIMENTO ALEATORIO
En estadística se pueden presentar casos en los que es difícil predecir un resultado, por varios factores
externos como, falta de información, desacuerdo en conceptos, indecisión etcétera, es por ello que se habla
de INCERTIDUMBRE. Algunos autores distinguen la Matemática de la Estadística como la ciencia de la
certeza y de la incertidumbre, caracterizando a la estadística como una ciencia que busca establecer los
límites de la incertidumbre y no como una rama de la matemática.
Las situaciones prácticas que envuelven incertidumbre son los llamados experimentos aleatorios.
3. CONCEPTOS DE ESPACIO MUESTRAL, RESULTADO O PUNTO
MUESTRAL, EVENTO O SUCESO
En estadística se contempla como EXPERIMENTO la descripción de cualquier proceso que genere un
conjunto de datos un ejemplo puede ser las opiniones de los votantes respecto de un impuesto sobre las
ventas. En estos casos lo importante son las observaciones que se tiene por la repetición del experimento
varias veces. La mayor parte de los casos los resultados dependen del azar por tanto su predicción no tiene
certeza, si el experimento se realiza varias veces con las mismas condiciones se obtendrán diferentes
medidas, que mostraran un elemento de probabilidad en el procedimiento experimental.
Cada una de las posibles soluciones que se pueden presentar en un experimento se considera como
SUCESO, por tanto el suceso es el resultado particular proveniente de un experimento.
Un ejemplo claro de suceso se evidencia al sacar cara cuando se lanza una moneda.
Cuando se agrupa uno o más sucesos hablamos de EVENTO, un ejemplo lo tenemos al sacar número par al
lanzar un dado 2, 4, 6 tres resultados posibles satisfacen el evento.
En un estudio estadístico tratamos de interpretar los resultados fortuitos que ocurren en un estudio planeado,
por ejemplo al registrar el número de accidentes que ocurren mensualmente en la diagonal 15 con quebrada
seca de la ciudad de Bucaramanga, con la finalidad de justificar la instalación de un semáforo; o al clasificar
los artículos que salen de una unidad de ensamble como “defectuosos” o “no defectuosos”, o al revisar el
volumen de gas que se libera de una reacción química cuando se cambia la concentración de un ácido. Con
los datos anteriores ya sean numéricos o categóricos registramos una OBSERVACIÓN.Por tanto definimos
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
como ESPACIO MUESTRAL al conjunto de todos los posibles sucesos elementales de un experimento y su
identificación en Estadística se trabaja como S.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Ejemplos:
Experimento
Seleccionar un estudiante del salón y registrar
su nacionalidad
Lanzar una moneda balanceada
Lanzar un dado no cargado
Lanzar un par de dados no cargados
Medir el pH de una sustancia
Seleccionar 4 personas del grupo y realizarles
la prueba para detectar el virus AH1N1
Jugar el baloto
Revisar artículos de la producción
encontrar el segundo defectuoso
hasta
Espacio Muestral
S = {colombiano}
S = {cara,sello}
S = {1,2,3,4,5,6}
S = {(x,y): 1 <x <6; 1 <y <6}
S = {x: 0<x<14} ó {rojo, azul}
S = {eees, eeee, eese, eess, eses, esee, esse,
esss, sees, seee, sese, sess, sses, ssee, ssse,
ssss} s:sano e:enfermo 16 posibilidades
2x2x2x2
S ={ ¿? }8'145.060 posibilidades de
combinaciones de 6 números de los 45 posibles
45C6
S ={ ¿? }mínimo 2, sigue al infinito
n=2,3,4,5,6, ....., infinito porque no se sabe si
alguna vez en el futuro aparecerá algún otro
defectuoso, para que aparezcan dos
defectuosos, mínimo debe revisar dos artículos
4. CONCEPTO DE PROBABILIDAD
La probabilidad es una medida de la posibilidad de que algo suceda.Una probabilidad es una medida
numérica del grado de ocurrencia de un evento, esta medida está en relación con la proporción de veces
que se espera el evento ocurra cuando es repetido muchas veces.
5. ASIGNACIÓN DE PROBABILIDADES
RELATIVA, PROBABILIDAD SUBJETIVA
CLÁSICA,
FRECUENCIA
Las probabilidades deben calcularse para tener argumentos que nos permitan predecir el resultado a un
experimento y insistimos que esto se hace necesario sólo cuando los experimentos admiten más de un
resultado posible.
LA ESCALA DE PROBABILIDAD
+----------------------------+----------------------------+
0
0.5
1
Evento Imposible
Es igualmente probable
Evento seguro
que ocurra o que no ocurra
NUNCA SE CONSIDERAN PROBABILIDADES NEGATIVAS
Conviene analizar dos perspectivas para asignar probabilidades:
Los enfoques objetivo y subjetivo. La probabilidad objetiva se divide en probabilidad clásica y
probabilidad empírica
ENFOQUE OBJETIVO
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
PROBABILIDAD CLÁSICA:Parte del supuesto de que los resultados de un experimento son igualmente
posibles a esto se denomina equiprobables,
Si el espacio muestral es equiprobable no es necesario lanzar una moneda, un dado o tomar una carta.
No tenemos que efectuar experimentos para poder llegar a conclusiones simplemente justificamos por qué
los diferentes resultados en el espacio muestral son equiprobables. Lo interesante es que si lo hacemos, los
valores calculados siguiendo la ley de Laplace (Cada uno de los resultados aquí deben ser igualmente
posibles) son precisamente el valor límite de las frecuencias relativas.
Este planteamiento de la probabilidad tiene serios problemas cuando intentamos aplicarlo a los problemas
de toma de decisiones menos previsibles. El planteamiento clásico supone un mundo que no existe, supone
que no existen situaciones que son bastante improbables pero que podemos concebir como reales.
Probabilidad
Número de casos exitosos
Clásica = Número de casos posibles
Ejemplo: Para un físico una moneda podría caer de lado!
La lotería de Santander=
Casos posibles # ganador
serie
____ ____ ____ _____
10 10 10 10
____ ___
10 10
10^6 posibilidades de ganar = 1/10[6=0.000001
Como se ve todos los resultados de la lotería tienen la misma posibilidad de ocurrir, el problema se reduce a
un problema de conteo por esto es bueno estudiar algunas técnicas que nos facilitarán esto y que más
adelante se estudiaran.
PROBABILIDAD EMPÍRICA O FRECUENCIA RELATIVA:Se basa en el número de veces que ocurre el
evento como proporción del número de intentos conocidos. Este método utiliza la frecuencia relativa de las
presentaciones pasadas de un evento como una aproximación de la verdadera probabilidad. Determinamos
qué tan frecuente ha sucedido algo en el pasado y usamos esa cifra para predecir la probabilidad de que
suceda de nuevo en el futuro.
Cuando utilizamos el planteamiento de frecuencia relativa para establecer probabilidades, el número que
obtenemos como probabilidad adquirirá mayor precisión a medida que aumentan las observaciones.
Una dificultad presente con este planteamiento es que la gente lo utiliza a menudo sin evaluar el número
suficiente de resultados o por ejemplo cuando se trata con seres vivos, es imposible repetir el experimento
bajo las mismas condiciones un gran número de veces.
Probabilidad = Número de veces que el evento ocurre
Empírica Número total de observaciones
El enfoque empírico de la probabilidad se basa en la llamada LEY DE LOS GRANDES NÚMEROS,(en una
gran cantidad de intentos, la probabilidad empírica de un evento se aproximará a su probabilidad real) la
clave para determinar las probabilidades de forma empírica consiste en que una mayor cantidad de
observaciones proporcionarán un cálculo más preciso de la probabilidad.
Para explicar la ley de los grandes números, suponemos que lanzamos una moneda común. El resultado de
cada lanzamiento es cara o sello, si se lanza la moneda una sola vez, la probabilidad empírica de las caras
es cero o uno. Si lanzamos la moneda una gran cantidad de veces, la probabilidad del resultado de las
caras se aproximará a 0,5.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Actividad
Utilice el applet “Coinflip” disponible en http://www.betweenwaters.com/probab/probab.html y trabaje con el,
complete la siguiente tabla según la información solicitada en cada celda. Para abreviar denotaremos Fr :
Frecuencia relativa
No. De Lanzamientos
1
10
50
100
500
1.000
10.000
# de caras
0
3
26
52
236
494
5.27
Fr (Cara)
,00
,3
,52
,52
:,472
,494
,5027
Elabore un gráfico de líneas que muestre en el eje horizontal el No. De lanzamientos y en el eje
vertical la frecuencia relativa. Luego redacte conclusiones sobre sus observaciones más importantes.
En la Figura se presenta la evolución de la frecuencia relativa del número de caras obtenido en el
lanzamiento de una moneda en 100 ocasiones (simulado por un ordenador). En principio la evolución
de las frecuencias relativas es errática, pero a medida que el número de tiradas aumenta, tiende a lo
que entendemos por probabilidad de cara.
Con este ejercicio se demuestra que a partir de la definición clásica de la probabilidad, la posibilidad de
obtener cara en un solo lanzamiento de una moneda común es de 0,5, desde el enfoque empírico de la
frecuencia relativa de la probabilidad, la probabilidad del evento se aproxima al mismo valor determinado
de acuerdo con la definición clásica de la probabilidad.
Figura: Convergencia a 1/2 de la frecuencia relativa del número de caras obtenido en lanzamientos
sucesivos de una moneda (por simulación del experimento).
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
En el siglo XIX, los estadísticos británicos, interesados en la fundamentación teórica del cálculo del riesgo de
pérdidas en las pólizas de seguros de vida y comerciales, empezaron a recoger datos sobre nacimientos y
defunciones. En la actualidad, a este p
planteamiento se le llama FRECUENCIA RELATIVA de presentación
de un evento
o y define la probabilidad como la
la frecuencia relativa observada de un evento durante un gran
número de intentos, o la fracción de veces que un evento se presenta a la larga, cuando las
la condiciones son
estables. Cuando las probabilidades se interpretan en esta forma se dice que estamos usando un enfoque
frecuentista de probabilidad.
Este razonamiento permite emplear el enfoque empírico y de la frecuencia relativa para determinar una
probabilidad.
Ejercicio
El 1 de febrero de 2003, el transbordador espacial Columbia explotó. Éste fue el segundo desastre en 113
misiones espaciales de la NASA. Con base en esta información. ¿cuál es la probabilidad de que una futura
misión concluya con éxito?
Probabilidad de vuelo exitoso= Número de vuelos exitosos = 111= 0,98
Número total de vuelos
113
En otras palabras, por experiencia la probabilidad de que una futura misión del transbordador espacial
concluya con éxito es te 0,98.
ENFOQUE SUBJETIVO
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Estas probabilidades están basadas en las creencias de las personas que efectúan la estimación de
probabilidad. Es la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que
se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia relativa de presentación de
eventos pasados o puede tratarse simplemente de una creencia meditada.
Ejemplos
Pronósticos del clima. (ver en el periódico local esta clase de pronósticos)
Calcular la posibilidad de que los patriotas de la Nueva Inglaterra jueguen en el Súper Tazón el año que
viene
Calcular la posibilidad de que usted contraiga matrimonio antes de los 30 años
Calcular la posibilidad de que el déficit presupuestario de Estados Unidos se reduzca a la mitad en los
siguientes 10 años.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Resumiendo, cómo Asignar Probabilidades?
Objetivo
Probabilidad clásica: Se basa en
resultados igualmente probables
(Equiprobables)
Probabilidad empírica: Se sustenta
en las frecuencias relativas
Para asignar una
probabilidad
Subjetivo
Parte de la inforamción disponible
opiniones, intuición, etc
Estadística Bayesiana
6. PROPIEDADES FUNDAMENTALES DE LAS PROBABILIDADES
Existen básicamente dos grandes propiedades de las probabilidades:
P(A) ≥0 : Toda probabilidad se define como mayor o igual que cero
La suma de las probabilidades es igual a uno
7. CLASES DE SUCESOS
En este estudio de probabilidades clásicas también se debe contemplar el concepto de MUTUAMENTE
EXCLUYENTE, el cual se define como el hecho de que un evento se presente significa que ninguno de los
demás eventos puede ocurrir al mismo tiempo.
Un ejemplo claro se detecta con la variable género la cual da origen a resultados mutuamente excluyentes:
hombre y mujer, una pieza fabricada es aceptable o no lo es, la pieza no puede ser aceptable e inaceptable
al mismo tiempo, en esta muestra el evento de seleccionar una pieza no aceptable y el evento de
seleccionar una pieza aceptable son mutuamente excluyentes.
SUCESOS COMPATIBLES
Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común.
Si A es sacar puntuación par al tirar un dado y B es obtener múltiplo de 3, A y B son compatibles porque el 6
es un suceso elemental común.
SUCESOS INDEPENDIENTES
Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve afectada porque
haya sucedido o no B.
Al lazar dos dados los resultados son independientes.
SUCESOS DEPENDIENTES
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya
sucedido o no B.
Extraer dos cartas de una baraja, sin reposición, son sucesos dependientes.
8. TÉCNICAS DE CONTEO
Si la cantidadde posibles resultados de un experimento es pequeña, resulta relativamente fácil contarlas, por
ejemplo los seis resultados del lanzamiento de un dado. Sin embargo, si hay un número muy grande de
resultados, tal como el número de caras y crucesen un experimento con 10 lanzamientos de una moneda,
sería tedioso contar todas las posibilidades. Todos podrían ser caras, una sello y nueve caras, dos caras y
ocho sellos, y así sucesivamente.
Existen diversas maneras de contar entre las que tenemos:
Regla de la Multiplicación
Combinaciones (no tienen orden, nCk),
Permutaciones
Para facilitar la cuenta, se analizan tres fórmulas para contar:
Fórmula de la multiplicación
Fórmula de la multiplicación = (m) (n)
Si hay m formas de hacer una cosa y n formas de hacer otra cosa, hay m x n formas de hacer ambas cosas
Ejemplo
Un distribuidor de automóviles quiere anunciar que por $60.000.000 usted puede comprar ocho modelos
diferentes entre convertibles y sedanes de diferentes categorías y elegir entre seis tipos de categorías de
rines que van desde rines de rayos hasta rines planos. Cuántas disposiciones de modelos y rines puede
ofrecer el distribuidor?
Con la fórmula de la multiplicación se diría entonces que (m)+(n)= (8)*(6)=48 posibles disposiciones
Fórmula de las permutaciones
La formula de la multiplicación se aplica para determinar el número de posibles disposiciones de dos o mas
grupos. La fórmula de las permutacionesse aplica para determinar el número de posibles disposiciones
cuando sólo hay un grupo de objetos.
Ejemplo
Tres piezas electrónicas se van a montar en una unidad conectable a un aparato de televisión. Las piezas
se pueden montar en cualquier orden. La pregunta es: ¿de cuántas formas pueden montarse tres partes?
Un orden para el primer ejemplo sería: primero el transistor, enseguida las LED y en tercer lugar el
sintetizador. A esta distribución se le conoce como permutación.
Las permutaciones están relacionadas con el orden
!
!
Cualquier distribución de r objetos seleccionados de un solo grupo de n posibles objetos,
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
donde n es el total de objetos y r el total de objetos seleccionados
Ejemplo
Respecto del grupo de tres piezas electrónicas que se van a montar en cualquier orden, ¿de cuántas formas
se puede montar?
Hay tres piezas electrónicas que van a montarse, así que n=3. Como las tres se van a insertar en la unidad
conectable, r=3. De acuerdo con la fórmula el resultado es:
nPr = n!
!=3! != 3! =3!¡= 6 ABC, BAC, CAB, ACB, BCA, CBA
(n - r)! (3-3)! 0!
1!
Con lo anterior determinamos cuántos espacios hay que llenar y las posibilidades para cada espacio. En el
problema de las tres piezas electrónicas, hay tres lugares en la unidad conectable para las tres piezas. Hay
tres posibilidades para el primer lugar, dos para el segundo (una se ha agotado) y una para el tercero.
Formula de las combinaciones
Si el orden de los objetos no es importante
Las combinaciones no tiene en cuenta el orden
!
! !
9. OPERACIONES CON PROBABILIDADES:
SUMA, COMPLEMENTO, MULTIPLICACIÓN
Una vez definida la probabilidad y descritos los diferentes enfoques se aplican algunas reglas como:
REGLA DE LA ADICION:
Existen dos reglas de la adición, la regla especial de la adición y la regla general de la adición.
REGLA ESPECIAL DE LA ADICIÓN
Para aplicarla, los eventos deber ser mutuamente excluyentes, recordemos que para que sean mutuamente
excluyentes significa que cuando un evento ocurre, ninguno de los demás eventos puede ocurrir al mismo
tiempo, un ejemplo consiste en que un producto proveniente de la línea de montaje no puede estar
defectuoso y en buen estado al mismo tiempo.
Si dos eventos A y Bson mutuamente excluyentes, la regla especial de la adición establece que la
probabilidad de que ocurra uno u otro es igual a la suma de sus probabilidades. Esta regla se expresa
mediante la siguiente fórmula:
Regla especial de la Adición = P (A o B) = P(A) + P (B)
En el caso de los tres eventos mutuamente excluyentes designados A, B y C, la regla se expresa de la
siguiente manera:
P(A o B o C) = P(A) + P(B) +P(C)
Ejemplo:
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Una máquina automática Shaw llena bolsas de plástico con una combinación de frijoles, brócoli y otras
verduras. La mayoría de las bolsas contienen el peso correcto, aunque, como consecuencia de la variación
del tamaño del frijol y de otras verduras, un paquete podría pesar menos o más. Una revisión de 4000
paquetes que se llenaron el mes pasado arrojó los siguientes datos:
Peso
Evento
Número de
paquetes
Menos peso
A
Peso satisfactorio B
Más peso
C
TOTAL
Probabilidad de que
ocurra el evento
100
3600
300
4000
0,025
0,9
0,075
¿Cuál es la probabilidad de que un paquete en particular pese menos o más?
El resultado “pesa menos” es el evento A, el resultado “pesa más” es el evento C. Al aplicar la regla especial
de la adición se tiene:
P(A o C)= P(A) + P(C) = 0,25 + 0,75 = 1,0
Los eventos son mutuamente excluyentes, lo cual significa que un paquete de verduras mixtas no puede
pesar menos, tener el peso satisfactorio y pesar más al mismo tiempo.
En diagrama de Venn:
Evento
A
Evento
B
Evento
C
REGLA DEL COMPLEMENTO:
La probabilidad de que una bolsa de verduras mixtas seleccionadas pese menos, P(A), más la probabilidad
de que no sea una bolsa con menos peso, P(˜A), que se lee no A, debe ser por lógica igual a 1. Esto se
escribe:
P(A) + P(˜A) = 1
Por tanto la fórmula para el complemento queda:
Regla del complemento = P(A) = 1 - P(˜A)
La regla del complemento se emplea para determinar la probabilidad de que un evento ocurra restando de 1
la probabilidad de un evento que no ha ocurrido. Esta regla es útil porque a veces es más fácil calcular la
probabilidad de que un evento suceda determinando la probabilidad de que no suceda y restando el
resultado de 1. Los eventos A y ˜A son mutuamente excluyentes
En diagrama de Venn:
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Evento
A
˜A
Ejemplo
Recordemos que la probabilidad de que una bolsa de verduras mixtas pese menos es de 0,025 y la
probabilidad de que una bolsa pese más es de 0,075. Aplique la regla del complemento para demostrar que
la probabilidad de una bolsa con un peso satisfactorio es de 0,90. Muestre la solución con un diagrama de
Venn.
La probabilidad de que la bolsa no tenga un peso satisfactorio es igual a la probabilidad de que la bosa
tenga un mayor peso más la probabilidad de que la bolsa pese menos. Es decir
P(A o C)= P(A) + P(C) = 0,25 + 0,75 = 0,100
La bolsa tiene un peso satisfactorio si no tiene menos peso ni más peso; así que
P(B) = 1 – [P(A) + P(C)] = 1 – [0,025 + 0,075] = 0,90.
El diagrama de Venn que representa este caso es el siguiente:
A
0,025
no A o C
0,90
C
0,075
REGLA GENERAL DE LA ADICIÓN
Los resultados de un experimento pueden no ser mutuamente excluyentes. Como ilustración, supongamos
que una empresa de turismo seleccionó 200 turistas que visitaron Colombia durante el año anterior. La
encuesta reveló que 120 turistas fueron al Eje cafetero y 100 a Cartagena. ¿Cuál es la probabilidad de que
una persona seleccionada haya visitado el Eje cafetero o Cartagena?. Si se emplea la regla especial de la
adición, la probabilidad de seleccionar un turista que haya ido al Eje cafetero es de 0,60 mas la probabilidad
de que un turista haya ido a Cartagena es de 0,50 al sumarlas daría 1,10, pero sabemos que esta
probabilidad no puede ser mayor a 1, la explicación radica en que muchos de los turistas visitaron ambas
atracciones turísticas y se les está contando dos veces. Una revisión de las respuestas de la encuesta
reveló que 60 de los 200 encuestados visitó ambos sitios.
Por consiguiente para hallar esta probabilidad debemos:
P(Eje cafetero o Cartagena) = P(Eje cafetero) + P(Cartagena) – P(tanto Eje cafetero como Cartagena)
= 0,60
+ 0,50
- 0,30
=
0,80
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Cuando dos eventos ocurren al mismo tiempo, la probabilidad se denomina probabilidad conjunta. La
probabilidad de que un turista visite ambas atracciones turísticas (0,30), es un ejemplo de probabilidad
conjunta.
El siguiente es el diagrama de Venn para ilustrar el ejemplo anterior:
P(Eje cafetero)=0,60
P(Cartagena)=0,50
P(Eje cafetero y
Cartagena)=0,30
La probabilidad conjunta mide la posibilidad de que dos o más eventos sucedan simultáneamente. Esta
regla para dos eventos designados A y B se escribe:
Regla General de la adición = P(A o B) = P(A) + P(B) -P(A y B)
En la expresión (A o B) la letra o sugiere que puede ocurrir A o puede ocurrir B, como incluye la posibilidad
que A y B ocurran, por tanto el uso de la o se denomina inclusivo. También es posible escribir P(A o B o
ambos) para hacer hincapié en el hecho de que la unión de dos eventos incluye la intersección de A y B.
Si se comparan las reglas general de la adición y la especial de la adición, la diferencia consiste en
determinar si los eventos son mutuamente excluyentes. Si los eventos son mutuamente excluyentes,
entonces la probabilidad conjunta (A y B) es 0 y podríamos aplicar la regla especial de la adición. De lo
contrario, debemos tomar en cuenta la probabilidad conjunta y aplicar la regla general de la adición.
Ejemplo
¿Cuál es la probabilidad de que una carta, escogida al azar, de una baraja convencional sea rey o corazón?
REGLA ESPECIAL DE LA MULTIPLICACIÒN
En este caso se estudia la probabilidad de combinar dos eventos es decir que la ocurrencia sea simultánea.
Por ejemplo, una empresa de marketing desea calcular la probabilidad de que una persona de 21 años de
edad o mayor compre un back berry. Los diagramas de Venn ilustran este evento como la intersección. En
la regla especial se requiere que dos eventos sean independientes y lo son si el hecho de que uno ocurra
no altera la posibilidad de que el otro suceda.
Regla especial de la multiplicación = P(A y B) = P(A) P(B)
INDEPENDENCIA, si un evento ocurre, no tiene ningún efecto sobre la probabilidad de que otro
acontezca
Ejemplo
Una encuesta llevada a cabo por AVIANCA reveló que el año pasado el 60% de sus miembros hicieron
reservaciones en líneas aéreas. Dos de ellos fueron seleccionados al azar. ¿Cuál es la probabilidad de que
ambos hicieran reservaciones el año pasado?
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
La probabilidad de que el primero haya hecho reserva el año pasado es de 0,60 P(R1)=0,60, y la
probabilidad de que el segundo miembro elegidos haya hecho un reserva es también de 0,60 P(R22)=0,60.
Como el número de miembros de AVIANCA es muy grande, suponemos que R1y R2 son independientes.
P(R1y R2)= P(R1)P(R2)= (0,60)(0,60) = 0,36
Todos los posibles resultados serían tomando como R hizo reservación y NR no la hizo.
Resultados
R1y R2
R1y NR
NR y R2
NR y NR
TOTAL
Probabilidad conjunta
(0,60)(0,60)
(0,60)(0,40)
(0,40)(0,60)
(0,60)(0,60)
0,36
0,24
0,24
0,36
1,00
REGLA GENERAL DE LA MULTIPLICACIÒN
Si dos eventos no son independientes se dice que son dependientes.
Ejemplo
Supongamos que hay 10 latas de refresco en un refrigerador, siete de las cuales son normales y 3 dietéticos.
Se selecciona una lata del refrigerador. La probabilidad de seleccionar una lata de refresco dietético es de
3/10, y la probabilidad de seleccionar una lata de refresco normal es de 7/10. Entonces se elige una
segunda lata del refrigerador sin devolver la primera. La probabilidad de que la segunda lata sea un refresco
dietético depende de que la primera sí lo haya sido o no. La probabilidad de que la segunda lata sea de
refresco dietético es:
2/9 si la primera bebida es dietética (ya solo quedan dos latas en el refrigerador)
3/9 si la primera lata elegida es normal (aún quedan los tres refresco en el refrigerador)
La denominación adecuada de la fracción 2/9 o 3/9 es probabilidad condicional, ya que su valor se
encuentra condicionado (o depende) por el hecho de que un refresco normal o dietético haya sido el
primero en ser seleccionado del refrigerador.
PROBABILIDAD CONDICIONAL: Probabilidad de que un evento en particular ocurra, dado que otro evento
haya acontecido.
La regla general de la multiplicación sirve para determinar la probabilidad conjunta de dos eventos cuando
éstos no son independientes. Por ejemplo, cuando el evento B ocurre después del evento A y A influye en la
probabilidad de que el evento B suceda, entonces A y B no son independientes.
La regla general de la multiplicación establece que en caso de dos eventos A y B, la probabilidad conjunta de
que ambos eventos ocurran se determina multiplicando la probabilidad de que ocurra el evento a por la
probabilidad condicional de que ocurra el evento B, dado que A ha ocurrido. Los símbolos de la probabilidad
conjunta se calculan de la siguiente manera:
Regla general de la multiplicación = P(A y B) = P(A) P(B|A)
Ejemplo
Un golfista tiene 12 camisas en su clóset. Suponga que 9 son blancas y las demás azules. Como se viste
de noche, simplemente toma una camisa y se la coloca. Juega golf dos veces seguidas y no las lava, pero
utiliza una camiseta diferente para cada juego. ¿Cuál es la probabilidad de que las dos camisas elegidas
sean blancas y limpias? El evento que tiene que ver con el hecho de que la primera camisa seleccionada
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
sea blanca es S1, la probabilidad es de P(S1) es de 9/12, el evento de que la segunda camisa seleccionada
también sea blanca S2 es de 8/11, entonces
P(S1 yS2) = P(S1)P(S2|S1) = (9/12)(8/11)= 0,55
Por lo anterior la probabilidad de seleccionar dos camisas de color blanco es de 0,55, se debe aclarar que
este experimento se llevo a cabo sin reemplazo, es decir que la primera camisa no se lavó y se colocó en el
clóset antes de hacer la selección de la segunda.
10.
TEOREMA DE BAYES
En términos más generales y menos matemáticos, el teorema de Bayes es de enorme relevancia puesto que
vincula la probabilidad de A dado B con la probabilidad de B dado A. Es decir que sabiendo la probabilidad
de tener un dolor de cabeza dado que se tiene gripe, se podría saber -si se tiene algún dato más-, la
probabilidad de tener gripe si se tiene un dolor de cabeza, muestra este sencillo ejemplo la alta relevancia
del teorema en cuestión para la ciencia en todas sus ramas, puesto que tiene vinculación íntima con la
comprensión de la probabilidad de aspectos causales dados los efectos observados.
Sea {A1,A3,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que la
probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las
probabilidades condicionales P(B | Ai). Entonces, la probabilidad P(Ai | B) viene dada por la expresión:
Teorema de Bayes= P(A1|B)=P(A1)P(B|A1).
P(A1)P(B|A1) + P(A2)P(B|A2)
donde:
P(A1) son las probabilidades a priori.
P(B|A1) es la probabilidad de B en la hipótesis A1.
P(A1|B) son las probabilidades a posteriori.
Ejemplo
Suponga que el 5% de la población del Playón, tiene una enfermedad propia de su situación de inundación.
Sea A1el evento “padece la enfermedad” yA2 “no padece la enfermedad”. Por tanto, si selecciona al azar a
una persona del Playón, la probabilidad de que el individuo elegido padezca la enfermedad es de 0,05 o
P(A1)=0,05 denominada la Probabilidad a priori, dado que se asigna antes de obtener los datos empíricos
y está basada en el nivel de información actualy por endela probabilidad a prioride que una persona no
padezca la enfermedad es de 0,95 o P(A2)=0,95, la cual se calcula de 1 - 0,05.
En el anterior ejemplo existe una técnica de diagnóstico para detectar la enfermedad, pero no es muy
precisa. Sea Bel evento “la prueba revela la presencia de la enfermedad” suponga que la evidencia histórica
muestra que si una persona padece realmente la enfermedad, la probabilidad de que la prueba indique la
presencia de ésta es de 0,90. De acuerdo con las definiciones de probabilidad condicional, el enunciado se
expresa:
P(B|A1) = ________
Si la probabilidad de que la prueba indique la presencia de la enfermedad en una persona que no la padece
es de 0,15, el enunciado se expresa:
P(B|A2) = _________
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Elija una persona al azar del Playón y aplique la prueba. Los resultados de la prueba indican que la
enfermedad está presente. ¿Cuál es la probabilidad de que la persona en realidad padezca la enfermedad?.
Lo que desea saber, en forma simbólica, es P(A1|B), que se interpreta como la probabilidad de padecer la
enfermedad dado que la prueba resulto positiva y esta Probabilidad es a posteriori, dado que es revisada
a partir de información adicional.
Con el teorema de Bayes determinamos la probabilidad a posteriori:
Teorema de Bayes= P(A1|B)=P(A1)P(B|A1).
P(A1)P(B|A1) + P(A2)P(B|A2)
Con el anterior resultado cómo se puede leer la respuesta?
Con lo anterior, resuma en la siguiente tabla los cálculos del problema del Playón:
Evento, Ai
Probabilidad a
priori, P(Ai)
Probabilidad
condicional, P(B|Ai)
Probabilidad
conjunta, P(Aiy
B)
Probabilidad a posteriori,
P(Aiy B)
Padece la
enfermedad
No padece la
enfermedad Ai
TÉCNICA DE ÁRBOL DE PROBABILIDAD O DIAGRAMA DE ÁRBOL
Se utiliza para organizar cálculos que implican varias etapas, cada rama o segmento del árbol implica una
etapa del problema, estas se ponderan por medio de probabilidades
En el siguiente ejemplo un banco informa que el 35% de sus créditos son para vivienda, el 50% para
industrias y el 15% para consumo diverso. Su departamento de cartera registra que el 20% de los créditos
para vivienda entran en mora, el 15% de los créditos para industrias es moroso y el 70% de los créditos para
consumo también son morosos.
El auditor del banco elige un crédito al azar y resulta moroso. Cuál es la probabilidad de que haya sido un
crédito otorgado para vivienda?
0,20
Vivienda
Moroso
0,07
No Moroso
0,28
0,80
0,35
0,15
0,50
Industria
0,075
No Moroso
0,425
0,85
0,15
0,70
Consumo
Moroso
Moroso
0,30
No Moroso
DEPARTAMENTO DE CIENCIASBÁSICAS
0,105
0,045
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
P(Moroso otorgado para vivienda)=0,07
0,07 + 0,075 + 0,105
.= 0,28 = 28%
En una clase que consta de 6 niñas y 10 niños, si se escoge un comité de 3 al azar, hallar la probabilidad de
que los seleccionados sean 3 niños
11.
DISTRIBUCIONES DE PROBABILIDAD
Una distribución de probabilidad muestra los posibles resultados de un experimento y la probabilidad de que
cada uno se presente.
Las características fundamentales de una distribución de probabilidad son:
1. La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive.
2. Los resultados son eventos mutuamente excluyentes.
3. La lista es exhaustiva. Así, la suma de las probabilidades de los diversos eventos es igual a 1
Algunos conceptos antes de continuar:
Variable aletoria: Cantidad que resulta de un experimento que, por azar, puede adoptar diferentes valores.
Variable aleatoria Discreta:Variable aleatoria que adopta sólo valores claramente separados.
Variable aleatoria Continua: Si la variable aleatoria es continua, es una distribución de probabilidad
continua y esta se da cuando es el resultado de algún tipo de medición.
Por lo general una distribución discreta es el resultado de contar algo como:
•
•
•
El número de caras que se presentan en tres lanzamientos de una moneda
El número de estudiantes que obtienen “A” en clase
El número de empleados de producción que se ausentaron hoy en el segundo turno
Las distribuciones continuas son el resultado de algún tipo de medición como:
•
•
•
La duración de cada canción en el último álbum de Sándalo
El peso de cada estudiante de esta clase
La temperatura ambiente en el momento en que se leen estos apuntes
Media, varianza y desviación estándar de una distribución de probabilidad
Recordemos que la media indica la localización central de los datos y la varianza describe la dispersión de
los mismos, de forma similar una distribución de probabilidad queda resumida por su media y su
varianza.
La media de una distribución de frecuencias se indica como µ (miu)
Donde P(x) es la probabilidad de un valor particular x, se multiplica cada valor por la probabilidad de que
ocurra luego se suman los productos.
2
La desviación estándar se identifica como σ (sigma) y la varianza como σ (sigma cuadrado)
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
12. DISTRIBUCION
DISCRETAS
DE
PROBABILIDADES
PARA
VARIABLES
DISTRIBUCIÓN BINOMIAL
Principales características para definir una distribución de probabilidad binomial
El resultado de cada prueba de un experimento se clasifica en una de dos categorías mutuamente
excluyentes: éxito o fracaso
La variable aleatoria de interés permite contar el número de éxitos en una cantidad fija de pruebas
La probabilidad de éxito y fracaso es la misma para cada prueba
Las pruebas son independientes, lo cual significa que el resultado de una prueba no influye en el resultado
de otra prueba.
Primer experimento
Éxito
Fracaso
Segundo experimento
Éxito
Fracaso
Tercer experimento
Éxito
Fracaso
n experimento
Éxito
E
F
E
1er
exp
Fracaso
F
2do
exp
F
F
E
E
F
E
F
E
F
E
: Combinación (n combina x)
es el número de pruebas o experimentos
Variable aleatoria definida como el número de éxitos
esla probabilidad de un éxito en cada prueba
Ejemplo
TAM tiene cinco vuelos diarios de Fortaleza al Aeropuerto Internacional de Sao Pablo en Brasil, suponga que
la probabilidad de que cualquier vuelo llegue tarde sea de 0,20. ¿Cuál es la probabilidad de que ninguno de
los vuelos llegue tarde hoy?. Cuál es la probabilidad de que exactamente uno de los vuelos llegue tarde
hoy?
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
La probabilidad de que un vuelo llegue tarde es de p=0,20, hay cinco vuelos n=5 y la variable aleatoria x=0
pues se refiere al número de éxitos que sería el hecho de que un avión llegue tarde y como no hay demoras
en las llegadas entonces tenemos cero éxitos.
ó
! "
ó
#
'
& ( %, *%
%
%
%
$
#
%, *%
'$%
= (1)(1)(0,3277)
Probabilidad binomial
= 0,3277
La probabilidad de que exactamente uno de los cinco vuelos llegue tarde hoy es de 0,4096 y sería
ó
! "
ó
#
'
& ( %, *%
#
#
#
$
#
%, *%
'$#
= (5)(0,20)(0,4096)
Probabilidad binomial
La media de una distribución binomial
= 0,4096
+
La varianza de una distribución binomial
,-
En el ejemplo de los vuelos retrazados:
+ 1
+
+
5 0,20
1
,
-
,-
+ 1 +
5 0,20 1 0,20
, - 1 0,80
, - 0,80
La media de 1,0 y la varianza de 0,80 y la distribución de probabilidad se observan en la siguiente tabla
Número de
vuelos
retrazados
0
1
2
3
P(x)
0,3277
0,4096
0,2048
0,0512
DEPARTAMENTO DE CIENCIASBÁSICAS
xP(x)
0
0,4096
0,4096
0,1536
2
2
(x-μ)
x-μ
-1
0
1
2
1
0
1
4
(x-μ) P(x)
0,3277
0
0,2048
0,2048
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
4
5
0,0064
0,0003
0,0256
0,0015
μ=1,0000
3
4
9
16
0,0576
0,0048
σ2=0,7997
DISTRIBUCIÓN POISSON
Esta distribución describe el número de veces que se presenta un evento durante un intervalo especificado.
El intervalo puede ser de tiempo, distancia, área o volumen.
La distribución se basa en dos supuestos, el primero consiste en que la probabilidad es proporcional a la
longitud del intervalo. El segundo supuesto consiste en que los intervalos son independientes.
Cuanto más grande sea el intervalo, mayor será la probabilidad y el número de veces que se presenta un
evento en un intervalo no influye en los demás intervalos.
Principales características para definir una distribución de probabilidad Poisson
1. La variable aleatoria es el número de veces que ocurre un evento durante un intervalo definido.
2. La probabilidad de que ocurra el evento es proporcional al tamaño del intervalo
3. Los intervalos no se superponen y son independientes
Es la media de la cantidad de veces (éxitos) que se presenta un evento en un intervalo particular
Es la constante que vale 2,71828
Es el número de veces que se presenta un evento
Es la probabilidad para un valor específico de x
Binomial
Éxito
1
Fracaso
0
DEPARTAMENTO DE CIENCIASBÁSICAS
Éxito
1
Fracaso
0
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Ejemplo
La Compañía Albergar Ltda. asegura propiedades frente a la playa a lo largo de Virginia, Carolina del Norte y
del sur y las costas de Georgia; el cálculo aproximado es que, cualquier año, la probabilidad de que un
huracán de categoría III (vientos sostenidos de más de 110 millas por hora) o más intenso azote una región
de la costa (la isla de St. Simons, Georgia, por ejemplo) es de 0,05. Si un dueño de casa obtiene un crédito
hipotecario de 30 años por una propiedad recién comprada en StSimons, ¿cuáles son las posibilidades de
que el propietario experimente por lo menos un huracán durante el periodo del crédito?
Primero se determina la media o número esperado de tormentas:
+
n= número de años
p= probabilidad de que toque tierra un huracán
= número esperado de tormentas en un período de 30 años
30 0,05
1,5
Para determinar la probabilidad de que por lo menos una tormenta azote la isla de St. Simons, Georgia,
primero se calcula la probabilidad de que ninguna tormenta azote la costa y luego se resta dicho valor de 1.
41
6
0!
0
1 0,2231
0
0,7769
1
0
41
1
41
1
1
5 $7,8
Se concluye entonces que las posibilidades de que un huracán de ese tipo azote la propiedad durante el
periodo de 30 años, mientras el crédito exista son de 0,7769. Debe insistirse en que se espera que haya 1,5
tormentas que azotan la costa cada periodo de 30 años.
En este anterior ejemplo se utilizó la distribución de Poisson como aproximación de la binomial y se
cumplieron con las características de:
1. Solo hay dos posibles resultados: un huracán azote la zona o no lo haga
2. Hay una cantidad fija de pruebas, en este caso son 30 años
3. Existe una probabilidad constante de éxito; es decir, la probabilidad de que un huracán azote la zona es
de 0,05 cada año
4. Los años son independientes, o sea si una tormenta importante azota en el quinto año, esto no influye
en ningún otro año.
Ahora para calcular la probabilidad de que por lo menos una tormenta azote el área en un período de 30
años se aplica la distribución binomial:
41
1
41
41
DEPARTAMENTO DE CIENCIASBÁSICAS
0
1
! "
<%
1
& ( %, %'% %, ='
1
%
#
#
<%
# %, *#>?
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
La probabilidad de que por lo menos un huracán azote el área durante un periodo de 30 años con la
distribución binomial es de 0,7854.
La respuesta obtenida con la distribución binomial es la más “correcta técnicamente”. La que se obtuvo con
la distribución de Poisson puede tomarse como una aproximación de la binomial,, cuando n, el número de
pruebas es grande y pla probabilidad de éxito pequeña.
En resumen, la distribución de Poisson es en realidad una familia discreta de distribuciones. Todo lo que se
necesita para construir una distribución de Poisson es la media del número de defectos, errores, etc. Que se
designa como µ.
13. DISTRIBUCION
CONTINUAS
DE
PROBABILIDADES
PARA
VARIABLES
DISTRIBUCIÓN NORMAL ESTANDAR
Las distribuciones normales ocupan un lugar importantísimo en la estadística aplicada y teórica por múltiples
razones, una de estas es que coincide muy estrechamente con las distribuciones de frecuencia observadas
de muchas mediciones de fenómenos físicos y naturales. Su mayor importancia radica en que aquellas
distribuciones de medias muestrales y proporciones de muestras grandes tienden a distribuirse como lo hace
la función de distribución normal lo cual hace resaltar su amplia aplicación en la teoría de muestreo.
Las características principales de la distribución de probabilidad normal son:
1. Tiene forma de campañay posee una sola cima en el centro de la distribución. La media aritmética, la
mediana y la moda son iguales, y se localizan en el centro de la distribución. El área total bajo la curva
es de 1,00. La mitad del área bajo la curva normal se localiza a la derecha de este punto central, y la
otra mitad, a la izquierda.
2. Es simétricarespecto a la media. Si hace un corte vertical, por el valor central, a la curva normal, las
dos mitades son imágenes especulares.
3. Desciende suavemente en ambas direcciones del valor central. Es decir, la distribución es asintótica.
La curva se aproxima más y más al eje X, sin tocarlo en realidad. En otras palabras, las colas de la
curva se extienden indefinidamente en ambas direcciones.
4. La localización de una distribución normal se determina a través de la media, µ. La dispersión o
propagación de la distribución se determina por medio de la desviación estándar σ.
La fórmula de la distribución de probabilidad normal tiene una fórmula muy compleja, sin embargo a parte de
su complejidad ya se conocen varios de estos valores:
µ y σ se refieren a la media y desviación estándar, la letra griega π es una constante matemática natural,
cuyo valor es aproximadamente 22/7 o 3,1416. La letra etambién es una constante matemática, es la base
del sistema de logaritmos naturales y es igual a 2,718; y x es el valor de una variable aleatoria continua. Así
una distribución normal se base en su media y su desviación estándar.
La curva normal es simétrica, dos
mitades idénticas
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Cola
En teoría la curva
tiende a -∞
Cola
La media, mediana y moda son iguales
En teoría la curva
tiende a +∞
Con la distribución normal no se requiere hacer cálculos con la fórmula anterior, se requiere una tabla para
buscar las diversas probabilidades.
Una distribución de probabilidad normal estándar resulta de restar la media de cada observación y dividir
esta diferencia entre la desviación estándar. Los resultados reciben el nombre de valores z o valores
tipificados.
Valor z:: Distancia con signo entre
ent un valor seleccionado, designado x,, y la media, µ, dividida entre la
desviación estándar σ.
Es el valor de cualquier observación y medición
medició
Es la media de la distribución
Es la desviación estándar de la distribución
Ejemplo:
Se desea calcular la probabilidad de que las cajas de Sugar pesen entre 283 y 285,4 gramos, el peso de la
caja de Sugar tiene una distribución normal con una media
med de 283 gramos y una desviación estándar de 1,6
gramos. Se quiere conocer la probabilidad o á
área
rea bajo la curva entre la media, 283 gramos y 285,4 gramos.
Para determinar la probabilidad es necesario convertir tanto 283 gramos como 285,4 gramos a valores z.
Z = 283-283 / 1,6 = 0
Z = 285,4-283/1,6 =1,50
Después con ayuda de la tabla de distribuci
distribución
ón de Áreas bajo la curva normal establecemos los valores para
z=1,5 y la probabilidad bajo la columna 0,00 que corresponde a 0,4332, (favor observar la imagen adjunta)
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Esto significa que el área bajo la curva entre 0,00 y 1,50 es de 0,4332. Tal es la probabilidad de que una caja
seleccionada al azar de Sugar pese entre 283 y 285,4 gramos. Esto se ilustra en la siguiente gráfica
.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
SEGUNDO CAPÍTULO: MUESTREO
1. TEORIA DEL MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una
población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El
muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar
que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. La
muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor
manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una
muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la
población, es decir ejemplificar las características de ésta. Los errores más comunes que se pueden cometer
son:
a. Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población,
se denomina error de muestreo.
b. Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomo la
muestra. Error de Inferencia. En la estadística se usa la palabra población para referirse no sólo
a personas si no a todos los elementos que han sido escogidos para su estudio y el término
muestra se usa para describir una porción escogida de la población.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden
dividirse en dos grandes grupos:
Métodos de muestreo probabilísticos y Métodos de muestreo no probabilísticos.
MUESTREO PROBABILÍSTICO
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es
decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte
de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad
de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de
la muestra extraída y son, por tanto, los más recomendables.
Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:
MUESTREO ALEATORIO SIMPLE: El procedimiento empleado es el siguiente:
a) Se asigna un número a cada individuo de la población y
b) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios,
números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como
sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que
estamos manejando es muy grande.
MUESTREO ALEATORIO SISTEMÁTICO: Este procedimiento exige, como el anterior, numerar todos los
elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de
ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los
que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el
resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que
empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros
son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos. 3.MUESTREO ALEATORIO ESTRATIFICADO: Trata de obviar las dificultades que presentan los anteriores ya
que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste
en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el
sexo, el estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos
que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...). La distribución de
la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada
estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera
la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.
MUESTREO ALEATORIO POR CONGLOMERADOS: Los métodos presentados hasta ahora están
pensados para seleccionar directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un
grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias,los departamentos universitarios, una caja de determinado producto, etc., son conglomerados
naturales.
En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por
conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario
para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a
los conglomerados elegidos.
MUESTREO NO PROBABILÍSTICO
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones
(estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea
representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En
general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo
posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y
epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados
aleatoriamente de la población. Entre los métodos de muestreo no probabilísticos más utilizados en
investigación encontramos:
MUESTREO POR CUOTAS
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para
los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no
tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en
un número de individuos que reúnen unas determinadas condiciones.
Por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Girón. Una vez determinada
la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza
mucho en las encuestas de opinión.
MUESTREO INTENCIONAL O DE CONVENIENCIA
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas"
mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en
sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También
puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso
más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso
(los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).
BOLA DE NIEVE
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una
muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
MUESTREO DISCRECIONAL
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
ERROR DE MUESTREO
Cada método de muestreo que se utilice para cualquier posible muestra de determinado tamaño de una
población, tiene una posibilidad o probabilidad conocidas, sus medias y sus desviaciones estándar tienden a
ser diferentes entre la población y la muestra.
Por tanto, puede esperarse una diferencia entre un estadístico de la muestray el parámetro de la
poblacióncorrespondiente. Esta diferencia se le llama error de muestreo.
Ejemplo
Dayana y Brayan administran el Viajero, una pensión donde dan alojamiento y desayuno, localizada en
Florianopolis-Brasil. Se rentan ocho habitaciones en esta pensión. A continuación aparece el número de
estas ocho habitaciones rentadas diariamente durante junio 2010, con un trabajo estadístico preliminar se
estableció que la muestra se realizaría con 10 días de junio.
Habitaciones
en renta
Junio
1
2
3
4
0
2
3
2
DEPARTAMENTO DE CIENCIASBÁSICAS
Habitaciones
en renta
Junio
11
12
13
14
3
4
4
4
Habitaciones
en renta
Junio
21
22
23
24
3
2
3
6
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
5
6
7
8
9
10
3
4
2
3
4
7
15
16
17
18
19
20
7
0
5
3
6
2
25
26
27
28
29
30
0
4
1
1
3
3
Se seleccionan tres muestras aleatorias de cinco días, se les calcula la media muestral y se compara con la
media poblacional. Cuál es el error de muestreo en cada caso.
Ejercicio para realizar como taller
2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA
La posibilidad de que se presente un error de muestreo cuando se emplean los resultados del muestreo para
aproximar un parámetro es casi inevitable. Las medias muestrales varían de una muestra a otra, si se
organiza las medias de todas las muestras posibles en una distribución de probabilidad, el resultado recibe
el nombre de distribución muestral de la media.
Ejemplo
Se tienen los ingresos por hora del personal administrativo de una oficina de cobranzas jurídicas
(considerada como toda la población) y se presentan en la siguiente tabla.
Ingresos
por hora en
Empleado
Cargo
miles de
pesos
1 Omar García
Auxiliar de Cartera
12.500
2 Stella Vega
Secretaria
5.000
3 Orlando Ávila Gerente Comercial
75.000
4 Edgar Galván
Auxiliar de Cobro
12.500
5 Javier Ayala
Auxiliar de Recaudo
12.500
6 Socorro Neira Gerente Cartera
75.000
7 Rafael Afanador Gerente Administrativo
75.000
Lo primero que se calcula es la media poblacional que para este caso es.
∑ AB
C
267.500
7
38214
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Seguido calculamos la distribución muestral de la media para muestras de tamaño 2, se selecciona sin
reemplazo de la población, todas las muestras posibles de tamaño 2 y se calculan las medias de cada
muestra. Hay 21 posibles muestras, que se calculan con la fórmula de las combinaciones, tomando los 7
empleados y se agrupan por parejas
C!
! C
C
7 2
!
7!
2! 7 2 !
70 2
21
El N es el número de elementos de la población que para este caso es de 7 y n es el número de elementos
de la muestra que corresponde a 2.
Con las 21 medias muestrales de todas las muestras posibles de tamaño 2 que pueden tomarse de la
población se construye una distribución de probabilidad, que es la distribución muestral de la media, la cual
se resuma en la siguiente tabla:
Medias muestrales
Muestra
Empleados
Ingresos por Hora
1 Omar García Stella Vega
12.500
5.000
2 Omar García Orlando Ávila
12.500
75.000
3 Omar García Edgar Galván
12.500
12.500
4 Omar García Javier Ayala
12.500
12.500
5 Omar García Socorro Neira
12.500
75.000
6 Omar García Rafael Afanador 12.500
75.000
7 Stella Vega Orlando Ávila
5.000
75.000
8 Stella Vega Edgar Galván
5.000
12.500
9 Stella Vega Javier Ayala
5.000
12.500
10 Stella Vega Socorro Neira
5.000
75.000
11 Stella Vega Rafael Afanador 5.000
75.000
12 Orlando Ávila Edgar Galván
75.000
12.500
13 Orlando Ávila Javier Ayala
75.000
12.500
14 Orlando Ávila Socorro Neira
75.000
75.000
15 Orlando Ávila Rafael Afanador 75.000
75.000
16 Edgar Galván Javier Ayala
12.500
12.500
17 Edgar Galván Socorro Neira
12.500
75.000
18 Edgar Galván Rafael Afanador 12.500
75.000
19 Javier Ayala Socorro Neira
12.500
75.000
20 Javier Ayala Rafael Afanador 12.500
75.000
21 Socorro Neira Rafael Afanador 75.000
75.000
Suma
17.500
87.500
25.000
25.000
87.500
87.500
80.000
17.500
17.500
80.000
80.000
87.500
87.500
150.000
150.000
25.000
87.500
87.500
87.500
87.500
150.000
Media
8.750
43.750
12.500
12.500
43.750
43.750
40.000
8.750
8.750
40.000
40.000
43.750
43.750
75.000
75.000
12.500
43.750
43.750
43.750
43.750
75.000
Distribución muestral de la media para n=2
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Media
Número de
Probabilidad
muestral
medias
8750
3
0,14
12500
3
0,14
40000
3
0,14
43750
9
0,43
75000
3
0,14
21
1,00
La media de la distribución muestral de la media se obtiene de sumar las medias muestrales y dividir la
suma entre el número de muestras. La media de todas las medias muestrales se representa mediante FG , la
µ es un valor poblacional el subíndice G , indica la distribución muestral de la media.
FG
HIJK L6 MNLKO PKO J6LBKO JI6OM KP6O
QNMKP L6 PKO JI6OM KO
8750 R 12500 R S R 75000
21
38214
La media de la distribución muestral de la media 38214 es igual a la media de la población 38214, µ= FG
La dispersión de la distribución muestral de las medias es igual que la dispersión de los valores de la
población. La media de las muestras varía de 8.750 – 75.000 igual que los valores de la población que
están entre 5.000 y 75.000 ingresos por hora.
La forma de la distribución muestral de la media y la forma de la distribución de frecuencias de los valores de
población son diferentes. La distribución muestral de las medias tiende a adoptar más forma de campana y
a aproximarse a la distribución de probabilidad normal.
Distribución de frecuencias de los valores de población
0,45
0,40
0,35
Probabilidade
0,30
0,25
0,20
0,15
0,10
0,05
0,00
5.000
DEPARTAMENTO DE CIENCIASBÁSICAS
12.500
Ingresos por hora
75.000
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Distribución muestral de las medias n=2
0,45
0,40
0,35
Probabilidade
0,30
0,25
0,20
0,15
0,10
0,05
0,00
8750
12500
40000
Ingresos por hora
43750
75000
3. TEOREMA DEL LIMITE CENTRAL
La relación entre la forma de la distribución de la población y la forma de la distribución muestral de la media
se conoce como el “Teorema del Límite Central”. Este teorema asegura que la distribución muestral de la
media se acerca a la normal a media que crece el tamaño de la muestra. Este teorema es quizá uno de los
más importantes en la Estadística Inferencial.
En términos generales el teorema se resuma en los siguientes términos:
Sin tener en cuenta la forma funcional de la población de donde se extrae la muestra, la distribución de las
medias muestrales, calculadas con muestras de tamaño n extraídas de una población con media µ y
2
varianza σ , se aproxima a una distribución normal cuando nse incrementa. Si nes grande, la distribución de
las medias muestrales puede aproximarse mucho a una distribución normal.
Distribución de frecuencias de los valores de población
0,45
0,40
0,35
Probabilidade
0,30
0,25
0,20
0,15
0,10
0,05
0,00
5.000
12.500
Ingresos por hora
75.000
Gráfica de la distribución de la población, cuando N=7, µ=38.214
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Distribución muestral de las medias n=2
0,45
0,40
0,35
Probabilidade
0,30
0,25
0,20
0,15
0,10
0,05
0,00
8750
12500
40000
Ingresos por hora
43750
75000
Gráfica de la distribución muestral de la media, Muestras = 21 y n=2
Distribución muestral de las medias n=3
0,30
0,25
Probabilidade
0,20
0,15
0,10
0,05
0,00
10.000
12.500
30.833
33.333
Ingresos por hora
51.667
54.167
75.000
Gráfica de la distribución muestral de la media, Muestras = 35 y n=3
Se concluye de este ejemplo que el teorema del límite central indica que sin importar la forma de la
distribución de la población, la distribución muestral de la media se aproximará a una distribución de
probabilidad normal. Cuando mayor sea el número de observaciones en cada muestra, más evidente será la
convergencia.
Se habla en estadística que una muestra grande es a partir de 30 elementos, por tanto n > 30 es
suficientemente grande para justificar el uso del teorema.
El teorema del limite central no dice nada sobre la dispersión de la distribución muestral de medias, ni de la
comparación entre la media de la distribución muestral de medias y la media de la población. Sin embargo
en algunos casos existe menor dispersión en la distribución muestral de medias que en la distribución de la
población, lo que indica la diferencia en el rango de la población y en el rango de las medias muestrales.
Observe que la media de las muestras se encuentra cerca de la media de la población. Se puede demostrar
, y si
que la media de la distribución muestral es la media de la distribución poblacional, es decir que FG
la desviación estándar de la población es σ, la desviación estándar de las medias muestrales es σ/√ , en la
que n es el número de observaciones de cada muestra. Entonces, σ/√ es el error estándar de la media.
U N 6OMá LK L6PKJ6LBK
DEPARTAMENTO DE CIENCIASBÁSICAS
,FG
,
√
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Con todo lo anterior se concluye entonces:
1. La media de la distribución muestral de las medias será exactamente igual a la media poblacional si
selecciona todas las muestras posibles del mismo tamaño de una población dada.
FG
Auque no seleccione todas las muestras, es de esperar que la media de la distribución muestral de medias
se aproxime a la media poblacional.
2. Habrá menos dispersión en la distribución muestral de las medias que en la población. Si la desviación
estándar de la población es σ, la desviación estándar de la distribución muestral de medias es σ/√ .
Note que, cuando se incrementa el tamaño de la muestra, disminuye el error estándar de la media.
El uso de la distribución muestral de las medias reviste importancia pues en la mayoría de las decisiones
tomadas en los negocios tienen como fundamento los resultados de un muestreo.
Recordemos que para convertir cualquier distribución normal debemos conocer un valor z y se debe utilizar
la tabla del área bajo la curva para determinar la probabilidad de seleccionar una observación que caerá
dentro de un intervalo específico. La fórmula para determinar el valor z es:
V
,
x= variable aleatoria
µ= media de la población
σ= desviación estándar de la población
Sin embargo, la mayor parte de las decisiones de negocios se refieren a una muestra, no a una sola
observación. Así, lo importante es la distribución de AW, la media muestral, en lugar de x, el valor de una
observación. Este es el primer cambio de la fórmula que se trabajó para hallar la z en la distribución normal,
el segundo cambio consiste en emplear el error estándar de la media de n observaciones en lugar de la
desviación estándar de la población. Es decir, se usa σ/√ en el denominador en lugar de σ. Por lo tanto
para determinar la probabilidad de una media muestral con rango especificado, primero se aplica la fórmula
para determinar el valor z correspondiente y luego con ayuda de la tabla para calcular el área bajo la curva
se localiza la probabilidad.
áPXIPNL6PYKPN VL6 G XIK LNO6XN NX6PKL6OYBKXBó 6OMá LK L6PK+NZPKXBó V
AW
,/√
Ejemplo
El departamento de control de calidad de cierta bebida refrescante conserva registros sobre la cantidad de
bebida en su botella gigante. La cantidad real de bebida en cada botella es de primordial importancia, pero
varía en una mínima cantidad de botella en botella. La entidad no desea llenar botellas con menos líquido
del bebido, pues tendría problemas en lo que se refiere a la confiabilidad de la etiqueta. Por otra parte, no
puede colocar líquido de más en las botellas porque regalaría bebida, lo cual reduciría sus utilidades. Los
registros indican que la cantidad de bebida tiene una distribución normal. La cantidad media por botella es
de 31,2 onzas y la desviación estándar de la población es de 0,4 onzas. Hoy, a las 8 de la
mañana, el técnico de calidad seleccionó al azar 16 botellas de la línea de llenado. La cantidad media de
bebida en las botellas es de 31,38 onzas. Es un resultado poco probable?, Es probable que el proceso
permita colocar demasiada bebida en las botellas? En otras palabras, es poco común el error de muestreo
de 0,18 onzas?
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Primero debemos determinar la probabilidad de seleccionar una muestra de 16 botellas de una población
normal con media 31,2 onzas y una desviación estándar de la población de 0,4 y encontrar la media
muestral de 31,38, aplicamos la fórmula para determinar z:
V
V
31,38
AW
,/√
31,20
0,4/√16
1,80
El numerador de esta ecuación es el error muestral o sea 0,80 y el denominador es el error estándar de la
distribución muestral de la media o sea 0,1.
Este valor z de 1,80 se ubica en la tabla de área bajo la curva y se determina que corresponde a 0,4641, la
probabilidad de un valor z mayor que 1,80 es de 0,0359, que se calcula restando 0,5000 – 0,4641
Por tanto se concluye:
No es probable (menos del 4% de probabilidad) que seleccione una muestra de 16 observaciones de una
población normal con una media de 31,2 onzas y una desviación estándar poblacional de 0,4 onzas y
determine que la media de la muestra es igual o mayor que 31,38 onzas. La conclusión es que en el
proceso se vierte demasiada bebida en las botellas. El técnico de control de calidad debe entrevistarse con
el supervisor de producción para sugerir la reducción de la cantidad de bebida en cada botella.
La gráfica para entender mejor este ejercicio quedaría de la siguiente manera:
Distribución muestral de la cantidad media de bebida en una botella gigante
4. DISTRIBUCIÓN DE LA PROPORCIÓN
Una proporción es la fracción, razón o porcentaje que indica la parte de la muestra de la población que
posee un rasgo de interés particular.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
En muchos casos se emplea la proporción de una muestra +G para hacer inferencias estadísticas sobre la
proporción poblacional e incluso sobre el tamaño N de la población. Como en el caso de las medias, se
puede decir en general que muestras distintas darán proporciones distintas: La distribución muestral de +G es
la distribución de las probabilidades de todos los valores de +G , calculados en muestras del mismo tamaño n,
extraídas aleatoriamente de la misma población.
El análisis de la distribución muestral de +G, sigue los mismos pasos que se emplearon para la media.
En realidad, la distribución de proporciones de muestras es una variante de la distribución binomial, en la
que se opta por trabajar con la proporción de éxitos en n=ensayos x/n, en lugar del número de x de éxitos en
n ensayos. Este resultado plantea el hecho de que la distribución de proporciones es una distribución
discreta, y aunque el teorema del límite central permita aproximarla con la distribución normal, se deberá
tener presente el uso del factor de corrección por continuidad.
Por otro lado, al igual que en el caso de la distribución de medias de muestras, la distribución de
proporciones estará distribuida aproximadamente en forma normal (teorema del límite central) si el tamaño
de la muestra es grande. Sin embargo, en este caso la regla práctica para considerar una muestra como
grande es que se cumplan simultáneamente.
np 4 5 y n(1-p)4 5
Ejemplo
Una encuesta reciente indicó que 92 de cada 100 entrevistados estaban de acuerdo con el horario de verano
para ahorrar energía. La proporción de la muestra es del 92/100 o sea 92%. Si Proporciónrepresenta la
proporción de la muestra, X el número de éxitos y n el número de elementos de la muestra, se determina
una proporción muestral de la siguiente manera:
N+
A
La proporción de la población se define por medio de p. Por consiguiente p se refiere al porcentaje de éxitos
en la población (concepto de una distribución binomial).
Para cumplir con un intervalo de confianza para una proporción es necesario cumplir con los siguientes
supuestos:
1. Las condiciones binomiales, quedan satisfechas:
a. Los datos de la muestra son resultado de conteos
b. Sólo hay dos posibles resultados (éxito y fracaso)
c. La probabilidad de éxito permanece igual de una prueba a la siguiente
d. Las pruebas son independientes
2. Los valores npy n(1-p)deben ser mayores o iguales que 5. Esta condición permite recurrir al
teorema del límite central y emplear la distribución normal estándar, es decir, z, para contemplar un
intervalo de confianza.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
TERCER CAPÍTULO: ESTIMACIÓN E HIPÓTESIS
1. ESTIMACION
Una pregunta fundamental respecto a ciertas especies, es el tamaño de población. Se puede tomar el caso
de las ballenas. Estos mamíferos gigantescos no se quedan quietos para contarlos. Viajan por grandes
extensiones y pasan la mayor parte del tiempo bajo el agua aunque suben a la superficie a respirar en
intervalos regulares. El método más sencillo para estimar la población consiste en marcar un cierto número
de ballenas; se les dispara un cilindro metálico de un pie de longitud, de modo que queda colocado en la
grasa bajo la piel. En la época de caza, las ballenas marcadas dan información sobre su movimiento y la
proporción de ballenas marcadas. La utilidad de la información anterior puede verse más fácilmente
simulando el experimento con una bolsa de canicas. Como en el caso de las ballenas, el número de canicas
en la bolsa es desconocido. Se seleccionan aleatoriamente unas cuantas canicas de la bolsa, por ejemplo
10, se marcan y se regresan a la bolsa. Después se agita la bolsa y se extraen nuevamente, en forma
aleatoria, cierto número de canicas. Se cuenta el número de canicas marcadas y las no marcadas,
obteniéndose la proporción muestral.
En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado
de un parámetro de una población a partir de los datos proporcionados por una muestra.
Ejemplo
Una estimación de la media de una determinada característica de una población de tamaño N podría ser la
media de esa misma característica para una muestra de tamaño n=1
2. ESTIMADORES
Estimador de intervalo:
Intervalo donde probablemente se localiza un parámetro de población, basado en información de la muestra.
Ejemplo
De acuerdo con los datos de la muestra, la media de la población está en el intervalo entre 0.9 y 2.0 libras.
Estimador puntual:
Valor único calculado a partir de una muestra para calcular un parámetro poblacional.
Ejemplo
Si la media de la muestra es del 1020 psi, éste constituye el mejor estimador de la fuerza de tensión media
de la población.
3. PROPIEDADES DE LOS ESTIMADORES
En el corte anterior se inició el estudio de la estadística inferencial. En ese capítulo se presentaron razones
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
por las cuales se debe hacer muestreo, ahora se estudiarán aspectos importantes del muestreo como el
estudio del estimador puntual que consiste en un solo valor deducido de una muestra para estimar una
población, pero es solo un valor, si se quiere un enfoque más profundo se presenta un intervalo de valores
del que se espera que se estime el parámetro poblacional, a eso se le llama INTERVALO DE CONFIANZA.
4. INTERVALOS DE CONFIANZA PARA LA MEDIA.
El análisis de estimadores puntuales y los intervalos de confianza comienza con el estudio del cálculo de la
media poblacional:
•
•
Se conoce la desviación estándar de la población (σ)
Se desconoce la desviación estándar de la población (σ). En este caso se sustituye la desviación
estándar de la muestra (s) por la desviación estándar de la población (σ)
Ahora bien, un estimador puntual sólo dice parte de la historia. Aunque se espera que el estimador puntual
se aproxime al parámetro poblacional, sería conveniente medir cuán próximo se encuentra en realidad. Un
intervalo de confianza sirve para este propósito.
Desviación estándar de la población conocida σ
Ejemplo
Se estima que el ingreso anual medio de 500 los trabajadores de la construcción en el área de Nueva York a
Nueva Jersey es de $65.000. Un intervalo para este valor aproximado puede oscilar entre $61.000 y
$69.000. Para describir cuánto es posible confiar en que el parámetro poblacional se encuentre en el
intervalo se debe generar un enunciado probabilístico. Por ejemplo: se cuenta con 90% de seguridad de
que el ingreso anual medio de los trabajadores de la construcción en el área de Nueva York a Nueva Jersey
se encuentra entre 61000 y 69000. La información relacionada con la forma de la distribución muestral de
medias, es decir, de la distribución muestral de AW , permite localizar un intervalo que tenga una probabilidad
específica de contener la media poblacional, µ. En el caso de muestras razonablemente grandes, los
resultados del teorema del límite central permiten afirmar lo siguiente:
1) 95% de las medias muestrales seleccionadas de una población se encontrará a ± 1.96
desviaciones estándar de la media poblacional, µ.
2) 99% de las medias muestrales se encontrará a ± 2.58 desviaciones estándar de la media
poblacional.
3)
Para los anteriores casos se utilizan las siguientes fórmulas:
W
Para el intervalo de confianza de 95%:A
\ 1,96
√^
W
Para el intervalo de confianza de 99%:A
\ 2,58
√^
]
]
En resumen la formula quedaría así para cualquier intervalo de confianza.
W
Intervalo de confianza para la media poblacional con una σ conocida A
\V
]
√^
Los valores de ± 1,96 y ± 2,58 son valores zcorrespondientes a 95% medio y 99% de las observaciones
respectivamente, por tanto estos intervalos de confianza para la media poblacional se utilizan cuando la
desviación estándar σ es conocida.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Ejemplo
Una firma de enlatados distribuye duraznos en trozo en latas de 4 onzas, para asegurar que cada lata
contenga por lo menos la cantidad que se requiere, la empresa establece que el proceso de llenado debe
verter 4,01 onzas de duraznos y almíbar en cada lata. Así 4,01 es la media poblacional. Por supuesto no
toda lata contendrá exactamente 4,01 onzas de duraznos y almíbar. Suponga que la desviación estándar
del proceso es del 0,02 onzas y el proceso se rige por una distribución normal, ahora se selecciona una
muestra aleatoria de 16 latas y se determina la media de la muestra. Esta es de 4,015 onzas de duraznos y
almíbar. El intervalo de confianza de 95% para la media poblacional de esta muestra en particular es de:
4,015 ± 1,96 (0,02 / √16 ) = 4,015 ± 0,0098
El nivel de confianza de 95% se encuentra entre 4,0052 y 4,0248. Estos puntos extremos reciben el nombre
de límites de confianza. El grado de confianza o nivel de confianza es de 95%, y el intervalo de confianza
abarca de 4,0052 a 4,0248. Con frecuencia, ± 0,0098 se conoce como margen de error.
Por supuesto en este caso, la media poblacional de 4,01 onzas se encuentra en este intervalo. Pero no
siempre será así. En teoría, si selecciona 100 muestras de 16 latas de la población , se calcula la media
muestral y se crea un intervalo de confianza basado en cada media muestral, se esperaría una media
poblacional de aproximadamente 95 de los 100 intervalos.
Desviación estándar de la población desconocida σ
Por fortuna se utiliza la desviación estándar de la muestra para estimar la desviación estándar de la
población. Es decir, se utiliza spara estimar σ. No obstante al hacerlo no es posible utilizar la fórmula antes
vista. Como no se conoce σ, no puedo utilizar la distribución z, por tanto se utiliza la distribución tla cual es
una distribución de probabilidad continua, con muchas características similares a las de la distribución z y su
fórmula es:
Distribución t =
_W $`
a
√b
Acá ses un estimador de σ. La distribución “t” es mas plana y se extiende mas que la distribución normal
estándar, esto se debe a que la desviación estándar de la distribución t es mayor que la distribución normal
estándar.
W
Intervalo de confianza para la media poblacional con una σ desconocida A
\M
c
√^
Ejemplo
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de 10 llantas para
recorrer 50.000 millas reveló una media muestral de 0,32 pulgadas de cuerda restante con una desviación
estándar de 0,09 pulgadas. Construya un intervalo de confianza de 95% para la media poblacional. Sería
razonable que el fabricante concluyera que después de 50.000 millas la cantidad media poblacional de
cuerda restante es de 0,30 pulgadas?
Primero se supone que la distribución de la población es normal. No se conoce la desviación estándar de la
población, pero sí se conoce la desviación estándar de la muestral, que es de 0,09 pulgadas.
W
Intervalo de confianza para la media poblacional con una σ desconocida A
Intervalo de confianza para la media poblacional con una σ desconocida 0,32\2,262
DEPARTAMENTO DE CIENCIASBÁSICAS
\M
5,5d
√75
c
√^
0,32 \ 0,064
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
Para hallar el valor de tse debe ubicar en la tabla el nivel de confianza y los grados de libertad gl el cual se
escribe como n-1, en este caso 10-1=9, en ese ejercicio el valor de tes de 2,262.
La interpretación de la respuesta quedaría:
El fabricante puede estar seguro (95% seguro) de que la profundidad media de las cuerdas oscila entre
0,256 y 0,384 pulgadas. Como el valor de 0,30 se encuentra en este intervalo, es posible que la media de la
población sea de 0,30 pulgadas.
5. INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN
El desarrollo de un estimador puntual para la proporción de la población y un intervalo de confianza para una
proporción de población es similar a hacerlo para una media.
La interpretación de un intervalo de confianza resulta de mucha utilidad en la toma de decisiones y
desempeña un papel importante en eventos como las elecciones.
Ejemplo
Danny Guerrero se postula para representar ante el Congreso a Piedecuesta. Suponga que se entrevista a
los electores que acaban de votar y 275 indican que votaron por Guerrero. Considere que 500 electores es
una muestra aleatoria de quienes votan en Piedecuesta. Esto significa que 55% de los electores de la
muestra votó por Guerrero.
_
p=
^
-e8
855
0,55
Ahora, para estar seguros de la elección, Guerrero debe ganar más de 50% de los votos de la población de
electores. En estos momentos se conoce un estimador puntual, que es de 0,55, de la población de electores
que votarán por él. Ahora bien, no se conoce el porcentaje de la población que votará por el candidato. Así,
la pregunta es: ¿Es posible tomar una muestra de 500 electores de una población en la que 50% o menos
de los electores apoye a Guerrero para encontrar que 55% de la muestra lo apoya? En otras palabras, ¿el
error de muestreo, que es p-P = 0,55 - 0,5 = 0,05, se debe al azar, o la población de electores que apoya a
Guerrero es superior a 0,50?. Si se establece un intervalo de confianza para la proporción de la muestra y
halla que 0,50 no se encuentra en el intervalo, concluirá que la proporción de electores que apoya a
Guerrero es mayor que 0,50. ¿Qué significa esto? Bien, significa que puede resultar electo. ¿Qué pasa si
0,50 pertenece al intervalo? Entonces concluirá que es posible que 50% o menos de los electores apoyen
su candidatura y no es posible concluir que será electo a partir de la información de la muestra. En este
caso, si se utiliza el nivel de significancia de 95% la formula sería:
Intervalo de confianza de la proporción de una población
Intervalo de confianza de la proporción de una población
= + \ Vf
= 0,55\1,96f
g 7$g
5,88 7$5,88
855
^
0,55 \ 0,044
Así los puntos extremos del intervalo de confianza son 0,55 – 0,044 = 0,506 y 0,55 + 0,44 = 0,594. El valor
de 0,50 no pertenece al intervalo. Por tanto, se concluye que probablemente más del 50% de los electores
apoya a Guerrero, lo cual es suficiente para que salga electo.
Este es el procedimiento que utilizan las cadenas de televisión, revistas de noticias y sondeos en la noche
de las elecciones.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
UNIDADES TECNOLÓGICAS DE SANTANDER
ELEMENTOS DE UNA PRUEBAS DE HIPÓTESIS
En este nuevo capítulo en lugar de crear un conjunto de valores en el que se espera que se presente el
parámetro poblacional, se expone un procedimiento para probarla validez de un enunciado relativo a un
parámetro poblacional, algunos ejemplos de enunciados por probar son los siguientes:
•
•
•
La cantidad media de kilómetros recorridos en una camioneta Chevrolet Captiva rentada durante
tres años es de 32000 kilómetros
El tiempo medio que una familia estadounidense vive en una vivienda en particular es de 11,8 años.
En 2005, el salario inicial medio en ventas para un graduado de universidad es de $37.130
Este capítulo trata de pruebas de hipótesis estadísticas, primero se definen los términos de hipótesis y
pruebas de hipótesis, luego se aplican pruebas de hipótesis para medias y proporciones.
HIPÓTESIS
En el sistema legal estadounidense, una persona es inocente hasta que se prueba su culpabilidad. Un
jurado platea como hipótesis que una persona a la que se le imputa un crimen es inocente, y someten esta
hipótesis a verificación, para lo cual revisan la evidencia y escuchan el testimonio antes de llegar a un
veredicto. En forma similar, un paciente visita al médico y acusa varios síntomas. Con base en ellos, el
médico indicará ciertos exámenes, determina el tratamiento.
En el análisis estadístico se establece una afirmación, una hipótesis, se recogen datos que posteriormente
se utilizan para probar la aserción. Entonces una hipótesis estadística es la afirmación relativa a un
parámetro de población sujeta a verificación.
PRUEBA DE HIPÓTESIS
Los términos prueba de hipótesisy probar una hipótesis se utilizan indistintamente. La prueba comienza con
una afirmación o suposición, sobre un parámetro de la población, como la media poblacional. Esta
afirmación recibe el nombre de hipótesis
Ejemplo
Una hipótesis puede ser que la comisión mensual media de las comisiones de los vendedores de tiendas al
menudeo de aparatos electrónicos, como Royal Circuitos es de $20.000. No es posible entrar en contacto
con todos los vendedores para asegurarnos de que la media en realidad es esa. El costo de localizarlos y
entrevistarse con ellos sería exorbitante. Para probar la validez de la afirmación (µ=20.000), se debe
seleccionar una muestra de la población de vendedores de dichos aparatos, calcular el estadístico muestraly
, con base en ciertas reglas de decisión, aceptar o rechazar la hipótesis. Una media muestral de $10.000
para dichos vendedores provocaría con certeza rechazo de la hipótesis. Sin embargo, suponga que la
media de la muestra es de $19.995. Está lo bastante cerca de $20.000 para aceptar la suposición de que la
media de la población es de $20.000? La diferencia de $5 entre las dos medias se puede atribuir al error de
muestreo, o dicha diferencia resulta estadísticamente significativa?
Entonces la prueba de hipótesis es el procedimiento basado en evidencia de la muestra y la teoría de la
probabilidad para determinar si la hipótesis es una afirmación.
DEPARTAMENTO DE CIENCIASBÁSICAS
Versión 2 – Agosto de 2011
Descargar