1 UNIDAD 6 TEORIA DE PROBABILIDADES EL INTERÉS DE LA ESTADÍSTICA VA MÁS ALLÁ DE LA MERA DESCRIPCIÓN DE LAS OBSERVACIONES. Los fenómenos pueden ser determinísticos (que se pueden predecir por ecuaciones matemáticas) o aleatorios (que no pueden predecirse exactamente). En estadística se manejan datos aleatorios; en ellos no es posible efectuar predicciones exactas mediante el uso de modelos matemáticos, pero al ser estudiados un gran número de veces bajo condiciones semejantes se encuentra que los resultados presentan cierta regularidad. Por lo tanto, nunca vamos a estar seguros de lo que vaya a pasar, pero con base en la información del pasado podemos predecir con fundamentos. El concepto de probabilidad ocupa un lugar importante en el proceso de toma de decisiones bajo incertidumbre, no importa si el problema es enfrentado en el campo de los negocios, de la ingeniería, en las ciencias sociales, o simplemente en nuestras vidas diarias. En muy pocas situaciones de toma de decisiones la información perfecta está disponible todos los factores u hechos necesarios-; la mayoría de las decisiones se toman encarando la incertidumbre. Precisamente, el objetivo de la teoría de probabilidades es poder hacer predicciones y tener un elemento más de juicio en la toma de decisiones (si pronostico qué tan probable es que ocurra algo, puedo determinar si tomo el riesgo o no). Con la teoría de probabilidades se pueden construir modelos que describen adecuadamente la regularidad de los resultados aleatorios, de tal forma que se puedan hacer predicciones. 1. CONCEPTOS BÁSICOS a. ¿Qué es?: La probabilidad es una herramienta para medir la posibilidad de ocurrencia de un evento. Dicho de otra forma, es la medición de la incertidumbre acerca de la ocurrencia de determinada situación. Puede tomar un valor entre 0 y 1 (0 si nunca se presenta y 1 si siempre lo hace). Si un experimento puede tener como resultado cualquiera de N diferentes resultados igualmente probables y si exactamente n de esos resultados corresponden al evento A, entonces: P( A) n N 2 La probabilidad de que no ocurra es: q = 1 – p. Una probabilidad también puede expresarse como p/q (p:q o de p a q). Aparte de su valor en apuestas, esta manera de expresarla permite especificar una probabilidad pequeña (cerca de cero) o una probabilidad grande (cerca de uno) usando números enteros grandes (1.000 a 1 o un millón a uno) para magnificar probabilidades pequeñas (o probabilidades grandes) con el objetivo de hacer las diferencias relativas visibles. Dicho de otra manera, la probabilidad clásica de que un evento ocurra se calcula dividiendo el número de resultados favorables entre el número de posibles resultados. El enfoque anterior supone que los resultados experimentales son equiprobables; eso es razonable si el caso es completamente aleatorio, pero tiene muchos problemas cuando intentamos aplicarlo a los problemas de decisión menos ordenados que encontramos en la realidad. Por eso, en general, lo mejor es calcular la probabilidad experimentalmente, determinando la frecuencia con que algo ha sucedido en el pasado y mediante esa cifra predecir la probabilidad de que vuelva a suceder en el futuro; por eso, la probabilidad de un resultado puede interpretarse como el valor límite de la proporción de veces que el resultado aparece en n repeticiones del experimento aleatorio, a medida que n crece sin cota alguna. Si n tiende a infinito, se da una estabilización de la frecuencia relativa (tiende a un límite fijo). Por ejemplo, al lanzar un dado, es imposible que un valor determinado resulte en 1/6 de las observaciones; tampoco significa que si hacemos 600 observaciones, vamos a obtener 100 de cada especie; pero si se repite muchas veces, en promedio, los 6 resultados posibles se presentarán con frecuencias prácticamente iguales. Si esto no sucede, debemos sospechar que otro factor está interviniendo en lo que observamos. La probabilidad puede también tener un enfoque subjetivo, es decir, basada en el grado de creencia de que ocurra el resultado, por lo que personas distintas pueden asignar distintas probabilidades a un mismo resultado. Para aplicar este método se puede usar cualquier dato disponible o la experiencia e intuición de la persona que evalúa. Cuando se asigna una probabilidad se está expresando un resultado del cual no se tiene seguridad, pero con base en la información del pasado o a partir de una comprensión de la estructura del experimento puede tenerse algún grado de confianza en la validez de la información. b. Experimento: Cualquier proceso que genere resultados bien definidos, lo cual quiere decir que en cualquier repetición única del experimento ocurrirá uno y sólo uno de los resultados experimentales posibles. En estadística, la noción de experimento es distinta de la noción en ciencias físicas; en éstas, por lo general, un experimento se lleva a cabo en un laboratorio o en un ambiente controlado, para aprender acerca de un hecho científico y cuando se repiten los experimentos bajo condiciones idénticas se espera obtener el mismo 3 resultado. En los experimentos estadísticos, los resultados están determinados por el azar y aunque el experimento se repita exactamente en la misma forma, puede obtenerse un resultado completamente distinto. c. Espacio muestral (S): Conjunto de todos los datos posibles de un experimento estadístico. d. Punto muestral: Cada resultado de un espacio muestral. Se pueden especificar por un diagrama de árbol, que es un dispositivo gráfico útil para visualizar un experimento de varias etapas y enumerar los resultados experimentales. Ejemplo 6.1. Considere el experimento de lanzar sucesivamente dos monedas. Describa el espacio muestral C C S C,C C,S C S,C S S,S S S (C, C ),(C, S ),(S , C ),(S , S ) e. Evento o suceso (E): Subconjunto del espacio muestral (colección de puntos muestrales). Un evento es el elemento básico al cual se puede aplicar la probabilidad; un evento sucede o no sucede. Con los eventos se pueden efectuar las operaciones comunes de conjuntos (intersección, unión y complemento) para describir cualquier caso en términos de eventos simples. f. Evento aleatorio: Se dice que un evento es aleatorio cuando no se tiene certeza de si ocurrirá o no en el momento de la observación. Independientemente de la forma que se utilice para asignar una probabilidad, se deben satisfacer dos requisitos básicos: (1) 0 P( E) 1 4 (2) P(S) =1, lo que implica que la suma de todas las probabilidades de resultados experimentales debe ser 1. Por lo tanto, si un espacio muestral tiene k resultados experimentales: P( E1 ) P( E2 ) ......... P( Ek ) 1 2. REGLAS DE PROBABILIDAD Es posible expresar gráficamente la relación entre eventos y el espacio muestral correspondiente por medio de diagramas de Venn (espacio muestral con un espacio cerrado –rectángulo- y los eventos con círculos). Ejemplo 6.2. De los 95 estudiantes del nivel III de Administración y Negocios Internacionales de la I.U.E. se encontró que 78 cursan Estadística, 65 Mercados, 69 Matemáticas III, 45 cursan las 3 materias, 17 Estadística y Mercados pero no Matemáticas III, 15 Estadística y Matemáticas III pero no Mercados y 3 Mercados y Matemáticas III pero no Estadística. ¿Cuál es la probabilidad de que uno de esos estudiantes no esté en ninguno de los 3 cursos? Solución: P(no curse ninguno) = 8/95 = 0.084 a) Eventos mutuamente excluyentes: Dos o más sucesos son considerados mutuamente excluyentes si éstos no pueden ocurrir simultáneamente; es decir, la ocurrencia de uno cualquiera de ellos excluye la ocurrencia de los otros. Dos eventos mutuamente excluyentes no tienen elementos en común, lo que implica que: P (A ∩ B) = 0 P (A U B) = P(A) + P(B) b. Eventos no excluyentes: Si es posible que ambos ocurran simultáneamente. En este caso: P (A U B) = P(A) + P(B) – P(A ∩ B) P (A ∩ B) es diferente de 0. P(A U B U C)=P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) +P(A ∩ B ∩ C) 5 Ejemplo 6.3. Una encuesta sobre las prestaciones a 254 ejecutivos de corporaciones indicó que a 195 se les dio celular, a 152 se les paga membresía a un club y a 110 se les daba ambas cosas como una prestación asociada con su puesto. a) Calcule la probabilidad de que uno de esos ejecutivos tenga al menos una de las dos concesiones. b) ¿Cuál es la probabilidad de que uno de esos ejecutivos no tenga alguna de las concesiones? Solución: P(C) = 195/254 P(M) = 152/254 P(T D) = 110/254 a) P(C M) = P(C) + P(M) – P(C M) = 195/254 + 152/254 – 110/254 = 0.9331 b) P(C M )' 1 0.9331 0.0669 (17/254) c. Probabilidad marginal, condicional y conjunta: Probabilidad marginal es la probabilidad de un evento simple [P(A), P(B)] Probabilidad conjunta es la probabilidad de que varios eventos ocurran simultáneamente. Se denota como P(A∩B) o P(AB). La probabilidad condicional se denota por P(B\A), lo cual indica la probabilidad de que un evento B ocurra cuando ya se sabe que ocurrió el evento A. De la misma forma P(A\B) indica la probabilidad de que ocurra A dado que ocurrió B. Las anteriores definiciones han sido expresadas para el caso de dos eventos, pero las mismas ideas pueden aplicarse para cualquier número de eventos. La probabilidad condicional de B dado que ocurrió A se define como: P( B / A) P( A B) P( A) 6 y la probabilidad condicional de A dado que ocurrió B se define como: P( A / B) P( A B) P( B) Lo anterior implica que P(A∩B) = P(A)*P(B\A) o P(A∩B) = P(B)*P(A\B) La noción de probabilidad condicional proporciona la capacidad de reevaluar la idea de probabilidad de un evento a la luz de la información adicional. Ejemplo 6.4. El 80% de las empresas pequeñas del sector de alimentos no están preparadas para un tratado de libre comercio con USA, al igual que el 63% de las empresas medianas y 30% de las grandes. El 80% de las empresas del sector son pequeñas, el 15% son medianas y el resto grandes. a) Hacer tabla que permita evaluar probabilidades. b) ¿Cuál es la probabilidad de que una empresa no esté preparada para el TLC y sea pequeña? c) ¿Qué porcentaje de las empresas están preparadas? d) Si una empresa no está preparada para el TLC, ¿cuál es la probabilidad de que sea pequeña? e) Si una empresa es pequeña, ¿cuál es la probabilidad de que esté preparada? Solución: a) Nivel de preparación Total No Sí Pequeña (P) 64 16 80 b) P(P ∩ no) = 64/100 = 0.64 c) P (sí) = 25.05% d) P (P\no) = 64/74.95 = 0.854 Tamaño Mediana (M) 9.45 5.55 15 Total Grande (G) 1.5 3.5 5 74.95 25.05 100 7 e) P(no\P) = 64/80 = 0.8 d. Independencia estadística: Dos eventos son independientes si la ocurrencia o no de A no afecta para nada la probabilidad de ocurrencia de B. En este caso: P(A\B) = P(A) y P(B\A) = P(B) Es decir, la ocurrencia de B no tiene impacto en la probabilidad de ocurrencia de A, o viceversa. Eso implica que, si dos eventos son independientes: P(A ∩ B) = P(A) * P(B) Es importante notar que los términos independiente y mutuamente excluyentes no significan lo mismo. Si A y B son independientes y el evento A ocurre, el resultado de B no se verá afectado, es decir, podrá ocurrir o no; no obstante, si A y B son mutuamente excluyentes y el evento A ocurre, es seguro que el evento B no ocurrirá. Ejemplo 6.5. Una gran empresa ha realizado un análisis cuidadoso de una promoción de precios que está bajo prueba en este momento. Un 20% de las personas en una gran muestra de individuos en el mercado de prueba están enterados de la promoción y han realizado una compra. Además, el 80% está enterado de la promoción y, antes de ella, 25% de las personas de la muestra compraban el producto. a) ¿Cuál es la probabilidad de que una persona compre, dado que está enterada de la promoción? b) ¿Son independientes los eventos “compró” y “enterado de la promoción de precios”? c) ¿Recomendaría usted que la empresa introdujera esta promoción a nivel nacional? Solución: Sea: C: Compra S: Sabe de la promoción P( S C ) 0.2 0.25 P( S ) 0.8 a) P(C\S) = b) Sí son independientes porque P(C\S) sigue siendo igual a P(C) antes de la promoción. c) Por lo anterior, no sería recomendable introducir la promoción. 8 3. TEOREMA DE BAYES Una parte importante del análisis de probabilidades es la actualización cuando se adquiere información adicional. Generalmente el análisis se comienza con estimados iniciales (probabilidades a priori) a los eventos específicos de interés; posteriormente, con base en otras fuentes –como por ejemplo una muestra o un informe-, se obtiene información adicional y con ella se modifican los valores de las probabilidades previas (probabilidades a posteriori). El teorema de Bayes proporciona un método para calcular esas probabilidades. Dicho teorema sólo puede utilizarse cuando los eventos para los cuales se desea aplicar las probabilidades a posteriori son mutuamente excluyentes y colectivamente exhaustivos, es decir, la unión de esos eventos es todo el espacio muestral. La manera más simple e ilustrativa para describir esas probabilidades es un diagrama de árbol, en el cual se muestran primero las probabilidades a priori y estas se subdividen en los condicionales. El Teorema de Bayes puede expresarse así: Si E1, E2,…., Ek son k eventos exhaustivos y excluyentes y B es cualquier evento, entonces: P( E1 / B) P( B / E1 ) * P( E1 ) P( B) Como las categorías son mutuamente excluyentes: P(B) = P(E1∩B) + P(E2∩B) + …..... + P(Ek∩B) = P(E1)P(B\E1) + P(E2)P(B\E2) + …......... + P(Ek)P(B\Ek) P( E1 / B) P( B / E1 ) * P( E1 ) P( B / E1 ) P( E1 ) P( B / E2 ) P( E2 ) ....... P( B / Ek ) P( Ek ) Ejemplo 6.6. Un productor de videograbadoras compra un microchip particular, llamado LS-24, a tres proveedores: Hall Electronics, Schuller Sales y Crawford Components. 30% de los chips los compra al primer proveedor, 20% al segundo de ellos y lo restante al último. El fabricante tiene largas historias sobre los tres proveedores y sabe que el 3% de los chips LS-24 de Hall Electronics son defectuosos, 5% de los de Schuller Sales salen defectuosos y 4% de los chips comprados a Crawford Components salen defectuosos. 9 Cuando los chips llegan a la fábrica los ponen directamente en una caja, sin inspeccionarlos o identificarlos según el proveedor. Un trabajador toma un microchip para instalarlo en una videograbadora y encuentra que está defectuoso. ¿Cuál es la probabilidad de que el proveedor haya sido Schuller Sales? Solución: La probabilidad que quiere determinarse puede describirse como P(A2\D). Como el récord de calidad de Schuller es el peor de los tres proveedores, se puede suponer que P(A2\D) es mayor que P(A2); para calcular qué tanto se aplica el Teorema de Bayes: P( A2 / D) P( A2 ) P( D / A2 ) P( A1 ) P( D / A1 ) P( A2 ) P( D / A2 ) P( A3 ) P( D / A3 ) P( A2 / D) (0.2)(0.05) 0.2564 (0.3)(0.03) (0.2)(0.05) (0.5)(0.04) Esto es razonable porque el récord de calidad de Schuller no es tan bueno como el de los otros proveedores; dicho de otra manera, como se tiene la información adicional de que el LS-24 está defectuoso, la posibilidad de que haya sido producido por Schuller aumenta en más de 5%. La probabilidad a posteriori muestra también los cambios en las posibilidades de que la pieza haya sido fabricada por otros proveedores; por ejemplo, se puede encontrar que la probabilidad de que la pieza defectuosa haya sido fabricada por Hall Electronics se reduce de una probabilidad a priori de 0.3 a una probabilidad a posteriori de 0.2308. Ejemplo 6.7. De acuerdo con la experiencia de un profesor de estadística, los estudiantes que desarrollan los ejercicios propuestos tienen una probabilidad de 0.9 de ganar el curso, pero quienes no los hacen tienen una probabilidad de 0.25 de aprobarlo. El profesor estima que el 75% de los estudiantes de la clase hacen los ejercicios. Si un alumno aprobó el curso, ¿cuál es la probabilidad de que haya hecho los ejercicios propuestos con regularidad? Solución: P(E) = 0.75 Por lo tanto: P(G\E) = 0.9 P(E\G) = P(G\E’) = 0.25 0.75 * 0.9 0.915 0.75 * 0.9 0.25 * 0.25 10 EJERCICIOS PROPUESTOS 1. Una encuesta a algunos estudiantes de la universidad sobre la cantidad de actividades extracurriculares en que participa dio como resultado los siguientes datos: Cantidad de actividades 0 1 2 3 4 5 Frecuencia 8 25 21 10 6 1 a) ¿Cuál es la probabilidad de que un estudiante participe al menos en una actividad? b) ¿Cuál es la probabilidad de que un estudiante participe en más de tres actividades? 2. En un estudio reciente que llevó a cabo el gerente de personal de una empresa de programas de cómputo encontró que de los 114 empleados que salieron de la compañía en los dos últimos años, 40 lo hicieron principalmente por no estar satisfechos con su salario, 35 salieron por no estar satisfechos con las actividades en su trabajo y 26 manifestaron no estar satisfechos ni con su salario ni con sus trabajos. a) ¿Cuál es la probabilidad de que un empleado que haya salido en los dos últimos años lo haya hecho por no estar satisfecho con su sueldo, su trabajo o con ambas cosas? b) ¿Cuál es la probabilidad de que haya salido por un motivo diferente? 3. El 49% de las exportaciones antioqueñas tienen como destino Estados Unidos, 20% va a países cercanos de Sudamérica, 16% a Europa y el resto a otros países. El 45% de lo que se exporta a Estados Unidos hace parte del sector agropecuario, al igual que 38% de lo que se exporta a países cercanos, 60% de lo que se exporta a Europa y 50% de lo que se exporta a otros países. a) ¿Qué proporción de las exportaciones antioqueñas es de productos agropecuarios? b) Si una exportación es de productos que no son agropecuarios, ¿cuál es la probabilidad de que sea a Europa? 4. Una compañía de seguros divide a las personas en dos clases: Quienes son propensos a accidentes y quienes no lo son. Sus estadísticas muestran que una persona propensa a accidentes tendrá, en no más de un año, un accidente con una probabilidad de 0.4; esa probabilidad decrece a 0.1 para personas no propensas a accidentes. Estadísticas anteriores demuestran que el 30% de la población es propensa a accidentes. 11 a) ¿Cuál es la probabilidad de que una persona que compra una nueva póliza tenga un accidente en no más de un año? b) Un nuevo asegurado ha tenido un accidente a los 3 meses de haber comprado su póliza, ¿cuál es la probabilidad de que sea propenso a accidentes? 5. La empresa de telemercadeo XYZ ha encontrado que el 10% de los clientes potenciales que ellos llaman, finalmente realizan la compra. Sin embargo, durante la primera llamada muchos clientes piden que los vuelvan a llamar después. Estadísticas de los últimos días han mostrado que de 30 personas que hicieron la compra, 12 habían pedido que los llamaran después; de los 270 que no compraron, 46 habían pedido que los llamaran después. a) Si alguien pide que lo llamen después, ¿se justifica hacerlo? Responda basándose en la probabilidad de ese hecho. b) ¿Qué porcentaje de los que no pidieron que los llamaran después realizaron la compra? 6. En una encuesta entre los estudiantes de Administración de la universidad se obtuvieron los datos siguientes acerca del principal motivo del estudiante para solicitar su ingreso. Horario Diurno Mixto Calidad 64 16 Motivo de la solicitud Costo Otros 156 105 45 36 a) Haga comentarios sobre el motivo principal para solicitar ingreso a la universidad. b) Si un alumno es de horario mixto, ¿cuál es la probabilidad de que la calidad sea el motivo principal para haber elegido la universidad? c) Si un estudiante de administración eligió la universidad por costo, ¿cuál es la probabilidad de que sea de horario diurno? d) Sea A el evento en que el alumno es de horario diurno y sea B el evento en que el alumno menciona que la calidad de la universidad fue el principal motivo de su solicitud. ¿Son independientes los eventos A y B? 7. Una empresa de consultoría se ha presentado a un concurso para un gran proyecto de investigación. Inicialmente la dirección de la empresa pensó que tenía una oportunidad de 50% de obtener el contrato; sin embargo, la dependencia a la que fue presentada la propuesta ha solicitado más información al respecto. Por experiencia, se sabe que la dependencia pidió información adicional en el 75% de las propuestas aceptadas y en el 40% de las propuestas rechazadas. a) ¿Cuál es la probabilidad de que la oferta tenga éxito, dado que se ha solicitado información adicional? b) ¿Cuál es la probabilidad de tener una solicitud de informes adicionales, dado que al final la oferta será seleccionada? 12 8. En la evaluación de un programa de adiestramiento de ventas, una encuesta encontró que de 50 vendedores que se hicieron acreedores a un bono en el año anterior por sus altas ventas, 20 habían participado en el programa de adiestramiento; la empresa tiene 200 vendedores. Sea B el evento en que un vendedor merece bono y S el evento en que un vendedor participa en el programa de adiestramiento en ventas. a) Determine P(B), P(S\B) y P(S∩B). b) Suponga que el 40% de los vendedores ha asistido al programa. Halle P(B\S). c) Si la empresa evalúa el programa en función de su efecto sobre la probabilidad de que los vendedores alcancen bono, ¿cuál es su evaluación de ese programa?. d) ¿Son B y S independientes? 9. El director de publicaciones de una importante editora de libros de texto trata de decidir si se debe publicar un nuevo texto de estadística para administración. Informaciones anteriores indican que 10% son grandes éxitos, 20% tienen un éxito moderado, 40% apenas cubren los costos y 30% producen pérdidas. No obstante, antes de tomar una decisión para publicarlo, se someterá la obra a una revisión de críticos. En el pasado, 99% de los grandes éxitos recibieron críticas favorables, 70% de los de éxito moderado recibieron críticas favorables, 40% de los que apenas cubrieron los costos recibieron críticas favorables y 20% de los que produjeron pérdidas recibieron críticas favorables. a) Si el texto propuesto recibe una crítica favorable, ¿cómo debe el director de publicaciones revisar las probabilidades de los diversos resultados para tener en cuenta esta información? b) ¿Qué proporción de los libros de texto reciben críticas favorables? 10. Un vendedor de Sistemas Empresariales S.A. vende equipo de rotulación automática de sobres a empresas pequeñas y medianas. La probabilidad de que con un cliente nuevo se concrete una venta es 0.1. Durante el contacto inicial con un cliente, a veces éste le pide al vendedor que lo llame después. De las 30 ventas más recientes, 12 fueron a clientes que inicialmente habían pedido que le llamaran después; de 270 clientes que no compraron, 46 habían pedido inicialmente al vendedor que los llamara después. Si un cliente pide al vendedor que lo llame después, ¿lo debe hacer? ¿Cuál es la probabilidad de vender a un cliente que ha pedido que lo llamen después? 11. Un estudio sobre los ejecutivos se ocupó de su lealtad a la compañía. Una de las preguntas fue: “¿si otra compañía le ofreciera a usted un puesto igual o ligeramente mejor al que tiene ahora, se quedaría en la compañía?”. Las respuestas de los 200 ejecutivos de la compañía se clasificaron de acuerdo con su tiempo de servicio. ¿Cuál es la probabilidad de seleccionar un ejecutivo que sea leal a la compañía y que tenga más de diez años de servicio? LEALTAD Se quedaría No se quedaría TIEMPO DE SERVICIO < un año 1 – 5 años 6 – 10 años 10 30 5 25 15 10 > 10 años 75 30 Total 120 80 13 12. El departamento de crédito de un almacén reportó que el 50% de sus ventas son pagadas en efectivo, 30% con cheque y 20% con tarjetas de crédito. Veinte por ciento de las compras en efectivo, 90% de las compras con cheque y 60% de las compras con tarjeta son por más de $200000. Una señora acaba de comprar un vestido que costó $300000, ¿cuál es la probabilidad de que haya pagado con tarjeta de crédito?