ESTADÍSTICA Y PROBABILIDADES I UNIVERSIDAD TECNOLÓGICA DEL PERÚ Vicerrectorado de Investigación ESTADÍSTICA Y PROBABILIDADES I TINS Básicos INGENIERÍA INDUSTRIAL, INGENIERÍA DE SISTEMAS, INGENIERÍA ELECTRÓNICA, INGENIERÍA MECATRÓNICA, INGENIERÍA TEXTIL, INGENIERÍA DE TELECOMUNICACIONES TEXTOS DE INSTRUCCIÓN BÁSICOS (TINS) / UTP Lima - Perú 1 ESTADÍSTICA Y PROBABILIDADES II © ESTADÍSTICA Y PROBABILIDADES I Desarrollo y Edición : Vicerrectorado de Investigación Elaboración del TINS : Mg. Heiner López Príncipe Diseño y Diagramación : Julia Saldaña Balandra Soporte académico : Instituto de Investigación Producción : Imprenta Grupo IDAT Queda prohibida cualquier forma de reproducción, venta, comunicación pública y transformación de esta obra. 2 ESTADÍSTICA Y PROBABILIDADES I Presentación El indeterministico, en el presente siglo va ganando márgenes importantes, en los certámenes donde se exponen trabajos relacionados con la “mecánica celestial” Universo y con la “mecánica de las partículas”. De modo que la teoría de probabilidades, en extensión, se va haciendo cada día más útil en el planteamiento y en la solución de problemas, en las diferentes áreas de actividad del hombre: en la economía, en el comportamiento social, en la esfera política, en general en toda actividad del hombre. Trabajos que tienen como antecedente las observaciones de Ricard de Fourmivel (1200-1250), contenido en su poema “De vetula”, donde expresa si se lanza tres dados se puede llegar a identificar 216 combinaciones. Doscientos años después Luca Paciola (1445-1517) propone un problema, conocido luego como “problema, del reparto de apuestas”, relacionado con la distribución de ganancias entre jugadores cuando el juego se interrumpe antes de finalizar. Más adelante Girolamo Cardano (1501-1576), en su obra el “Libro de los Juegos de Azar”, escrito en 1565 y sin embargo publicado en 1663, se ocupa también del problema de reparto de apuestas. Indica que la solución de Pacioli era incorrecta porque al considerar tan sólo el número de juegos generados por cada equipo, no contaba cuántos juegos debían ganar para hacerse con el premio. El problema que se comenta también fue tratado por Niccolo Tartaglia (1499-1557), quien observaba que la solución elaborada por Paccioli tenía restricciones y propuso una solución más general. No se puede cerrar estos años de la teocracia sin dedicar algunas líneas al trabajo de un coloso de la humanidad: Galileo Galilei (1564-1642), famoso por sus trabajos de Física, Astronomía e Ingeniería; primer sistematizador de la metodología experimental en la investigación científica, quien dedicó una parte de su tiempo a resolver problemas sobre dados, contenidos en su libro “sobre la puntuación en tiradas de dados”. No obstante su mayor contribución fue la creación de la “teoría de errores”: errores sistemáticos y errores aleatorios. Liberado de las ataduras de la escolástica que frenó, para desgracia de la humanidad trabajos de gran envergadura, no sólo en el campo de la incerteza, por considerarlos impíos, recién en el siglo XVII, con los trabajos de Pascal (1623-1662) y Fermat (16011665) empieza a establecerse los principios y métodos de cálculo de la incerteza. Más tarde el espíritu humano se ve engrandecido con la contribución de Huyghens (1629-1675), quien acopiando diversos trabajos elaborados hasta su época, reunió problemas diversos en un tratado, al que llamó “De Rotiociniis in ludo aleae”. Posteriormente siguieron trabajando para la gloria de la humanidad, en Holanda Huddes y Witt (1625-1672); Halley (1656-1742) en Inglaterra; aplicaron los cálculos a las probabilidades de la vida humana; Bernoulli (1654-1705) a su vez propuso a los geómetras de su época diversos problemas de probabilidades; entre ellos a Moivre. Unos años después, entre 1700 y 1706 Montmort (1678-1719) y Moivre (1667-1754) publican obras sobre el cálculo de probabilidades. La obra de Montmort con el título “Essai sur les Jeux de hasard” y el trabajo de Moivre 3 ESTADÍSTICA Y PROBABILIDADES II aparecieron en “Transactions Philosophiques” de 1711; obra que fue sometido por él a sucesivas correcciones, mientras intensificaba su trabajo de las “series recurrentes” que luego usó Lagrange para la integración de las ecuaciones lineales de diferencias con coeficientes constantes; procedimiento que muy poco antes había sido trabajo por Taylor. Más adelante, Bayes (1702-1761) bebiendo en la cantera de trabajos realizados por varios sabios que le antecedieron, estudió el problema de las causas y de los acontecimientos futuros, inferida de los acontecimientos sucedidos. Trabajos publicados después de su muerte en “Transactions Philosophiques” de 1763. Así mismo, dos años después de su muerte, en 1763 se publica “Essay Towards Solving a Problem in the Doctrine of Chances”, donde se enuncia el teorema que lleva su nombre. Continúa el avance de esta teoría con las contribuciones de Lagrange, con su obra publicada en “Mémoires de Turin” sobre las probabilidades de los términos medios, basado en la ley de los errores de las observaciones. En esta avanzada continuaron Legendre (1752-1833) y Gauss que concibieron la idea de sumar los cuadrados de los primeros miembros de las ecuaciones de condición y de convertir dicha suma en un “minimun”. Gauss (1777-1855), considerado el “príncipe de las matemáticas” y “el matemático más grande desde la antigüedad”, en 1823 publica “Theoria combinations observationum erroribus minimis obnoxiae”, dedicado a la distribución normal, cuya curva característica (campana de Gauss) es muy usada en disciplinas donde los datos podrían estar afectados por errores sistemáticos y casuales. Por ese tiempo, Pierre Simon Laplace un matemático francés que a los 24 años se le llamó el “Newton de Francia”, por la calidad de sus trabajos en la “Mecánica Celestial”, expuso en su gran obra “Traite du Mecanique Celeste” sus estudios acerca del sistema solar; contribuyendo a extender el modelo de Newton y sin embargo anotando que el sistema solar era estable y que “Dios era hipótesis innecesaria”. Un sabio de tal brillantez, no sólo trabajó en física astronómica, sino también como pensador presentó su “Hipótesis Nobular”, antecedido por Inmanuel Kant quien en 1755 presenta su obra “Allgemeine Naturgeschichte”. Trabajó, así mismo, en la teoría de probabilidades, planteando diversos problemas al azar, siendo uno de ellos el método de los mínimos cuadrados, presentando en 1812, en su “Theorie Analitique des Probabilités” donde supera las restricciones que Lagrange había considerado en sus “Memories de Turin”. Otra gran contribución, a la teoría de errores fué la de Simeon Poisson (1781-1840) quien planteó la pregunta: ¿es cierto que la media aritmética es siempre mejor que una única observación?. Altamente conocido por la distribución que lleva su nombre, comprobado posteriormente por A. Cauchy (1789-1857). Se suman a estos brillantes científicos, que trabajaron en la teoría de errores P Chebyshev con su Método de los Momentos (1821-1894) y A. Markov (1856-1922), conocido por su trabajo denominado: cadenas de Markov; discípulo de Chebyshev quien mejoró uno de los teoremas de su profesor, que más tarde fuera motivo de comprobación de A. Liaponuv (1857-1918) y de extensión en su generalización por Lindeberg (0000 0000), William Feller (0000 0000) y S. Bernshtein (0000 0000) Por esa misma época A. Khinchine (1894-1959) y Paul Levy (1886-1971) considerando 4 ESTADÍSTICA Y PROBABILIDADES I la sucesión de variables aleatorias, motivo de interés de estos científicos, encontraron las condiciones necesarias y suficientes para la convergencia de la distribución ∑ de variables. Avanzando en el tiempo de ascenso del hombre, en el siglo pasado se destaca la presencia de Frank P. Ramsey ( ) con su obra “Los fundamentos de la Matemática”; publicado en 1931 en el campo de la interpretación subjetiva de la probabilidad, considerada más amplia que la probabilidad de las frecuencias, conocida como frecuentista u objetiva. En el siglo pasado no se puede dejar de mencionar los trabajos de Émile Borel (1871-1956) en torno a la “teoría general de las medidas” para la sustentación amplia de los fundamentos de la teoría de las probabilidades. Sustento que N. Kolmogorov (1903-1987) continuó al proponer la axiomatización de la teoría de las probabilidades. En el marco de esta breve consideración de evolución de la probabilística y la estadística se pretende, dentro de las restricciones propias de la formación profesional, componer el Curso de Estadística y Probabilidades I, para alumnos del IV ciclo de la Carrera de Ingeniería de Sistemas, que con esfuerzo singular el profesor Mg. Heiner López, de gran ejecutoria académica-profesional, quien trabajando con denuedo académico ha logrado elaborar un texto didáctico para el aprendizaje de la teoría de probabilidades y la estadística. En este efecto la composición mencionada del presente trabajo se desplaza según la siguiente secuencia: Capítulo I. ESTADÍSTICA DESCRIPTIVA. El aprendizaje se inicia con el cálculo de los diferentes estadísticos mas usuales; media, mediana, moda, varianza, coeficiente de variación, etc, determinado sus valores será necesario interpretarlos según sus propiedades y definiciones. Se presenta también las graficas histogramas, polígonos de frecuencia, ojivas, diagrama circular, de los diferentes tipos de datos cualitativos o cuantitativos. Las propiedades de la media y varianza en soluciones de problemas son usuales. Se termina con el estudio con los percentiles deciles, cuartiles, además medidas de asimetría y curtosis. Capítulo II. PROBABILIDAD. Es la base fundamental del curso ya que es el soporte matemático para la inferencia estadística. Se basa fundamentalmente en experimentos aleatorios en los cuales se calcula las probabilidades sobre eventos aparecen teoremas importantes en probabilidad muy usuales en la solución de problemas. Desarrollamos la probabilidad condicional que tiene trascendencia en los procesos estocásticos, así mismo tratamos la probabilidad de independencia y dependencia de eventos que tienen gran aplicabilidad en ingeniería, para terminar con el teorema de la probabilidad total y teorema de Bayes de gran significación, ya que origina la teoría Bayesiana. Capítulo III. VARIABLE ALEATORIA. Es una función especial definida sobre un espacio muestral el cual puede ser discreto o continuo según sea el experimento aleatorio a tratar, generando funciones que pueden ser discretas (funciones de probabilidad) las cuales cumplen con propiedades establecida dentro del modelo probabilístico. Se le puede calcular su media (μ), Varianza (σ2) y la esperanza matemática E(X) de la variable aleatoria X, las cuales tienen propiedades que se usan en la solución de problemas diversos. Seguidamente desarrollamos las funciones de 5 ESTADÍSTICA Y PROBABILIDADES II densidad de probabilidad uniforme y exponencial ambas muy usuales en aplicaciones teóricas como prácticas. Capítulo IV. DISTRIBUCIONES DISCRETAS Y CONTINUAS. Las distribuciones generadas por variables aleatorias, pueden ser discretas como: Bernoulli, Binomial, Poisson, etc. ó continuas como la Normal, t de Student, etc. cada una de estas distribuciones tienen su media (μ) y varianza (σ2), las cuales son de utilidad en inferencia estadística. Las distribuciones mencionadas son modelos que con frecuencia se presentan en las diferentes especialidades, teniendo aplicaciones muy diversas. Por ejemplo la distribución binomial, muy usual en control de calidad, en encuestas de opinión, etc. la distribución de Poisson, estudia por ejemplo los fenómenos de llegada la teoría de colas, etc. La distribución normal la mas importante y usual en estadística, por su simetría en experimentos aun cuando las mediciones sean con errores de aproximación. Bajo condiciones determinadas podemos aproximar la binomial y Poisson con la Normal. Capítulo V. DISTRIBUCIONES MUESTRALES. El capítulo anterior se ocupó de distribuciones específicas, muy usuales en teoría de confiabilidad control de calidad y muestreo de aceptación. Nos concentramos en el muestreo de distribuciones o poblaciones y se estudian los valores de los estadísticos mas importantes como son la media muestral y varianza muestral que resultan de la extracción de una muestra aleatoria de una población pueda tener cualquier distribución, pero sin embargo la distribución de la media muestral puede seguir una normal o aproximadamente una normal tal afirmación lo sostiene el teorema del Límite Central (TLC) de gran aplicabilidad en la estadística inferencial. Capítulo VI. ESTIMACIÓN. Hemos señalado la importancia de las propiedades de la media y varianza muestral, el propósito de nuestro estudio es crear un fundamento para sacar conclusiones acerca de los parámetros poblacionales a partir de los datos experimentales. Por ejemplo, el Teorema Central de Límite (TLC) nos proporciona información acerca de la distribución de la media muestral X ; la distribución comprende la media poblacional μ. Entonces cualquier conclusión referente a μ, que se obtenga de un promedio muestral observado, depende del conocimento de la distribución muestral. La estimación de los parámetros poblacionales (μ, σ2, p) pueden, ser puntuales o por intervalos. Los estimadores usuales son la media, varianza y proporción ( x , S2, p̂ ) muestrales; siendo isesgados eficientes, consistentes y asintóticos. Nos centramos en la estimación para la media μ mediante intervalos usando las distribuciones, normal y “t” de Student. Al cerrar esta presentación debemos reconocer el esfuerzo y trabajo del profesor Heiner López Príncipe a quien la Institución agradece por su excelente contribución. Lucio H. Huamán Ureta Vicerrectorado de Investigación 6 ESTADÍSTICA Y PROBABILIDADES I “El presente material de lectura contiene una compilación de artículos, de breves extractos de obras de Estadística y probabilidades I publicadas lícitamente, acompañadas de resúmenes de los temas a cargo del profesor; constituye un material auxiliar de enseñanza para ser empleado en el desarrollo de las clases en nuestra institución. Éste material es de uso exclusivo de los alumnos y docentes de la Universidad Tecnológica del Perú, preparado para fines didácticos en aplicación del Artículo 41 inc. C y el Art. 43 inc. A., del Decreto Legislativo 822, Ley sobre Derechos de Autor”. 7 ESTADÍSTICA Y PROBABILIDADES II ÍNDICE CAPÍTULO I. Estadística Descriptiva ................................................. Semana 1 Introducción....................................................................................... Algunas definiciones y términos importantes en estadística ................ Definición de estadígrafos .................................................................. Etapas que cubre la estadística............................................................ Semana 2 Calculo de los estadígrafos más importantes....................................... Ejercicios de aplicación casos I, II y III................................................ Métodos de clasificación de datos por intervalos................................ 13 13 14 17 18 21 26 Semana 3 Estadísticos de tendencia central......................................................... Tipos de gráficas................................................................................. Propiedades de la media y varianza ................................................... Propiedades adicionales de la media.................................................. Ejercicios de aplicación ...................................................................... 31 32 36 36 38 Semana 4 Percentiles, deciles y cuartiles ............................................................ Medidas de asimetría y curtosis .......................................................... Ejercicios propuestos de recapitulación (tarea).................................... 44 49 52 CAPÍTULO II. Probabilidades ............................................................ Semana 5 Introducción....................................................................................... Algunas definiciones importantes en probabilidad ............................. Álgebra de eventos............................................................................. Ejercicios de aplicación ...................................................................... 67 68 69 70 Semana 6 Probabilidad de un evento ................................................................. Algunos teoremas importantes en probabilidad .................................. Ejercicios de aplicación ...................................................................... 77 78 79 8 67 ESTADÍSTICA Y PROBABILIDADES I Semana 7 Probabilidad condicional.................................................................... Ejercicios de aplicación ...................................................................... Probabilidad de la multiplicación de eventos ..................................... Ejercicios de aplicación ...................................................................... 89 90 95 96 Semana 8 Probabilidad de independencia de eventos ........................................ Ejercicios de aplicación ...................................................................... Teorema de la probabilidad total y teorema de Bayes......................... Ejercicios de aplicación ...................................................................... Ejercicios propuestos de recapitulación (tarea).................................... 101 105 103 105 108 Semana 9 Repaso y solución de los ejercicios propuestos de recapitulación Semana 10. EXAMEN PARCIAL CAPÍTULO III. Variable Aleatoria ..................................................... Semana 11 Secuencia natural de problemas en variable aleatoria......................... Propiedades de la variable aleatoria discreta y continua ..................... Variable aleatoria discreta .................................................................. Ejercicios de aplicación ...................................................................... Esperanza matemática en variable aleatoria discreta........................... Ejercicios de aplicación ...................................................................... Semana 12 Variable aleatoria continúa................................................................. Función de densidad de probabilidad uniforme ................................. Función de densidad de probabilidad exponencial............................. Ejercicios de aplicación Ejercicios propuestos de recapitulación (tarea).................................... CAPÍTULO IV. Distribuciones de probabilidad discreta y continua .. Semana 13 Distribuciones de probabilidad discreta.............................................. Distribución binomial......................................................................... Ejercicios de aplicación ...................................................................... Distribución de Poisson...................................................................... Ejercicios de aplicación ...................................................................... 9 125 125 127 128 128 128 138 141 144 146 149 167 167 167 169 174 175 ESTADÍSTICA Y PROBABILIDADES II Teorema de aproximación de las distribuciones binomial y Poisson... 180 Semana 14 Distribución Normal........................................................................... Lectura de tabla .................................................................................. Ejercicios de aplicación ...................................................................... 183 186 186 Semana 15 Errores de aproximación en mediciones usando distribución normal . Ejercicios de aplicaciones................................................................... Aproximación de la distribución Normal a la binomial ...................... Ejercicios de aplicación ...................................................................... Distribución de Weibull ..................................................................... Ejercicios de aplicación ...................................................................... Ejercicios propuestos de recapitulación (tarea).................................... 193 193 197 198 202 204 205 CAPÍTULO V. Distribuciones muéstrales........................................... Semana 16 Distribuciones muéstrales................................................................... Teorema del límite central (TLC)......................................................... Ejercicios de aplicación ...................................................................... Estimación.......................................................................................... 223 223 225 226 229 CAPÍTULO VI. Estimación ................................................................. Semana 17 Métodos clásicos de estimación ......................................................... Estimación puntual ............................................................................. Cualidades de un buen estimador ...................................................... Estimación por Intervalo ..................................................................... Intervalo de confianza para la media con varianza conocida.............. 231 231 232 234 236 Semana 18 Intervalo de confianza para la media con varianza no conocida......... Ejercicios de aplicación ...................................................................... Ejercicios propuestos de recapitulación (tarea).................................... 243 245 249 Semana 19. EXAMEN FINAL TABLAS ESTADÍSTICAS TABLA 1.- Distribución Normal Estándar........................................... TABLA 2.- Distribución t de Student ................................................... Bibliografía ........................................................................................ 257 259 261 10 231 ESTADÍSTICA Y PROBABILIDADES I DISTRIBUCIÓN TEMÁTICA Clase N° Tema Horas 1 Conceptos y definiciones fundamentales de la estadística. Población, muestra, variable, etc. Tipos de muestra, (no probabilística y probabilística, extracción de una muestra aleatoria) 03 2 Estadísticos de posición y dispersión para datos clasificar. Cálculo y propiedades. 03 3 4 sin Estadísticos de posición y dispersión para datos clasificados por intervalos de clase. Método de clasificación tablas de distribución, sus elementos. Cálculo de los estadísticos de posición y dispersión. Propiedades de los estadísticos de posición y dispersión media y varianza. Gráficas: Histograma, Polígono de frecuencia, Ojivas, etc. Diagrama circular. 03 03 5 Percentiles para datos clasificados y sin clasificar. Asimetría y Curtosis. 03 6 Probabilidad: Álgebra de eventos, axiomas y teoremas importantes sobre probabilidades. Probabilidad condicional. Aplicación. 03 7 Probabilidad de un producto de evento y probabilidad de independencia de eventos. 03 8 Probabilidad total y teorema de Bayes. Aplicaciones. 03 9 Revisión y nivelación 03 10 11 EXAMEN PARCIAL Variable aleatoria continua y discreta. Variable aleatoria discreta. Función de cuantía. Propiedades, media varianza. Aplicaciones. 11 02 03 ESTADÍSTICA Y PROBABILIDADES II Clase N° Tema Horas 12 Variable aleatoria continúa. Función de densidad, propiedades, media y varianza. Aplicaciones. 03 13 Distribuciones discretas binomial y Poisson. 03 14 Distribuciones continuas importantes: Uniforme y exponencial. Normal propiedades, uso de tablas. Aplicaciones. 03 15 Distribución Normal aproximación a la binomial. Distribución de Weibull. Aplicaciones. 03 16 17 18 importantes: Bernoulli, Distribuciones muestrales: distribución muestral de medias. Muestreo aleatorio: Muestreo aleatorio simple. Teorema del Límite central. Palicaciones. Estimación. Estimador insesgado y de mínima varianza. Estimación por intervalos para la media poblacional con varianza conocida. Intervalo de confianza para la media con varianza no conocida. Repaso - Revisión 03 03 03 19 EXAMEN FINAL 02 20 EXAMEN SUSTITUTORIO 02 12 ESTADÍSTICA Y PRO BABILIDADES I Semana 1 ESTADÍSTICA DESCRIPTIVA RESEÑA HISTÓRICA: La estadística tiene etapas de desarrollo que podemos clasificar en tres: • ETAPA INICIAL: Podemos considerar desde la antigüedad hasta el siglo XVII. Se caracteriza por que la estadística esta asociada por causas poblacionales y a los registros del estado como muerte, nacimientos, impuestos, etc. Las grandes civilizaciones la utilizaron como las egipcias, romanas, aztecas y el imperio incaico. • ETAPA DE SISTEMATIZACIÓN: Aparecen tres escuelas: o Escuela Alemana: Crea la primera cátedra estadística y la asocia con la administración. o Escuela Inglesa: Utiliza la estadística para el estudio de fenómenos sociales y política, es decir, la aritmatizan. o Escuela Francesa: Introduce la teoría de la probabilidad como fundamento matemático de la estadística. • ETAPA ACTUAL: Se considera a partir del siglo XIX hasta nuestros días caracterizándose la estadística como ciencia y metodología de la investigación científica que se aplica en todas las ramas del saber humano. DEFINICIÓN DE ESTADÍSTICA: es una disciplina que nos proporciona un conjunto de métodos y procedimientos que permiten recolectar, clasificar, presentar y describir datos en forma adecuada para tomar decisiones cuando prevalecen condiciones de incertidumbre o predecir o afirmar algo acerca de la población y sus parámetros a partir de los datos extraídos de la misma. ESTADÍSTICA DESCRIPTIVA: Es la que nos proporciona la metodología para la recolección, clasificación, presentación y simplificación de los datos. 13 ESTADÍSTICA Y PROBABILIDADES I ESTADÍSTICA INFERENCIAL: Es la que nos proporciona la teoría necesaria para inferir o estimar las leyes de una población, partiendo de los resultados o conclusiones del análisis de una muestra. ALGUNAS DEFINICIONES ESTADÍSTICA Y TÉRMINOS IMPORTANTES EN 1. POBLACIÓN (N): Totalidad de individuos o elementos en los cuales puede presentarse una característica susceptible de ser estudiada. La población esta constituida por unidades elementales a las cuales se les llama unidad estadística, unidad experimental u observación. Una población puede ser: • Finita pequeña o grande • Infinita (se puede considerar una población finita muy grande) 2. MUESTRA (n): Conjunto de medidas o conteos que se obtiene de una población con propósito de obtener información acerca de ella 3. VARIABLE ESTADÍSTICA (x, y, z,……): Característica de la población que interesa al investigador y que puede tomar diferentes valores 14 ESTADÍSTICA Y PROBABILIDADES I VARIABLE CUALITATIVA: Son variables cuyos valores consisten en categorías de clasificación ósea se refieren a la cualidad que presenta la población no lleva clasificación numérica. EJEMPLO: Soltero (a) Casado (a) Estado civil Viudo (a) Divorciado (a) VARIABLE CUALITATIVA NOMINAL: Son aquellos que surgen cuando se definen categorías y se cuenta el numero de observaciones pertenecientes a cada categoría. EJEMPLO: APRA PARIDOS POLÍTICOS UPP UNIDAD NACIONAL 15 ESTADÍSTICA Y PROBABILIDADES I VARIABLE CUALITATIVA ORDINAL: Cuando en la clasificación se busca ordenar los casos en términos del grado que posee en una característica determinada. EJEMPLO: PRIMARIA ESTUDIO SECUNDARIA SUPERIOR BACHILLER GRADO MAGISTER DOCTORADO VARIABLE CUANTITATIVA: Son aquellas que se obtienen como resultado de mediciones o conteo. VARIABLE CUANTITATIVA DISCRETA: Es aquella que toma valores enteros. Ejemplos, número de hijos en una familia, número de estudiantes, número de accidentes, etc. VARIABLE CUANTITATIVA CONTINUA: Variables que toman valores infinitos entre dos números. Ejemplos, peso, talla, unidades monetarias, tiempo, etc Existen otros tipos de variables: - variable independiente - variable dependiente - variable aleatoria - variable control 4. DATO ESTADÍSTICO: Son números o medidas que han sido recopiladas como resultado de observaciones que pueden ser comparados, analizados e interpretados. Entendemos también que es la valorización de una variable x por ejemplo si tenemos la variable peso de n estudiantes, sus valores serian x1 , x2,…, xn que vendrían a ser los datos a ser tratados. 16 ESTADÍSTICA Y PROBABILIDADES I 5. PARÁMETRO: Medida que describe alguna característica de la población cuyo valor es determinado utilizando todos los valores de las variables estadística u observaciones que la constituyen, por lo tanto las decisiones no tendrán error y serán de certidumbre total. Por ejemplo los parámetros poblacionales: - 6. μ : media población σ 2 variable poblacional p: proporción poblacional ( 0 ≤ p ≤1 ) ESTADÍSTICO O ESTADÍGRAFOS: Es una medida usada para describir alguna característica de la muestra y la toma de decisiones contiene un grado de incertidumbre o error. Por ejemplo - x : media muestral Me: mediana muestral Mo: moda muestral S2: varianza muestral S = s 2 desviación estándar o típica muestral Cv = s coeficiente de variación x DEFINICIONES DE ESTADÍGRAFOS 1. MEDIA: ( x ) Suma de todos los datos divididos entre el total de datos (n). 2. MEDIANA: (Me) Se encuentra justo al centro del conjunto de datos ordenados previamente de menor a mayor (o de mayor a menor). Divide al conjunto de datos 50% a un lado (izquierdo)y 50’% al otro lado (derecho) 3. MODA (Mo) Se determina considerando la mayor frecuencia con que se repiten los datos. En un conjunto de datos pueden haber varias modas por ejemplo la uní modal (una), bimodal (dos) trimodal (tres), etc. 4. VARIANZA (S2).- Es la suma de las desviaciones ( di = xi - x ) de los datos (xi) respecto de su media x elevadas al cuadrado y divididas entre (n – 1). Indica como los datos están dispersos al rededor de la 17 ESTADÍSTICA Y PROBABILIDADES I media. Una varianza grande indica una alta dispersión o variabilidad de los datos. El divisor entre (n – 1) lo utilizamos en vez de n porque produce una estimación mas precisa de la correspondiente varianza poblacional σ 2 . Entendemos por estimación al instrumento estadístico que intenta asignar un solo valor lo mas cercano posible al valor verdadero del parámetro poblacional. La varianza definida así, dividida entre (n – 1) es por que tiene propiedades matemáticas deseables, para la inferencia estadística. 5. DESVIACIÓN ESTÁNDAR: ( S = S 2 ) Representa el grado de dispersión de lo valores de una variable, con respecto a su media. Cuando mayor sea la dispersión de los valores de la variable mayor será la magnitud de las desviaciones respecto a la media por lo tanto la desviaciones estándar crecerá en magnitud. En un experimento, normalmente la mayor parte de los datos estará a una distancia de una desviación estándar de la media. Muy pocos estarán más allá de dos o tres veces la desviación estándar. 6. COEFICIENTE DE VARIACIÓN: (CV = S/ x ) Indica en porcentaje de la variabilidad de los datos respecto a la medida es decir; Baja si → 0 ≤ CV < 20% Media si → 20% ≤ CV < 50% Alta si → 50% ≤ CV < 100% Como es una medición relativa, el coeficiente de variación es particularmente útil para comparar la variabilidad dos o mas series de datos, que se expresan en distintas unidades de medición. ETAPAS QUE CUBRE LA ESTADÍSTICA DESCRIPTIVA RECOLECCIÓN: Si la información es recolectada cuidadosamente las conclusiones que de ella se derive podrán tener validez. Para recolectar una buena información es necesario no cometer errores y saber como controlarlo. Los métodos de recolección de datos se realizan mediante diseños y la elaboración de los formularios, cuestionarios, encuestas de opinión; se dirigirán obviamente a los individuos en estudio. 18 ESTADÍSTICA Y PROBABILIDADES I CRITICA DE LOS DATOS: Recolectada la información es necesaria resolverla cuidadosamente, resumirla y presentarla convenientemente. Los datos deberán ser clasificados, esto equivale decir que aquellos datos serán organizados en clases y/o categorías. PRESENTACIÓN: Una vez organizados los datos de acuerdo a algunos métodos de clasificación estos son descritos y analizados al fin de facilitar su entendimiento y comprensión de los resultados para ello usamos tablas de frecuencias y graficas. DESCRIPCIÓN: Estudiados cuidadosamente los datos en la muestra nos ocupamos de su descripción mediante el calculo y estudio de los estadígrafos. Estas medidas descriptivas fundamentalmente estudian las medidas de: • Posición de tendencia central: x , Me, Mo • Variabilidad o de dispersión: S2, S, CV • Asimetría y kurtosis En el presente cuadro se muestran las estadísticas de tendencia central, las cuales por comparación definen tipos de curva x < Me < Mo x = Me = Mo x > Me > Mo Los siguientes cuadros presentan los grados de deformación vertical, que tienen las curvas generadas por los datos, estudiada por la Kurtosis. Que hace uso de los percentil es. 19 ESTADÍSTICA Y PROBABILIDADES I La deformación horizontal estudia la asimetría mediante los sesgos de Pearson que serán estudiados mas adelante. 20 ESTADÍSTICA Y PROBABILIDADES I Semana 2 CÁLCULOS DE LOS ESTADÍGRAFOS MÁS IMPORTANTES Supongamos que obtenemos datos mediante experimentación u otros métodos de técnicas estadísticas siendo estas: x1, x2,…………………………., xn Para el cálculo de las estadísticas consideraremos tres casos: CASO I: Datos originales, es decir; sin agruparlos xi. i = 1, 2, .., n CASO II: Datos agrupados por sus frecuencias ni. i = 1, 2,..,k CASO III: Datos agrupados por intervalos de clase Ii. i = 1, 2,.., k 21 ESTADÍSTICA Y PROBABILIDADES I CASO I CASO II Datos Originales Xi Datos Agrupados según sus Frecuencias ni; i=1,2,…,k Datos agrupados por intervalos de clase Ii, Xi (Marcas de Clase) k ∑ ni xi k i =1 x= ; n = ∑ ni i =1 n k ∑ ni xi i =1 x= n Media: n ∑ xi x = i =1 n CASO III Mediana: Ordenar los datos Xi de mayor a menor o viceversa. ⎧ X n+1 ; n impar ⎫ ⎪ 2 ⎪ ⎪ ⎪ Me = ⎨ ⎬ ⎡ ⎤ ⎪ 1 ⎢ X n + X n ⎥ ; n par⎪ +1 ⎪⎩ 2 ⎣⎢ 2 ⎪⎭ 2 ⎥⎦ Me ⎧X n+1 ; n impar ⎫ ⎪ 2 ⎪ ⎪ ⎪ Me = ⎨ ⎬ ⎡ ⎤ ⎪1 ⎢ X n + X n ⎥ ; n par⎪ +1 ⎪⎩2 ⎣⎢ 2 ⎪⎭ 2 ⎦⎥ ∈ n [Li ; Li+1 [ ← ⎯⎯ Ni ≤ 2 ⎛n ⎞ ⎜ − Ni−1 ⎟ ⎟ Me = Li + Ci ⎜ 2 ⎜ ni ⎟ ⎜ ⎟ ⎝ ⎠ N1− i Frecuencia acumulada Mo Moda: ∈ Mo = Frecuencia más Alta ni Mo = Frecuencia más Alta ni [ Lio ; Lio+1 [ ←⎯ ni o mayor ⎛ Δ1 Mo = Lio + C io ⎜ ⎜Δ +Δ ⎝ 1 2 Δ 1 = n io − n io −1 Δ 2 = n io − n io +1 2 k ∑ ni xi − x k 2 S = i =1 ; n = ∑ ni i=1 n −1 Varianza: 2 n ∑ xi − x 2 S = i =1 n −1 ( ) ó S 2 = ( 2 2 ∑ xi −( ∑ xi ) / n n−1 Desviación estándar: 2 S = S ; S>0 Coeficiente de Variación: S CV = ; 0 < CV < 1 x ) ò ( ∑ ni xi 2 ∑ ni xi − 2 n S = n −1 S = S CV = 2 S x 22 ; )2 S>0 ; 0 < CV < 1 2 k ∑ ni xi − x 2 S = i =1 n −1 ò ( ) ( ∑ ni xi 2 ∑ ni xi − 2 n S = n −1 S = S CV = 2 S x ; )2 S>0 ; 0 < CV < 1 ⎞ ⎟ ⎟ ⎠ ESTADÍSTICA Y PROBABILIDADES I EJEMPLO: Supongamos una escala de calificación de 0 a 5 la cual es utilizada en una evaluación de un concurso de proyectos presentados por estudiantes de ultimo ciclo de ingeniería. Supongamos que son 10 los estudiantes obteniéndose los siguientes resultados 0, 1, 5, 4, 3, 3, 2, 1, 3, 3. Calcular los estadígrafos media ( X ), mediana (Me), moda (Mo), varianza (S2), desviación típica o estándar (S), coeficiente de variación (CV). Solución: CASO I: ∑ xi = 0 + 1 + 5 + 4 + 3 + 3 + 2 + 1 + 3 + 3 = 2.5 x= n 10 ⎛ ⎞ ⎜ xn + xn ⎟ ⎜ +1 ⎟ (x + x ) 2 ⎠ Me = ⎝ 2 = 5 6 =3 2 2 Mo = 3 ; (mayor frecuencia n=4) (∑ x ) − 2 2 S = S= ∑x 2 i i n −1 n = 2.2778 S 2 = 1.51 C. V. = 1.51 S = = 0.6040 = 60.40% Î Variación alta x 2.5 CASO II: Datos agrupados en una tabla según sus frecuencias n: xi 0 1 2 3 4 5 n i n x i i n x2 i i N i 1 2 1 4 1 1 ∑ ni =10 0 2 2 12 4 5 ∑ ni xi =25 0 2 4 36 16 25 ∑ ni xi2 = 83 1 3 4 8 9 10 23 ESTADÍSTICA Y PROBABILIDADES I ∑n x 25 = 2.5 n 10 ⎛ ⎞ ⎜ xn + xn ⎟ ⎜ +1 ⎟ (x + x ) 2 2 ⎠ ⎝ Me = = 5 6 =3 2 2 Mo = 3 ; (mayor frecuencia n=4) x = S2 = S= i ∑ ni x S2 C. V = • i = (∑ n x ) − 2 2 i i i n (25) 2 10 = 2.2778 10 − 1 83 − = n −1 = 2.2778 = 1.51 1.51 S = = 0.604 = 60.4% Î Variación alta x 2.5 En ambos casos se obtienen los mismos resultados. CASO III: Datos agrupados en una tabla por intervalos de clase Ii: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Supongamos n datos: x1, x2,…………………………., xn, extraídos de una población o resultados por observación o experimentación. Los clasificamos en k intervalos: Ii = [Li + L i +1 ; una vez clasificados los datos xi son representados por las marcas de clase, Xi como se observa en la tabla siguiente; Ni Xi n i n1 [L2, L3> Xi n2 N2 M [Li , Li+1> M Xi M M Ni f i F i M M M M M M Nk = n f k F k Ii Xi [L1, L2> [Lk ,Lk+1> Xk n i nk ∑n i N1 f i f 1 f 2 F i F 1 F 2 M M ∑f =n 24 i =1 %fi %Fi ESTADÍSTICA Y PROBABILIDADES I [ • Ii = Li + L i +1 Intervalos de clase i=1, 2, 3, …, k • Ci = Li +1 − Li Amplitud o ancho de clase • X i : marca de clase representa a los datos que caen en el mismo intervalo • • Xi = Li + Li +1 2 n : frecuencias con que se repiten los datos: 0 ≤ n ≤ n, i i Ni: Frecuencia acumulada: N1 = n1 ; Ni = k ∑n =n i i =1 i ∑ nj j =1 • • n fi = i frecuencias relativas: 0 ≤ fi ≤ 1, n k ∑f i =1 i Fi; frecuencia relativa acumulada: F1 = f1 ; Fi = =1 i ∑f j =1 j EJEMPLO: Completar los datos que faltan en la siguiente tabla donde X i es una marca de clase. Los valores numéricos en negrita son los datos [0.5;1.5 [1.5; 2.5 [2.5; 3.5 [3.5; 4.5 [4.5; 5.5 [5.5; 6.5 [6.5; 7.5 [7.5; 8.5 Xi n i Ni f i 1 4 4 0.08 2 4 8 0.08 3 8 16 0.16 4 7 23 0.14 5 5 28 0.1 6 10 38 0.2 7 7 45 0.14 8 5 n = 50 0.1 ∑n i = 50 25 ∑f i =1 ESTADÍSTICA Y PROBABILIDADES I n fi = i n n 4 ⇒n = i ⇔ n = = 50 f 0.08 i 4 5 10 5 f = = 0.08 ; f = = 0 .1 ; f = = 0 .2 ; f = = 0.1 2 50 5 50 7 50 8 50 n1 = N1 ; n1 = N1 = 4 ; N1 + n2 = 4 + 4 = 8 ; N 3 + n4 = 16 + 7 = 23 ; N 7 + n8 = 45 + n 8 = 50 ⇒ n 8 = 50 - 45 = 5 CASO III: MÉTODOS DE CLASIFICACIÓN DE DATOS POR INTERVALOS o o o Regla de Sturges La regla de la raíz cuadrada Método libre (el investigador elige el número de intervalos) MÉTODOS DE CLASIFICACIÓN 1. 2. 3. R = [ menor dato, mayor dato] l( R ) = | mayor dato - menor dato | Numero aproximado de intervalos o Regla de Sturges: k = 1 + 3.33 Log n o Regla de la raíz cuadrada: si n ≤ 25, k =5 si n > 25, k = n 4. Amplitud del intervalo: c = 5. l ( R) k Determinación de los intervalos: 1 I2 I = [L1, L2> = [L2, L3> IK . . . . = [LK, LK+1> 26 ESTADÍSTICA Y PROBABILIDADES I EJEMPLO: Los siguientes datos proporcionan cobro en dólares por hora de técnicos calificados en una compañía. 73 65 69 76 73 47 70 58 79 64 67 57 76 77 70 82 85 67 88 46 67 59 52 94 68 70 70 68 67 63 60 57 69 77 72 67 73 66 54 84 61 77 72 93 63 80 58 86 56 74 Clasificar los datos en una tabla de distribución de frecuencia y calcular los estadígrafos: media ( X ), mediana (Me), moda (Mo), varianza (S2), desviación típica o estándar (S), coeficiente de variación (CV). Solución: o Usando método de Sturges: 1. R = [ 46, 94 ] 2. l ( R ) = | 94 – 46 | = 48 3. k = 1 + 3.33 Log 50 = 6.657 ≈ 6, 7, 8, se considera una terna 4. c= l ( R) 48 = = 8 , pocos intervalos para el número de datos 6 k 5. l ( R) 48 = = 6.857 (no se considera por que no es exacta la k 7 división) c= c= = 88, 94 27 [ = 64, 70 ; 5 I [ 4 I = 82, 88 ; [ = 58, 64 ; I8 [ I3 I6 [ = 76, 82 ; [ = 52, 58 ; 7 I [ = 46, 52 ; I2 1 I 5. l ( R) 48 = = 6 (v) k 8 [ = 70, 76 ; ESTADÍSTICA Y PROBABILIDADES I Ii [46,52 [52 , 58 [58 , 64 [64 , 70 [70 , 76 [76 , 82 [82, 88 [88 , 94 Xi n i Ni n x i i n x2 i i 49 2 2 98 4802 55 5 7 275 15125 61 7 14 427 26047 67 12 26 804 53868 73 10 36 730 53290 79 7 43 553 43687 85 4 47 340 28900 91 3 n = 50 273 24843 ∑n x = ∑n x i n i = Si Ni es mayor a i ∑n x = 50 i i =3500 ∑n x i 2 i = 250562 3500 = 70 50 n n ⇒ Me ∈ [Li, Li+1〉 ; N4 = 26 > = 25 ⇒ Me ∈ [64,70〉 2 2 ⎛n ⎞ ⎜ − N i −1 ⎟ 25 − 14 ⎞ 11 ⎟ = 64 + 6⎛⎜ Me = Li + Ci ⎜ 2 ⎟ = 64 + 6 * = 69.5 12 ⎝ 12 ⎠ ⎜⎜ ni ⎟⎟ ⎝ ⎠ 26 = Mayor frecuencia, nio = 12 ⇒ Mo ∈ [64,70〉 ⎛ Δ1 ⎞ 5 ⎛ 5 ⎞ ⎟⎟ = 64 + 6⎜ Mo = Li + Ci ⎜⎜ ⎟ = 64 + 6 * = 68.285 ≅ 68.29 ; nio =12 7 ⎝5+ 2⎠ ⎝ Δ1 − Δ 2 ⎠ Δ1 = ni 0 − ni 0−1 = 12 − 7 = 5 Δ 2 = ni 0 − ni 0+1 = 12 − 10 = 2 28 ESTADÍSTICA Y PROBABILIDADES I S2 = ∑n x i i ∑ (n x ) − 2 2 i i n −1 n = 2 ( 3500) 250562− 50 −1 50 = 250562− 245000 5562 = = 113.5102 49 49 S = S 2 = 113.51 = 10.65 CV = S 10.65 = = 0.1521 70 X CV = 0.1521*100 = 15.21 ٪ Coeficiente de variación bajo (0%<CV < 20%) 29 ESTADÍSTICA Y PROBABILIDADES I 30 ESTADÍSTICA Y PROBABILIDADES I Semana 3 ESTADÍSTICOS DE TENDENCIA CENTRALES ( X , Me, Mo) Son aquellos que como su nombre lo indica tienden a ubicarse al centro del conjunto de datos, podemos observar y comparar el resultado; logrado del ejemplo anterior Las graficas a escala nos dan una idea mucho más precisa del comportamiento que los cuadros estadísticos. Los cuadros estadísticos guardan correspondencia con las graficas. 1. 2. Las tablas estadísticas tienen 3 partes: el titulo (muy claro y preciso), el cuerpo de la tabla (presenta los elementos que se usa para el calculo de los estadísticos) y la fuente de información (indica de donde o como se obtuvieron los datos). Las graficas consideran: el titulo, la grafica propiamente dicha y las notas explicativas. ESCALAS MAS USADAS EN LA ESTADÍSTICA a.- Escala 1:1 (esta es la mejor para representar) b.- Escala 1:3/4 31 ESTADÍSTICA Y PROBABILIDADES I TIPOS DE GRAFICAS Las más usuales son: 1. 2. 3. 4. 5. Diagrama de Barras Para datos Cualitativos Diagrama Circular Histograma Para datos cuantitativos Polígono de Frecuencias Polígono de Frecuencias Acumuladas 1. DIAGRAMA DE BARRAS: Es un conjunto de rectángulos de igual base sobre el eje horizontal separados y proporcionales a fi ò ni sobre el eje vertical. Por ejemplo consideremos exportación de harina de pescado: I años, T toneladas T toneladas fi ò ni o I 1. años Para construir un diagrama de barras se elige la escala por ejemplo 1 : 1 se toma una longitud l, cada rectángulo tiene una misma base l i y un pequeño espaciamiento ei todo esto sobre el eje horizontal y sobre el eje vertical ni ò fi, siendo las alturas hi proporcionales a las frecuencias ni ò frecuencias relativas fi. Calculo de las hi l - n ⎛n ⎞ ⇒ hi = ⎜ i ⎟ l ; n = hi - ni ⎝n⎠ ∑ ni , l = k ∑( l i = 1 i + ei ) ; k : nùmero de barras Los diagramas de barras pueden presentar datos cualitativos o cuantitativos 32 ESTADÍSTICA Y PROBABILIDADES I 2. DIAGRAMA CIRCULAR: Dado un conjunto de datos, pueden ser ellos presentados proporcionalmente en una grafica. Por ejemplo consideremos la siguiente grafica supuesta, en donde los sectores circulares son A, B, C y D expresados mediante frecuencias relativas expresadas porcentualmente Para su construcción tomamos una circunferencia y lo repartimos proporcionalmente a ni ò fi n - 360º ⎛n ⎞ ⇒ θ i = ⎜ i ⎟ 360º , i = 1, 2, ., k ni - θ i ⎝n⎠ Donde cada ángulo θ i define un sector circular, como en el ejemplo define cuatro sectores que sumados da el 100% 3. HISTOGRAMA: Es un conjunto de rectángulos unidos por sus lados. Utilizamos las siguientes coordenadas Ii vs ni ò Ii vs fi 0 33 ESTADÍSTICA Y PROBABILIDADES I Para su construcción se toma una longitud l sobre el eje horizontal sus alturas hi se reparte porcentualmente a ni ò fi l -n hi - ni 4. ⎛n ⎞ ⇒ h i = ⎜ i ⎟ l , i = 1, 2, ..., k ⎝n⎠ POLÍGONO DE FRECUENCIAS: Es un conjunto de segmentos de rectas que se obtiene utilizando los puntos medios de la parte superior de los rectángulos del histograma. Los polígonos de frecuencia pueden ser: • • Abiertos Cerrados El área que encierra tanto el polígono de frecuencias como el histograma es igual a 1. La construcción será realizada a escala. Para que el área bajo el histograma o polígono cerrado sea 1, es necesario considerar la densidad de clase es decir: hi = fi , donde fi es la frecuencia relativa y ci es la amplitud del ci intervalo. Luego el área = ∑ ci hi = ∑ ci (fi/ci ) = ∑ fi = 1 . 34 ESTADÍSTICA Y PROBABILIDADES I 5. POLÍGONO DE FRECUENCIAS ACUMULADAS: Es un conjunto de rectángulos unidos por sus lados cuya grafica se obtiene utilizando los intervalos Ιi las acumuladas Ni ò las frecuencias relativas acumuladas Fi Ii vs Ni; Ii vs Fi Fk = 1 1 OJIVA Ii 0 La ojiva se obtiene uniendo los puntos medios de la parte superior de los rectángulos de frecuencias relativas acumuladas. (Fi). Cuando n tiende al infinito se obtiene una línea continua en el límite como se presenta en la siguiente grafica que corresponde a una función de distribución simétrica 1 0.5 0 Me Ii Similarmente ocurre con el histograma y polígono de frecuencias que coinciden en una curva continua que tiende a ser casi siempre simétrica. 35 ESTADÍSTICA Y PROBABILIDADES I PROPIEDADES DE LA MEDIA Y LA VARIANZA Estos dos estadísticos son de los más importantes por que a partir de ellos se puede realizar inferencias sobre la población. Sean X 1 , X 2; ,......, X n ; una muestra extraída de una población; se desea estudiar las características de dicha población, utilizando la media y la varianza para lo cual es necesario utilizar las propiedades de los respectivos estadígrafos. Media Varianza x = M ( x) = ∑ i 1.2.3.4.- Xi n ( xi − x) 2 s x = V ( x) = ∑i n − 1 2 s s s s si : X = Ci → X = C si : Yi = X i + b → Y = X + b si : Yi = aX i → Y = a X si : Yi = aX i + b → Y = a X + b 2 x 2 y 2 y 2 y = V (c ) = 0 2 = V(y) = sx = V ( y ) = a 2 s x2 2 = V ( y) = a 2 s x PROPIEDADES ADICIONALES DE LA MEDIA 5. MEDIA PONDERADA:- Es aquella en donde los Xi son afectados por coeficiente Pi:, “pesos” o coeficientes de cada xi ; se define como la suma de los Pi xi divididos por ∑ pi k Xp = ∑PX i =1 K i i ∑P (i =1) i Por ejemplo los Xi pueden ser cursos y los Pi créditos en la inscripción que un estudiante realiza al momento de matricularse. 36 ESTADÍSTICA Y PROBABILIDADES I 6. MEDIA GLOBAL:- Es aquella en donde las medias xi y sus frecuencias respectivos, se definen como la suma de los productos n i x i , divididos por ∑ ni : X 1 ; X 2 ;...............; X K ↓ ↓ ↓ n1 nz nk k X = ∑n X i i =1 K ∑n i =1 i k ; ∑ ni = n (2) i Por ejemplo, la media global de los gastos mensuales de n familias de un determinado estrato social. 7. La suma de las desviaciones madia es cero. (d ∑ (X n i i ) = x i - x de los datos respecto de la ) - X = 0 i 8. La media X de un conjunto de datos es el centro de gravedad (C. G:)de dicho conjunto, y es por ello que la suma es igual a cero. ∑(X i n1 n2 ; ; nK X1 Xk − X )ni = 0 X2 XC.G 9. ∑(X i − X ) 2 〈∑ ( X i − C ) 2 C ≠ Xi Esta desigualdad nos indica que ∑ (xi - x ) 2 es mínima respecto a cualquier número C ≠ X i y si dividimos entre (n – 1) la desigualdad obtenemos la varianza s 2 x la cual tiene un mínimo valor. 37 ESTADÍSTICA Y PROBABILIDADES I EJERCICIOS DE APLICACIÓN: 1. Una distribución de frecuencias de sueldos en cientos de nuevos soles consta de cinco intervalos de clase de igual amplitud y de ellas se n = 110 n 4 − n 3 − n1 = 0 conocen los siguientes datos: n 4 − n 5 = 10 n1 = n 5 n2 = n4 El limite inferior de la primera clase es 12.5; y5n4 = 975 ; donde y5 es el limite superior de la cuarta clase. a) Completar la tabla b) Calcular los estadígrafos. c) Calcular la varianza ….. d) Determine el porcentaje de datos…. Solución: Sea C el ancho de las intervalos: [ 12, 5, 12.5 + c [12.5 + 2c , 12.5 + 3c , [12.5 + 3c , [12.5 + 4c , 12.5 + c, 12.5 + 2c , , [ 12.5 + 4c , 12.5 + 5c a) Ii [12,5;17,5> [17,5;22,5> [22,5;27,5> [27,5;32,5> [32,5;37,5> Xi 15 20 25 30 35 ni 20 30 10 30 20 110 Ni 20 50 70 80 110 fi 0.18 0.27 0.09 0.27 0.18 0.99 nixi 300 600 250 900 700 2750 nixi2 4500 12000 6250 27000 24500 74250 n1 + n 2 + n3 + n 4 + n 5 = 10 , n 2 = n 4 = 10 + n1 = n1 + n3 ⇒ n3 = 10 2 n5 + 2(10 + n5 ) + 10 = 110 4 n5 = 80 n5 = 20 n4 − n5 = 10 Y5n4 = 975 Y5 = 975 30 Limite superior de la cuarta clase 12.5 + 4c Y5 = 32.5 = 12.5 + 4c ⇒ c = 5 Calculado C = 5 podemos definir los intervalos n4 = 30 38 ESTADÍSTICA Y PROBABILIDADES I b) MEDIA X = ∑n X i n i = 2750 = 25 110 MEDIANA Me : n 110 = = 55 ≤ N 3 2 2 ni Ni 50 Me ∈ [22,5; 27,5> 10 …. 55 ; ⎛ 55 − 50 ⎞ Me = 22.5 + 5⎜ ⎟ = 25 ⎝ 10 ⎠ MODA nio ⎞ ⎛ 30 − 2 Mo [17,5;22,5> ..30 ; Mo = 17.5 + 5⎜⎜ ⎟⎟ = 19.17 ⎝ (30 − 20 ) + (30 − 10 ) ⎠ VARIANZA 2 ⎛ 2750 ⎞ 74250 − ⎜ ⎟ 74250 − 68750 110 ⎠ 2 ⎝ S = = = 50.4587 109 109 DESVIACIÓN ESTÁNDAR S = 50.4587 = 7,1034 COEFICIENTE DE VARIACIÓN CV = 7,1034 = 0,2841 → 28,41%, la dispersiòn de los datos es media 25 20% ≤ C V < 50% 39 ESTADÍSTICA Y PROBABILIDADES I c) Calcular la varianza y la media de los últimos sueldos si la desviación estándar de los sueldos originales xi es igual a 50, según el reajuste lineal, y = x + 0.2x Yi = Xi + 0,2 Xi Yi = 1,2 Xi ⇒ y = 1.2 x = 1.2 (25) = 30 V (Y ) = V (1,2 X ) = (1,2) 2V ( X ) = (1,2) 2 (10) 2 = 144; (V ( X ) = S x2 ) Sy = v (y) = s 2 = 12 y d) Determine el porcentaje de datos que caen en el intervalo [18,30] (del ejercicio anterior) Solución: Usemos interpolación lineal para determinar las frecuencias x, y sea la frecuencia total nt = x + 10 + y 18 . 17.5 x . 30 30 y 22.5 . 10 27.5 32.5 30 n t = X + 10 + Y X 22 ,5 − 18 X 4 ,5 = → = ⇒ X = 27 30 22 ,5 − 17 ,5 30 5 Y 30 − 27 ,5 Y 2 ,5 = → = ⇒ y = 15 30 32 ,5 − 27 ,5 30 5 f t = frecuencia relativa ft = nt 52 = = 0.4727 ni 110 n t = 27 + 10 + 15 = 52 Respuesta: El porcentaje de datos que caen en [18,30] es 47,27% 2. En una empresa pùblica el promedio de los sueldos de los obreros es 40 unidades monetarias (u. m.) y el de los empleados 50 u.m. Si la empresa decide aumentar 20 u.m. a cada empleados y obrero; hallar 40 ESTADÍSTICA Y PROBABILIDADES I el promedio general de los sueldos actuales (considerando el aumento) si el número de obreros es el 10% del numero de empleados. Solución Sea n1 número de obreros y su media: x1 = 40 Sea n2 número de empleados y su media: x 2 = 50 El aumento para ambos: y = x + 20 ⇒ y = x + 20 Propiedad: n x1 + n 2 x 2 x = 1 n1 + n2 Numero de obreros n1 = 0.10 n2 ( 0.10 n 2 ) x 1 + n 2 x 2 = 54 x = 0.10n 2 + n 2 1.1 54 Sueldos actuales: y = x + 20 = + 20 = 69.09 1.1 Respuesta: sueldos actuales y = 69.09 u.m. 3. En una empresa en donde los sueldos tienen una media de $ 500 y una desviación estándar $50, en una reunión de directorio se decide hacer un aumento mediante la relación lineal y i = 1.5x i ; + 20 El gerente general acoge parcialmente la solución disminuyendo en un 10% los sueldos así propuestos. Calcular la nueva media y desviación típica Solución: Sean los sueldos: x1, x2, …. xn La media de los sueldos x = 500 Según las hipótesis: s = 50 y i = 1.5 x i + 20 ⇒ y = 1.5 x + 20 = 770 Sueldos reajustados y'i = yi - 0.10 yi = 0.9 yi ⇒ y' = 0.9 y = 693 s 2 y' = 0.92 s 2 y ⇒ Sy' = 0.90 x 1.5 x 50 = 67.5 Respuesta: los sueldos reajustados 41 y i = $ 693 S y′ = $ 67.5 ESTADÍSTICA Y PROBABILIDADES I 4. Los salarios de una empresa son, en promedio $ 500, con posteridad se incorporan a la empresa un grupo de obreros igual al 25% de los que estaban anteriormente. El nuevo grupo ingresa a la empresa con un salario promedio igual al 60% del antiguo. dos meses más tarde, la empresa concede un aumento de salario de $ 30. Se pide: a) El promedio de salario del total de obreros b) Si el aumento hubiera sido del 20% de los salarios ¿Cuál habría sido la media de los salarios así ajustados? Solución . Salario promedio de n obreros antiguos: x1 = $ 500 . Salario promedio de n’ = 0.25n obreros incorporados x 2 = 0.60 x 1 = 300 Salario promedio total n x1 + n1 x 2 n (500) + 0.25n (300) x = = = 460 n + n' n + 0.25n a) Promedio total: y = x + 30 ⇒ y = x + 30 = 460 + 30 = 490 b) Si el aumento hubiera sido del 20%: Respuesta: y = x + 0.20 x = 1.2 x , y = 1.2 (460) = 552 a) $ 490 b) $ 552 42 ESTADÍSTICA Y PROBABILIDADES I Semana 4 5. n estudiantes se matricularon, cada cual, en un numero de créditos cuya media y varianza son iguales a: $ 19,4 y $ 1,84 respectivamente. Si cada estudiante pago el costo fijo de 20 dólares, mas 60 dólares por cada crédito ¿Cuál es la madia y la varianza de los pagos que realizaron los estudiante? Solución: Sean x1, x2,…….. xn créditos de cada uno de los estudiantes Estudiante 1 = X1 créditos Estudiante 2 = X2 créditos Estudiante n = Xn créditos x = 19.4 S 2 = 1.84 Por cada crédito paga un estudiante $60 más un costo fijo de $20 yi = 60 xi + 20 Por propiedad de la media y varianza: y = 60 x + 20 = 1184 V ( y ) = (60) 2 Vx = 60 2 × 1.84 = 624 Respuesta: Media de los pagos = 1184 dólares Varianza de los pagos = 624 dólares 6. Una serie de mediciones de la temperatura de un cuerpo realizadas con el termómetro A; tienes media 12,01 y la desviación estándar 0.027; mientras que con otro termómetro B; la media de las mediaciones fue 11.97 y la desviación estándar 0.014. Suponiendo que la persona que opera los instrumentos sin sesgo alguno en la mediciones; ¿Cuál es el termómetro relativamente mas consistente? 43 ESTADÍSTICA Y PROBABILIDADES I Solución: Para el termómetro A CA = 0.027 S → = 2.2481× 10 −3 → 0.22% 12 . 01 X Para el termómetro B CB = 0.014 S → = 1.1695 × 10 −3 → 0.12 % 11 .97 X Respuesta: el termómetro B es más consistente OBSERVACIONES 1. 2. 3. 4. 5. 6. 7. () La media x es influenciada por los valores extremos de un conjunto de datos. La media no es calculable en intervalos de clases abiertos en el primer intervalo y en el último intervalo de datos clasificados. La mediana es insensible a valores extremos. La moda (Mo) puede ser unimodal, la bimodal (dos máximos), trimodal (tres máximos). La moda es significativa para un gran número de datos (no hay moda cuando todo sea uniforme) El valor de la moda es independiente de los valores extremos, es inestable si se cambia o varía el intervalo de clase. El coeficiente de variación se utiliza a menudo para comparar la variabilidad de dos o más conjuntos de datos. PERCENTILES Cuando deseamos describir la posición de un dato en un conjunto de datos estos, los ordenamos para ver si el dato es o no significativo, dentro del grupo. Nos podemos preguntar si 12 es una calificación significativa o no, dentro de un grupo de 20 calificaciones. Para ello será necesario ordenarlos dentro de una escala de 0% a 100%. y desarrollar la teoría de percentiles 44 ESTADÍSTICA Y PROBABILIDADES I DEFINICIÓN: Los percentiles son valores que dividen a la muestra ordenada en forma ascendente o descendente en 100 partes iguales. P1 P2 Pi P1: 1er percentil, deja el 1% de las observaciones menores o iguales a él y el 99% de observaciones superiores a él. P2: 2do percentil, deja el 2% de las observaciones menores o iguales a él y el 99% de observaciones superiores a él. Pi : i-ésimo percentil, deja el i% de las observaciones menores o iguales a él y el (100-i)% de observaciones superiores a él. P99: 99avo percentil, deja el 99% de las observaciones menores o iguales a él y el 1% de observaciones superiores a él. Los percentiles se subdividen en: Di: Deciles i = 1, 2,…, 9. Dividen las observaciones en 10 partes iguales. Qi: Cuartiles i = 1, 2, 3. Dividen las observaciones en 4 partes iguales. Rango intercuartil Q3 – Q1 45 ESTADÍSTICA Y PROBABILIDADES I OBSERVACIONES 1 Los percentiles en general se pueden determinar para los casos I y II de datos no agrupados y agrupados por sus frecuencias ni ⎛ i ⎞ Pi , i = 1,2,..,99 ← Pi : ⎜ Por ejemplo ⎟n ⎝ 100 ⎠ ⎛ i ⎞ Di , i = 10, 20, .. 90 ← Di : ⎜ ⎟n ⎝ 100 ⎠ ⎛ i ⎞ Qi , i = 25, 50,75 ← Qi : ⎜ ⎟n ⎝ 100 ⎠ El tamaño de los datos n puede ser par o impar CASO I.- Datos no agrupados, por ejemplo consideremos el sueldo de 10 personas, cuyos sueldos ya están ordenados Calcular Q1 , Q2 , Q3 Q1 Q2 Q3 Xi ($) ni Ni 200 1 1 300 1 2 400 1 3 500 1 4 600 1 5 700 1 6 750 1 7 800 1 8 850 1 9 900 1 10 ⎛ 25 ⎞ Q1 = ⎜ ⎟ 10 = 2.5 ← Frec. acumulada ⎝ 100 ⎠ 1 Q1 = [300 + 400] = 350 2 ⎛ 50 ⎞ Q2 = ⎜ ⎟ 10 = 5 ← Frec. acumulada ⎝ 100 ⎠ 1 Q2 = [600 + 700] = 650 2 ⎛ 75 ⎞ Q3 = ⎜ ⎟ 10 = 7.5 ← Frec. Acumulada ⎝ 100 ⎠ 1 Q3 = [ 750 + 800] = 775 2 Q1: Indica que el 25% de las personas ganan a lo mas $ 350 Q2: Indica que el 50% de las personas ganan a lo mas $ 650 Q3: Indica que el 75% de las personas ganan a lo mas $ 825 46 ESTADÍSTICA Y PROBABILIDADES I CASO II.- Consideremos sueldos ya ordenados pro sus frecuencias de 33 personas. Calcular P10, Q1, Q3 P90 P10 Q1 Q3 P90 Xi ($) ni Ni 150 3 3 250 4 7 300 5 12 400 6 18 550 7 25 600 4 29 700 3 32 800 1 33 ⎛ 10 ⎞ P10 : ⎜ ⎟ 33 = 3.3 ⎝ 100 ⎠ P10 = 250 ⎛ 25 ⎞ Q1 : ⎜ ⎟ 33 = 8.25 ⎝ 100 ⎠ Q1 = 300 ⎛ 75 ⎞ Q3 : ⎜ ⎟ 33 = 24.75 ⎝ 100 ⎠ Q 3 = 550 ⎛ 90 ⎞ P90 : ⎜ ⎟ 33 = 29.7 ⎝ 100 ⎠ P90 = 700 33 Observamos que P10 = D1 , P25 = Q1 , P75 = Q3 , P90 = D9. Las respuestas siempre se dan en forma razonada como en el ejemplo anterior CASO III EJEMPLO DE APLICACIÓN.- Se han medido las pulsaciones de un equipo de atletas después de una carrera los datos obtenidos son; clasificados por intervalos Ii, con sus respectivas frecuencias. Solución: Ii Pulsaciones [70,75> [75,80> [80,85> [85,90> [90,95> [95,100] Xi 72.5 77.5 82.5 87.5 92.5 97.5 ni 3 3 7 10 12 8 n=43 Ni 3 6 13 23 35 43 47 fi 0.0698 0.0698 0.1628 0.2326 0.2791 0.1860 ∑fi=1.0000 Fi 0.0698 0.1396 0.3024 0.5350 0.8141 1.0000 ESTADÍSTICA Y PROBABILIDADES I Calcular los percentiles: P10, P25, P50, P75, P90 ⎛ i ⎞ • Dado i, Pi: ⎜ ⎟n ⎝ 100 ⎠ Pi ∈ ⎡⎣ Li, Li +1 ⎛ ⎛⎜ i ⎞⎟ n − N i −1 ⎞ ⎟ Pi = Li + C ⎜ ⎝ 100 ⎠ ⎜ ⎟ ni ⎝ ⎠ • i = 10, ⎛ 10 ⎞ P10: ⎜ ⎟ 43 ⎝ 100 ⎠ = 4.3 ⎛ 4.3 − 3 ⎞ P10 = 75 + 5 ⎜ ⎟ ⎝ 3 ⎠ • i = 25, P10 ∈ ⎣⎡75,80 = 77.17 ⎛ 25 ⎞ Q1= P25: ⎜ ⎟ 43 ⎝ 100 ⎠ ⎛ 10.75 − 6 ⎞ P25 = 80 + 5 ⎜ ⎟ 7 ⎝ ⎠ • Î = 10.75 Î P25 ∈ ⎣⎡80,85 = 83.39 ⎛ 50 ⎞ i = 50, Me = D5 = Q2 = P50: ⎜ ⎟ 43 = 21.5 Î Me ∈ ⎣⎡85,90 ⎝ 100 ⎠ ⎛ 21.5 − 13 ⎞ P50 = Q2 = D5 = Me = 85 + 5 ⎜ ⎟ = 89.25 ⎝ 10 ⎠ • i = 75, ⎛ 75 ⎞ Q3 = P75: ⎜ ⎟ 43 = 32.25 ⎝ 100 ⎠ Î P75 ∈ ⎣⎡90,95 ⎛ 32.25 − 23 ⎞ P75 = Q3 = 90 + 5 ⎜ ⎟ = 93.85 12 ⎝ ⎠ • i = 90, ⎛ 90 ⎞ D9 = P90: ⎜ ⎟ 43 = 38.7 Î P90 ∈ ⎣⎡95,100 ⎝ 100 ⎠ ⎛ 38.7 − 35 ⎞ P90 =D9 = 95 + 5 ⎜ ⎟ = 97.31 8 ⎝ ⎠ 48 ESTADÍSTICA Y PROBABILIDADES I CÁLCULO DEL RANGO PERCENTIL Sea el percentil Pi = 87. Determinar el rango percentil i. Pi = 87 ∈ 85 , 90 ⎛ ⎛⎜ i ⎞⎟ 43 − 13 ⎞ ⎟ P87 ∈ ⎣⎡85,90 Î 87 = 85 + 5 ⎜ ⎝ 100 ⎠ ⎜ ⎟ 10 ⎝ ⎠ i = 39.53% El rango percentil 39.53% de los atletas tienen pulsaciones menores o iguales a 87 pulsaciones MEDIDAS DE ASIMETRÍAS SESGO DE PEARSON La simetría de los gráficos unimodales indica la dirección de la dispersión de los datos denominándose sesgo de Pearson. Este índice muestra la deformación horizontal de los datos o el sesgo de la grafica de los mismos. 1. Cuanto mas se aparta la moda de la media mayor será la asimetría. 2. Para asimetrías moderadas la media es muy próxima a la mediana, se usa la relación empírica 49 ESTADÍSTICA Y PROBABILIDADES I x - Mo ≈ x - Me ⇒ Mo ≈ x − 3( x − Me) 3 Sustituyendo en la formula anterior obtenemos SP ≈ 3( X − Me) S El sesgo de Pearson (SP) como se observa es una medida positiva o negativa, diríamos es un valor que excede a la simetría MEDIDA DE CURTOSIS Es el grado de deformación vertical de una distribución de frecuencias. Con relación al grado de apuntamiento podemos tener curvas leptocurticas, mesocurticas y platicurticas, se define como: 1 ⎛ Q − Q1 ⎞ k= ⎜ 3 ⎟ 2 ⎝ P90 − P10 ⎠ • P90 – P10 = Q3 – Q1, K-> ½ leptocurtica • Q3 – Q1 tiende a ser pequeño respecto a P90 – P10 platicurtica • P90 – P10 es aproximadamente el doble de Q3 – Q1 P90 – P10 = 2(Q3 – Q1) K -> ¼ mesocurtica 50 K->0 ESTADÍSTICA Y PROBABILIDADES I Ejemplo de Aplicación.- Podemos suponer una sección de estudiantes que son evaluados en tres materias diferentes, con una misma media. Ingles: las calificaciones (leptocurtiva) obtenidas tienen poquísima variación Historia: Las calificaciones tienen poca variabilidad (mesocutica) Matemática: Las calificaciones tienen una alta variabilidad (platicurtica) En experimento estadísticos ocurren los casos de asimetría y curtosis con mucha frecuencia las cuales están asociadas a distribuciones que la inferencia estadística usa para estimar o tomar decisiones respecto a los parámetros de las distribuciones. 51 ESTADÍSTICA Y PROBABILIDADES I EJERCICIOS PROPUESTOS I. UTILIZACIÓN DE DEFINICIONES IMPORTANTES EN ESTADÍSTICA 1. TÉRMINOS MAS En cada uno de los siguientes experimentos, especifique (1) la variable independiente, (2) la variable dependiente, (3) la muestra, (4) la población, (5) los datos y (6) es estadístico. a) Un fisiólogo quiere sabe si una región particular del cerebro (el hipotálamo) está implicada en la regulación del consumo de comida. Se realiza un experimento en el cual se elige 30 ratas de un vivero universitario, las cuales se separan en dos grupos. Uno de estos grupos recibe lesiones en el hipotálamo, mientras que el otro grupo es lesionado en un área neutral. Después de recuperarse de las operaciones, todos lo animales tienen acceso libre de alimento durante dos semanas y se lleva un registro del consumo diario de alimento de cada animal. Al final del período de dos semanas, se determina el promedio de consumo diario de alimento de cada grupo. Por último, se comparan estos promedios para ver si las lesiones en el hipotálamo han afectado la cantidad de alimento consumido. b) 2. Y Un profesor de mecanografía piensa que un orden diferente de las teclas de una máquina promoverá una escritura más rápida. Se elige a veinte estudiantes de secretariado en una escuela de comercio de gran tamaño para participar en un experimento diseñado para probar esta creencia. Diez de estas estudiantes aprenden a escribir con el teclado convencional. Las otras diez reciben su entrenamiento con el nuevo teclado. Al final del periodo de entrenamiento, se mide la velocidad de escrituras de cada estudiante en palabras por minuto. Luego se calcula el promedio de velocidad de escritura para ambos grupos y se comparan estos promedios para determinar si el nuevo orden ha tenido algún efecto. La compañía “Central Eléctrica” incluye una tarjeta de garantía para el comprador con cada aparato que produce. Además de validar la garantía y suministrar a la compañía el nombre y la 52 ESTADÍSTICA Y PROBABILIDADES I dirección del comprador, la tarjeta también solía tener otra información que se utiliza en estudios de mercado. Nombre……………………………………..Estado Civil……….(3)………….... Dirección……………..…… ¿Dónde compró el aparato?......... (4)………... Ciudad…………………………………………………………………………....….. Indicativo de la zona……………..……… ¿Por qué compró el aparato? (5) Edad…………… (1)…………………..Ingresos anuales……… (2)………….... Para cada uno de los espacios numerados de la tarjeta, determine las características más probables de las categorías que serán usadas por la compañía para registrar la información. En particular, ello sería: a) ¿Cualitativas o cuantitativas? b) ¿Continuas o discretas? Brevemente de las razones que sustentan las personas. 3. Se ha indicado que el porcentaje de varones mayores de 20 años que no tienen empleo en una ciudad de 5 millones de habitantes es 6%. Los resultados fueron obtenidos a partir de un cuestionario aplicado a 200 personas de la ciudad elegidas de entre las personas mayores de 20 años. a) ¿Sobre que población se ha realizado la encuesta? ¿Cuáles son las unidades estadísticas? b) ¿Cuál ha sido la muestra utilizada? 4. El gerente de venta de una tienda de prendas de vestir desea saber cuál será la demanda de pantalones en el próximo mes, así como las tallas que mas demanda tendrán. Si el gerente dispone de un registro del total de las ventas realizadas por la tienda durante los 10 meses anteriores y usa esta información como una muestra para predecir las ventas del próximo mes. ¿Cuál es la población? 5. En los siguientes casos, indicar la población, las unidades estadísticas. a) Asignar a los distritos de la capital su código postal b) Asignar a las personas de una ciudad, el número de teléfono que poseen. 53 ESTADÍSTICA Y PROBABILIDADES I II. 6. El censo de alumnos de una universidad considera las siguientes variables: Facultad, año de ingreso, nacionalidad, tiempo de residencia en el país, número de semestres que lleva la universidad, grado en la escala de pensiones, grado de instrucción del padre, número de hermanos, ingreso mensual familiar promedio. Clasifique las variables e indique el tipo de escala en que están medidas. 7. Un profesor propone a sus alumnos del curso de Aritmética, una prueba de 10 ejercicios de cálculo de sumas. Si alguno de los ejercicios presenta, al resolverlo, algún error de cálculo, el profesor califica la prueba con 0, de otro modo la califica con 1, ¿Qué tipo de escala empleó? DISTRIBUCIÓN DE DATOS ORIGINALES, POR FRECUENCIAS Y CLASIFICACIÓN DE DATOS POR INTERVALOS 1. Los siguientes datos representan el número de interrupciones por día de trabajo debidas a fallas mecánicas en una planta procesadora de alimentos: 3, 4, 1, 3, 6, 5, 6, 3, 2, 3 Calcule la media, la mediana y encuentre el número modal de interrupciones diarias. 2. La media mínima para aprobar una asignatura es 11. Su un estudiante obtiene las notas 13.5, 14, 9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestión, ¿el estudiante fue aprobado? 3. Diga usted que medidas de tendencia central sería mas útiles en cada uno de los siguientes casos: a) El gerente de producción de una fábrica de vasos de vidrio quiere saber ¿Cuál es el tamaño de vaso que debe fabricar de vasos ordenados por los clientes? El tiene a la mano un buen número de datos de los tamaños de los vasos ordenados por los clientes. b) El gerente de ventas de una compañía que produce muebles de lujo desea seleccionar regiones para establecer salas de exhibición. ¿en que medida de ingreso familiar por región estará mas interesado, en la media o la mediana? 54 ESTADÍSTICA Y PROBABILIDADES I c) 4. Un analista de bolsa de valores está interesado en describir el cambio diario en el precio en el mercado de una acción de Banco de Vivienda. Rara vez al precio cambia más de un punto, pero hay ocasiones en que el precio cambia hasta cinco puntos. ¿Qué medida debe usar el analista para describir el cambio de precio de la acción en cuestión, la media, la mediana o la moda de los cambios de precio en el mercado? A continuación se dan las notas de 50 alumnos 60 85 33 52 63 77 84 71 35 81 50 35 64 74 80 61 41 91 55 73 59 41 55 78 48 69 85 67 94 98 66 66 73 42 65 65 47 53 39 94 74 54 77 60 88 57 68 45 76 89 Se pide: a) Número de clase por la fórmula de Sturges y la amplitud de las clases b) ¿Cuáles son los intervalos de clase? (inicie en 30) c) Trazar el histograma y el polígono de frecuencias d) Determinar la media, mediana y la moda e) Determinar el 3er cuatil, 7mo decil, 55vo percentil f) Calcular el rango percentil de la calificación 80 g) Calcular el sesgo de Pearson y curtosis e indicar el tipo en ambos casos. 5. Los siguientes resultados representan las un curso de estadística elemental: 23 60 79 32 57 74 80 77 81 95 41 65 52 10 64 75 78 25 41 71 83 54 64 72 60 78 89 76 84 48 34 67 17 82 69 74 a) b) calificaciones finales en 52 92 80 88 84 63 70 85 98 62 90 80 82 55 81 74 15 85 36 76 67 43 79 61 Determinar los intervalos de clase y la tabla de distribución de frecuencias de las calificaciones Calcular la media, mediana, moda, varianza desviación estándar o típica y el coeficiente de determinación e interpretar su resultado. 55 ESTADÍSTICA Y PROBABILIDADES I III. TABLA INCOMPLETA, CALCULO DE TENDENCIAS CENTRAL Y DISPERSIÓN 1. ESTADÍSTICOS DE El consumo de agua, en metros cúbicos, de 30 viviendas en el mes de Julio fue como sigue: 4.3 7.8 6.1 15.7 12.8 17.2 3.5 16.1 12.4 6.9 18.0 11.5 13.4 6.5 14.3 8.7 13.0 9.2 12.8 3.0 4.2 11.2 16.2 7 4.5 7.8 15.9 16.5 8.4 5.9 a) b) c) 2. Construir un tabla de distribución de frecuentas usando 5 intervalos de clase y graficar el histograma de frecuencia relativas, el polígono de frecuencia relativas y la ojiva. Indicar de manera aproximada el porcentaje de viviendas que consumieron entre 10 y 15 metros cúbicos. Graficar la ojiva y usando ésta, indicar de manera aproximada, el porcentaje de viviendas que consumieron entre 12 y 15 metros cúbicos. El número de periodos que un canillita vendió durante los últimos 24 días fue como sigue: 13 21 16 30 42 5 33 26 28 45 17 28 39 32 8 34 27 33 27 26 24 28 16 21 ¿Cuál es el porcentaje de días en los que el canillita vendió más de 20 periódicos?. Usar el método de los intervalos de clase indicado para variables continuas, para obtener una tabla de distribución de frecuencias, con cuatro intervalos de clase y responder la pregunta anterior. Comentar los resultados, con respecto a los métodos usados. 3. Los salarios que una empresa ofrece a los practicantes oscilan entre $150 y $270 y se encuentran divididos en cuatro intervalos de clase de igual longitud. Si se supone que los salarios se distribuyen de manera uniforme, que el 40% de los practicantes ganan no más de $195, el 80% ganan $225 o menos y el 15% gana más de $232.5. a) ¿Cuál es el porcentaje de practicantes en cada categoría o intervalo de clase? b) ¿Cuánto debe aumentar la compañía a cada practicante para que el 20% de ellos supere los $240 de salario? 4. Completar la siguiente tabla. intervalo de clase 56 Indicar los extremos de cada ESTADÍSTICA Y PROBABILIDADES I 5. Intervalos de clase Marcas de clase Frecuencia relativa Frecuencia acumulada, relativa A B C D E ... 6 ... 14 … 0.10 … 0.55 … 0.10 … 0.25 … 0.9 … Los elementos datos son los haberes básicos del mes de abril de 20 empleados de un Ministerio: 210 150 a) b) c) 6. 200 180 220 230 150 210 190 160 100 140 160 180 150 120 170 190 200 190 Calcular la media, mediana y moda de los datos anteriores. Clasifique en 5 intervalos de clase de igual tamaño y calcule la media y la mediana de los datos así agrupados. Para el mes de mayo se decreta un aumento del 10% sobre los haberes básicos del mes de abril y un descuento del 2% de los haberes básicos del mes de mayo pro fondos de reconstrucción. Se pide calcular la media y la mediana de los nuevos haberes. Dada la tabla siguiente: Intervalos de Clase [0.20,0.40 > [0.40,0.60 > [0.60,0.80 > [0.80,1.00 > Frecuencias Relativas 0.10 f2 f3 0.10 Determinar: a) Los datos que faltan sabiendo que la media aritmética es 0.61 b) La mediana y moda 7. Se han medido mediante pruebas adecuadas los coeficientes intelectuales de un grupo de 20 alumnos, viniendo los resultados 57 ESTADÍSTICA Y PROBABILIDADES I agrupados en 6 intervalos de amplitud variable. Estas amplitudes son: C1=12, C2=12, C3=4, C4=4, C5=12, C6=20. Si las frecuencias relativas acumuladas correspondientes a cada uno de los intervalos son: F1=0.15, F2=0.25, F3=0.55, F4=0.8, F5=0.95, F6=1 Se pide: a) Formar la tabla de distribución de frecuencias, (frecuencias relativas, frecuencias acumuladas) sabiendo que el extremo inferior del primer intervalo es 70. b) Dibujar el histograma y el polígono de frecuencias absolutas. Calcular la moda. c) ¿Entre qué dos percentiles esta comprometido un coeficiente intelectual de 98.4?. Encontrar el valor de ambos percentiles. Al mismo grupo de alumnos se le hace una prueba de rendimiento, los resultados nos viene dados en el gráfico siguiente: F 20 16 10 5 1 4 6 58 8 10 X ESTADÍSTICA Y PROBABILIDADES I d) e) 8. Formar la tabla de distribución de frecuencias y calcular la mediana. ¿Qué medidas están mas dispersas, los coeficientes intelectuales o las puntuaciones del rendimiento? Se tiene la siguiente información, sobre una distribución de frecuencias de 50 elementos de un material sometido a prueba de rotura (en Kg/cm2), la longitud de los intervalos de clase es constante e igual a 20. Intervalo Marca de clase Xi ni fi Ni niXi 23 300 400 350 10 17 110 a) b) 9. 1,100 Determinar la media y mediana Determinar el Nº de datos que se estima que pertenezcan al ~ intervalo X , X [ ] Una distribución de frecuencias consta de 5 intervalos de clase de igual longitud y de ella se conocen los siguientes datos: n=110; n4-n5=10; n4-n3-n1=0 n1=n5; n2=n4 límite inferior de la primera clase 12.5 y L5n4=975, donde L5 es el límite superior de la cuarta clase. a) Dibujar histograma y polígono de frecuencias b) Hallar el valor de media, mediana, moda, los percentiles 25 y 75 10. Se tiene la siguiente información sobre una distribución de frecuencias de 50 elementos de un material sometido a prueba de rotura (en Kgr/cm2). Los intervalos tienen la misma amplitud igual a 20. 59 ESTADÍSTICA Y PROBABILIDADES I Xi ni Ni niXi 18 23 300 400 350 10 [ 17 4 ,120> 440 50 Total Determinar la media, desviación típica y el coeficiente de variación y tipo de curva que definen el sesgo de Pearson y Kurtosis que definen. IV. PROBLEMAS USANDO LAS PROPIEDADES DE MEDIA Y VARIANZA 1. La fábrica A produce n artículos, la fábrica B produce el doble número de artículos que la fábrica A y la fábrica C produce 20% más que la fábrica B. Si los costos unitarios son respectivamente 100, 120, 140 soles, calcular el precio promedio de venta, si los productores desean ganar el 30% de los correspondientes precios unitarios de costo. 2. En una sección de Estadística General, 24 estudiantes llevan el curso por primera vez, 6 llevan por segunda vez y 2 por tercera vez. Se sabe que 12 es el promedio de notas de los que llevan por primera vez y que las notas de los que llevan por segunda vez en promedio son superiores en un 10% de los que llevan por primera vez. Calcule el promedio de la notas de los que llevan el curso por tercera vez si la suma total de las notas es de 390. 3. Los salarios de una empresa son, en promedio S/. 500, con posterioridad se incorporan a la empresa un grupo de obreros igual al 25% de los que estaban anteriormente. El nuevo grupo ingresa a la empresa con un salario medio igual al 60% de los antiguos. Dos meses mas tarde, la empresa concede un aumento de S/. 30. se pide: a) El promedio de salario del total de obreros b) Si el aumento hubiera sido del 20% de los salarios ¿Cuál habría sido la media de los salarios así ajustados? 60 ESTADÍSTICA Y PROBABILIDADES I 4. En un examen final dado por tres secciones de una clase de Estadística de 91 alumnos, la nota promedio de todos los estudiantes fue de 14.5. El promedio de la sección A fue de 15.5 y el de la sección B fue de 9.2 los datos sobre el número de alumnos de cada sección y el promedio de las notas de la sección C se perdieron, pero los profesores de la sección Ay B recuerdan que ellos tenían exactamente el mismo número de estudiantes; mientras que el profesor de la sección C recuerda que tenía 5 estudiantes menos que el de la sección A. ¿Cuál es el promedio de los alumnos de la sección C? 5. En la siguiente tabla se presenta la distribución de salarios de 50 trabajadores de la universidad del mes de Abril del presente año. Haberes (en miles de soles) [60,100 > [100,150 > [150,210 > [210,250 > [250,260 > Nº de trabajadores 5 10 20 8 7 Por incremento del costo de vida se plantean dos alternativas de aumento para el mes de Mayo. La primera propuesta consiste en un aumento general de 35,000 soles mensuales. La segunda propuesta consiste en un aumento del 30% de los salarios de Abril a los obreros que ganan de 210,000 soles y del 5% a los obreros que ganan mas de 210,000 soles y un aumento adicional de 20,000 soles para todos los trabajadores. a) ¿Cuál de las propuestas convendría a los trabajadores? b) Para los trabajadores que ganan menos de 210,000 soles ¿Qué propuesta convendría? 6. Se tiene una población dividida en dos grupos de diferentes tamaños el primer grupo tiene un ingreso medio de 8,000 soles y el segundo grupo tiene un ingreso medio de 4,000 soles. Si el ingreso medio total es de 5,200 soles. ¿Qué porcentaje de la población está en cada grupo? 61 ESTADÍSTICA Y PROBABILIDADES I V. 7. El servicio de salud pública de Lima calculó que los costos de servicio de salud han aumentado desde S/.43 a S/.46.50 a S/.49.80 a S/.53.65 por paciente durante los últimos cuatro años; sin embargo, el presupuesto para el servicio se ha mantenido el mismo durante cada uno de estos años. ¿Cuál ha sido el costo promedio por paciente sobre el periodo de 4 años? 8. Una muestra de 130 alumnos se subdivide en dos subgrupos A y B. el profesor del subgrupo A encontró una media de calificaciones de 14 con una desviación típica de 3 y el profesor del subgrupo B encontró una media de 12 pero se olvidó calcular la varianza correspondiente. El coordinador del curso afirma que en grupo B hay 70 estudiantes y la varianza global es de 8. ¿Se puede determinar la varianza del subgrupo B con la información dada? ¿y de ser posible, cuánto vale? CALCULO DE PERCENTILES, SESGO Y CURTOSIS 1. Los datos siguientes corresponden al tiempo, en minutos, que demora una oficina “en darle trámite” a 50 documentos que ha recibido. 400 392 358 304 108 156 483 60 360 168 448 224 576 384 194 216 120 280 232 72 264 168 128 256 72 136 168 308 340 64 480 114 80 246 224 184 104 112 184 152 536 224 464 72 154 152 168 288 264 208 168 a) b) c) d) 2. A partir de la tabla de frecuencias, construir el histograma de frecuencias relativas. Graficar el polígono de frecuencias relativas. Indicar las características de la distribución. Calcular la media, varianza, desviación estándar y el coeficiente de variación de datos. Calcular la mediana, utilizando directamente los datos y utilizando la ojiva de la frecuencia acumulada relativa. Calcular los percentiles P10,P20,P75 y P90. y calcular la curtosis e interpretar su significado. Una universidad tiene 100 empleados. Para los nombrados el haber básico máximo es de 4,500 soles mensuales y el mínimo es de 600 soles mensuales. Hay un 5% de eventuales que trabajan ad-honoren o perciben compensaciones inferiores a 600 soles; 15 trabajadores nombrados reciben haberes inferiores a 62 ESTADÍSTICA Y PROBABILIDADES I 2,500 soles; el 85% de los trabajadores tienen haberes inferiores a 4,000 soles. Con esta información calcular. a) Cuartil 3, percentil 20 b) ¿Cuántos trabajadores ganan más de 2,000 soles mensuales? c) La media, mediana y moda de los haberes 3. Si tiene una distribución de frecuencias simétricas, con 6 intervalos de amplitud constante, y los siguientes datos. n=150, límite superior del quinto intervalo de clase = 60 n3=30, Q1=43.5, n2=n1+5 Calcule el sexto decil 4. Si tiene una distribución de frecuencias simétricas, con 9 intervalos de amplitud constante, y los siguientes datos: f5=0.50, límite superior de la quinta clase =110, f1+f6=0.13 f8-f1=0.002, P77=112, f7=f1+0.04 Calcule el 22 percentil 5. En una prueba de Probabilidad y Estadística aplicada a 20 alumnos, se obtuvo la siguiente distribución de puntos: Puntos [35,45 > Nº de alumnos 1 a) b) c) d) e) 6. Peso en Kgr. Nº de Alumnos [45,55 > [55,65 > [65,75 > [75,85 > [85,95 > 3 8 3 3 2 Calcular la desviación media respecto al promedio Determinar la desviación estándar Calcular el coeficiente de variación Determinar el primer coeficiente de asimetría de Pearson Calcular el coeficiente de curtosis En la siguiente distribución de frecuencias se dan los pesos de una muestra de 45 alumnos. [40,45 > [45,50 > [50,55 > [55,60 > [60,65 > [65,70 > 4 10 15 63 8 5 3 ESTADÍSTICA Y PROBABILIDADES I a) b) c) d) 7. Determine la varianza por el método abreviado ¿Cuál es el valor del coeficiente de variación? ¿La distribución es simétrica? ¿La distribución es mesocúrtica? Un encargado de compras ha obtenido muestras de focos de luz de los proveedores. En su propio laboratorio, ha probado ambas, muestras con respecto a la duración de su vida útil, con los siguientes resultados. Duración de la vida útil, en horas [700,900 > [900,1.100 > Muestras de Empresa A Empresa B 10 3 16 42 26 12 8 3 [1.100,1.300 > [1.300,1.500 > TOTAL a) b) 60 60 ¿Los focos de qué empresa tienen el mayor promedio en la duración de vida útil? ¿Los focos de cuál de las empresas tienen mayor uniformidad? 8. Una publicidad sobre camiones enumera la siguiente distribución de kilómetros recorridos por galón de gasolina según reportes de los propietarios de esos vehículos: a) Calcule la desviación estándar. Explique su significado b) Si usted obtiene 14 kilómetros por galón uno de los camiones, ¿a cuántas unidades de desviación estándar se encuentra por debajo de la media de 18.82 kilómetros por galón? 9. La edad media de los candidatos a un determinado curso de segunda especialización fue baja, del orden de 22 años. Como ese curso fue planificado para atender a personas de todas las edades, se decidió hacer una campaña de divulgación. Para verificar si la campaña fue o no eficiente se hizo un levantamiento de la edad de los candidatos a la última promoción y los resultados se dan en la siguiente tabla. 64 ESTADÍSTICA Y PROBABILIDADES I Edad [18,20 > [20,22 > [22,26 > [26,30 > [30,36 > TOTAL a) b) Frecuencia 18 Porcentaje 36 12 10 8 24 20 16 2 50 4 100 En base a estos resultados, ¿Ud. Diría que la campaña ha sido efectiva? (Esto es, ¿aumentó la edad media?) Otro investigador decidió usar la siguiente regla: Si la diferencia X − 22 es mayor que el valor 25 , entonces la n campaña ha sido efectiva. ¿Cuál es la conclusión de él en base a los datos? 65 ESTADÍSTICA Y PROBABILIDADES I 66 ESTADÍSTICA Y PROBABILIDADES I Semana 5 PROBABILIDAD INTRODUCCIÓN • En la actualidad y cada vez mayor las aplicaciones de la teoría de probabilidad en una amplia variedad de campos Científicos se da así por ejemplo en: o Los cálculos de la densidad de tráfico telefónico o El nivel de calidad de los artículos manufacturados Transmisión de señales en presencia de ruido (Problema que o afrontan los ingenieros en el diseño de sistemas de comunicaciones y control automático) o Los Estudios del ruido térmico en los circuitos eléctricos y del movimiento Browniano de las partículas sumergidas en un líquido o gas (física). • ¿Qué es, entonces lo que estudia la teoría de probabilidad que da lugar a diversas aplicaciones? Para contestar a esta pregunta simplemente se considera en los ejemplos anteriores sus respectivos fenómenos aleatorios los cuales generan sus respectivos espacios muéstrales, dentro de los cuales se definen los eventos aleatorios, para luego calcular su probabilidad la cual se encuentra entre cero y uno. Otras preguntas que afrontaremos en probabilidad o ¿Qué queremos decir al afirmar que la probabilidad de un evento es 0.50, 0.25, 0.80 en un determinado experimento aleatorio? ¿Cómo se determinan o miden en la práctica los números que o llamamos probabilidad? o ¿Cuáles son las reglas matemáticas que las rigen? Secuencialmente responderemos a estas preguntas según vayamos desarrollando el curso. • • La teoría de probabilidades proporciona los modelos para estudiar los fenómenos que se caracterizan por la variabilidad de sus resultados. Estos modelos se llaman modelos aleatorios. En general un modelo describe las propiedades fundamentales de un fenómeno sin describir todos sus detalles. 67 ESTADÍSTICA Y PROBABILIDADES I Existen diferentes modelos: modelos físicos : (máquinas en general) modelos analógicos : (mediciones de voltaje, continuidad) modelos abstractos : (en general, ciencia) Los modelos abstractos se clasifican en: - • determinísticos (es lo que siempre ocurre). Ej: si se suelta una tiza, ésta cae. aleatorios ó estocásticos (al azar). Ej.: un terremoto ALGUNAS DEFINICIONES IMPORTANTES EN PROBABILIDAD MODELOS ALEATORIOS: Describen experimentos aleatorios, los resultados ocurren con regularidad estadística; es decir que éstos resultados están entre 0 y 1 que representa a la frecuencia relativa con que ocurre en una serie de repeticiones independientes. FENÓMENO ALEATORIO: Es un fenómeno empírico que se caracteriza por la propiedad de que al observarlo bajo determinado conjunto de condiciones no siempre se obtiene el mismo resultado. (Fortuito o al azar) • SECUENCIA NATURAL PARA LA SOLUCIÓN DE PROBLEMAS EN PROBABILIDAD P Exp. S E 0 1 0 ≤ P(E ) ≤ 1 Experimento Aleatorio Espacio Muestral Evento E⊆ S Experimento Espacio Muestral . Lanzar 2 monedas: {CS, CC, SC, SS} Lanzar 1 dado: {1, 2, 3, 4, 5,6} 68 Evento E Probabilidad de Ocurrencia Probabilidad de Ocurrencia de E E = {CC}, P(E) = nE / Ns = ¼ E = {#par}, P (E) = 3 / 6 = 1/2 ESTADÍSTICA Y PROBABILIDADES I EXPERIMENTO ESTADÍSTICO (EXP) Es un proceso mediante el cual se obtiene resultados por observación. a) Aleatorio: cuando los resultados de la observación no se pueden predecir con exactitud. b) Determinístico: cuando el resultado de la observación es determinado en forma precisa por las condiciones bajo las cuales se realiza dicho experimento. ESPACIO MUESTRAL (S) Es el conjunto de puntos correspondientes a todos los posibles resultados de un experimento aleatorio. EVENTO O SUCESO (E) Es cualquier subconjunto del espacio muestral que corresponde al experimento aleatorio. EVENTOS ESPECIALES Es el llamado evento imposible evento seguro Ф, P(Ф) = 0 S, P(S) = 1 ALGEBRA DE EVENTOS Tiene Similitud con el álgebra de conjuntos. Las operaciones posibles en eventos son: * Unión ( ∪ ) * Intersección ( ∩ ) * Complementación (‘) Sean A y B eventos en S: 1.- A ∪ B: evento que ocurre si y solo si y solo si A ocurre ó B ocurre. 2.- A ∩ B: evento que ocurre si y solo si A ocurre y B ocurre. 3.- A’ (Ac): evento que ocurre si A no ocurre. A-B = A∩ B’ (diferencia de eventos) Leyes de Morgan: (A ∪ B)′ = A′ ∩ B′ (A ∩ B)′ = A′ ∪ B′ PRINCIPIO DE LA DUALIDAD Es la relación que tiene el evento imposible con el evento seguro. S’ = Ф Ф‘=S 69 ESTADÍSTICA Y PROBABILIDADES I EJERCICIOS DE APLICACIÓN SOBRE EVENTOS 1. Sean A1, A2, A3, A4 eventos. Explicar siguientes enunciados: a) Por lo menos ocurre un evento. b) ocurren todos los eventos. c) ningún evento ocurra d) no ocurre exactamente un evento presentar en símbolos los Solución: a) A1 ∪ A2 ∪ A3 ∪ A4 b) A1 ∩ A2 ∩ A3 ∩ A4 c) A1’ ∩ A2’ ∩ A3’ ∩ A4’ d) (A1’ ∩ A2 ∩ A3 ∩ A4) ∪ (A1 ∩ A2’ ∩ A3 ∩ A4) ∪ (A1 ∩ A2 ∩ A3’ ∩ A4) ∪ (A1 ∩ A2 ∩ A3 ∩ A4’) 2. Sean A, B, C tres eventos asociados a un cierto experimento. Exprese las siguientes proposiciones verbales en notación de conjuntos a) Al menos uno de los eventos ocurre b) Exactamente uno de los eventos ocurre c) Exactamente dos de los eventos ocurren d) No ocurren, mas de dos eventos simultáneamente Solución: a) ( A∩B'∩C') ∪( A'∩B∩C') ∪( A'∩B'∩C) ∪( A∩B∩C') ∪( A'∩B∩C) ∪( A∩B'∩C) ∪( A∩B∩C) b) ( A ∩ B '∩C ') ∪ ( A'∩ B ∩ C ') ∪ ( A'∩ B '∩C ) c) ( A ∩ B ∩ C ') ∪ ( A ∩ B'∩C ) ∪ ( A'∩ B ∩ C ) d) ( A'∩B'∩C') ∪( A∩B'∩C') ∪( A'∩B∩C') ∪( A'∩B'∩C) ∪( A∩B∩C') ∪( A∩B'∩C) ∪( A'∩B∩C) 3. Sean A, B y C tres sucesos arbitrarios. Encontrar las expresiones para los sucesos consistentes en que entre A, B y C. a) Se ha producido solamente A b) Se ha producido Ay B, en tanto que C no se ha producido c) Se han producido los 3 sucesos d) Se han producido al menos uno de los suceso e) No se ha producido ninguno de los sucesos. Solución: a) ( A ∩ B '∩C ') b) ( A ∩ B ∩ C ') c) ( A ∩ B ∩ C ) d) (A ∩ B'∩C' ) ∪ ( A'∩B ∩ C') ∪ ( A'∩B ∩ C) ∪ ( A'∩B ∩ C) ∪ ( A ∩ B'∩C) ∪ (A ∩ B ∩ C' ) ∪ ( A ∩ B ∩ C ) e) ( A'∩ B'∩C ') 70 ESTADÍSTICA Y PROBABILIDADES I 4. Se escoge dos jurados, entre 4 alternativas posibles, para atender un juicio por asesinato. Utilice la notación A1 A3 , por ejemplo, para indicar el evento simple en que se seleccionan las alternativas 1 y 3, enumere los 6 elementos del espacio muestral. Solución: A1 , A2 , A3 , A4 • Sean los jurados: • Se eligen dos jurados • Maneras de elegir a dos jurados A1 A2 A3 A4 A1 A2 A2 A3 A1 A3 A2 A4 A3 A4 A1 A4 S = {A1 A2 , A2 A3 , A3 A4 , A1 A3 , A2 A4 , A1 A4 } 5. Se Seleccionan aleatoriamente cuatro estudiantes de una clase de química y se clasifican en hombres y mujeres. Escriba los elementos del espacio muestral S1 utilizando la letra H para hombres y la letra M para las mujeres. Defina un segundo espacio muestral, S 2 , donde los elementos representan el número de mujeres seleccionadas. Solución: • Cuando se elige un estudiante se tiene dos posibilidades Cuando se elige dos estudiantes se tiene cuatro posibilidades Cuando se elige tres estudiantes se tiene ocho posibilidades Cuando se elige cuatro estudiantes se tiene dieciséis posibilidades : : : 21 22 23 : 24 • El experimento es del tipo dicotómico. Usemos el diagrama del árbol (arborecencia) el cual es muy usual en muchos experimentos. 71 ESTADÍSTICA Y PROBABILIDADES I 4to Est 3er Est H 2do Est H 1er Est H H M M M H H M H H M M H H M M H M H M H M M H M H M S1 HHHH S2 0 HHHM 1 HHMH 1 HHMM 2 HMHH 1 HMHM 2 HMMH 2 HMMM 3 MHHH 1 MHHM 2 MHMH 2 MHMM 3 MMHH 2 MMHM 3 MMMH 3 MMMM 4 S 2 = {0, 1, 2, 3, 4} 6. Un experimento consiste en preguntar a 3 mujeres aleatoriamente si lavan sus platos con detergente marca X. a) Enumere los elementos de un espacio muestral S utilizando la letra Y para las respuestas “si” y N para las “No”. b) Escriba los elementos de S que correspondan al evento E en que al menos 2 de las mujeres usan la marca X. c) Defina un evento que tenga como elemento los puntos {YYY , NYY , YYN , NYN } Solución a) Tres mujeres participan y cada una tiene dos posibilidades de contestar 72 ESTADÍSTICA Y PROBABILIDADES I 3ra 1ra S YYY Y 2da Y N Y YYN YNY Y N N Y N YNN Y NYY NYN N N Y NNY NNN N b) E: al menos dos mujeres usan la marca X, observemos el e.m.S E = {YYY, YYN, YNY, NYY} c) 7. Un evento posible observando el evento dado: “La segunda mujer entrevistada usa marca X”. Suponga que una familia sale de vacaciones de verano en su vehículo de acampar y que M es el evento en que tendrán problemas mecánicos, T el que reciban una infracción por cometer una violación de tránsito y V el que lleguen a un campamento totalmente ocupado. Con ayuda del diagrama de Venn de la figura explique con palabras los eventos representado por las siguientes regiones a) Región 5 b) Región 3 c) Regiones 1 y 2 juntas d) Regiones 4 y 7 juntas e) Regiones 3, 6, 7 y 8 juntas 73 ESTADÍSTICA Y PROBABILIDADES I M T 5 7 4 1 2 3 6 8 V Solución M: e. de que tendrán problemas mecánicos T: e. de que recibirán una infracción por cometer una violación de tránsito. V: e. de que lleguen a un campamento totalmente ocupado a) Región 5: e. de que tendrán problemas mecánicos, pero no recibirán una infracción por cometer una violación de transito y tampoco llegará a un campamento totalmente ocupado. b) Región 3: e. la familia recibirá una infracción por cometer una violación de tránsito y llegará a un campamento totalmente ocupado pero no tendrá problemas mecánicos. c) Regiones 1 y 2 juntas: e. la familia tendrá problemas mecánicos y llegará a un campamento totalmente ocupado d) Regiones 4 y 7 juntas: e. la familia no llegará a un campamento totalmente ocupado pero recibirá una infracción por cometer una violación de tránsito. e) Regiones 3, 6, 7 y 8 juntas: e. la familia no experimentará problemas mecánicos. 8. Con referencia al ejercicio anterior (7) y al diagrama de Venn de la figura, haga una lista de los números de las regiones que representan los siguientes eventos. a) La familia no tendrá problemas mecánicos y no cometerá violación alguna de tránsito pero encontrará un campamento totalmente ocupado. 74 ESTADÍSTICA Y PROBABILIDADES I b) c) d) La familia tiene problemas mecánicos y dificultades para encontrar un campamento que no esté ocupado en su totalidad, pero no cometerán violación alguna de tránsito. La familia tendrá problemas mecánicos o encontrará un campamento totalmente ocupado, pero no cometerá violaciones de tránsito. La familia no llegará a un campamento totalmente ocupado Solución a) 6. b) 2. 9. C) 2, 5, 6. d) 4, 5, 7, 8 Expresar simbólicamente es decir en términos del algebra de eventos las preguntas a), b), c), d) y e) del ejercicio (7) Solución a) M ∩ (V ∪ T ) ' ; b) (V ∩ T ) ∩ M ' ; c) M ∩ V ; d) V ′ ∩ T ; e) M ' 10. Expresar simbólicamente es decir en términos del algebra de eventos las proposiciones a), b), c) y d) que aparecen en el ejercicio 8 a) ( M ' ∩ T ' ) ∩ V ; b) (M ∩ V ) ∩ T ' ; c) ( M ∪ V ) ∩ T ' ; d) (M ∪ T ) ∩ V ' 11. Un fabricante tiene cinco terminales de computadoras aparentemente idénticas listas para enviarlas a su destino. No sabe que dos de las cincos son defectuosas. Recibe un pedido especial de dos terminales y lo surte seleccionando al azar dos de las cinco disponibles. Solución • Existen cinco terminales de los cuales dos son defectuosas y tres buenas; esto indica que podemos hacer una combinatoria 5! 5 C 2 = 2! 3! = 10 existen 10 posibilidades de enviar el pedido. • El espacio muestral lo determinamos del modo siguiente. D1 , D2: terminales defectuosos Maneras que pueden ocurrir en el envío B1,B2,B3: terminales buenos 75 ESTADÍSTICA Y PROBABILIDADES I D1 D2 B1 B2 D1 D2 , D1 B1 , D1 B2 , D1 B3 ⎧⎪D1 D2 , D1 B1 , D1 B2 , D1 B3 , D2 B1 ,⎫⎪ S =⎨ ⎬ ⎪⎩D2 B2 , D2 B3 , B1 B2 , B1 B3 , B2 B3 ⎪⎭ 76 D2 B1 D 2 B2 D 2 B3 B1 B2 B1 B3 B2 B3 B3 ESTADÍSTICA Y PROBABILIDADES I Semana 6 PROBABILIDAD DE UN EVENTO Sea S un espacio muestral asociado a un experimento: Sea A un subconjunto (evento) de S. P: A [0,1] Se lee: P de A (P(A)) llamada probabilidad del evento A que satisface los tres axiomas siguientes: 1. la probabilidad 0≤P(A) ≤1 A ⊆ S 2. P(S)=1 3. (aditividad finita) si A1, A2,….. An eventos en S, disjuntos dos a dos (ó mutuamente excluyentes) Ai ∩ Aj =ǿ i≠j La probabilidad de la unión es. P ( A1 ∪ A2 ∪ ... ∪ An ) = Σni=1 P (A;) n P ( A1 ∪ A2 ∪ ... ∪ An ) = P( A1 ) + P( A2 ) + ... + P( An ) = ∑ P( Ai ) i =1 OBSERVACIÓN: La frecuencia relativa cumple con éstos tres axiomas: fA = nA nS nA: número de elementos del evento A en S nS:: número de elementos del espacio muestral S 1.- 0 ≤ fA ≤ 1 n 2.- f S = S = 1 nS n +n 3.- f ( A1 ∪ A2 ) = A1 A2 = f A1 + f A2 nS n A1 n A 2 + → f A1∪ A 2 = f A1 + f A 2 nS nS f A1 U A2 = 77 nA1 ∪ nA2 ns = nA1 ns + nA2 ns = f A1 + f A2 ESTADÍSTICA Y PROBABILIDADES I Esteresultado nos muestra que la frecuencia relativa satisface los tres axiomas de probabilidad, motivo por el cual se le denomina probabilidad clásica. ALGUNOS TEOREMAS IMPORTANTES EN PROBABILIDADES 1. La probabilidad de un evento imposible es cero P (Ø)=0, demostración: Demostración: Propiedad (A U Ø) = A P(A U Ø) = P(A) Axioma 3 P(A) + P (Ø) = P(A) P (Ø) =0 2. Si A ⊂ es complemento de A ⇒ P ( A ⊂ ) = 1-P(A). Demostración: Sea A un evento en S Propiedad: Ax 3 y Ax2 3. A ⊂ U A =S P ( A ⊂ U A) = P(S) P ( A ⊂ ) +P(A) =1 P ( A ⊂ )=1-P(A) Si Ay B son 2 eventos cualesquiera en S Ö P (AUB) = P(A) +P (B) – P(A ∩ B) Demostración: Usando propiedades: A ∪ B = A ∪ (A’ ∩ B) . P (A ∪ B) = P (A) + P (A’ ∩ B) A ‘∩ B = (S - A) ∩ B =B-A ∩ B P (A ∪ B) = P (A) + P (B - A ∩ B) P (A ∪ B) = P (A) + P (B) - P (A ∩ B) 78 A′∩ B ESTADÍSTICA Y PROBABILIDADES I Extensión a tres eventos • P(A ∪ B ∪ C)=P(A)+P(B)+P(C)-P(A ∩ B)-P(A ∩ C)-P(B ∩ C)+P(A ∩ B ∩ C) Podemos extender a n eventos; A1 ∪ A2 ∪ ..... ∪ An y calcular la probabilidad P( A1 ∪ A2 ∪ .... ∪ An ) 4. Si A ⊂ B ⇒ P(A) ≤ P (B) Si un evento A esta contenido en un evento B indica que la probabilidad de A es menor o igual a la probabilidad de B Demostración: (ejercicio) Como observamos de esta sección definimos la función de probabilidad con los tres axiomas fundamentales, adicionalmente enunciamos teoremas los cuales se demuestran haciendo uso de los axiomas y propiedades que se derivan de la teoría de eventos definidos en el espacio muestral S. • EJERCICIOS DE APLICACIÓN SOBRE MUESTRAL, EVENTOS Y USO DE TEOREMAS 1. Entre cinco generadores portátiles producidos en una línea de montaje en un día, hay dos defectuosos. Si se seleccionan dos generadores para su venta, determinar la probabilidad de que ninguno de los dos tenga defecto. Suponer que la selección de los dos generadores para la venta se hizo de modo que todas las muestras posibles sean del mismo tamaño tengan la misma probabilidad de ser seleccionado. ESPACIO Solución Según el enunciado existen dos generadores defectuosos y tres buenos por que en total son cinco: Di: defectuosos; Bi: buenos D1 D2 B1 B2 B3 Determinamos el espacio muestral del experimento S = {D1 D 2 , D1 B1 , D1 B 2 , D1 B3 , D 2 B1 , D 2 B 2 , D 2 B3 , B1 B 2 , B1 B3 , B 2 B3} 79 ESTADÍSTICA Y PROBABILIDADES I A: Evento de que ninguno tenga defecto: B1 B2 , B1 B3 , B2 B3 3 n P ( A) = A = ns 10 2. La probabilidad de que un hombre siga vivo dentro de 25 años es de 3/5 y la de su esposa los esté es de 2/3. Hallar la probabilidad de que en ese momento. a) Ambos estén vivos b) Sólo el hombre viva c) Sólo viva la esposa d) Al menos uno esté vivo. Solución: Sean los eventos; ambos independientes H: e. de que el esposo viva dentro de 25 años; H’ el esposo no viva E: e. de que la esposa viva dentro de 25 años; E’ la esposa no viva P(H ) = 3 / 5, P(E) = 2/3, P(H' ) = 1 - P(H) = 2/5, P(E' ) = 1 - P(E) = 1/3 3 2 2 a) P(H ∩ E ) = P ( H ) P( E ) = × = 5 3 5 3 2 1 b) P(H ∩ E ') = P( H ) − P( H ∩ E ) = − = 5 5 5 2 2 4 c) P(E ∩ H ') = P( E ) - P ( H ∩ E ) = − = 3 5 15 3 2 2 13 d) P(H ∪ E ) = P( H ) + P( E ) − P( H ∩ E ) = + − = 5 3 5 15 * Es cierto que P ⎡⎣( H ∩ E ') ∪ ( H ′ ∩ E ) ∪ ( H ∩ E ) ⎤⎦ = P( H ∪ E ) ? . Justificar 3. La probabilidad de que una industria peruana se ubique en Venezuela es 0.7; de que se localice en Argentina, de 0.4 y de que se encuentre en Venezuela o Argentina, de 0.8 ¿Cuál es la probabilidad de que la industria se localice: a) En ambos países? b) En ninguno de ellos? Solución: Sean los eventos: V: e de que la industria se ubique en Venezuela A: e de que la industria se ubique en Argentina P(V)=0.7 P(A)=0.4 P(V ∪ A)=0.8 80 ESTADÍSTICA Y PROBABILIDADES I Aplicando las propiedades vistas {V ∪ A}; P(V ∪ A) = P(V ) + P( A) − P(V ∩ A) a) 0.8 = 0.7 + 0.4 − P(V ∩ A) P(V ∩ A) = 0.7 + 0.4 − 0.8 = 0.3 {V '∩ A'}; P(V '∩ A' ) = P(V ∪ A)' = 1 − P(V ∪ A) = 1 − 0.8 = 0.2 b) 4. De un grupo de 100 estudiantes universitarios del último año, 60 estudiaron biología, 20 geología y 10 astronomía. 15 estudiaron biología y geología siete biología y astronomía y tres; geología y astronomía. Tres de los estudiantes cursaron las 3 materias. Si se selecciona al azar un estudiante del último año; ¿cuál es la probabilidad de que haya estudiado: a) Por lo menos una de estas materias? b) Biología y geología pero no astronomía? c) Astronomía pero no biología o geología? d) Ninguno de los tres? Solución: Sean los eventos: B: e. de que el estudiante haya estudiado biología G: e. de que el estudiante haya estudiado geología A: e. de que el estudiante haya estudiando astronomía a) {B ∪ G ∪ A} P(B ∪ G ∪ A) = P( B) + P(G ) + P( A) − P( B ∩ G ) − P( B ∩ A ) − P(G ∩ A) + P( B ∩ G ∩ A) 60 20 10 15 7 3 3 68 = + − − − + = 100 + 100 100 100 100 100 100 100 b) {A'∩( B ∩ G )} P( A'∩( B ∩ G )) = P( B ∩ G ) − P( A ∩ B ∩ G ) 15 3 12 = − = 100 100 100 c) {A ∩ ( B ∪ G )'} P ( A ∩ ( B ∪ G ) ') = P ( A) − P ( A ∩ ( B ∪ G )) = P ( A) − P( A ∩ B) − P( A ∩ G ) + P( A ∩ B ∩ G ) 10 7 3 3 3 = − − + = 100 100 100 100 100 81 ESTADÍSTICA Y PROBABILIDADES I 5. Se somete a un estudiante a un examen del tipo verdadero – falso, el que contiene 10 preguntas; para aprobar debe responder correctamente ocho o mas preguntas. Si el estudiante adivina ¿cuál es la probabilidad de que apruebe el examen? Solución: • El examen contiene 10 preguntas: X i , i = 1,2, …,10 6. 1 2 independientes. • Cada pregunta tiene éxito Ei; luego cada Ei; P(Ei ) = • Probabilidad • Como debe responder ocho o mas preguntas: X ≥ 8 ⎛10 ⎞ ⎛10 ⎞ ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ 8 ⎠ 9 ⎠ 10 ⎝ ⎝ P( X = 8) = 10 , P( X = 9) = 10 , P( X = 10) = ⎝ 10 ⎠ 2 2 2 • Probabilidad de que apruebe el examen: ⎛10 ⎞ ⎛10 ⎞ ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ 10 10 9 8 56 P( X i ) = ⎝ 10 ⎠ + ⎝ 10 ⎠ + ⎝ 10 ⎠ = ∑ 1024 2 2 2 i =8 total 1 P(E1 , E 2 ,..., E10 ) = 10 2 de éxitos Cierto tipo de motor eléctrico falla por obstrucción de cojinetes, por combustión del embobinado o por desgaste de las escobillas. Suponga que la probabilidad de una obstrucción es doble que la de la combustión, la cual es cuatro veces mas probable que la de la combustión, la cual es cuatro veces mas probable que la inutilización de las escobillas. ¿Cuál es la probabilidad de que la falla sea por cada uno de estos mecanismos? Solución: • De acuerdo a las hipótesis definamos los siguientes eventos. O: e. obstrucción de los cojinetes C: e. combustión del embobinado D: e. desgaste de las escobillas • Condiciones del enunciado: P(O ) = 2 P(C ) P(C ) = 4 P( D) 82 ESTADÍSTICA Y PROBABILIDADES I • Propiedades, teoremas, etc. O ∪ C ∪ D = S → P(O ∪ C ∪ D ) = P( S ) P(O) + P(C) + P(D) = 1 • Por las condiciones establecidas: 2 P(C ) + P(C ) + 0.25P(C ) = 1 1 4 P(C) = = 3.25 13 ⎛4⎞ 8 P(O) = 2⎜ ⎟ = ⎝ 13 ⎠ 13 P(D) = 7. 1⎛ 4 ⎞ 1 ⎜ ⎟= 4 ⎝ 13 ⎠ 13 Se ha cargado un dado para que la probabilidad de obtener 1, 2, 3, 4, 5 y 6 sea de 1/3, 1/4, 1/6, 1/12, 1/12 y 1/12, respectivamente. Suponga que las propiedades usuales de la probabilidad son válidas todavía en esta situación donde los sucesos no tienen la misma probabilidad. Busque la probabilidad de obtener: a) Un número par b) Un número menor que cinco c) Un número par o menor que cinco Solución: Sean los siguientes eventos según el enunciado 5 a) A = {2,4,6}; P( A) = P(2) + P (4) + P(6) = 12 b) B: e. número menor que 5, B = {1,2,3,4} 10 P ( B) = P(1) + P(2) + P(3) + P(4) = 12 c) A ∪ B : e. de ser número para o menor que cinco P ( A ∪ B ) = P ( A1 + P( B) − P ( A ∩ B) ( A ∩ B = {2,4,6} ∩ {1,2,3,4} = [2,4] P( A ∪ B) = 5 10 ⎛ 1 1 ⎞ 11 + −⎜ + ⎟ = 12 12 ⎝ 4 12 ⎠ 12 83 ESTADÍSTICA Y PROBABILIDADES I 8. Un dado se construye de tal forma que un 1 o un 2 ocurran dos veces más frecuentemente que un 5, mismo que se presenta tres veces más seguido que un 3, un 4 o un 6. Si el dado se lanza una vez, encuentre la probabilidad de que : a) El número sea par b) El número sea un cuadrado perfecto c) El número sea mayor que cuatro Solución: • Según el enunciado asignemos la probabilidad w cuando aparecen un 3, un 4 y un 6, cuando aparece 5 será 3w y cuando aparece 1, 2 (3w), cuando aparece 2, 2(3w); tenemos luego las asignaciones. 1 2 3 4 5 6 6w 6w w w 3w w • a) b) c) 9. La suma de las probabilidades debe ser igual a UNO ( P( S ) = 1) 1 6w + 6w + w + w + 3w + w = 1 ⇒ w = 18 8 P(P{2} ∪ {4} ∪ {6}) = P(2) + P(4) + P(6) = 18 7 P({1} ∪ {4}) = P(1) + P(4) = 18 4 P({5} ∪ {6}) = P(5) + P(6) = 18 Una red de comunicaciones tiene un sistema incorporado de seguridad contra fallas. Si en este sistema falla la línea I, se utiliza la línea II como emergencia, se utiliza la línea III como una desviación. La Probabilidad de que falle cualquiera de las tres líneas es de 0.2, y las fallas de estas tres líneas son independientes (excluyentes). ¿Cuál es la probabilidad de que este sistema de tres líneas no falle totalmente? Solución: • Sean los eventos F: e. falla en la línea I: P(F)=0.2 E: e. emergencia la línea II; P(E)=0.2 D: e. desviación de la línea III; P(D)=0.2 84 ESTADÍSTICA Y PROBABILIDADES I • • Para que el sistema no falle es necesario considerar los eventos de no falla: F’, E’, D’. Luego se considera que al menos uno no falle {F '∪ E '∪ D'} Luego la probabilidad de no falla; P(F '∪ E '∪ D') y por la propiedad de complementación e independencia de eventos: P (F '∪ E '∪ D ') = P ( F ∩ E ∩ D)' = 1 − P( F ∩ E ∩ D) = 1 − P ( F )P( E ) P( E ) = 1 − (0.2) 3 P (F '∪ E '∪ D') = 0.992 10. La probabilidad de fallar cada una de las 4 piezas de un aparato electrónico es de 0.001. Si el aparato funciona por lo menos con tres piezas de las indicadas, hallar la probabilidad de que éste no funcione si cada pieza se desarrolla en forma independiente. Solución: • Sean los eventos de no falla: A1, A2, A3, A4, los cuales son independientes. • El aparato funciona al menos con 3 piezas, esta hipótesis induce a pensar que con 4 piezas también funciona luego. • Sea el evento el aparato funciona: F y F’ evento de que no funciona. A B C D F = ( A1 A2 A3 A4 ) ∪ (( A1 A2 A3 )A' 4 ) ∪ (( A1 A2 A4 )A'3 ) ∪ (( A1 A3 A4 )A' 2 ) E ∪ (( A2 A3 A4 )A'1 ) P ( F ) = P( A) + P( B) + P(C ) + P( D) + P( E ) = (0.999) + 4(0.999) 0.001 4 3 = 0.999994008 P ( F ' ) = 1 − 0.999994008 = 0.000001 11. Suponga que una promoción de 500 estudiantes, se encuentran que210 fuman, que 258 toman bebidas alcohólicas que 216 toman alimentos entre comidas, que 122 fuman y toman bebidas alcohólicas que 83 toman alimentos entre comidas y también bebidas alcohólicas, que 97 fuman y toman alimentos entre comidas y que 52 practican 85 ESTADÍSTICA Y PROBABILIDADES I estas tres dañinos hábitos. Si se escoge aleatoriamente a un miembro de esta promoción, encuentre la probabilidad de que el estudiante. a) Tome alimentos entre comidas e ingiera bebidas alcohólicas pero no fume. b) No fume y no tome alimentos entre comidas. c) Realice exactamente uno de estos tres dañinos hábitos. Solución: F: e. de que estudiantes fuman B: e. de que estudiantes toman bebidas alcohólicas A: e. de que estudiantes toman alimentos entre comidas S a) {( A ∩ B ) ∩ F '} P(( A ∩ B ) ∩ F ') = P( A ∩ B ) − P( A ∩ B ∩ F ) = 210 F 83 52 31 − = 500 500 500 97 52 83 216 b) {F '∩ A'} P(F '∩ A') = P(F ∪ A)' = 1 − P(F ∪ A) = 1 − [P ( F ) + P( A) − P( F ∩ A)] = c) B 122 258 A 171 500 Existen tres eventos posibles definidos del modo siguiente M = ( F ∩ ( B ∪ A)' ), N = ( A ∩ ( F ∪ B )' ), Q = ( B ∩ ( F ∪ A)' ) Son eventos excluyentes mutuamente, luego: P(M ∪ N ∪ Q ) = P(M ) + P( N ) + P(Q ) P(M ) = P(F )(1 − P( A ∪ B )) = 0.091560 P(Q ) = P(B )(1 − P(F ∪ A)) = 0.176472 P(M ∪ N ∪ Q ) = 0.401088 ≈ 0.4011 Como resumen podemos indicar que hemos presentado ejercicios de aplicación sobre algebra de eventos, probabilidad de ocurrencia de eventos y uso de teoremas fundamentales en probabilidad. A continuación presento un esquema que nos toca desarrollar el cual presenta el núcleo y la importancia de la probabilidad en sus diversas aplicaciones prácticas; sin el conocimiento pleno de estos teoremas, poco podríamos hacer en inferencia estadística en donde las ciencias 86 ESTADÍSTICA Y PROBABILIDADES I en general se apoyan para realizar inferencias, tomar decisiones y predicciones de hechos experimentales o tratamiento de información reales. 87 ESTADÍSTICA Y PROBABILIDADES I 88 ESTADÍSTICA Y PROBABILIDADES I Semana 7 PROBABILIDAD CONDICIONAL La probabilidad de ocurrencia de un evento tiene sentido cuando hemos definido un espacio muestral específico. Por ejemplo determinar la probabilidad de que un ingeniero gane al menos S/.10,000 mensuales no tiene sentido si no hemos especificado el universo o espacio muestral la que pertenece, tendrá sentido si solamente definimos el espacio muestral esto es: a todos los ingenieros del Perú que forman parte de la industria, a los que laboran en una universidad, etc. • La probabilidad de ocurrencia de un evento A referido o acondicionado al espacio muestral S es: S P( A ∩ S ) P(S ) P ( A) = 1 P ( A / S ) = P ( A) P( A / S ) = • A A∩ S = A Consideremos el evento A referido o condicionado a otro evento B, ambos inmersos en el espacio muestral S S P( A ∩ B ) P( A / B ) = , P (B ) > 0 P (B ) A B A∩ B ≠ ∅ • Es lógico que ambas probabilidades P( A ∩ B ) yP(B ) están referidas al espacio muestral S. Consideremos los siguientes ejemplos a) Lancemos un dado y definamos el evento A de que salga 3 y calculemos en probabilidad de ocurrencia P(A) 89 ESTADÍSTICA Y PROBABILIDADES I Solución: Espacio muestral S = {1,2,3,4,5,6} Evento A = {3} P ( A ∩ S ) P ( A) 1 / 6 1 = = = P( A / S ) = 1 1 6 P(S ) b) Consideremos ahora el evento anterior A referido o condicionado al evento B el cual está definido por los números impares. Solución: S = {1,2,3,4,5,6} B = {1,3,5} A ∩ B = {3} A = {3} P( A / B ) = P( A ∩ B ) 1 / 6 1 = = 3/ 6 3 P (B ) DEFINICIÓN.- Sean A y B eventos en S. La probabilidad condicional de un evento A dado que ocurrió B, esté dado por P( A ∩ B ) P( A / B ) = , P (B ) > 0 P (B ) OBSERVACIÓN 1. La probabilidad condicional cumple con los tres axiomas de probabilidad. 2. Cómo se muestra en el diagrama anterior utilizando la probabilidad condicional definimos la probabilidad de un producto de eventos y la independencia de eventos. EJERCICIOS DE APLICACIÓN 1. Consideremos el lanzamiento de un par de dados y definamos los siguientes eventos en el espacio muestral S. A = {( X , Y ) / X + Y ≥ 6} B = {( X , Y ) / Y = X } a) b) C = {( X , Y ) / 2 ≤ X + Y ≤ 8} Presentar en un gráfico el conjunto de pares eventos dados. Calcular las probabilidades: P( A ∩ B ), P( A ∪ C ), P( A / B ), P( A / C ) 90 ESTADÍSTICA Y PROBABILIDADES I Solución: a) Espacio muestral por extensión; S = {(1,1), (1,2),..., (6,5), (6,6 )} Espacio muestral por comprensión; S = {( X,Y ) / X = 1,2,...,6yY = 1,2,...,6} como un entendimiento del ejemplo graficar {( X i , Y1 )}i = 1,2,...,6 y luego definir los eventos A, B y C por extensión. b) Los eventos por extensión A = {(5,1), (4,2), (3,3), (2,4),..., (6,6)}; n A = 26 B = {(1,1), (2,2),..., (6.6)}; n B = 6 C = {(1,1), (1,2),..., (6,1), (6,2)}; nc = 26 P( A ∩ B ) = n A∩ B = 4 n A∩C = 16 n A∩ B 4 = nS 36 P ( A ∩ B ) = P ( A ) + P (B ) − P ( A ∩ B ) n n n = A + B − A∩ B nS nS nS 26 6 4 + − 36 36 36 28 = 36 P( A ∩ B ) 4 / 36 4 P( A / B ) = = = P (B ) 6 / 36 6 P( A ∩ C ) 16 / 36 16 P( A / C ) = = = P(C ) 26 / 36 26 = 2. En un experimento para estudiar la relación entre la hipertensión y el hábito de fumar; se recurrieron a los siguientes datos con180 individuos: 91 ESTADÍSTICA Y PROBABILIDADES I Si se selecciona aleatoriamente a uno de estos individuos, encuentre la probabilidad de que la persona: a) b) c) Experimente hipertensión, dado que es un fumador empedernido. Sea un no fumador, dado que no ha presentado problemas de hipertensión. Sea un hipertenso dado que no es fumador empedernido. Solución: Sean los eventos: H: Evento de que el individuo sea hipertenso. N: Evento de que el individuo sea no hipertenso. E: Evento de que el individuo sea fumador empedernido. F: Evento de que el individuo sea un no fumador. M: Evento de que el individuo sea un fumador moderado. a) H/E P (H/E) = P (H∩E) = 30/180 = 30 P (E) 49/180 49 b) F/N P (F/N) = P (F∩N) = 48/180 = 48 P (N) 93/180 93 c) H/E’ P (H/E’) = P (H∩E’) = P (H) – P (H∩E) = 87/180 – 30/180 = 57 P (E’) 1 – P (E) 1 - 49/180 131 3. La probabilidad de que un vuelo de programación regular despegue a tiempo es P (D) = 0.83; la de que llegue a tiempo es P(A) = 0.82 y la que despegue y llegue a tiempo es P (D∩A) = 0.78. Encuentre la probabilidad de que un avión: a) Llegue a tiempo dado que despego a tiempo. b) Despegue a tiempo dado que llego a tiempo. c) No despegue a tiempo dado que no llego a tiempo. Solución: A: Evento de que el avión llegue a tiempo, P(A) D: Evento de que el avión despegue a tiempo, P(D) P (A) = 0.82 P (D) = 0.83 P (D∩A) = 0.78 92 ESTADÍSTICA Y PROBABILIDADES I a) {A/D} P (A/D) = P (A∩D) = 0.78 = 78 P (D) 0.83 83 b) {D/A} P (D/A) = P (D∩A) = 0.78 = 78 P (A) 0.82 82 c) {D’/A’} P (D’/A’)= P (D’∩A’) = P (DUA)’ = 1 – (P (DUA) P (A’) P (A’) 1 - P (A) = 1 – [P (D) + P (A) - (A∩D)] = 1 – [0.83 + 0.82 - 0.78] 1 – P (A) 1 – 0.82 = 1 – [0.87] = 0.13 = 13 0.18 0.18 18 4. La probabilidad de que a un automóvil al que se le llena el tanque de gasolina necesite también un cambio de aceite es de 0.25, la de que requiera un Nuevo filtro de aceite es de 0.40 y de que haga falta tanto un cambio de aceite como un Nuevo filtro es de 0.14 a) b) Si debe cambiar el aceite ¿Cual es la probabilidad de que necesite un nuevo filtro? Si necesita un filtro nuevo ¿Cuál es la probabilidad de que requiera un cambio de aceite? Solución: Sean los eventos según enunciado del problema A: e. cambio de aceite ; P(A) = 0.25 B: e. filtro nuevo ; P(F) = 0.40 A ∩ F : e. Cambio de aceite y filtro nueve ; P( A ∩ B ) = 0.14 a) Evento de que requiere filtro nuevo que cambia aceite: {F / A} P( A ∩ F ) 0.14 14 P (F / A) = = = P ( A) 0.25 25 b) Evento cambio de aceite dadoque requiere filtro nuevo: {A / F } P( A ∩ F ) 0.14 7 P( A / F ) = = = P (F ) 0.40 20 5. La probabilidad de que un vehículo que llega a Arequipa tenga placas de Lima es de 0.14, de que sea para acampar, de 0.30 y la probabilidad de que además tenga placas de Lima, de 0.10 ¿Cuál es la probabilidad de que : a) Un vehículo para acampar en Arequipa tenga placas de Lima? b) Un vehículo con placas de Lima que llega a Arequipa sea para acampar? 93 ESTADÍSTICA Y PROBABILIDADES I c) Un vehículo que llega a Arequipa no sea para acampar o no tenga placas de Lima? Solución: Sean los eventos según enunciado del problema L : e. tenga placa de Lima A : e. de acampar en Arequipa L ∩ A : e. tenga placa de Lima y acampe en Arequipa P(L ∩ A) = 0.10 a) b) c) 6. ; P( L) = 0.14 ; P ( A) = 0.30 : Tenga placa de Lima dado que va acampar: {L / A} P(L ∩ A) 0.10 1 P (L / A) = = = P ( A) 0.30 30 Acampe en Arequipa dado que tiene placa de Lima: {A / L} P(L ∩ A) 0.10 5 P( A / L ) = = = P (L ) 0.14 7 El vehículo no acampa, ó no tiene placa de Lima: A'∪ L' P( A'∪ L') = P(L ∩ A)' = 1 − P(L ∩ A) = 1 − 0.10 = 0.90 En el último año de la escuela, en un grupo de 100 alumnos se encontró que 42 cursaron matemática, 68 psicología, 54 historia, 22 matemática e historia, 25 matemática y psicología, 7 historia pero no matemática ni psicología, 10 las tres materias y 8 ninguna de las tres. Si se selecciona un estudiante aleatoriamente, encuentre la probabilidad de que: Una persona inscrita en psicología haya estudiado las tres materias. b) Una persona que no se inscribió en psicología haya tomado historia y matemática. c) Una persona que no se inscribió en historia haya tomado matemática y psicología. S 100 Solución: 42 a) Sean los eventos según el enunciado del problema M: e. de que la persona estudie matemática P: e. de que la persona estudie psicología H: e. de que la persona estudie historia 94 M 22 H P 25 68 10 7 54 8 ESTADÍSTICA Y PROBABILIDADES I a) b) {M ∩ P ∩ H / P}; P(M ∩ P ∩ H / P ) = P(M ∩ P ∩ H ) = 10 / 100 = 10 P (P ) 68 / 100 68 {H ∩ M / P'}; P(H ∩ M / P') = P(H ∩ M ∩ P') P (P ') P ( H ∩ M ) − P ( H ∩ M ∩ P ') = 1 − P (P ) 22 / 100 − 10 / 100 1 − 68 / 100 12 = 32 P ( M ∩ P ∩ H ') M ∩P → P M ∩P = H' H' P ( H ') P( M ∩ P)′ P( M ∩ P ∩ H ) 15 = = 1 − P( H ) 46 = c) { } ( ) PROBABILIDAD DE MULTIPLICACIÓN DE EVENTOS Como habíamos presentado en el esquema luego de la probabilidad condicional se prosigue con la multiplicación de eventos como indicamos seguidamente P ( A ∩ B ) = P (B )P ( A / B ). P( A ∩ B ) ο' ⇒ P( A / B ) = P (B ) P (B ∩ A) = P ( A)P (B / A) Por la conmutatividad de eventos: A ∩ B = B ∩ A ⇒ P( A ∩ B ) = P(B ∩ A) DEFINICIÓN.- Si en un experimento pueden ocurrir los eventos A y B entonces P( A ∩ B ) = P(B )P( A / B ) Esta definición podemos extenderla a k eventos: A1,A2,…,Ak P ( A1 ∩ A2 ∩ ... ∩ AK ) = P( A1 )P( A2 / A1 )P( A3 / A1 ∩ A2 )...P( AK / A1 ∩ ... ∩ AK −1 ) 95 ESTADÍSTICA Y PROBABILIDADES I EJERCICIOS DE APLICACIÓN 1. El supervisor de un grupo de 20 técnicos pide la opinión de dos de ellos (seleccionados al azar) sobre las nuevas disposiciones de seguridad en la construcción. Si doce están a favor de las nuevas disposiciones y los ocho restantes están en contra, ¿cuál es la probabilidad de que ambos trabajadores elegidos por el supervisor estén en contra de las nuevas disposiciones? Solución: Sean los eventos de acuerdo al enunciado del problema A: e. de que el primer técnico esté en contra de las nuevas disposiciones. B: e. de que el segundo técnico esté en contra de las nuevas disposiciones. 12 a favor Opiniones 20 8 en contra A ∩ B : e. los dos contra 8 7 P ( A ∩ B ) = P ( A) P ( B / A) = × 20 9 8 P ( A) = Probabilidad del primer técnico en contra 20 7 P (B / A) = Probabilidad de que el segundo esté en contra dado que 19 el primero lo estuvo. 2. La probabilidad de que una persona que visita a su dentista requiera de una placa de rayos X es 0.6; la de que una persona a la que se le toma una placa de rayos X también tenga un tapón, de 0.3 y la que una persona que se toma una placa de rayos X y que tiene un tapón, tenga también un diente extraído, de 0.1 ¿cuál s la probabilidad de que a una persona que visita a su dentista se le tome una placa radiográfica, presente un tapón y se le haya extraído un cliente? Solución Sean los eventos de acuerdo al enunciado. X: e. de que una persona tenga placa de rayos x T: e. de que la persona tenga tapón D: e. de que la persona tenga diente extraído Probabilidades según condiciones P( X ) = 0.6, P(T / X ) = 0.3, P(D / X ∩ T ) = 0.1 96 ESTADÍSTICA Y PROBABILIDADES I Probabilidad conjunta de ocurrencia de los tres eventos P( X ∩ T ∩ D ) = P( X )P(T / X )P(D / X ∩ T ) = 0.6 × 0.3 × 0.1 = 0.018 3. Suponga que un impulso eléctrico debe pasar del punto I al II para producir una señal. Para llegar al punto II debe pasar por dos componentes electrónicos E1 y E2. La trayectoria del impulso se interrumpe si falla cualquiera de los componentes. La probabilidad de que el componente E1 no falle es de 0.7 y la probabilidad de que el componente E2 no falle es de 0.8. Además, la probabilidad de que al menos uno no falle es de 0.94 ¿cuál es la probabilidad de que la señal se produzca? Solución Sean los eventos según el enunciado E1: e. de que no falle; P(E1)=0.7 E2: e. de que no falle; P(E2)=0.8 E1 ∪ E2: e. de que alumnos uno no falle; P(E1 ∪ E 2 ) = 0.94 P(E1 ∪ E 2 ) = P(E1 ) + P(E 2 ) − P(E1 ∩ E 2 ) 0.94 = 0.7 × 0.8 − P(E1 ∩ E 2 ) P(E1 ∩ E 2 ) = 0.7 + 0.8 − 0.94 = 0.56 4. Supóngase que se tiene una caja de fusibles que contiene 20 piezas de las cuales 5estan defectuosos. Si se seleccionan 2 al azar y se sacan de la caja en sucesión sin reemplazo del primero. ¿Cuál es la probabilidad de que ambas fusibles resulten defectuosos? Solución: 1ero Sin reposición 2do 97 ESTADÍSTICA Y PROBABILIDADES I D1: evento de que el primer fusible sea defectuoso. D2: evento de que el segundo fusible sea defectuoso. Dependencia de Eventos: P ( D1 ∩ D 2 ) = P ( D1 ) P ( D 2 / D1 ) = 5. 5 4 1 = * 20 19 19 Encuentre la probabilidad de que se seleccionen aleatoriamente, en sucesión, 4 litros de leche en condiciones de tomarse de un congelador que tiene 20 litros, de los cuales 5 se han echado a perder. Solución: o Total de litros en el congelador: 20 o Litros de leche malograda: 5 o Litros de leche consumible: 20 – 5 = 15 Eventos de extracción aleatoria de litros de leche en buenas condiciones: A1: Evento de extraer el 1er litro A2: Evento de extraer el 2do litro A3: Evento de extraer el 3er litro A4: Evento de extraer el 4to litro a) Probabilidad de ocurrencia de extracción de los 4 litros de leche extraídos uno a uno: P ( A1 ∩ A2 ∩ A3 ∩ A4 ) = P ( A1 ) P ( A2 / A1 ) P ( A3 / A1 ∩ A2 ) P ( A4 / A1 ∩ A2 ∩ A3 ) 15 14 13 12 91 × × × = 20 19 18 17 323 El teorema de la multiplicación de eventos podemos extenderlo a n eventos A | , luego la i i = 1,........, n probabilidad de ocurrencia de estos eventos es: P ( A1 ∩ A 2 ∩ .......... .. ∩ A n ) > 0 el cual se define por: P ( A1 ∩ A 2 ∩ .... ∩ A n ) = P ( A1 ) P ( A 2 / A1 )..... ... P ( A n / A1 ∩ A 2 ∩ .... ∩ A n −1 ) 98 ESTADÍSTICA Y PROBABILIDADES I b) Utilizando el análisis combinatorio y la definición clásica de probabilidad: • Posibilidades de elección de cuatro litros de leche en condiciones de tomarse entre 20 litros en donde existen 5 en 20 20! C mal estado : 4 = 4! 16! • Si 5 están en mal estado, buenos habrán 20 - 5 = 15 posibilidades de elegir 4 en condiciones de 15 ! 15 tomarse. C14 = 4! 11! C415 91 • P (tomar los 4 litros de leche) = 20 C4 323 99 ESTADÍSTICA Y PROBABILIDADES I 100 ESTADÍSTICA Y PROBABILIDADES I Semana 8 PROBABILIDAD DE INDEPENDENCIA DE EVENTOS Como habíamos ya presentado en el esquema; en general dos eventos Ay B son independientes cuando uno no depende del otro por ejemplo P( A / B) = P( A) o P(B / A) = P(B ) , en consecuencia podemos formular P( A ∩ B ) = P(B )P( A / B ) = P(B )P( A) o' P(B ∩ A) = P( A) P( B / A) = P ( A) P ( B ) DEFINICIÓN.- dos eventos A y B son independientes si y solo si P( A ∩ B ) = P( A)P(B ) utilizando la probabilidad de multiplicación de K eventos, podemos obtener la probabilidad para k eventos independientes. P( A1 ∩ A2 ∩ ... ∩ AK ) = P( A1 ) P( A2 )...P( AK ) EJERCICIOS DE APLICACIÓN 1. Un pueblo tiene dos carros de bomberos que operan independientemente. La probabilidad de que un vehículo específico esté disponible cuando se necesite es de 0.96. a) ¿Cuál es la probabilidad de que ninguno esté disponible en caso necesario? b) ¿Cuál la de que alguno lo esté cuando se le necesite? Solución: Sean los eventos según enunciado del problema A1: e. de que el carro 1 esté disponible; P(A1)=0.96 A1: e. de que el carro 2 esté disponible; P(A2)=0.96 A1 y A2 eventos independientes, luego P(A1 ∩ A2)=P(A1) P(A2) a) {A'1 ∩ A' 2 }; P( A'1 ∩ A' 2 ) = P( A1 ∪ A2 )' = 1 − P( A1 ∪ A2 ) = 1 − [P( A1 ) + P( A2 ) − P( A1 ∩ A2 )] = 1 - [0.96 + 0.96 - 0.96 × 0.96] = 0.0016 101 ESTADÍSTICA Y PROBABILIDADES I {A1 ∪ A2 }; P( A1 ∪ A2 ) = P( A1 ) + P( A2 ) − P( A1 ∩ A2 ) = 0.63 + 0.96 - 0.96 × 0.96 = 0.9984 b) 2. La probabilidad de fallar cada una de las 4 piezas de un aparato electrónico es de 0.001. Si el aparato funciona por lo menos con tres piezas de las piezas indicadas, hallar la probabilidad de que este no funcione si cada pieza se desarrolla en forma independiente. Solución: Sean los eventos A1, A2, A3, A4, que representan las piezas electrónicas elegidas al azar e independientes. • Las piezas {Ai }i =1,...4 : eventos de que falle P( Ai ) = 0.001 Evento de que no falle P( A'i ) = 0.999 • • E: e. de que el aparato funcione por lo menos con 3 piezas E ' : e. de que el aparato no funcione E ∪ E ' = S , P ( E ') = 1 − P ( E ) E = A'1 A'2 A'3 A'4 ∪A1A'2 A'3 A'4 ∪A'1 A2 A'3 A'4 ∪A'1 A'2 A3A'4 ∪A'1 A'2 A'3 A4 M N O P Q P(E ) = P(M ) + P( N ) + P(O) + P(P ) + P(Q) = 0.9994 + 0.9993 × 0.001× 4 P( E ' ) = 1 − 0.000005992003 = 0.000006 3. Supóngase que en los circuitos de la figura a) y b) la probabilidad de que cada uno de los interruptores automáticos estén cerrados es p y que todos los interruptores automáticos funcionan independientemente. ¿cuál es la probabilidad de que pase corriente I a O? 102 ESTADÍSTICA Y PROBABILIDADES I Solución: a) Según el circuito podemos b) Según el circuito podemos definir 5 eventos Ai por donde definir 6 eventos Ai por donde pasa corriente I a O pasa corriente de I a O 4. {( A4 ∩ A5 ) ∪ A3 ∪ ( A1 ∩ A2 )} P{( A4 ∩ A5 ) ∪ A3 ∪ ( A1 ∩ A2 } (( A1 ∩ A2 ) ∪ A3 ) ∪ (( A5 ∩ A6 ) ∪ A4 ) P(( A1 ∩ A2 ) ∪ A3 ) ∪ (( A5 ∩ A6 ) ∪ A4 = P + 2P 2 − 2P 3 − P 4 + P 5 = P + 3P 2 − 4 P 3 − P 4 + 3P 5 − P 6 Tres equipos de radar que trabajan de manera independiente están disponibles para detectar cualquier avión que vuele sobre cierta área. Cada equipo tiene una probabilidad de 0.02 de no detectar un avión que vuele en el área, si un avión entra por casualidad al área a) b) ¿Cuál es la probabilidad de que no sea detectado? ¿Cuál es la probabilidad de que sea detectado por los tres equipos de radar? Solución: Sean los tres equipos de radar constituidos por los eventos A1, A2, A3: e. que detectan a cualquier avión independientemente P(A1)= P(A2)= P(A3)= 0.02, probabilidad de no detectar a) b) Probabilidad conjunta: P(A1 A2 A3)=(0.02)3 de no detectar. Probabilidad de detectar: P(A’1 A’2 A’3)=(0.98)3 TEOREMA DE LA PROBABILIDAD TOTAL Sean A1 , A2 ,.........., An una partición del espacio muestral S tal que la probabilidad de Ai sea mayor que cero si la P( Ai ) > 0 entonces para n cualquier evento B en S se tiene que: P(B ) = ∑ P( Ai )P(B / Ai ) i =1 103 ESTADÍSTICA Y PROBABILIDADES I DEMOSTRACIÓN: P(Ai) → A1 A2 ………… Ai ……………An B P(B/Ai) → B = ( A1 ∩ B ) ∪ ( A2 ∩ B ) ∪ .........( An ∩ B ) P(B ) = P( A1 ∩ B ) + P( A2 ∩ B ) + ........ + ( An ∩ B ) = P( A1 )P(B / A1 ) + P( A2 )P(B / A2 ) + .................... + P( An )P(B / An ) n P(B ) = ∑ P( Ai )P(B / Ai ) i =1 EJEMPLO DE APLICACIÓN: Supongamos que una planta de ensamblado recibe reguladores de voltaje de 3 diferentes proveedores: 60% del proveedor A1, 30% del proveedor A2, 10% del proveedor A3. Si el 95% de los reguladores de voltaje que provienen de A1, 80% de los reguladores de voltaje que provienen de A2, 65% de los reguladores de voltaje que provienen de A3 tienen un rendimiento de acuerdo a las especificaciones nos agradaría saber la probabilidad de que cualquier regulador recibido por la planta dé un rendimiento según las especificaciones: Solución: P(Ai) → A1 A2 A3 0.60 0.30 0.10 B P(B/Ai) → 0.95 Sean los eventos: 0.80 104 0.65 ESTADÍSTICA Y PROBABILIDADES I A1: Evento de que el regulador provenga del proveedor 1 A2: Evento de que el regulador provenga del proveedor 2 A3: Evento de que el regulador provenga del proveedor 3 B: Evento de que el regulador recibido cumpla especificaciones con las 3 P(B ) = ∑ P( Ai )P(B / Ai ) i =1 = P( A1 )P(B / A1 ) + P( A2 )P(B / A 2 ) + P( A3 )P(B / A3 ) = 0.60 × 0.95 + 0.30 × 0.80 + 0.10 × 0.65 P(B ) = 0.875 TEOREMA DE BAYES Si A1, A2, ……. …….. An son eventos mutuamente excluyentes de los cuales uno debe ocurrir entonces: P( Ai / B ) = P( Ai ∩ B ) P( Ai )P(B / Ai ) = ; i = 1,2,....., n P (B ) ∑ P( Ai )P(B / Ai ) EJERCICIOS DE APLICACIÓN Usando el ejemplo anterior podemos responder a la siguiente inquietud. Si deseamos saber la probabilidad de que un regulador de voltaje específico cuyo rendimiento corresponde a las especificaciones este provenga del proveedor A3, A2, A1 Solución: P( A3 / B ) = P( A3 )P(B / A3 ) 0.10 × 0.65 = = 0.0743 P (B ) 0.875 P( A2 / B ) = P( A2 )P(B / A2 ) 0.30 × 0.80 = = 0.2743 P (B ) 0.875 P( A1 / B ) = P( A1 )P(B / A1 ) 0.60 × 0.95 = = 0.6514 P(B ) 0.875 ¿Cuál de ellos elegiría como proveedor? ¿Y cuál no? 105 ESTADÍSTICA Y PROBABILIDADES I 1. La policía planea reforzar el respeto a los limites de velocidad mediante la utilización de sistema de radar en 4 diferentes sitios de la cuidad. Los sistemas de radar en cada sitio L1, L2, L3, y L4 se ponen a funcionar respectivamente el 40%, 30%, 20% y 30% del tiempo, y si una persona que conduce a gran velocidad rumbo a su trabajo tiene, respectivamente, las probabilidades de 0.2, 0.1, 0.5 y 0.2 de pasar por alguno de estos sitios, ¿Cuál es la probabilidad de que le levanten una multa? • Si una persona que va a gran velocidad rumbo a su trabajo, ¿Cuál es la probabilidad de que pasa por el radar en L2? Solución: L1 0.40 P(Li) L2 0.30 L3 0.20 L4 0.30 M 0.2 P(M/Li) 0.1 0.5 0.2 Li: Evento de que el vehículo pase por el radar Li. M: Evento de que le apliquen una multa. P (M) = ∑ P(Li) P(M/Li) = P(L1) P(M/L1) + P(L2) P(M/L2) + P(L3) P (M/L3) + P(L4) P(M/L4) = 0.40 * 0.20 + 0.30 * 0.10 + 0.20 * 0.50 + 0.3 * 0.2 = 0.27 2. Si en el ejercicio 1 la persona recibe una infracción por conducir a gran velocidad rumbo a su trabajo. ¿Cuál es la probabilidad de que haya pasado el radar que se localiza en el sitio L2? Solución: = = 106 = = 0.11 ESTADÍSTICA Y PROBABILIDADES I 3. En una cierta región del país se sabe que por experiencia pasada que la probabilidad de seleccionar a un adulto mayor de 40 años de edad con cáncer es de 0.02. Si la probabilidad de que un medico le diagnostique correctamente a una persona con cáncer que tiene la enfermedad es de 0.75 y la de que se equivoque de 0.06. ¿Cuál es la probabilidad de que una persona se le diagnóstica cáncer? Solución: C: Evento de que una persona tenga cáncer. C’: Evento de que una persona no tenga cáncer. D: Evento del diagnostico. P(C) = 0.02, P(C’) = 0.98 P(D) = P(C) P(D/C) + P(C’) P(D/C’) = 0.02 * 0.78 + 0.98 *0.06 = 0.0156 + 0.0588 = 0.0744 4. En referencia del ejercicio 3 ¿Cuál es la probabilidad de que a una persona a la que se le diagnostica cáncer, verdaderamente tenga la enfermedad? Solución: P(C) = P(C) P(D/C) = 0.02 * 0.78 = 0.2097 P(D) 0.0744 P(C’/D) = P(C’) P(D/C) = 0.98 * 0.06 = 0.7903 P(D) 0.0744 107 ESTADÍSTICA Y PROBABILIDADES I EJERCICIOS PROPUESTOS I. ESPACIOS MUÉSTRALES Y EVENTOS 1. ¿Cuál es el espacio muestral de los siguientes experimentos aleatorios? a) Lanzar un par de dados distinguibles y observar, los números resultantes. b) Lanzar un par de dados no distinguibles y observar, los números resultantes. c) Se fabrica un tubo de rayos catódicos y se somete a una prueba de duración hasta que se presenta una falla. Enseguida se registra el tiempo (en horas) de buen funcionamiento. d) Dos soldaduras de amarre sobre una tablilla de circuito impreso se inspeccionan electrónicamente y visualmente y cada una de ellas se cataloga como buena (G) o defectuosa (D) si quiere soldarse o desecharse. e) Se prueban diodos de un lote, de uno en uno, y se marcan como defectuosos y no defectuosos. Esto prosigue hasta encontrar dos artículos defectuosos o haber probado cinco artículos. f) Los pacientes que llegan a una clínica pueden seleccionar una de las tres secciones donde se les atenderá. Supongamos que los médicos se asignan al azar a las secciones y que los pacientes no tienen preferencia especial por ninguna de las secciones. Tres pacientes a las clínica y se registra la sección que elijan. 2. Supongamos que en un estudio efectuado con 900 profesionales, 25 años después de su graduación, se descubre lo siguiente: 300 de ellos tuvieron éxito profesional, 300 estudiaron teoría de probabilidades en su carrera y 100 tuvieron éxito y estudiaron teoría de probabilidades en la carrera. Encuentre para k=0, 1, 2 el número de personas del grupo que hayan hecho estas dos cosas: a) Exactamente k b) Por lo menos k c) No más de k 3. En una ciudad se publican tres periódicos: A, B, C. Supongamos que 60% de las familias de la cuidad están suscritas al periódico A; 40% al periódico B; 30% al periódico C. Supóngase también que 20% de las familias están suscritas a los periódicos A y B; 10% al A y C; 20% al B y C; y 5% a los tres periódicos A, B y C ¿Qué porcentaje de las familias de la ciudad están suscritas a uno de estos tres periódicos? 108 ESTADÍSTICA Y PROBABILIDADES I 4. Un agente visita tres clientes para tratar de venderles un artículo. Sean A, B y C los siguientes eventos: A:”el primer cliente compro el articulo” B:”el segundo cliente compro el articulo” C:”el tercer cliente compro el articulo” Indicar el evento: “Al menos dos clientes compraron” 5. Considere el siguiente ensayo. Se realizan tres exámenes de admisión al ITESM. Si A es el evento “se aprobó el primer examen realizado”, B es el evento “el segundo examen revisado resulto aprobado”, y C es el evento “el tercer examen revisado resulto aprobado”, represente el evento “Solo un examen fue aprobado” en términos de los eventos A, B y C. 6. Sea A, B y C los eventos. Represente en términos de A, B y C los siguientes eventos: a) Ocurre solo A b) Ocurre solo A y B c) Ocurren los tres eventos d) Por lo menos ocurre un evento 7. Sean A, B y C tres sucesos arbitrarios. Encontrar las expresiones para los sucesos consistentes en que entre A, B y C. a) Se ha producido solamente A b) Se ha producido A y B, en tanto C no se ha producido c) Se han producido los tres sucesos. d) Se han producido al menos uno de los sucesos. e) No se ha producido ninguno de los sucesos. 8. Encontrar expresiones simples de: a) ( A ∪ B ) ∩ ( A ∪ B C ) b) ( A ∪ B ) ∩ ( AC ∪ B ) ∩ ( A ∪ B C ) c) ( A ∪ B ) ∩ ( B ∪ C ) 9. Demostrar que los eventos A y B son iguales si: a) A ∪ C = B ∪ C y A ∩ C = B ∩ C b) A ∪ C = B ∪ C y A ∪ C C = B ∪ C C 109 ESTADÍSTICA Y PROBABILIDADES I 10. Sean A, B, C y D los eventos y sea X = ( A ∩ B ) ∪ ( AC ∩ C ) , Y = ( AC ∩ B ) ∪ ( A ∩ D ) C Z = ⎡( A ∪ B) ∩ C ⎤ ∪ ( A ∩ B ∩ D) . ⎣ ⎦ Demostrar que para cualquier evento D. a) A ∩ X = A ∩ B b) A ∪ Y = A ∪ B c) ( A ∩ B ) ∪ Z = ( A ∪ B ) ∩ (B ∪ C ) II. PROBABILIDAD CLÁSICA 1. Se ha cargado un dado para que las probabilidades de obtener 1, 2, 3, 4, 5 y 6 sean de 1/3, 1/4, 1/6, 1/12, 1/12 y 1/12, respectivamente. Suponga que las propiedades usuales de la probabilidad son validas todavía en esta situación, donde los sucesos no tienen la misma probabilidad. Busque la probabilidad de obtener: a) Un número par. b) Un número menor que cinco. c) Un numero par o menor que cinco. 2. Se lanza una moneda cuatro veces. Encuéntrese la probabilidad de que: a) Jamás obtener cara. b) Obtener al menos una cruz. c) Obtener tres caras. 3. Un monedero contiene tres monedas de 5 centavos, una de 10, una de 25 y una de medio dólar. Si se sacan al azar 3 monedas del monedero. ¿Cuál es la probabilidad de que su valor sea: a) 15 centavos? b) 40 centavos? c) Un dólar? d) Mas de 50 centavos? 4. Si se lanzan juntos 3 dados, ¿Cuál es la probabilidad de que el total sea: a) 18? b) 16? c) Mayor que cuatro? 110 ESTADÍSTICA Y PROBABILIDADES I 5. Se lanza una moneda y un dado. Supóngase que una cara de la moneda tiene un numero 1 y la otra un 2. Elaborar una lista de los resultados posibles del experimento. ¿Cuál es la probabilidad de que caiga: a) Un total de cuatro? b) Un total par? c) Un total impar? 6. Suponga lo siguiente: la probabilidad de que un habitante de la ciudad de México sea mayor de 40 años o tenga calvicie es de 0.4. Si la probabilidad de que sea mayor de 40 años es de 0.5 y la probabilidad de que tenga calvicie es 0.3 ¿Cuál es la probabilidad de que sea mayor de 40 años y calvo? 7. Las probabilidades de que una compañía de grúas responda a 0, 1, 2, 3, 4, 5, 6, o menos de 7 llamadas de urgencia de conductores durante una tormenta son: 0.03, 0.10, 0.17, 0.25, 0.19, 0.13, 0.09, y 0.04. ¿Cuáles son las probabilidades que durante una tormenta una compañía de grúas responda a: a) Cuando mucho cinco llamadas? b) Cuando menos tres llamadas? c) De dos a cuatro llamadas? 8. Un paquete de seis focos tiene dos piezas defectuosas. Si se seleccionan tres focos para su uso, calcular la probabilidad de que ninguno tenga defectos. 9. Un ingeniero de una fábrica de microcircuitos inspeccionará un lote de obleas de silicio para tratar de encontrarles defectos. Suponer que hay 4 circuitos integrados defectuosos en un recipiente que contiene 20 obleas: Para esa inspección se seleccionan 2 obleas al azar. Calcular la probabilidad de que: a) Ninguna de ellas tenga defectos. b) Por lo menos una de las dos no tenga defectos. 10.- La probabilidad de que un inspector de una fabrica de tejidos clasifique un suéter como imperfecto, de segunda calidad o tercera calidad es 0.04, 0.02 o 0.01, respectivamente. ¿Cual es la probabilidad de que un suéter reciba una u otra de estas 3 clasificaciones? 111 ESTADÍSTICA Y PROBABILIDADES I 11. Las probabilidades de que un estudiante obtenga una A, una B o una C en un curso de contabilidad son de 0.08, 014 y 0.045 respectivamente ¿Cuál es la probabilidad de que el estudiante reciba una clasificación mas baja que C ? (A>B>C) 12. Un criador de animales mete un novillo y un caballo a un concurso en la feria del estado, El cree que las probabilidades de que gane una banda con su novillo, con su caballo o con ambos son 0.25, 0.19 y 0.16 ¿Cuáles son las probabilidades de que gane: a) Con el novillo o con el caballo? b) Ni con el novillo ni con el caballo? c) Con el novillo pero no con el caballo? 13. La probabilidad de que un hombre siga vivo dentro de 25 años es de 3/5 y la de que su esposa los esté es de 2/3. Hallar la probabilidad de que en ese momento: a) Ambos estén vivos. b) Solo el hombre viva. c) Solo viva la esposa. d) Al menos uno este vivo. 14.- Supóngase que la probabilidad de que el sistema de control utilizado en una nave espacial no funcione en un vuelo concreto e de 0.001: Asimismo, supóngase que la nave también tiene instalado un segundo sistema de control idéntico, pero completamente independiente del primero, que toma el control cuando el primero falla. Determine la probabilidad de que en un vuelo concreto la nave espacial este bajo control, ya sea por el sistema original o por el sistema duplicado. 15. Cierto tipo de motor eléctrico falla por obstrucción de cojinetes por combustión del embobinado o por desgaste de las escobillas. Suponga que la probabilidad de la obstrucción es doble que la de la combustión, la cual es 4 veces más probable que la inutilización de la escobilla ¿cual es la probabilidad de que la falla sea por cada uno de estos mecanismos? 16. Suponga que se tienen 2 eventos A y B tal que P( A) = 2 5 , P( B ) = 2 5 y P( A∪ B ) = 1 2 obtener P( A∩ B ) 112 ESTADÍSTICA Y PROBABILIDADES I 17. En el colegio Madrid, los cursos de ingles e historia son obligatorios. En el primer intento 30 % de estudiantes reprueba ingles, 20 % reprueba historia y el 8% reprueba ambas asignaturas. Encuentre: a) La probabilidad de que un estudiante repruebe uno o el otro. b) La probabilidad de que un estudiante repruebe ingles dado que ya ha reprobado historia. 18. Con base en experiencias pasadas, un corredor de bolsa considera que bajo las condiciones económicas actuales un cliente invertirá con una probabilidad de 0.6 en bonos libre de impuestos, en fondos mutualistas con una probabilidad de 0.3 y en ambos instrumentos con una probabilidad de 0.15. En ese momento, encuentra la probabilidad de que el cliente invierta: a) Ya sea en bonos libre de impuestos o en fondos mutualistas. b) En ninguno de los dos instrumentos. 19. La probabilidad de que el señor Jiménez invierta en acciones comunes A es de 0.20, en acciones comunes B es de 0.30, y en ambas de 0.10 ¿cual es la probabilidad de que no invierta ni en A ni en B? 20. Suponga que una bolsa contiene 10 esferas marcadas con los números 1, 2, 3,……, 10. Sea E el evento de extraer una esfera marcada con un numero par y F el evento de extraer una esfera marcada con un numero 5 o mayor, ¿son E y F mutuamente excluyentes? Calcule P( EUF) 21. Tenemos como datos las probabilidades de los eventos A y A∩B. Calcular P A∩ B C ( ) 22. Sean A y B dos eventos. Demuestre que: P AC ∩ BC = 1 − P( A) − P( B ) + P( A∩ B ) ( ) 23. Demostrar que para los eventos A y B cualesquiera P( A ∩ B ) − P( A)P( B) = P (A C )P( B) − P(A C ∩ B ) = P( A) P( B C ) − P(A ∩ B C ) 24. Demostrar que P( A∩ B ) ≤ P( A) ≤ P( A∪ B ) ≤ P( A) + P( B ) 113 ESTADÍSTICA Y PROBABILIDADES I 25. Demostrar que para cualquiera de los eventos A y B: P( A∩ B ) ≥ P( A) + P( B ) − 1 La probabilidad de que suceda exactamente uno de los eventos es: P( A) + P( B ) − 2 P( A∩ B ) III. PROBABILIDAD CONDICIONAL Y EVENTOS INDEPENDIENTES 1. Supóngase que A y B son 2 eventos independientes asociados con un experimento. Si la probabilidad de que A o B ocurra es igual a 0.6, mientras que la probabilidad de que A ocurra es igual a 0.4, determine la probabilidad de que B ocurra. 2. Supóngase que A y B son 2 eventos tales que P(A) = 1/3, P(B) =1/5 y P(A/B) + P(B/A) = 2/3. Calcular P AC ∪ BC ( ) 3. Se sabe que P(A) = 1/3, P(A/B) = 1/3, P(B/A) = 1/3. Determinar cuales de las siguientes afirmaciones son verdaderas: a) A y B son independientes b) A ⊂ B c) A y B son mutuamente excluyentes d) P AC BC = 2 3 ( ) 4. Dados P( A) = 0.4 , P( B A) = 0.3 , P BC ( AC ) = 0.2 a) P AC ( ) b) P B ( AC ) c) P( B ) d) P( A∩ B ) e) P( A B ) 5. La probabilidad de que una compañía emplee una nueva estrategia de mercado es de 0.54, la probabilidad de que al nueva estrategia de mercado sea adoptada y que las ventas crezcan a los niveles proyectados es de 0.39 ¿Cuál es la probabilidad de que si la nueva compañía emplea la nueva estrategia de ventas y que las venta crezcan a los niveles proyectados? 114 ESTADÍSTICA Y PROBABILIDADES I 6. Ocho boletos con los números 111, 121, 122, 122, 211, 212, 212, 221 están dentro de un sombrero, revuelto. Si se va a seleccionar uno al azar, muéstrese que los eventos A: “El primer digito del boleto seleccionado será 1”; B: “El segundo digito del boleto seleccionado será 12”; C: “El tercer digito del boleto seleccionado será 1”, no son independientes por parejas aun cuando: P( A∩ B ∩C ) = P( A) P( B ) P( C ) 7. Demuéstrese que si A y B son eventos independientes, entonces: a) A y B C b) AC y B c) AC y B C Son eventos independientes 8. Consideremos una muestra de tamaño tres, extraída de la siguiente manera. Se empieza con una urna que contiene cinco bolas de color blanco y siete de color rojo. En cada ensayo se extrae una bola y se anota su color. La bola extraída se devuelve a la urna junto con una bola adicional del mismo color. Encuentre la probabilidad de que entre los colores anotados, la muestra tenga: a) Cero bolas de color blanco b) Una bola de color blanco c) Tres bolas de color blanco 9. Dado un experimento, Ω = {W 1, W 2, W 3, W 4, W 5} ; cuyo espacio con muestra es: P(W1)=1/8, P(W2)=P(W3)=P(W4)=3/16 y P(W5)=5/16. Consideramos los eventos A1={ W1, W2, W3}, A2 = { W1, W2, W4}y A3 = { W1, W3, W4}. Demostrar que los eventos A1, A2 y A3 satisfacen la igualdad P( A1∩A2∩A3) = P( A1) P( A2) P( A3) , pero no son independientes. 10. Considere el diagrama de un sistema electrónico que muestra las probabilidades de que los componentes del sistema operen de, modo apropiado, ¿Cuál es la probabilidad de que el sistema opere si el ensamble III, y al menos uno de los componentes en los ensambles I y II deben operar para que funcione el ensamble? Suponga que los componentes de cada ensamble operan independientemente que la operación de cada ensamble también es independiente. 115 ESTADÍSTICA Y PROBABILIDADES I 0.8 0.8 0.9 0.99 0.9 0.9 I II III 11. Tres estudiantes A, B y C están inscritos en la misma clase. Supóngase que A asiste a clase 30% de las veces, B 5% y C 80%. Si estos estudiantes asisten a clase independientemente uno del otro, ¿Cuál es la probabilidad de que: a) Al menos uno de ellos este en clase un día concreto? b) Exactamente uno de ellos este en clase un día concreto? 12. Considere el segmento de un circuito eléctrico con tres relevadores. La corriente pasa de (a) a (b) si por lo menos hay una trayectoria cerrada cuando los relevadores se cierran. Sin embargo, los relevadores podrían no trabajar bien. Suponer que cierran en forma correcta solo con una probabilidad de 0.9 cuando se acciona el interruptor, y que trabajan en forma independiente uno del otro. Sea A el evento que denota que la corriente pasa de (a) a (b) cuando los relevadores se cierran. a) Calcular P(A) b) Calcular la probabilidad de que el relevador 1 cierre en forma correcta, dado que se sabe que la corriente pasa de (a) a (b). 1 2 a b 3 116 ESTADÍSTICA Y PROBABILIDADES I 13. De las personas que llegan a un aeropuerto pequeño, 60% vuela en aerolíneas grandes, 30% en aeroplanos privados y 10% en aeroplanos comerciales que no pertenecen a una aerolínea. De las personas que llegan por las aerolíneas principales, 50% viajan por negocios mientras que esta cifra es de 60% para los que llegan en aeroplanos privados y de 90% para, los que llegan en otros aviones comerciales. Para una persona que se seleccione al azar de entre un grupo de llegadas, calcular la probabilidad de que: a) La persona este en viaje de negocios b) La persona este en viaje de negocios y llegue en un aeroplano privado c) La persona este en viaje de negocios y se sabe que llego en un aeroplano comercial d) La persona ha llegado en un aeroplano privado, dado que viaja por negocios 14. La probabilidad de que un hombre casado vea un cierto programa de televisión es de 0.4 y la de que una mujer del mismo estado civil lo haga es de 0.5.- La probabilidad de que un hombre ve el programa dado que su esposa lo hace es de 0.7. Encuentre la probabilidad de que: a) Una pareja de casados vea el programa. b) Una esposa vea el programa dado que su esposo lo hace. c) Al menos una persona de un matrimonio vea el programa. 15. Para parejas de casados que viven en cierta ciudad de los suburbios, la probabilidad de que el esposo vote en alguna elección es de 0.21; la de que la esposa lo haga, de 0.28 y la de que ambos voten, de 0.15. ¿Cuál es la probabilidad de que: a) Al menos un miembro de la pareja de casados vote? b) Vote una esposa, dado que su esposo lo hace? c) Vote un esposo, dado que su esposa no lo hace? 16. La probabilidad de que una persona que visita a su dentista requiera de una placa de rayos X es de 0.6; la de que una persona a la que se le toma una placa de rayos X también tenga un tapón, de 0.3 y la de que una persona se toma una placa de rayos X y que tiene un tapón, tenga también un diente extraído, de 0.1 ¿Cuál es la probabilidad de que a una persona que visita a su dentista se le tome una placa de rayos X, presente un tapón y se le haya extraído un diente? 117 ESTADÍSTICA Y PROBABILIDADES I 17. En cierta ciudad, 40% de los votantes son conservadores y 60% liberales; 70% de los conservadores y 80% de los liberales están a favor de una emisión particular de bonos. Al seleccionar al azar un votante de la ciudad ¿Cuál es la probabilidad de que esté a favor de la emisión de bonos? 18. Una persona posee dos automóviles, un modelo compacto y uno estándar. Usa el vehículo compacto para trasladarse a su trabajo las tres cuartas partes del tiempo, el tiempo restante usa el carro mas grande. Cuando emplea el auto compacto llega a su casa a las 17:30 el 75% de las veces; si utiliza el auto de tamaño estándar llega a la misma hora el 60% de las veces. Si llega a su casa después de las 17:30 ¿Cuál es la probabilidad de que haya usado el auto compacto? 19. Un examen contiene ocho preguntas del tipo verdadero – falso, en el que se requiere responder un mínimo de seis preguntas para aprobar. a) En el supuesto de que se este adivinando para contestar cada una, ¿Cuál es la probabilidad de aprobar el examen? b) En el supuesto de que se conozca la respuesta a la primera pregunta y que, en consecuencia, solo se debe adivinar de la segunda a la séptima, y en el supuesto también de que la primera respuesta estuvo correcta, ¿Cuál es la probabilidad de aprobar el examen? c) Si se conoce las respuestas de las dos primeras preguntas, ¿Cuál es la probabilidad de aprobar el examen? 20. Considere el ensamble serie – paralelo que se muestra abajo. Los valores Ri (i = 1, 2, 3, 4, 5) son las confiabilidades de los cinco componentes indicados, esto es Ri = probabilidades de que la unidad i funciones de manera adecuada. Los componentes operan (y fallan) de manera mutuamente independiente y el ensamble falla solo, cuando se rompe la trayectoria de A a B. Exprese la confiabilidad del ensamble como una función R1, R2, R3, R4 y R5. R2 R5 a R1 R4 b R3 118 D ESTADÍSTICA Y PROBABILIDADES I 21. Un elevador tiene dos sistemas de freno que se activan automáticamente en caso de una rotura de cable principal. La probabilidad de que cada uno de ellos frene el elevador después de una rotura es de 0.99. a) ¿Cuál es la probabilidad de que el elevador se frene? b) ¿Cuál es la probabilidad de que el elevador se frene, si en caso de que falle el primer sistema, siempre funciona el otro? 22.- En un circuito eléctrico sucede una interrupción si falla el elemento K o los elementos K1 y K2 que trabajan de forma independiente. Si se sabe que K, K1 y K2 tiene una probabilidad de fallar de 0.3, 0.2 y 0.2 respectivamente, calculen la probabilidad de que ocurra una interrupción en el circuito. 23. Se construye un sistema electrónico complejo con determinado número de componentes de respaldo en sus subsistemas. Un subsistema tiene cuatro componentes idénticos, cada uno de los cuales tiene una probabilidad de 0.2 de fallar en menos de 1000 horas. El subsistema trabaja si dos o más de las cuatro componentes trabajan. Si se supone que los componentes trabajan en forma independiente, calcular la probabilidad de que: a) Dos de los cuatro componentes duren más de 1000 horas. b) El subsistema trabaje más de mil horas 24. De los muchos automóviles que se guardan en el estacionamiento de empleados de un edificio de oficinas, 75% solo transporta a un empleado y el resto transporta a dos o mas empleados, 60% de los automóviles son modelos anteriores a 1984 y el resto son de 1984 o de dos años mas recientes. De los automóviles de modelos anteriores a 1984, dos tercios solo transportan a un empleado y el resto a dos o más empleados. Si se selecciona un automóvil al azar de todos los que están en el estacionamiento, ¿Cuáles son las probabilidad de que estos automóviles: a) Sea un modelo anterior a 1984 que transporta a un solo empleado? b) No transporta a dos o mas empleados ni sea un modelo anterior a 1984? c) Transporta a dos o más empleados o sea un modelo anterior a 1984? 119 ESTADÍSTICA Y PROBABILIDADES I d) Transporta a dos o más empleados dado que no se trata de un modelo anterior a 1984? Antes de 1984 Después de 1984 Total Transporta a un empleado Transporta a dos o mas empleados 0.4 0.35 0.75 0.25 0.05 0.25 Total 0.60 0.40 25. Si A, B, C y D dicen la verdad una de cada tres veces (de manera independiente), y A afirma que B niega que C declara que D es un mentiroso. ¿Cuál es la probabilidad que D haya dicho la verdad? IV. PROBABILIDAD TOTAL Y TEOREMA DE BAYES 1. Considere dos urnas, uno con tres pelotas de color rojo y siete de color blanco, la otra con seis pelotas de color rojo y seis de color blanco. Si se elige una urna al azar y después se saca una pelota ¿Cual es la probabilidad de que sea color rojo? 2. Fernando López conoce una nueva chica en la mitad de las fiestas a las que asiste. Tres cuartas partes de las veces que conoce a una nueva joven, se divierte, pero la probabilidad de que se divierta cuando no conoce una nueva chica es solamente de 0.10. Fernando López acaba de decir que se esta divirtiendo ¿Cuál es la probabilidad de que haya conocido una nueva joven? 3. Se tiene 2 monedas, ambas cargadas, la primera tiene la probabilidad 0.3 de caer cara, la segunda 0.6. Un jugador elige al azar una de las monedas y la lanza dos veces obteniendo dos caras. ¿Cuál es la probabilidad de que obtenga una tercera cara? 4. A una rata se le permite seleccionar al azar uno de cinco laberintos diferentes. Si las probabilidades de que pase por cada uno de los diferentes laberintos en tres minutos son de 0.6, 0.3, 0,1 y 0.1, respectivamente y la rata escapa en tres minutos. a) ¿Cuál es la probabilidad de que haya escogido el primer laberinto? b) ¿Cuál es la probabilidad de que haya escogido el segundo laberinto? 120 ESTADÍSTICA Y PROBABILIDADES I 5. Un estudiante presenta un examen de selección múltiple en el cual cada pregunta tiene cinco posibles respuestas, de las cuales una es correcta. Suponga que el estudiante conoce la respuesta de 70% de las preguntas. a) ¿Cuál es la probabilidad de que el estudiante, sobre una pregunta dada, conteste la respuesta correcta? b) si el estudiante contesta correctamente la pregunta, ¿Cuál es la probabilidad de que el estudiante conozca la respuesta? 6. Se supone que una cierta maquina detecta el cáncer con probabilidad de 0.8, entre gente que padece de cáncer, y no detecta el 20% restante. Si una persona no padece cáncer, la prueba indicara este hecho 90% de las veces e indicara que tiene cáncer 10% de ellas. Supondremos que 5% de las personas de la población de prueba padecen cáncer y la prueba de una persona determinada, seleccionada al azar, indica que tiene cáncer. ¿Cuál es la probabilidad de que efectivamente padezca dicha enfermedad? 7. En una fabrica hay dos maquinas A y B, que realizan 60 y 40% de población total, respectivamente. De su producción, la maquina produce 3% de material defectuoso y la B 5%. Encontrar probabilidad de que dado un material defectuoso, provenga de maquina B. la A la la 8. Se supone que 0.95 es la probabilidad de que un jurado seleccionado para juzgar un caso criminal emita el veredicto adecuado. Esto significa que si se presenta a juicio un individuo culpable, la probabilidad de que el jurado lo condene es de 0.95, además, recíprocamente, si el individuo juzgado es inocente, la probabilidad de que el jurado lo absuelva es de 0.95. Se supone también que el cuerpo de la policía local realiza su labor a conciencia, de manera que 99% de las personas que se presentan en la corte para ser juzgadas son verdaderamente culpables. Se pide calcular la probabilidad de que el acusado sea inocente, si el jurado lo encuentra inocente. 9. Suponer que la ciencia medica ha desarrollado una prueba para el diagnostico del SIDA que tiene 95% de exactitud, tanto en los que padecen SIDA como entre los que no padecen. Si 0.005 de la población realmente tiene SIDA, calcular la probabilidad de que determinado individuo tenga SIDA si la prueba indica que lo tiene. 121 ESTADÍSTICA Y PROBABILIDADES I 10. Cierto artículo es manufacturado por tres fábricas, designadas estas como 1, 2 y 3. Se sabe que la primera produce el doble de artículos que la segunda y que esta y la tercera producen el mismo numero de artículos. Se sabe también que 2% de los artículos producidos por las dos primeras es defectuoso mientras que 4% de los manufacturados por la tercera es defectuoso. Se colocan juntos los artículos producidos en una fila y se elige uno al azar. a) ¿Cuál es la probabilidad de que este articulo sea defectuoso? b) Supongamos que el depósito se elige un artículo y que es defectuoso. ¿Cuál es la probabilidad de que se produjo en la primera fabrica? 11. Tres maquinas tragamonedas se arreglan de modo que, en general, paguen al jugador una de cada 10 veces y que el jugador pierda nueve de cada 10 veces. Sin embargo, una de las maquinas esta descompuesta y paga al jugador tres de cada 10 veces, pero no se sabe cual es la maquina descompuesta. Si usted elige una maquina, juega una vez y gana ¿Cuál es la probabilidad de que haya seleccionado la maquina descompuesta? 12. Un armador de ventiladores eléctricos usa motores de dos vendedores. La compañía A le surte 90% de los motores, y la compañía B, el 10% restante, supongamos que se sabe que 5% de los motores que suministra la compañía A son defectuosos y que el 3% de los que suministra la compañía B también los son. Se encuentra que un ventilador ya armado tiene un motor defectuoso ¿Cual es la probabilidad de que ese motor lo haya suministrado la compañía B? 13. Se dice que una prueba de diagnostico para determinar enfermedad tiene 90% de exactitud y que, si una persona tiene la enfermedad, la prueba la detecta con la probabilidad de 0.9. También, si una persona no tiene la enfermedad, el resultado del diagnostico será que no la tiene, con una probabilidad de 0.9. Solo 1% de la población tiene la enfermedad en cuestión. Si selecciona una persona al azar de entre la población, y la prueba de diagnostico asegura que tiene la enfermedad, ¿Cuál es la probabilidad condicional de que la tenga en realidad? ¿Le sorprende la respuesta? ¿Diría que esta prueba de diagnostico es confiable? 122 ESTADÍSTICA Y PROBABILIDADES I 14. Se dispone de dos métodos, el A y el B, para enseñar determinada destreza en manufactura. El índice de reprobados es de 20% para el método A y 10% para el B. Sin embargo, el método B es mas caro y, por lo tanto, solo se usa 30% del tiempo, y el A el 70% restante. A un trabajador se le capacita con uno de los métodos, pero no puede aprender en forma correcta, ¿Cuál es la probabilidad de que se la haya capacitado con el método A? 15. A y B participan en un duelo A. Cuya probabilidad de acertar es de 0.2 si dispara primero; el segundo disparo (de haberlo) puede hacerlo cualquiera de ellos con igual probabilidad, y por ultimo puede haber un tercer disparo que hará B si es que aun esta ileso. B tiene una probabilidad de acertar de 0.3. ¿Cuál es la probabilidad de que:? a) b) c) d) B mate a A. Ambos salgan ilesos? A salga ileso sabiendo que hubo tres disparos? A haya disparado dos veces sabiendo que salio ileso? 123 ESTADÍSTICA Y PROBABILIDADES I 124 ESTADÍSTICA Y PROBABILIDADES I Semana 11 VARIABLES ALEATORIAS SECUENCIA NATURAL DE PROBLEMAS EN VARIABLES ALEATORIA Experimento aleatorio Espacio muestral Rango Probabilidad [0,1] IR S Exp. Aleat. w X P X (W) = x 0 IRX 1 0 ≤ P (X (W) = x ) ≤ 1 IR X ⊆ IR Ρ0 X (P 0 X ) (w) = P (X (w) = x ) = p (X = x) ∈ 0;1 La estadística se ocupa de realizar inferencias a cerca de poblaciones y sus características. Se realizan experimentos cuyos resultados se encuentran sujetos al azar, como por ejemplo en control de calidad de artículos los cuales pueden ser defectuosos o no defectuosos, éstos constituyen un espacio muestral S, de modo que a cada punto del espacio muestral se le asignará mediante la función X un valor numérico los cuales se encuentran en su rango Rx, luego se tiene la necesidad de representar todas las probabilidades de una variable aleatoria X mediante una fórmula. La variable X genera una función de distribución y puede ser discreta o continua. Consideramos las distribuciones frecuentes y usuales en experimentos aleatorios. 125 ESTADÍSTICA Y PROBABILIDADES I 9 V.A. Discreta: Binomial, Poisson. Hipergeomètricas; etc P (x) X X 0 9 V.A. Continua: Normal, “t” student, “F” Fisher, X2 Ji – cuadrado, etc Aproximación: Binomial ≅ Poisson ≅ Normal 126 ESTADÍSTICA Y PROBABILIDADES I • Como observamos las gráficas nos dan una idea de la forma y característica de las funciones de probabilidad a estudiar, ocurriendo también algo interesante como es el de aproximar una variable discreta a una variable continua. Definición.- La variable aleatoria X es una función de variable real, con dominio igual a S y rango IRx asigna uno y solamente un elemento del dominio a su rango. • Como indicaremos las funciones de probabilidad de variables aleatorias discretas o continuas deben cumplir con determinadas condiciones, se caracterizan por tener una función de distribución acumulada, el poder calcular el valor esperado o lo que con mayor frecuencia ocurre y la varianza o variabilidad de la variable aleatoria X en un experimento. Para los diferentes cálculos usamos la sumatoria en el caso discreto y en el caso continuo integrales. Variable Aleatoria Continua 9 f(x): Función de densidad de Variable Aleatoria Discreta 9 P (x): Función de Probabilidad ó de cuantía. probabilidad 9 Condición: 9 Condiciones: 1.- f (x) ≥ 0 1.- P (x) ≥ 0 2.- ∞ ∞ ∑ P (x ) −∞ i 2.- =1 ∫ f(x) d (x) =1 −∞ 3.- P ( a < x < b ) = 3.- P (X = x) ∈[0,1] b = ∫ f ( x ) d (x) ∈ [0 ; 1] a 9 Función de Distribución 9 Función de Distribución Acumulada F (x) = P (X ≤ x) = x ∑ P (x i ) F(x) = P(X ≤ x) = xi ≤ x ∫ f(x) dx −∞ 127 ESTADÍSTICA Y PROBABILIDADES I 9 Esperanza Matemática o 9 Esperanza Matemática o Valor Esperado (es lo que con valor Esperado mayor frecuencia se espera ∞ E (X) = ∫ xf (x)d(x) = μ que ocurra y es un número -∞ real) ∞ E (X) = ∑ x i p (x i ) = μ -∞ 9 Varianza de una V. A. D. x 9 Varianza de una V.A.C. x ∞ ∞ E(X − μ) = ∫ (x − μ) f (x)dx = σ 2 2 E (X - μ ) 2 = ∑ (xi − μ ) P(xi ) = σ 2 2 2 −∞ -8 Propiedad para el Cálculo de la Varianza σ 2 : Para ambos casos de variable aleatoria tiene la misma propiedad. E (X - μ ) = Ex 2 - μ 2 = σ 2 2 Demostración: ( E (X - μ ) 2 = E x 2 - 2xμ + μ 2 ) 2 = EX - 2 μ EX { + Eμ 2 = EX 2 - 2 μμ + μ 2 ∴ E (X - μ ) = EX 2 - μ 2 2 Lqqd! VARIABLE ALEATORIA DISCRETA La función de Probabilidad o de cuantía la notamos por f(x) ó p(x). La variable aleatoria toma valores enteros en los reales y la suma de los valores de la función de probabilidad o de cuantía es igual a 1. EJERCICIOS DE APLICACIÓN 1. Sea X variable aleatoria que da el número de caras menos el número de sellos en tres lanzamientos de una moneda. Determine los elementos del espacio muestral, así mismo los valores de la variable aleatoria. 128 ESTADÍSTICA Y PROBABILIDADES I Calcular su función de cuantía o de probabilidad, su distribución acumulada y calcular su media y varianza. Solución: X: nc - ns • ; nc: numero de caras , ns: numero de sellos Determinación del espacio muestral: Primera Moneda Segunda Moneda Tercera Moneda S CCC C C CCS S C C S CSS S Exp. Aleatoria X SCC C C S CSC SCS S C S SSC SSS S 21 22 X (ccc) = 3 - 0 = 3 X (ccs) = X (csc) = X (scc) = 2 - 1 = 1 X (css) = X (scs) = X (ssc) = 1 - 2 = -1 X (sss) = 0 – 3 = -3 • Rango de la Variable Aleatoria X: Rx = {-3, -1 , 1 , 3} 129 23 ESTADÍSTICA Y PROBABILIDADES I • Distribución de probabilidades de X: X (w i ) = x i x1 -3 P(x(xi) = xi P(x)) • 1 8 P(x1) x2 -1 x3 1 x4 3 3 8 P(x2) 3 8 P(x3) 1 8 P(x4) ¿Cumple con las condiciones de una función de cuantía? ⎛1 3 3 1 ⎞ 1. P(x i ) ≥ 0 ⇒ ⎜ , , , > 0 ⎟ ⎝8 8 8 8 ⎠ 2. 1 3 1 3 8 ∑ P( x ) = 8 + 8 + 8 + 8 = 8 = 1 // Si no cumple con esta propiedad. i Quiere decir que no es de cuantía 3. P( x = −3) = • 1 3 3 1 ; ; ; ∈ [ 0 :1] 8 8 8 8 Grafica de la función de cuantía: P (xi ) f (x) 3/8 n →∞ 1/8 ‐3 ‐2 ‐1 1 2 3 x 130 x ESTADÍSTICA Y PROBABILIDADES I • Determinación de la distribución acumulada ⎧ 0 ⎪1 ⎪ 8 ⎪⎪ F (x) ⎨ 4 8 ⎪ ⎪7 8 ⎪ ⎩⎪ 1 • : x < -3 : -3 ≤ x < 1 : -1 ≤ x < 1 : 1 ≤ x < 3 : x ≥ 3 Calculo de la media y la varianza Xi P(xi) xiP(xi) xi2 P (xi) -3 1/8 (-3)(1/8) = -3/8 (-3)2 1/8 -1 3/8 (-1)(3/8 = -3/8 (-1)23/8 1 378 (1) (3/8) = 3/8 (1)2 3/8 3 1/8 (3) (1/8) = 3/8 (3)2 1/8 ∑x 131 i P (x i ) = 0 ∑x 2 i P(x i ) = 24/8 ESTADÍSTICA Y PROBABILIDADES I μ= ∞ ⎛1⎞ 4 ⎛3⎞ ⎛3⎞ ⎛1⎞ ∑ x P(x ) = ∑ x P(x ) = (- 3) ⎜⎝ 8 ⎟⎠ + (- 1) ⎜⎝ 8 ⎟⎠ + (1) ⎜⎝ 8 ⎟⎠ + (3) ⎜⎝ 8 ⎟⎠ = 0 -∞ i i I =1 i i σ 2 = EX 2 - μ 2 = EX i2 P(x i ) - μ 2 ∴σ 2 = 3 = (-3)2 (1/8) + (-1)2 (3/8) + (1) 2 (3/8) + (3) 2 (1/8) = • 2. 9 3 3 9 24 + + + = 8 8 8 8 8 Desviación Estándar o Típica: σ = σ2 σ = 3 Determine el valor c de tal forma que la siguiente función sirva como una distribución de probabilidad de la variable aleatoria discreta x. f (x) = c (x2 + 4) : x = 0, 1, 2, 3 Solución: Usamos las condiciones de una función de cuantía 1. 2. P(x) = f(x) ≥ 0 ⇒ c(x 2 + 4) ≥ 0 ⇒ C ≥ 0 ∑ P(x ) 1 [( 2 ) ( ) ( 2 ) ( 2 )] 2 = 1 ⇒ c x i `+ 4 + x 2 + 4 + x 3 + 4 + x 4 + 4 = 1 0 = c[4 + 5 + 8 + 13] = 1 c (30) = 1 ∴c = 1 30 132 1 2 3 ESTADÍSTICA Y PROBABILIDADES I ( 1 2 0 +4 30 1 2 x = 1 : ¨f(1) = 1 + 4 30 1 2 2 +x4 x = 2 : f (2) = 30 1 2 x = 3 : f(3) = 3 + 4 30 x = 0 : f(0) = ( 3. • • )= ) ( ) ( ) 4 30 5 = 30 8 = 30 13 = 20 Determinación de la distribución de probabilidad xi 0 1 2 3 f(xi) 4 30 5 30 8 30 13 30 Calcular la media y la varianza xi f(xi) xif(xi) x12f(xi) 0 4/30 0 0 1 5/30 5/30 5/30 2 8/30 16/30 32/30 3 13/30 39/30 117/30 ∑ f(x ) = 1 ∑ xif(xi) = 60/30 i ∴ μ = ∑ xi f(xi) = ∴σ2 = 3. {(xi , fi )} ∑x 2 i ∑x 2 i f(x i ) = 154/30 60 = 2 30 f(x i ) - μ 2 = 154 34 - 22 = 30 30 Encuentre la distribución de probabilidad para el número de discos de jazz cuando 4 discos se seleccionan al azar de una colección que contiene de 5 discos de jazz, 2 de música clásica y 3 de polka 133 ESTADÍSTICA Y PROBABILIDADES I a) Exprese el resultado por medio de una formula b) Determine su distribución acumulada F(x) y graficarla c) Calcular su media y varianza Solución: • x: V.A. discos de jazz • valores de la V. A: x = 0, 1, 2, 3, 4 • Determinación de la función de cuantía X : V.A. discos de jazz a) ¿Cómo elegir al zar? 5 jazz 10 4 2 clasic 3 polkas ⎛10 ⎞ Total de maneras de elegir ⎜⎜ ⎟⎟ ⎝ 4⎠ ⎛5 ⎞ ⎛ 5 ⎜⎜ ⎟⎟ ⎜⎜ x 4-x f (x) = ⎝ ⎠ ⎝ ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎝4 ⎠ . Maneras de elegir los disco de jazz ⎛5 ⎞ cuando lo son ⎜⎜ ⎟⎟ ⎝ x⎠ . Maneras de elegir los discos de jazz ⎛ 5 ⎞ ⎟⎟ cuando no lo son ⎜⎜ ⎝4 − x⎠ ⎞ ⎟⎟ ⎠ : x = 0 , 1, 2, 3, 4 ⎛5⎞ ⎛ 5 ⎞ 5! 5! ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ x 0 4 − 0⎠ 1 0! x (5 - 0)! 4! x(5 - 4)! f (0) = ⎝ ⎠ ⎝ = = 0.0238 = 10! 42 ⎛10 ⎞ ⎜⎜ ⎟⎟ 4! x(10 - 4)! ⎝ 4⎠ ⎛5⎞ ⎛ 5 ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ 1 ⎠ ⎝ 4 − 1⎠ f(1) = ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎝ 4⎠ 5! 5! x 1! x (5 - 1)! 3! x(5 - 3)! 10 = = 0.2381 = 10! 42 4! x(10 - 4)! 134 ESTADÍSTICA Y PROBABILIDADES I ⎛5⎞ ⎛ 5 ⎞ ⎜ ⎟ ⎜ ⎟ 2⎠ ⎝ 4 - 2 ⎠ ⎝ = f(2) = ⎛10 ⎞ ⎜ ⎟ ⎝4 ⎠ 5! 5! x 2!x(5 - 2)! 2!x(5 -2)! 10! 4! x(10 − 4)! = 0.42762 = 20 42 ⎛ 5⎞ ⎛ 5 ⎞ 5! 5! ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ x 3 4 − 3⎠ 10 3! x(5 - 3)! 1! x(5 - 1)! f(3) = ⎝ ⎠ ⎝ = = 0.2381 = 10! 42 ⎛10 ⎞ ⎜⎜ ⎟⎟ 4! x(10 - 4)! ⎝ 4⎠ ⎛5⎞ ⎛ 5 ⎞ 5! 5! ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ x 4 4 − 4 ⎠ 4! x(5 - 4) 0! x(5 - 0)! f(4) = ⎝ ⎠ ⎝ = 10! ⎛10 ⎞ ⎜⎜ ⎟⎟ 4! x(10 - 4)! ⎝ 4⎠ b) c) 1 42 x < 0 ⎧ 0 ⎪1 ⎪ 42 ⎪ ⎪⎪1142 F (x) = ⎨ ⎪3142 ⎪ ⎪41 ⎪ 42 ⎪⎩ 1 μ = E (X) = = 0.0238 = 0 ≤ x< 1 1≤ x < 2 2 ≤ x < 3 3≤ x < 4 x ≥ 4 4 ∑xi f(xi) = (0) 142 + (1)1042 + (2)2042 + (3)1042 + (4) 142 = 2 i=0 μ = 2 se espera tener en el experimento 2 discos de jazz. σ 2 = EX2 - μ 2 = 4 ∑ x f(x ) - μ 2 1 i 2 = (0)2 1 1- 0 42 + (1)2 .10 + (4)2 1 + (2)2 20 42 + (3) 2 10 42 - (2)2 14 -4 3 2 = indicaque la dispercionde discoses pequeña 3 = σ2 42 42 135 ESTADÍSTICA Y PROBABILIDADES I 4. Un ingeniero de la planta manufacturera tiene 5 hombres y 3 mujeres trabajando con él. El ingeniero desea seleccionar 4 trabajadores para un trabajo especial deseando no tener influencia en la selección de los trabajadores. El decide al azar 4 trabajadores. Sea X el número de hombres en el grupo: Hallar la tabla de distribución de Probabilidad de X, así mismo calcular la media o el valor esperado. Solución: • X: V.A. hombres seleccionados • Valores que toma la V.A.X. 5H • Exp. Aleat. 8 Selecc. de trab. Selección 4Trab. hombres • ⎛5 ⎞ Elección de 4 hombres ⎜⎜ ⎟⎟ ⎝ x⎠ ⎛ 3 ⎞ ⎟⎟ Elección de mujeres ⎜⎜ − 4 x ⎝ ⎠ 3M ⎛8 ⎞ Elección total ⎜⎜ ⎟⎟ ⎝ 4⎠ ⎛5 ⎞ ⎛ 3 ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟ x ⎠ ⎝ 4 - x ⎟⎠ ⎝ ; x = 1, 2, 3, 4 Función de Probabilidad: f (x) = ⎛8 ⎞ ⎜⎜ ⎟⎟ ⎝ 4⎠ • Distribución de probabilidad: xi f (x i ) μ σ 1 2 1/14 6/14 4 x 2 x = EX = ∑ x i f(x i ) = 1 * i =1 = E (X 2 ) 3 4 6/14 1/14 1 6 6 1 35 + 2 * + 3* + 4 * = 14 14 14 14 14 ⎛ 35 ⎞ - μ = ∑ X f (x i ) - ⎜ ⎟ ⎝ 14 ⎠ 2 x 2 i 136 2 95 ⎛ 35 ⎞ = -⎜ ⎟ 14 ⎝ 14 ⎠ 2 = 105 196 ESTADÍSTICA Y PROBABILIDADES I • En el ejemplo siguiente la esperanza matemática o valor esperado se puede aplicar no solamente a la V.A.X, si no también a una función aleatoria g(x) definimos luego la media y la varianza μ g ( x) = E (g (x)); σ 2g ( x) = E (g (x)2 ) - μg2 (x) 5. Sea X una variable aleatoria con la siguiente distribución de probabilidad: xi -3 6 9 f (x i ) 1/6 3/6 2/6 Determine ⎧⎪g(xi ) = (2xi + 1)2 2 2 μ y , dondeg(x) = (2x + 1) = ⎨ g(x) σ g ( x)) ⎪⎩g(xi) = 4x i2 + 4xi + 1 Solución: 2 3 1 6 3 6 μ g(x) = ∑g (xi ) f(xi ) = ∑(2xi +1) f(xi ) = (2 (-3)+1)2 + (2 (6)+1)2 + (2 (9)+1)2 i =1 3 2 = 209 6 3 μ g(x) = ∑ (4 xi2 + 4x i + 1) f(x i ) = 209 i =1 μ g(x) μ g(x) [ ] [ ] [ ] 1 3 2 2 = 4(- 3) + 4 (-3) + 1 * + + 4(6) 2 + 4(6) + 1 * + 4(9) 2 + 4(9) + 1 * 6 6 6 = 25 3 2 25 507 722 1254 + 169 * + 361 * = + + = = 209 6 6 6 6 6 6 6 2 2 = ∑ (2xi + 1)4 f(xi) - (209) 2 = 14144 σ 2g ( x) = E (g (x)) - μ g(x) 137 ESTADÍSTICA Y PROBABILIDADES I VALOR ESPERADO O ESPERANZA MATEMÁTICA EX = μ E( X − μ)2 = σ 2 E ( aΧ + b) = aEΧ + b = aμ + b V ( aΧ − b) = a 2V ( x ) = a 2σ 2 V ( aΧ + b) = E [( aΧ + b) − aΧ − b]2 = a 2V ( x ) = a 2σ 2 EJEMPLOS DE APLICACIÓN SOBRE ESPERANZA MATEMÁTICA 1. Una gran empresa industrial compra varias computadoras nuevas cada año, cuya cantidad depende de la frecuencia de reparaciones en el año anterior. Suponga que el número de computadoras X que se compran cada año tiene la siguiente distribución de probabilidad. xi f (x i ) 0 1 1 10 3 2 3 10 4 10 2 10 Si el costo del modelo que se desea adquirir permanece sin cambio en $1200 durante un año y se ofrece un descuento de 50X2 de cualquier compra ¿Cuánto dinero espera esta firma invertir en computadoras para el fin de año? Solución: Inversión Esperada = Precio de Venta esperada – Descuento esperado Precio de venta esperada ( ⎛ 3 ⎞ = 1200 ⎜ ∑ xi f(x i ) ⎟ = 1200 0 x 1 + 1 x 3 + 2x 4 + 3 x 2 10 10 10 10 i 0 = ⎝ ⎠ = 17 • 1200 = 2040 10 138 ) ESTADÍSTICA Y PROBABILIDADES I Descuento esperado: 3 = ∑ ( 50x 2i ) f (x i ) = 50 i= 0 (0 2 + 12 x 3 + 22 x 4 + 32 x 2 x 1 10 10 10 10 = 185 Inversión esperada = 2030 – 185 = $ 1855 Rta: Inversión esperada = $ 1855 2. Supongamos que un distribuidor de joyas antiguas esta interesado en comprar un collar de oro para el cual las probabilidades son 0.22, 0.36. 0.28 y 0.14 respectivamente, de que la poseedora estaría dispuesta a vender la en $ 250, en $ 150, al costo o con una perdida de $ 150. ¿Cuál es la utilidad queda espera? Solución: La utilidad esperada seria = P venta – P costo P = precio E (X) = ∑x i f (x i ). xi 250 150 0 f (x i ) 0.22 0.36 0.28 Pventa Pcost - P perdida; -150 0.14 Ppérdida E(X) = (250) * 0.22 + (150) * 0.36 + (0) * 0.28 + (-150) * 0.14 = $ 88 139 ) ESTADÍSTICA Y PROBABILIDADES I 140 ESTADÍSTICA Y PROBABILIDADES I Semana 12 VARIABLE ALEATORIA CONTINUA f(x): función de función densidad de probabilidad (fddp) EJERCICIO DE APLICACIÓN 1. Considere la función de densidad, el área bajo la curva que describe es igual a 1 y generalmente es asintótica al eje x. ⎧⎪k x ; 0 < x < 1 f ( x) : ⎨ ; en cualquier otro caso ⎪⎩0 a) Evalué k b) Encuentre F(x) y utilice para evaluar P (0.3 < Χ < 0.6) c) Calcular la media y varianza Solución: a) Usamos las propiedades 1. f ( x) ≥ 0 ⇒ f ( x) = k x ≥ 0 ⇒ k ≥ 0 1 2. 0 1 ∞ ∫0 f ( x)dx = −∫∞dx + ∫0 k x dx + ∫ 0dx = 1 1 ⎞ ⎟ =1 ⎟ ⎠ο ⎛ x3/ 2 ∫0 k xdx = 1 ⇒ k ⎜⎜ 3 / 2 ⎝ 1 1 ⎛2⎞ k ⎜ ⎟(1) = 1 ⎝3⎠ ⎛3⎞ k =⎜ ⎟ ⎝2⎠ 141 ESTADÍSTICA Y PROBABILIDADES I ⎧(3 / 2) x ∴f(x)= ⎨ , 0 < x < 1; en otro caso ⎩0 b 3. P(a < x < b)= b) ∫a f ( x)dx ∈ [0,1] Determinación de la función de distribución F(x). Usemos la definición x F(x)= ∫ f ( x)dx −∞ 3 x = ∫ x dx 2 −∞ x 3⎞ ⎛ 3⎜ x 2 ⎟ = x3/ 2 = ⎜ ⎟ 2 ⎜ 3/ 2 ⎟ ⎠ο ⎝ ⎧0 ⎪ F ( x) = ⎨ x 3 / 2 ⎪1 ⎩ ; x≤ 0 ; 0<x<1 ; x≥1 Observemos que es creciente y se puede graficar fácilmente xi F ( xi ) = xi3/ 2 0.2 F(0.2)= 0.0894 0.4 F(0.4)= 0.2530 0.8 F(0.8) = 0.7155 142 ESTADÍSTICA Y PROBABILIDADES I • Usemos la definición F(x)=P(x ≤ x) 0.6 P(0.3 < x < 0.6)= ∫ f ( x)dx 0.3 0.6 ⎛ x3/ 2 ⎞ 3/ 2 3/ 2 ∫0.3 3 / 2 xdx = 3 / 2⎜⎜ 3 / 2 ⎟⎟ = (0.6) − (0.3) ⎠0.3 ⎝ 0.6 • =F(0.6) - F(0.3) = 0.3004 Utilizando la función de distribución F(x) directamente el resultado es el mismo. P(0.3 <x < 0.6) = F(0.6) – F(0.3) = (0.6) 3/ 2 - (0.3) 3/ 2 = 0.4647 – 0.1643 = 0.3004 c) Calculo de la media y varianza Calculo de la media μ ∞ μ = EX = ∫ xf ( x)dx −∞ 0 = 1 ∞ 0 1 ∫ x(0)dx + ∫ x * 3 / 2 x + ∫ x0dx −∞ 1 = 3 / 2 ∫ x x dx 0 1 = 3 / 2∫ x 3/ 2 dx 0 1 ⎛ x5/ 2 ⎞ = 3/ 2⎜ ⎟ ⎝ 5 / 2 ⎠0 μ = E(X) = μ = 3 5/ 2 1 3 ( x )0 = (15 / 2 − 05 / 2 ) 5 5 3 5/ 2 ( 1 − 05 / 2 ) 5 μ = EX = 3/5 143 ESTADÍSTICA Y PROBABILIDADES I Calculo de la Varianza σ 2 = 2 2 1 σ2 ) ( Ex − μ = ∫ x 2 3 / 2 x 3 / 2 dx − (3 / 5) 2 0 1 3 1 5/ 2 3 ⎛ x 7 / 2 ⎞ ⎛ 3 ⎞2 2 ⎟ −⎜ ⎟ = ∫ x dx − (3 / 5) = ⎜ 20 2⎜ 7/2 ⎟ ⎝5⎠ ⎝ ⎠0 2 = 3 ⎛3⎞ 12 −⎜ ⎟ = 7 ⎝5⎠ 7 * 25 σ= 12 175 FUNCIÓN DE DENSIDAD DE PROBABILIDAD UNIFORME f(x) 1 ;a ≤ x ≤ b b−a f(x)= 0; en otro caso x 0 a) Determinar su función de distribución F(x). b) Calcular su media y varianza. Solución: x a) x F ( x) = 1 1 1 ∫a b − a dx = b − a ∫a dx = b − a x F ( x) = x−a b−a x a 0; x < a F(x)= x−a ;a ≤ x ≤ b b−a F ( x) = 1; x > b 144 x a − b−a b−a ESTADÍSTICA Y PROBABILIDADES I F(x) x 0 • Calculo de la media: b 1 μ = EX = ∫ xf ( x ) dx ⎛ 1 ⎞ ⎟ dx ⎝b−a⎠ μ = ∫ x⎜ a 0 b b 1 1 ⎛ x2 ⎞ 1 1 ⎜⎜ ⎟⎟ = * xdx b2 − a2 = = ∫ b−a a b − a ⎝ 2 ⎠a 2 b − a • ( ) μ= a+b 2 Calculo de la varianza: σ 2 = EX 2 − μ 2 b 3 x 1 ⎛ 1 ⎞ 2 * = ∫x ⎜ ⎟ dx − μ = b−a 3 ⎝b−a⎠ a 2 b a 2 ⎛a+b⎞ −⎜ ⎟ = ⎝ 2 ⎠ ( ) = ( 1 ⎛ b3 − a 3 ⎞ ⎛ a + b ⎞ b − a ) a 2 + ab + b 2 ⎛ a + b ⎞ ⎟−⎜ ⎜ −⎜ ⎟ = ⎟ (b − a ) 3 b − a ⎜⎝ 3 ⎟⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ = 4 a 2 + ab + b 2 − 3 a 2 + 2ab + b 2 4 a 2 + 4 ab + 4b 2 − 3a 2 − 6 ab − 3b 2 = 12 12 2 ( ) ( a 2 − 2ab + b 2 ( b − a ) = = 12 12 ) 2 145 2 ESTADÍSTICA Y PROBABILIDADES I FUNCIÓN DE DENSIDAD DE PROBABILIDAD EXPONENCIAL f(x) λe − λx ; x > 0; λ > 0 f(x)= 0; enotrocaso x 0 a) Determinar su función de distribución acumulada F(X). b) Calcular su media y varianza. Solución: x a) x x ⎛ e − λx ⎞ −λ x − λx F ( x ) = ∫ λ e dx = λ e dx = λ ⎜ ∫0 ⎜ − λ ⎟⎟ 0 ⎠0 ⎝ ( F ( x ) = − e − λx ( ) x ) F ( x ) = − e − λ x − − e λ 0 = 1 − e − λx 0 0; x ≤ 0 F(x)= 1 − e −λx ;0 < x < ∞ 1; x → ∞ teoricamen te b) El cálculo de la media y varianza se realiza por medio de la integración por partes. E(X) = ∫ ∞ 0 ∞ xλe − λ x dx = λ ∫ xe− λ x dx = 1 λ ⇒ μ = 1 λ 0 E(X- μ)2 = λ ∫ ∞ 0 (x − μ) 2 e − λ x dx = 1 λ ⇒ σ 2 = 1 λ 2 146 2 ESTADÍSTICA Y PROBABILIDADES I 2. El tiempo de espera en horas que tarda un radar en detectar dos conductores sucesivas a alta velocidad es una variable aleatoria continúa con una distribución acumulada. ⎧0, x ≤ 0 F ( x) = ⎨ −8 x ⎩1 − e , x > 0 a) Encuentre la probabilidad de esperar menos de 12 minutos entre dos conductores sucesivos: I. Utilizando la distribución acumulada de x II. Utilizando la función de densidad de probabilidad de x b) Calcular su media y varianza Solución: a) X: V.A tiempo de espera 0 < x < 12 → 0 < x ≤ 0.2 → (1hr = 60min; I. P ( 0 < x < 0 .2 ) = 12 = 0.2) 60 0 .2 ∫0 f ( x)dx = F (0.2) − F (0) → Teorema fundamenta l del Cálculo [(1 − e TEOREMA FUNDAMENTAL DEL CÁLCULO: −8 ( 0.2 ) ) − (1 − e −8 ( 0 ) )] = 1 − e −1.6 = 0.7981 b ∫a f ( x)dx = G (b) − G (a) x TEOREMA FUNDAMENTAL F ' ( x ) = f ( x ) ↔ F ( x ) = ∫ f ( x ) dx −∞ DEL CÁLCULO: II. Por teorema fundamental del cálculo d F ' ( x) = (1 − e −8 x ) = 8e −8 x = f ( x ) dx P ( 0 < x < 0 .2 ) = 0.2 ∫0 8e −8 x ⎛ e −8 x dx = 8⎜⎜ ⎝ −8 0.2 ⎞ ⎟ = 1 − e −1.6 = 0.7981 ⎟ ⎠0 147 ESTADÍSTICA Y PROBABILIDADES I b. Se utilizará el método integración por partes el calculo de μ y δ2 E(X) = ∫ x (8e )dx = 8∫ ∞ −8 x 0 ∞ xe − λ x dx = 1 8 ⇒ μ = 1 8 hrs 0 E(X - μ2)= E(X2) -μ2 = ∫ x2 (8e−8x )dx −μ2 =8∫ x2e−8xdx −μ2 =18 ⇒σ2 =1 64hrs2 3. ∞ ∞ 0 0 2 La demanda diaria de arroz en “Metro”, en centenas de kilos es una variable aleatoria X con función densidad en la probabilidad. ⎧2 ⎪3 x ; 0 ≤ x <1 ⎪ F ( x ) ⎨ −1/ 3 x + 1;1 ≤ x ≤ 3 ⎪0; si, x < 0 ó x > 3 ⎪ ⎩ a) ¿Cuál es la probabilidad de que en un día escogido al azar, se venden más de 150kgrs? b) En 30 días ¿el gerente de ventas de “Metro” cuanto espera vender? c) ¿Cuál es la cantidad de arroz que debe ser dejado a disposición del público diariamente para que no falte arroz en 95% de días? Solución: X: V.A de demanda diaria de arroz en centenas de kg. a) {x > 150kg } → {x > 1.5} 3 P ( x > 1.5) = ∫ (−1 / 3 x + 1) dx = ( −1 / 6 x 2 + x )13.5 = 0.375 1 .5 3 b) 1 3 0 1 E ( Χ ) = ∫ xf ( x ) = ∫ x (2 / 3 x ) dx + ∫ x( −1/ 3 x + 1) dx = 1.33 dx 0 El valor esperado en 30 días es: 30(1.33)=39.9 cientos de kg. c) Sea Xo la cantidad de arroz dejado diariamente a disposición del público de modo que: P ( X ≤ x 0 ) = 0.95 ⇒ xο ∫ f ( x)dx = 0.95 −∞ 148 ESTADÍSTICA Y PROBABILIDADES I xο ∫ο 1 x ο 2 ⎛ x ⎞ f ( x)dx = ∫ x dx + ∫ ⎜ − + 1⎟dx = 0.95 3 ⎠ ο 3 1⎝ ⇒ xο2 − 6 xο + 8.70 = 0 ⇒ xο = 2.4523 Respuesta: Debe dejarse a disposición del público 245.23 kg. de arroz el 95% de los días. EJERCICIOS PROPUESTOS I. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD 1. Clasifique las siguientes variables aleatorias como discretas o continuas: X : El numero de accidentes de automóvil por año en el estado de Virginia. Y : El tiempo que toma jugar 18 hoyos de golf. M : La cantidad de leche producida anualmente por una vaca en particular. N : El numero de huevos que pone mensualmente una gallina. P El numero de permisos para la construcción de edificios que otorga mensualmente una ciudad. : Q : 2. 3. La cantidad de grano producido por acre. Un embarque de 5 automóviles extranjeros incluye 2 que tienen unas ligeras manchas de pintura. Si una agencia recibe 3 de estos vehículos aleatoriamente, indique los elementos del espacio muestral S utilizando las letras B y N para “manchado” y “no manchado”, respectivamente; asigne entonces para cada punto muestral un valor x de la variable aleatoria X que representa el numero de automóviles de pintura comprados por la agencia. Sea W una variable aleatoria que da el número de caras menos el de cruces en tres lanzamientos de una moneda. Indique los elementos del espacio muestral S para los tres lanzamientos de la 149 ESTADÍSTICA Y PROBABILIDADES I moneda y asigne un valor de w de la variable W a cada punto muestral. 4. Una moneda se lanza al aire hasta que ocurren 3 caras en sucesión. Escriba solo aquellos elementos del espacio muestral que requieren 6 o menos lanzamientos. ¿Este es un espacio muestral discreto? Explique. 5. Determine el valor c de tal forma que cada una de las siguientes funciones sirva como una distribución de probabilidad de la variable aleatoria discreta x. a) f(x)=c(x2+4) para x=0, 1, 2, 3 ⎛ 2 ⎞⎛ 3 ⎞ b) f(x)=c ⎜ ⎟ ⎜ ⎟ para x=0,1,2 ⎝ x ⎠⎝ 3− x ⎠ 6. De una caja que contiene 4 monedas de 1000 pesos y 2 de 500 pesos, se seleccionan 3 de ellas al azar sin reemplazo. Determine la distribución de probabilidad para el total T de las 3 monedas. Exprese gráficamente la distribución de probabilidad como un histograma. 7. De una caja que contiene 4 pelotas negras y 2 verdes, se seleccionan 3 de ellas en sucesión con reemplazo. Encuentre la distribución de probabilidad para el número de pelotas verdes. 8. Encuentre la distribución de probabilidad de la variable aleatoria W en el ejercicio 3, suponiendo que la moneda esta cargada de tal forma que una cara tiene dos veces más la posibilidad de ocurrir con respecto a la cruz. 9. Encuentre la distribución de probabilidad para el número de discos de Jazz cuando 4 discos se seleccionan al azar de una colección que consiste de 5 discos de Jazz, 2 de música clásica y 3 de polka. Exprese el resultado por medio de una fórmula. 10. Encuentre una fórmula para la distribución de probabilidad de la variable aleatoria X que representa el resultado de un solo lanzamiento de un dado. 11. Un embarque de 7 televisores contiene 2 aparatos defectuosos. Un hotel realiza una compra aleatoria de 3 de ellos. Si X es el número 150 ESTADÍSTICA Y PROBABILIDADES I de unidades defectuosas que se compran, encuentre la distribución de probabilidad de X. Exprese los resultados gráficamente como un histograma de probabilidad. 12. De un paquete de cartas se sacan tres en sucesión sin reemplazo. Encuentre la distribución de probabilidad para el número de cartas espadas. 13. Encuentre la distribución acumulada de la variable aleatoria W en el ejercicio 8. Utilizando F(w), encuentre: P (W > 0 ) a) b) P(− 1 ≤ W ≤ 3) 14. Dibuje una gráfica de la distribución acumulada del ejercicio 13. 15. Encuentre la distribución acumulada de la variable aleatoria X que representa el número de televisores defectuosos en el ejercicio 11. utilizando F(x), encuentre: a) P(W = 1) P(0 < W ≤ 2 ) b) 16. Dibuje una gráfica de la distribución acumulada del ejercicio 15. 17. La distribución de probabilidad de X, el numero de defectos por cada 10 metros de una tela sintética en rollos continuos de ancho uniforme es: x 0 1 2 3 4 f(x) 0.41 0.37 0.16 0.05 0.01 Dibuje la distribución acumulada de X. 18. Una firma de inversiones ofrece a sus clientes bonos municipales que vencen después de diferente número de años. Dada la distribución acumulada T, el número de años para el vencimiento de un bono seleccionado aleatoriamente es: 151 ESTADÍSTICA Y PROBABILIDADES I ⎧0 ⎪1 ⎪ ⎪4 ⎪⎪ 1 F(x) = ⎨ ⎪2 ⎪2 ⎪3 ⎪ ⎪⎩ 1 ; t <1 ; 1≤ t < 3 ; 3≤ t <5 ; 5≤t<7 ; t≥7 Encuentre: a) P(T = 5) b) P(T > 3) c) P(1.4 < T < 6 ) 19. Una variable aleatoria continua X que puede tomar valores entre x=1 y x=3 tiene una función de densidad f (x ) = 1 2 . a) Demuestre que el área bajo la curva es igual a 1. b) Encuentre P(2 < X < 2.5) . c) Encuentre P(X ≤ 1.6 ) . 20. Una variable aleatoria continua X que puede tomar valores entre x=2 y x=5 tiene una función de densidad f (x ) = 2(1 + x ) 27 . Encuentre: a) P(X < 4 ) b) P(3 < X < 4 ) 21. La proporción de personas que constan una cierta encuesta enviada por correo es una variable aleatoria continua X que tiene la función de densidad: ⎧ 2(x + 2 ) ⎪ 5 ⎪ f (x ) = ⎨ ⎪ 0 ⎪ ⎩ ; 0 < x <1 ; en cualquier otro caso 152 ESTADÍSTICA Y PROBABILIDADES I a) Demuestre que P(0 < X < 1) = 1 b) Encuentre la probabilidad de que más de ¼ pero menos de ½ de las personas en contacto responderán a este tipo de encuesta. 22. El numero total de horas, que se miden en unidades de 100 horas, que una familia utiliza una aspiradora durante un año es una variable aleatoria continua X, que tiene la función de densidad: ⎧ x ⎪ f (x ) = ⎨ 2 - x ⎪ 0 ⎩ ; 0 < x <1 ; 1< x < 2 ; en cualquier otro caso Encuentre la probabilidad de que una familia utilice la aspiradora durante un año: a) Menos de 120 horas. b) Entre 50 y 100 horas. 23. Para la función de densidad del ejercicio 19, encuentre F(x) y utilícela para evaluar P(2 < X < 2.5) . 24. Para la función de densidad del ejercicio 20, encuentre F(x) y utilícela para evaluar P(3 ≤ X < 4 ) . 25. Considere la función de densidad: ⎧k x ⎪ f (x ) = ⎨ ⎪ 0 ⎩ ; 0 < x <1 ; en cualquier otro caso a) Evalúe k b) Encuentre F(x) y utilícela para evaluar P(0.3 < X < 0.6 ) 26. El tiempo de vida útil, en días, de frascos de una cierta medicina es una variable aleatoria que tiene la función de densidad: 153 ESTADÍSTICA Y PROBABILIDADES I ⎧ 20.000 ⎪ (x + 100 )3 ⎪⎪ f (x ) = ⎨ ⎪ 0 ⎪ ⎪⎩ ; ; x>0 en cualquier otro caso Encuentre la probabilidad de que un frasco de este medicamento tenga una vida útil de: a) Al menos 200 días. b) Cualquier duración entre 80 y 120 días 27. El tiempo de espera, en horas, que tarda un radar en detectar dos conductores sucesivos a alta velocidad es una variable aleatoria continua con una distribución acumulada. ; x≤0 ⎧0 F ( x) = ⎨ −8 x ; x>0 ⎩1 − e Encuentre la probabilidad de esperar menos de 12 minutos entre dos conductores sucesivos: a) utilizando la distribución acumulada de X b) utilizando la función de densidad de probabilidad de X. II. ESPERANZA MATEMÁTICA 1. Un embarque de 7 televisores incluye dos defectuosos. Un hotel realiza una compra de manera aleatoria de tres de estos aparatos. Si X es el número de televisores defectuosos adquiridos por el hotel, encuentre la media de X. 2. La distribución de probabilidad de la variable aleatoria discreta X es: x ⎛ 3 ⎞⎛ 1 ⎞ ⎛ 3 ⎞ f (x ) = ⎜⎜ ⎟⎟⎜ ⎟ ⎜ ⎟ ⎝ x ⎠⎝ 4 ⎠ ⎝ 4 ⎠ 3− x ; x = 0, 1, 2, 3 Encuentre la media de X 3. Encuentre la media de la variable aleatoria T que representa el total de las tres monedas en el ejercicio 6 del conjunto de problemas del tema variables aleatorias y distribuciones de probabilidad. 154 ESTADÍSTICA Y PROBABILIDADES I 4. Una moneda se “carga” de tal manera que una cara es tres veces mas probable de ocurrir que una cruz. Encuentre el número esperado de cruces cuando esta moneda se lanza dos veces. 5. La distribución de probabilidad de X, el número de faltas por cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, que se dio en el ejercicio 17 del conjunto de problemas del tema variables aleatorias y distribuciones de probabilidad. x 0 1 2 3 4 f(x) 0.41 0.37 0.16 0.05 0.01 Encuentre el número promedio de fallas por cada 10 metros de esta tela. 6. Al encargado de un servicio de lavado de automóviles se le paga de acuerdo al número de automóviles que se atienden. Suponga que las probabilidades son 1 , 1 , 1 , 1 , 1 y 1 respectivamente, 12 12 4 4 6 6 de que el encargado reciba $7, $9, $11, $13, $15, o $17 entre las 4:00pm y las 5:00pm de cualquier viernes. Encuentre las ganancias que espera el encargado durante este periodo en particular. 7. Por intervenir en unas acciones en particular, una persona puede obtener ganancias de $4000 con una probabilidad de 0.3, o una pérdida de $1000 con una probabilidad de 0.7. ¿Cuál es la ganancia que espera la persona? 8. Suponga que un distribuidor de joyas antiguas esta interesado en comprar un collar de oro para el cual las probabilidades son 0.22, 0.36, 0.28 y 0.14 respectivamente, de que la poseedora estaría dispuesta a venderla en $250, $150, al costo con una perdida de $150. ¿Cuál es la utilidad que ella espera? 9. En un juego de azar una mujer ganará $3 si saca una sota o una reina y $5 si saca un rey o un as de un paquete común de 52 cartas. Si saca cualquiera otra carta, pierde. ¿Cuánto deberá pagar si el juego queda empatado? 155 ESTADÍSTICA Y PROBABILIDADES I 10. Un tazón contiene 5 fichas que no pueden distinguirse una de la otra. Tres de las fichas están marcadas con $2 y las restantes 2 con $4. un jugador saca del tazón 2 fichas al azar sin reemplazo, y se le paga una cantidad igual a la suma de los valores indicados en las dos fichas. Si el costo por jugar es de $5.60. ¿Es justo el juego? 11. Un piloto privado desea asegurar su avión por $50 000. la compañía aseguradora estima que una pérdida total puede ocurrir con una probabilidad de 0.002, un 50% de pérdida con una probabilidad de 0.01 y un 25% de pérdida con una probabilidad de 0.1. Ignorando todas las otras pérdidas parciales, ¿Qué prima deberá cobrar anualmente la compañía aseguradora para tener una utilidad promedio de $500? 12. Si la utilidad de un distribuidor, en unidades de $1000, en un nuevo automóvil puede considerarse como una variable aleatoria X con una función de densidad: ⎧2(1 − x ) ⎪ f (x ) = ⎨ ⎪ 0 ⎩ ; 0 < x <1 ; en cualquier otro caso Encuentre la utilidad promedio por automovil. 13. La función de densidad de las mediciones codificadas del diámetro del hilo de un encaje es: ⎧ 4 ⎪ π(1+x 2 ) ⎪⎪ f (x) = ⎨ ⎪ 0 ⎪ ⎪⎩ ; 0 < x <1 ; en cualquier otro caso Encuentre el valor esperado de X 14. ¿Qué proporción de personas puede esperarse que respondan a un cierto requerimiento por correo, si la proporción X tiene la función de densidad: 156 ESTADÍSTICA Y PROBABILIDADES I ⎧ 2(x+2) ⎪ 5 ⎪ f (x) = ⎨ ⎪ 0 ⎪ ⎩ 0 < x <1 ; ; en cualquier otro caso? 15. La función de densidad de la variable aleatoria continua X, el número total de horas, en unidades de 100 horas de que una familia utilice una aspiradora durante un año se dio en el ejercicio 22 del conjunto de problemas del tema variables aleatorias y distribuciones de probabilidad, como: ⎧ x ⎪ f ( x ) = ⎨ 2-x ⎪ 0 ⎩ ; 0 < x <1 ; 1≤ x < 2 ; en cualquier otro caso Encuentre el numero promedio de horas por año que la familia utiliza la aspiradora. 16. Si X representa el resultado cuando se lanza un dado balanceado. Encuentre μ g (X ) , donde g(X) = 3X2 + 4. 17. Sea X una variable aleatoria con la siguiente distribución de probabilidad: x f(x) -3 6 9 1 1 1 6 2 3 Encuentre μ g (X ) , donde g(X) = (2X + 1)2. 18. Encuentre el valor esperado de la variable aleatoria g(X) = X2, donde X tiene la distribución de probabilidad del ejercicio 2. 19. Una gran empresa industrial compra varias máquinas de escribir nuevas cada año, cuya cantidad depende de la frecuencia de reparaciones en el año anterior. Suponga que el número de 157 ESTADÍSTICA Y PROBABILIDADES I maquinas de escribir, X, que se compran cada año tiene la siguiente distribución de probabilidad: x f(x) 0 1 2 3 1 3 10 4 10 2 10 10 Si el costo del modelo que se desea adquirir permanece sin cambio en $1200 durante un año y se ofrece un descuento de 50 X2 en cualquier compra, ¿Cuánto dinero espera esta firma invertir en máquinas de escribir para fin de año? 20. Una variable aleatoria continua X tiene una función de densidad: ⎧e − x ; x > 0 F ( x) = ⎨ ; en otro caso ⎩0 Encuentre el valor esperado de g(x)=e2x/3 21. ¿Cuál en la utilidad promedio por automóvil para el distribuido si la ganancia por cada vehículo es g(X) = X2, donde X es una variable aleatoria que tiene la función de densidad del ejercicio 12? 22. El periodo de hospitalización, en días, para pacientes que sigue un tratamiento para un cierto tipo de desorden renal es una variable aleatoria Y = X + 4; donde X tiene la función de densidad: ⎧ 32 ⎪ 3 ⎪ (x + 4) ⎪ f (x ) = ⎨ ⎪ 0 ⎪ ⎪⎩ ; ; x>0 en cualquier otro caso Encuentre el número promedio de días que una persona esta hospitalizada para seguir el tratamiento contra este desorden. 158 ESTADÍSTICA Y PROBABILIDADES I III. VARIANCIA 1. Calcular la varianza de la variablealeatoria X del ejercicio 1 de la sección anterior esperanza matemática. 2. Sea X una variable aleatoria con la siguiente distribución de probabilidad: x -2 3 5 f(x) 0.3 0.2 0.5 Encuentre la desviación de X. 3. La variable aleatoria X, que representa el numero de pedacitos de chocolate en un pastel, tiene la siguiente distribución de probabilidad: x 2 3 4 5 6 f(x) 0.01 0.25 0.4 0.3 0.04 Utilizando el teorema 3.2, encuentre la variancia de X. 4. 5. 6. Suponga las probabilidades 0.4, 0.3, 0.2 y 0.1, respectivamente, de que 0, 1, 2 o 3 fallas de energía eléctrica afecten una cierta subdivisión en un año cualquiera. Encuentre la media y la variancia de la variable aleatoria X que representa el numero de fallas de energía eléctrica que afectan esta subdivisión. Las ganancias de un distribuidor, en unidades de $1000, en un nuevo automóvil es una variable aleatoria X que tiene la función de densidad que se dio en el ejercicio 12 del conjunto de problemas del tema esperanza matemática. Encuentre la variancia de X. La proporción de personas que responden a un cierto requerimiento enviado por correo es una variable aleatoria X que tiene la función de densidad que se dio en el ejercicio 14 del conjunto de problemas del tema esperanza matemática. Encuentre la variancia de X. 159 ESTADÍSTICA Y PROBABILIDADES I 7. El número total de horas, en unidades de 100 horas, que una familia utiliza una aspiradora durante un año es una variable aleatoria X que tiene la función de densidad que se dio en el ejercicio 15 del conjunto de problemas del tema esperanza matemática. Encuentre la variancia de X. 8. Con los datos del ejercicio 16 del conjunto de problemas del tema esperanza matemática. Encuentre σ2g( X ) para la función g(X) = 3X2 + 4. 9. Encuentre la desviación estándar de la variable aleatoria g(X) = (2X + 1)2 en el ejercicio 17 del conjunto de problemas del tema esperanza matemática. 10. Con los resultados del ejercicio 21 del conjunto de problemas del tema esperanza matemática, encuentre la variancia de g(X) = X2, donde X en una variable aleatoria que tiene la función de densidad que se dio en el ejercicio 12 del conjunto de problemas del tema esperanza matemática. 11. El periodo de tiempo, en minutos, que un aeroplano espera vía libre para aterrizar en un cierto aeropuerto es una variable aleatoria Y = 3X – 2, donde X tiene la función de densidad: x ⎧ ⎪1 − 4 ; x>0 ⎪2 e ⎪ f (x ) = ⎨ ⎪ 0 ; en cualquier otro caso ⎪ ⎪ ⎩ Encuentre la media y la variancia de la variable aleatoria Y. 160 ESTADÍSTICA Y PROBABILIDADES I RESPUESTAS VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD 1. Discreta, Continua; Continua; Discreta; Discreta; Continua 2. 3. Espacio Muestral x Espacio Muestral x NNN NNB NBN BNN NBB BNB BBN BBB 0 1 1 1 2 2 2 3 HHH HHT HTH THH HTT THT TTH TTT 3 1 1 1 -1 -1 -1 -3 4. S = {HHH, THHH, HTHHH, TTHHH, TTTHHH, HTTHHH, THTHHH, HHTHHH,……} Discreta 5. a.- 1 b.- 1 30 10 6. t 20 25 1 3 1 5 5 5 P(T = t) 30 7. x f(x) 0 1 2 3 8 4 2 27 9 9 1 27 161 ESTADÍSTICA Y PROBABILIDADES I 8. w P(W = w) -3 -1 1 3 1 2 4 8 27 9 9 27 9. ⎛ 5 ⎞⎛ 5 ⎞ ⎜⎜ ⎟⎟⎜⎜ ⎟ x ⎠⎝ 4 − x ⎟⎠ ⎝ f( x ) = ; para x = 0, 1, 2, 3, 4. ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎝ 4⎠ 10. f (x ) = 1 6 ; x = 1, 2, ...., 6. 11. x 0 f(x) 1 2 2 4 1 7 7 7 12. x f(x) 0 1 2 703 741 117 11 1700 1700 850 850 162 3 ESTADÍSTICA Y PROBABILIDADES I 13. ⎧ ⎪ ⎪ ⎪ ⎪⎪ F(w ) = ⎨ ⎪ ⎪ ⎪ ⎪ ⎪⎩ ; para w < -3 ; para - 3 ≤ w ≤ -1 ; para - 1 ≤ w < 1 ; para 1 ≤ w < 3 ; para w ≥ 3 ; para x < 0 ; para 0 ≤ x ≤ 1 0 1 27 7 27 19 27 1 a.- 20 27 b.- 2 3 b.- 5 7 15. ⎧ 0 ⎪ 2 ⎪ ⎪ 7 F( x ) = ⎨ ⎪ 6 ⎪ 7 ⎪ 1 ⎩ a.- 4 ; para 1 ≤ x < 2 ; para w ≥ 2 0 ; para x < 0 0.41 ; para 0 ≤ x < 1 0.78 ; para 1 ≤ x < 2 0.94 ; para 2 ≤ x < 3 0.99 ; para 3 ≤ x < 4 1 ; para x ≥ 4 17. ⎧ ⎪ ⎪ ⎪ F( x ) = ⎨ ⎪ ⎪ ⎪ ⎩ 18. a.- 1 19. 4 1 b.4 20. a.- 16 27 b.- 1 c.- 1 2 2 c.- 0.3 b.- 1 3 163 7 ESTADÍSTICA Y PROBABILIDADES I 21.b.- 19 80 22.a.- 0.68 23. F( x ) = 24. F( x ) = 25.a.- 3 b.- 0.375 ( x − 1) 2 ; 1 4. ( x + 4)(x - 2) 27 ; 1 3. 3 2 b.- F(x) = x 26. a.- 1/9 b.- 0.1020 27. a.- 0.7981 b.- 0.7981 2 ; 0.3004 ESPERANZA MATEMÁTICA 1. 6 2. 3 3. 25 centavos 7 4 4. 1 2 5. 0.88 6. $12.67 7. $500 8. $88 9. $1.23 164 ESTADÍSTICA Y PROBABILIDADES I 10. Juego empatado 11. $2100 12. $333 13. (ln 4 ) π 14. 8 15. 100 horas 16. 49.5 17. 209 18. 9 19. $1855 20. 3 21. $167 22. 8 15 8 VARIANCIA 1. 20/49 2. 3.041 3. 0.74 4. μ=1 ; 5. 1 18 σ2 = 1 165 ESTADÍSTICA Y PROBABILIDADES I 6. 37 7. 1 6 450 8. 1342.25 9. 118.9 10. 7 11. μ = 10 180 y ; σ 2 y = 144 166 ESTADÍSTICA Y PROBABILIDADES I Semana 13 DISTRIBUCIONES DE PROBABILIDAD DISCRETA INTRODUCCIÓN Con frecuencia las observaciones que se generan en diferentes experimentos estadísticos tienen el mismo tipo de comportamiento en términos generales. En consecuencia la V.A. Discretas que se asocian, con estos experimentos puede describirse esencialmente por la misma distribución de probabilidad y por lo tanto se representa de una sola forma, De hecho se necesita las distribuciones de probabilidad más importantes para describir diferentes V.A. Discretas que se encuentran en la práctica. Así tenemos la distribución: Binomial, Poisson, Hipergeométrica, Pascal Multinomial. DISTRIBUCIÓN BINOMIAL: • Consideremos un experimento de Bernoulli: Éxito: p Fracasa : 1 – P = q • Podemos calcular su media y varianza según el siguiente esquema: Xi P(Xi) = p(xi) μ = EX = 0 1 q p ∑ x p(x ) = 0 * q + 1 * p = p ⇒ μ = p i i σ = ∑ x p(xi) - μ = 0 2 * q + 12 * p - p 2 2 2 i 2 σ 2 = p - p 2 = p(1 - p) = pq ⇒ σ 2 = pq o n Bernoulli ↔ Binomial • p+q = 1 Luego, la media y varianza de la Binomial es: μ = np σ 2 = npq 167 ESTADÍSTICA Y PROBABILIDADES I o La distribución binomial se basa en la repetición de n veces el experimento de Bernoulli. o Condiciones que deben cumplir un experimento binómico. 1. La V. A. tiene 2 posibilidades: éxito o fracaso en cada ensayo. 2. Los n ensayos son independientes. 3. La probabilidad de éxito se mantienen constante. 4. Existen n ensayos donde n es constante. DEDUCCIÓN DE LA DISTRIBUCIÓN BINOMIAL Consideremos n V.A.I. X1 , X2, X3, ………Xn Cada una de ellas en un experimento de Bernoulli. ⎧p; x èxito p(x i ) = ⎨ ⎩1 − p = q; fracaso P {X1, X2, X3,.........., Xn} = p(X1 (w) ) p(X 2 (w) ).....p(X n (w) ) o Una posibilidad de ocurrencia de un éxito p………………..p q………………..q x éxito n – x fracaso n x P (1-p)n-x o Existen x posibilidades de éxito ⎛n⎞ x ⎜⎜ ⎟⎟ p (x - p) n - x ⎝ x⎠ ⎛n⎞ P (X = x) = ⎜⎜ ⎟⎟ p x (1 - p) n - x , x = 0,1,.............., k ; k ≤ n ⎝ x⎠ La distribución binomial tiene media μ = np y varianza σ 2 = npq parámetros en esta distribución, su deducción se realiza haciendo uso de la definición. 168 ESTADÍSTICA Y PROBABILIDADES I EJERCICIOS DE APLICACIÓN 1. Determinar la probabilidad de obtener sellos cuando se lanza una moneda 3 veces. Solución • X: V.A. de obtener como éxito sello • Valores que toma la V.A. 0, 1, 2, 3 • P = ½; n = 3 x ⎛ 3 ⎞ ⎛1 ⎞ P(X = x) = ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ (1 - 1/2)3- x ⎝ x ⎠ ⎝ 2⎠ ⎛3⎞ x = 0 : P(x = 0) = ⎜⎜ ⎟⎟ (1/2 )º (1 − 1 / 2)3− 0 = 1 8 ⎝ 0⎠ ⎛ 3⎞ x = 1 : P(x = 1) ⎜⎜ ⎟⎟ (1/2)1 (1 - 1/2)3-1 = 3/8 ⎝1 ⎠ ⎛3⎞ x = 2 : P(x = 2) = ⎜⎜ ⎟⎟ (1/2) 2 (1 - 1/2)3- 2 = 3/8 ⎝ 2⎠ ⎛ 3⎞ 3 3−3 x = 3 : P(x = 3) = ⎜⎜ ⎟⎟ (1/2 ) (1 − 1 / 2 ) = 1 / 8 ⎝ 3⎠ 2. Supongamos se trata de elegir aleatoriamente componentes electrónicos de unas líneas de producción de los cuales, estamos interesados en los defectuosos D y no defectuosos N se pide: a) Determinar el espacio muestral S b) Utilizando la distribución binomial, calcular la probabilidad de extraer componentes defectuosos c) Calcular su media y varianza Solución: 169 ESTADÍSTICA Y PROBABILIDADES I a) Determinar el espacio muestral S: S DDD D DDN D D N D N DND DNN N NDD D D N N N NDN D NND N NNN b) Usando Binomial: X: V.A. que el elemento sea defectuoso X (w) = X: 0, 1, 2, 3 P=½ n=3 ( )( ) 0 3− 0 ⎛3⎞ =1 P(x = 0) = ⎜ ⎟ 1 1− 1 2 2 8 0 ⎝ ⎠ 1 3−1 ⎛ 3⎞ =3 P(x = 1) = ⎜ ⎟ 1 1− 1 2 8 ⎝1 ⎠ 2 ( )( ( ) ) 3− 2 ⎛3⎞⎛ 1 ⎞ =3 P(X = 2) ⎜ ⎟ ⎜ ⎟ 2 1 - 1 2 8 2 2 ⎝ ⎠ ⎝ ⎠ 3 3−3 ⎛ 3⎞ =1 P(X = 3) = ⎜ ⎟ 1 1-1 2 8 ⎝ 3⎠ 2 ( ) ( 170 ) ESTADÍSTICA Y PROBABILIDADES I c) Calculo de la media: 0 X(wi) = Xi 3 1 8 P(Xi) = p(xi) ∑ x p(x ) μ = EX = 1 i i = 3 8 2 3 8 1 8 12 3 = 8 2 Calculo de la varianza 2 24 ⎛ 3 ⎞ 3 σ = ∑ x p(x ) - μ = -⎜ ⎟ = i 8 ⎝2⎠ 4 2 2 i 2 Se verifica usando las formulas: μ = Ex = np σ 2 = E(x - μ ) 2 = Ex 2 - μ 2 = npq En el problema resuelto: μ = 3(1/2) = 3/2 σ 2 = 3(1/2) (1/2) = 3/4 3. Supongamos que 10 aparatos de radar están operando independientemente uno del otro y que la probabilidad de que solo uno de los aparatos detecte un cohete enemigo es de 0.80. ¿Cuál es la probabilidad de que nueve aparatos de radar detecten el cohete? Solución: X: V.A. de que el radar detecte un cohete p= 0.80 n = 10 ⎛10 ⎞ {x = 9} → p (x = 9) = ⎜ ⎟ 0.89 x 0.21 = 10 × 0.89 × 0.21 = 0.2684 ⎝ 9⎠ 4. Un complejo sistema electrónico esta construido con cierto número de componentes de apoyo en sus subsistemas. Un subsistema contiene cuatro componentes idénticos cada uno con una probabilidad de 0.2 de fallar en menos de mil horas. El sistema funciona si dos o mas componentes cuales quiera de los cuatro que 171 ESTADÍSTICA Y PROBABILIDADES I trabajan en forma adecuada. Además se supone que los componentes operan en forma independiente. c) Encuentre la probabilidad de que exactamente dos de cuatro componentes resistan más de mil horas. d) Encuentre la probabilidad de que el sistema funcione por más de mil horas. Solución: X: V.A. componentes que resistan mas de mil horas Probabilidad de fallas en menos de 1000, horas P(Ei) = 0.2; i= 1, 2, 3, 4. Probabilidad de no fallar en menos de 1000, horas P (Ei) = 0.8 n=4 p = 0.8 ⎛ 4⎞ 2 2 a) {x = 2} → P(x = 2) = ⎜⎜ ⎟⎟ (0.8) (0.2 ) = 0.1536 ⎝ 2⎠ b) {x ≥ 2} → P(x ≥ 2) = 1 - P (x < 2 ) = 1 - [P (0) + P(1)] ⎡⎛ 4 ⎞ ⎤ ⎛ 4⎞ = 1 - ⎢⎜⎜ ⎟⎟ 0.8 0. 0.2 4 + ⎜⎜ ⎟⎟ 0.81 x 0.2 3 ⎥ ⎝1 ⎠ ⎣⎝ 0 ⎠ ⎦ = 1 - 0.0272 P(x ≥ 2) = 0.9728 5. Un estudiante de ingeniería de sistemas tiene la certeza de aprobar una signatura cualquiera con probabilidad 0.8. Si lleva 6 asignaturas: a) ¿Cuál es la probabilidad de que salga mal en todas las asignaturas? b) ¿Cuál es la probabilidad de que aprueben menos dos o mas de cuatro cursos? c) ¿Cuál es la probabilidad de que apruebe exactamente dos curso sabiendo que al menos aprueba un curso? Solución: • X: V.A. cursos que el estudiante apruebe • Valores de x: 0, 1, 2, 3, 4, 5, 6 • p = 0.8 , n = 6 ⎛6 ⎞ a) P (X = x) = ⎜⎜ ⎟⎟ 0.8 x (1 - 0.8) 6 - x ; x = 0 , 1, ..., 6 ⎝x⎠ ⎛6⎞ P (x = 0) = ⎜⎜ ⎟⎟ 0.8 0 (1 - 0.8) 6 = 0 .0000 64 ⎝0⎠ 172 ESTADÍSTICA Y PROBABILIDADES I b) {x < 2 ∪ x > 4} → P((x < 2) ∪ (x > 4)) = P(x < 2) + P(x > 4) = 0.65696 P(0) + P(1) + p(5) + p(6) = 0.65696 P ( x > 4) = 0.65536 P ( x < 2) = P( x = 0) + P( x = 1) = 0.0016 ⎛6⎞ 6! (1)(0.2)6 = 0.000064 P(x = 0) = ⎜⎜ ⎟⎟ (0.8)0 (1 - 0 - 8)6 - 0 = 0 0!*6! ⎝ ⎠ ⎛ 6⎞ 6! (0.8)1 (0.2)5 = 0.001536 P(x = 1) = ⎜⎜ ⎟⎟ (0.8)1 (1 - 0 - 8)6 -1 = 1!*5! ⎝1 ⎠ ⎛6⎞ 6! (0.8)2 (0.2)4 = 0.01536 P(x = 2) = ⎜⎜ ⎟⎟ (0.8)2 (1 - 0 - 8)6 - 2 = 2!*4! ⎝ 2⎠ ⎛ 6⎞ 6! (0.08)3 (0.2)3 = 0.08192 P(x = 3) = ⎜⎜ ⎟⎟ (0.8)3 (1 - 0 - 8)6 - 3 = 3!*3! ⎝3⎠ ⎛6⎞ 6! (0.8)4 (0.2)2 = 0.24576 P(x = 4) = ⎜⎜ ⎟⎟ (0.8) 4 (1 - 0 - 8)6 - 4 = 4!*2! ⎝ 4⎠ ⎛6⎞ 6! 5 1 P(x = 5) = ⎜ ⎟ (0.8)5 (1-0-8)6-5 = ( 0.8) ( 0.2 ) = 0.293216 5!*1! ⎝5⎠ ⎛6⎞ 6! 6 P(x = 6) = ⎜ ⎟ (0.8)6 (1-0-8)6-6 = ( 0.8) ( 0.2 ) 0 = 0.362144 6!*0! ⎝6⎠ Se puede usar la propiedad complementaria P(x > 4) = 1- P(x ≤ 4) = 1- 0.34464 = 0.65536 c) P (x = 2 / x ≥ 1) = p ({ x = 2} ∩ {x ≥ 1} ) P (x ≥ 1) 173 = P (x = 2) = 0.0153609831 1 - P (x < 1) ESTADÍSTICA Y PROBABILIDADES I DISTRIBUCIÓN DE POISSON X → P (X, λt) = p (x, λt) Los experimentos que resultan en valores numéricos de una variable aleatoria X la misma, que representa el numero de resultado que ocurre en un intervalo de tiempo dado o en una región especifica por t, frecuentemente se llaman experimentos de Poisson y se define por: ⎧ e - λt (λt) x ; x = 0, 1, 2...k, k ≤ n ⎪ p(x, λt) = P(X = x) = ⎨ x! ⎪ ⎩ Donde λ es el numero promedio de resultado por unidad de tiempo o región y e = 2.7182 λ : ( ) ≠ de llamadas telefonicas λ : ( ) bactarias 3 t = 1cm 3 λ : ( t = 1 hectàrea 1 hora 1cm ) roedores 1 hectàrea t = 1 hora Región: segmento de línea, área, volumen, tiempo: segundo, minutos, horas, etc. Un experimento de Poisson que surge de un proceso de Poisson y tiene las siguientes propiedades. 1. 2. El numero de resultados que ocurre en un intervalo de tiempo, región, volumen específicos es independiente del numero que ocurre en cualquier otro intervalo disjunto de tiempo o región del espacio disjunto. De esta manera se dice que el proceso de Poisson no tiene memoria o que son estocásticamente independientes ya que las ocurrencias en intervalos no se superponen. La probabilidad de que un resultado sencillo ocurra en un intervalo de tiempo muy corto o en una región pequeña es proporcional a la longitud del intervalo de tiempo o el tamaño de la región y no depende del número de resultados que ocurre fuera del intervalo o región. 174 ESTADÍSTICA Y PROBABILIDADES I 3. La probabilidad de que más de un resultado ocurra en ese intervalo tan corto o en esa región tan pequeña es despreciable. λ : Promedio de ocurrencia por la unidad de tiempo o región t : tiempo en segundo, minutos, horas. La media y varianza de la distribución de Poisson p(x, λt) tienen ambas el valor λt EJERCICIOS DE APLICACIÓN: 1. El tiempo promedio de partículas radioactivas que pasan a través de un contador durante un milisegundo en un experimento de laboratorio es 4. ¿Cuál es la probabilidad de que entren 6 particular al contador en un milisegundo determinado? Solución: X: variable aleatoria particular que llegan al contador λ : 4 partículas / milisegundo 4 part t : 1 milisegundo λt = * 1 miliseg. = 4 part ; miliseg {x 2. = 6} ⇒ p (x = 6) = e-4 (4)6 6! = 0.1042 Se ha observado en forma empírica que las muertes ocasionadas por accidentes de tráfico ocurren a razón de ocho por hora en los largos fines de semana feriados. En el supuesto que estas muertes ocurren en forma independiente, calcular la probabilidad de que: a) Transcurra una hora sin que haya muertes b) Transcurra un periodo de 15 minutos sin muertes c) Transcurra cuatro periodos consecutivos, que no se traslapen, sin que haya muertos Solución: X : V.A. accidentes que causan la muerte acc λ =8 hora λ t = 8 accidentes t = 1 hora 175 ESTADÍSTICA Y PROBABILIDADES I −8 (8) 0 = e -8 = 0.003355 ≈ 0.0034 0! 15 1 1 t= = hora , λ t = 8 x = 2 accidentes 60 4 4 b) -2 0 {x = 0} → P (x = 0) = e 2 = e- 2 = 0,1353 0! c) 4 periodos a) {x = 0} → P( x = 0) = e ( ) → { X1 , X 2 , X3 , X3 ,} → P( X 1 X 2 X 3 X 4 ) = e −2 = e −8 = 0.0034 V.A. Independientes, donde: P(X1 ) = P(X 2 ) = P(X 3 ) = P(X 4 ) = e-2 4 3. En una determinada planta manufacturera han ocurrido accidentes a razón de uno cada dos meses. En el supuesto de que ocurren en forma independiente. a) ¿Cual es el número esperado de accidentes al año? b) ¿Cual es la desviación estándar del número de accidentes al año? c) ¿Cual es la probabilidad de que no haya accidentes en un mes determinado? Solución: X : V.A. accidentes λ = 1 accd / 2 meses) t = 1 mes 1 2 λ t = accident. a) ⎛ 1 accident ⎞ Ex = λ t = ⎜ ⎟ (12 meses) = 6 accident. ⎝ 2 mes ⎠ b) σ 2 = λ t = 6 ⇒ σ = 6 = 2. 4495 accident. c) λ = accidentes 1 2 t = 1 mes λt = 1 accident. 2 {x = 0} → P(x = 0) = e-0.5 (0.5)0 0! = e -0.5 = 0.6065 4. En promedio en una cierta intersección ocurre en 3 accidentes viales por mes, ¿Cuál es la probabilidad de que un determinado mes en este intersección? 176 ESTADÍSTICA Y PROBABILIDADES I a) Ocurran exactamente 5 accidentes? b) Ocurran menos de 3 accidentes? c) Calcular su media y varianza Solución: X: Variable aleatoria accidentes que ocurran en un mes λ : 3 accidentes/mes 3 accidentes × mes = 3 accidentes λt t : 1 mes mes e -3 (3) 5 = 0.1008 5! a) X (w) = x = 5 accidentes; p (x = 5) = b) {x < 3} → P(x < 3) = ∑ P(x , 3) = P(0,3) + P (1,3) + P(2,3) c) ⎡ 31 3 2 ⎤ = e ⎢1 + + ⎥ = 0.4230 ⎣ 1! 2! ⎦ 2 media μ = λ t = 3 accidentes; σ = λ t = 3 2 x =0 -3 5. El número promedio de ratas de campo por acre en un campo de trigo de cinco acres se estima que es de 12. Encuentre la probabilidad de que menos de 7 ratas de campo se encuentre: a) En un acre de terreno determinado b) En dos de los siguientes tres acres Solución: X: variable aleatoria de ratas en el campo λ : 12 ratas / acres ratas λt = 12 × 1 acre = 12 ratas t : 1 acre acre 6 a) {x < 7} → P(x < 7) = ∑ p(x, λ t) = p(0)+ p(1)+ p(2)+ p(3)+ p(4)+ p(5) p(6) x=0 ⎡ 1 121 122 123 124 125 126 ⎤ = e-12 ⎢ + + + + + + ⎥ 0 ! 1 ! 2 ! 3 ! 4 ! 5 ! 6! ⎦ ⎣ = e-12 [7457.8] = 0.04582230 6 P (x < 7) = 0.0458 ⎛3 ⎞ 2 b) P (x = 2) = ⎜⎜ ⎟⎟ (0.0458) (1 − 0.0458)3− 2 = 0.0060 ⎝ 2⎠ 177 ESTADÍSTICA Y PROBABILIDADES I 6. En un sistema de cómputo de tiempo compartido, el número de peticiones de tele puerto es de 0.2 por milisegundo, en promedio y sigue una distribución de Poisson. a) Calcular la probabilidad de que no lleguen peticiones durante el siguiente milisegundo. b) Calcular la probabilidad de que no lleguen peticiones durante los tres siguientes milisegundos. Solución X: V.A. de que no lleguen peticiones peticiones λ : 0.2 λ t = 0.2 peticiones milisegundo t: 1 milisegundo a) P(x = 0 ) = e -0.2 0.2 0 = e -0.2 = 0.8187 0! b) Los eventos son independientes por cada milisegundo P (X1 , X 2 , X 3 ) = e-0.2 x e-0.2 x e-0.2 = e -0.6 = 0.5488 7. En un conmutador telefónico se reciben llamadas de acuerdo con un proceso de Poisson con parámetros λ = 5 llamadas por hora. Si hay una persona en el conmutador. ¿Cuál es la probabilidad de que: a) transcurran al menos 15 minutos ante de la siguiente llamada? b) no pasen más de 10 minutos antes de la siguiente llamada c) De que trascurran exactamente cinco minutos antes de la siguiente llamada? Solución: X : V.A. llamadas λ : 5 llamadas/ hora t : 1 hora a) t = {x 15 1 1 5 hr → λ t = 5 x = = 60 4 4 4 ≥ 1} → P( x ≥ 1) = 1 - e -5 4 178 = 0.7135 ESTADÍSTICA Y PROBABILIDADES I b) t = {x c) 10 1 1 5 = hr → λ t = 5 × = 60 6 6 6 ≤ 1} → P(x ≤ 1) = P(0) + P(1) = e -5 6 + e -5 6 ( 6)) 5 1 1! = 0.7968 5 1 1 5 hr → λ t = 5 * = = 60 2 12 12 1 -5 e 12 5 12 = 0.2747 {x = 1} → P(x = 1) = 1! λ = ( ) 8. Se certifica la calidad de los discos para computadoras pasándolos por un certificador que cuenta el número de pulsos faltantes. Una determinada marca de discos para computadoras tiene en promedio 0.1 pulsos faltantes por disco. a) Calcular la probabilidad de que el siguiente disco que se inspeccione no le falten pulsos. b) Calcular la probabilidad de que al siguiente disco que se inspeccione le falte un pulso. c) Calcular la probabilidad de que a ninguno de los dos discos inspeccionados le falten pulsos Solución: X: V.A. Pulsos faltantes en el disco λ : 0.1 Pulsos/disco t: 1 disco a) e-0.1 x 0.10 {x = 0} → P(x = 0) = = e- 0.1 = 0.9048 0! b) {x ≥ 1} → p(x ≥ 1) = 1 - P(x < 1) = 1 - P(x = 0) = 1 - 0.9048 = 0.0952 c) {X 1 y X 2 } → P(X1 X 2 ) = P (X1 ) P(X 2 ) = e -0.1 x e -0.1 = 0.8187 179 ESTADÍSTICA Y PROBABILIDADES I • V.A. independientes: X1, X2 ⎛n⎞ Binomial : P (X = x) = ⎜⎜ ⎟⎟ P x (1 - P) ⎝x⎠ μ = np; σ 2 = npq Poisson : P(x = x) = e -λ t n -x ; x = 0,1,2,... (λ t )x ; x = 0,1,2,3... x! μ = λ t ; σ = λt ⇒ σ = μ 2 2 TEOREMA APROXIMACIÓN ENTRE LA DISTRIBUCIÓN BINOMIAL Y POISSON Sea X una variable aleatoria Binomial con distribución de probabilidad β ( x , n, p ) Cuando n → ∞, p → 0, μ = np permanece constante ⎧ e −μ μ x , x = 0,1, .., ⎪ β (x, n, p ) → p(x, μ ) → Poisson( x, λ t ) = ⎨ x! ⎪0 en otro caso ⎩ EJERCICIOS DE APLICACIÓN 1. En un proceso de manufactura en el cual se producen piezas de vidrio, ocurren defectos o burbujas, ocasionando que la pieza se no deseable para la venta. Se sabe que en promedio uno de casa mil piezas tiene una o más burbujas ¿Cuál es la probabilidad de que en una muestra aleatoria de 8000 piezas, menos de 7 de ellas tengan burbujas? Solución: X : variable aleatoria numero de burbujas n= 8000 grande P= 1/1000 = 0.001 pequeña 180 ESTADÍSTICA Y PROBABILIDADES I ⎛ 8000 ⎞ x n− x ⎟ ( 0.001) (1 - 0.001) , no x = 0⎝ ⎠ conveniente usar la distribución binomial. {x 6 ∑⎜x < 7} → P(x < 7) = Como observamos n → ∞ y μ → 0 , usamos aproximación de la binomial a la Poisson. Luego: μ = np = 8000 x 0.001 = 8 el teorema sería de μ = 8. Apliquemos Poisson 6 {x < 7} → P(x < 7) = ∑ P (x , μ ) x=0 e - μ (μ ) P (x , μ ) = x! x 6 P(x < 7) = ∑ P(x ; 8) = P(0) + P(1) + P(2) + P(3) + P(4) x=0 + P(5) + P(6) ≈ β (x, 8000, 0.001) ⎡ 8 82 83 84 85 86 ⎤ = e-8 ⎢1 + + + + + + ⎥ ⎣ 1! 2! 3! 4! 5! 6! ⎦ = e −8 [1 + 8 + 32 + 85.33 + 160.66 + 273.06 + 364.08] = e-8 [934.13] = 0.3134 Luego P(x < 7) = ∑ b(x; 8000,0.001) ≈ 0.3134 2. La probabilidad de que un estudiante presente problema de escoliosis (desviación lateral sufrida por la columna vertebral) en una escuela de la localidad es de 0.004. De los siguientes 1875 estudiantes revisados, encuentre la probabilidad de que: a) Menos de 5 presenten este problema b) 8, 9 ó 10 presenten este problema Solución: X = Variable aleatoria de que un estudiante presente problemas de escoliosis n= 1875 grande P= 0.004 pequeñas Usando luego β (x; 1875, 0.004) ≈ P (x, 7.5) 181 ESTADÍSTICA Y PROBABILIDADES I μ = np = 1875 x 0.004 = 7.5 a) 4 4 {x < 5} ∑ = P(x, 7,5) → P(x < 5) = ∑ P(x; 7.5) x=0 x =0 ⎡ 7.5 7.5 7.5 7.5 4 ⎤ = e ⎢1 + + + + ⎥ 1! 2! 3! 4! ⎦ ⎣ = e −7.5 [1 + 7.5 + 28.125 + 70.313 + 131.8359] ≈ 0.1321 = 0.13206 -7.5 b) 2 3 10 10 x =8 x =8 {8 ≤ x ≤ 10} → P (8 ≤ x ≤ 10) = ∑ β (x;1875,0.004) ≈ ∑ P( x,7.5) 10 ≈ ∑ P( x,7.5) x =8 ≈e -7.5 ≈ e -7.5 ⎡ 7.58 7.5 9 7.510 ⎤ + + ⎢ ⎥ 9! 10! ⎦ ⎣ 8! x [610.3941] ≈ 0.3376 182 ESTADÍSTICA Y PROBABILIDADES I Semana 14 DISTRIBUCIÓN NORMAL La distribución continúa de probabilidad mas importantes en todo el campo de la estadística es la distribución normal. Su gráfica recibe el nombre de curva normal, teniendo forma de campana (como en la figura), la cual describe aproximadamente muchos fenómenos que ocurren en la naturaleza, la industria y la investigación. Fue estudiada por primera vez en el siglo XVIII cuando científicos observaron con sorpresa el grado de regularidad en los errores de medición descubrieron que los patrones (distribuciones) eran aproximados a una distribución continua que denominaran “curva normal de errores” y le atribuyeron reglas de probabilidad. En 1733 Abraham De Moivre desarrollo la ecuación matemática de la curva normal, también se llama distribución Gaussiana en honor a Karl Friedrich Gauss (1777-1855) quien también derivo su ecuación en un estudio de errores en mediciones repetidas de la misma cantidad. La ecuación matemática depende de los parámetros μ y σ 2 y notandosela por N ( x; μ ; σ 2 ) . f(x) σ μ -σ μ +σ x μ 1 ⎛ x−μ ⎞ σ ⎟⎠ − ⎜ 1 X → f ( x) = e 2⎝ 2πσ 2 −∞< x <∞ 183 ESTADÍSTICA Y PROBABILIDADES I Particularidades: 1. La media, mediana y moda x, Me, Mo coinciden, definiendo la simetría de f (x) . 2. Es simétrico respecto a su media μ 3. La curva tiene punto de inflexión μ ± σ → (desviación estándar) 4. Es asintótica con el eje x ⎛∞ ⎞ 5. La gráfica de la curva y el eje x encierra un área 1⎜⎜ ∫ f ( x)dx = 1⎟⎟ ⎝ −∞ ⎠ ( ∞ Media: EX = ∫ xf ( x)dx = μ −∞ 6. ) ∞ Varianza: E( X − μ ) = ∫ (x − μ) 2 f (x)dx = σ 2 2 −∞ Comportamientos más frecuentes en experimentos. 184 ESTADÍSTICA Y PROBABILIDADES I Áreas bajo la curva normal: Experimento: X → N ( x, μ , σ 2 ) z= X −μ σ En cualquier experimento que hagamos estaremos interesados en calcular la probabilidad de ocurrencia en el intervalo dado <a,b>: b b P(a < X < b ) = ∫ f ( X )dX = ∫ a a 1 2πσ e 1 ⎛ X −μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 dX, para cada a y b tendríamos que integrar para evitar, se utiliza la transformación Z = ( ) x−μ σ y se logra estandarizar N x, μ , σ 2 ⎛a−μ X −μ b−μ⎞ P(a < X < b ) = P⎜ < < ⎟ = P (Z 1 < Z < Z 2 ) σ σ ⎠ ⎝ σ Definimos finalmente: P(a < x < b ) = P(Z < Z 2 ) − P(Z < Z 1 ) La normal estándar N ( z;0,1) es la que mediante los métodos numéricos en integración se determinan los diferentes valores de Z y sus respectivas probabilidades que se presentan en una tabla. A continuación mostramos que su media es cero y varianza 1. 1 1 ⎛ X −μ⎞ 1 E (Z ) = E⎜ ⎟ = E ( X − μ ) = (EX − μ ) = (μ − μ ) = 0 σ σ ⎝ σ ⎠ σ 2 1 σ2 ⎛ X −μ⎞ ⎛ X −μ⎞ 2 V (Z ) = V ⎜ ⎟ = E⎜ ⎟ = 2 E(X − μ ) = 2 = 1 σ σ ⎝ σ ⎠ ⎝ σ ⎠ 185 ESTADÍSTICA Y PROBABILIDADES I LECTURA DE LA TABLA Casos que se presentan en solución de problemas relacionados con la distribución normal. Caso 1. Cuando la probabilidad se encuentra en la tabla Caso 2. Cuando la probabilidad no se encuentra en la tabla es necesario realizar una interpolación lineal. Caso 3. Cuando se nos pide determinar un número k dada una probabilidad la cual se puede o no encontrar en la tabla. Usando la normal estándar con media 0 y varianza 1: N (z,0,1) , se determina la probabilidad deseada. La lectura de la tabla se realiza de izquierda a derecha. EJERCICIOS DE APLICACIÓN Determinar las siguientes probabilidades: 1. Utilizando la definición calcular las siguientes probabilidades: a) P(Z < 1.48) 0.9306 0 b) 1.48 P(Z < −0.53) 186 ESTADÍSTICA Y PROBABILIDADES I c) P(2.45 < Z < 3.2) d) P(− 2.01 < Z < −1.05) e) P(− 1.96 < Z < 1.25) Solución: a) 0.9306 b) 0.2981 c) P(Z < 3.2) − P ( Z < 2.45) = 0.9993 − 0.9929 = 0.0064 d) P(− 2.01< Z < −1.05) = P(Z < −1.05) − P(Z − 2.01) = 0.1469− 0.0222= 0.1247 e) 2. P ( −1.96 < Z < 1.25) = P(Z < 1.25) − P(Z < −1.96) = 0.8944 − 0.0250 = 0.8694 Dada la variable x distribuida normalmente con media 8 y desviación estándar 2.5 encuentre: P ( X < 15) a) b) El valor de k tal que P( X < k ) = 0.2236 c) El valor de k tal que P ( X > k ) = 0.1814 d) P(17 < x < 21) 187 ESTADÍSTICA Y PROBABILIDADES I Solución: a) b) X → N ( X ; 18; 2.5 2 ) ⎛ X − 18 15 − 18 ⎞ P ( X < 15) = P⎜ < ⎟ 2.5 ⎠ ⎝ 2.5 = P(Z < −1.2) = 0.1151 Calcular k tal que P( X < k ) = 0.2236 ⎛ X − 18 k − 18 ⎞ < P⎜ ⎟ = 0.2236 2.5 ⎠ ⎝ 2.5 k − 18 ⎞ ⎛ P⎜Z < ⎟ = 0.2236 2.5 ⎠ ⎝ z=0.75 k − 18 = 0.2236 2.5 k = 18+2.5(-0.75) = 16.12 c) Calcular k tal que P( X > k ) = 0.1814 P( X > k ) = 1 − P( X ≤ k ) = 0.1814 P( X ≤ k ) = 1 − 0.1814 k − 18 ⎞ ⎛ P⎜ z < ⎟ = 0.8186 2.5 ⎠ ⎝ k - 18 = 0.91 2.5 k = 18 + 2.5(0.91) = 20.28 d) 21 − 18 ⎞ ⎛ 17 − 18 P(17 < X < 21) = P⎜ <z< ⎟ 2.5 ⎠ ⎝ 2.5 = P(− 0.4 < z < 1.2) = P( z < 1.2) − P( z < −0.4) = 0.8849 − 0.3446 = 0.5403 188 ESTADÍSTICA Y PROBABILIDADES I • 3. Supongamos que una población estudiantil de tamaño N=3000 tiene una media de 18 años de edad, y una desviación estándar de 2.5 años. ¿Cuántos estudiantes tienen edades entre 18 y 21 años? Tenemos la probabilidad P(17 < X < 21) = 0.5403 Número de estudiantes = 3000(0.5403) = 1620.9 Rpta: número de estudiantes = 1621 Una maquina despachadora de refrescos esta ajustada para servir un promedio de 200 ml. Por vaso. Si la cantidad de refrescos es normalmente distribuida con una desviación estándar igual a 15 ml. a) ¿Qué fracción de los vasos contendrá más de 224ml.? b) ¿Cuál es la probabilidad de que una vaso contenga entre 191 y 209 ml.? c) ¿Cuantos vasos probablemente se derramarán si se utilizan vasos de 230 ml. En los siguientes 1000 refrescos? d) ¿Por debajo de que valor se obtiene el 25% mas pequeño de los refrescos? Solución: X: V.A capacidad del vaso μ : 200 ml/vaso σ : 15 ml. a) {X > 224} ⇒ P ( X > 224 ) = 1 − P ( X ≤ 224 ) 224 − 200 ⎞ ⎛ = 1 − P⎜ z < ⎟ 15 ⎝ ⎠ = 1 − P( z < 1.6) = 1 − 0.9452 P( X > 224) = 0.0548 b) {191 < X 209 − 200 ⎞ ⎛ 191 − 200 < 209} ⇒ P(191 < X < 209 ) = P⎜ <z< ⎟ 15 15 ⎝ ⎠ = P(− 0.6 < z < 0.6 ) = P (z < 0.6 ) − P( z < −0.6 ) = 0.7257 − 0.2743 = 0.4514 189 ESTADÍSTICA Y PROBABILIDADES I c) {X > 230} ⇒ P ( X > 230 ) = 1 − P ( X ≤ 230 ) 230 − 200 ⎞ ⎛ = 1 − P⎜ z < ⎟ 15 ⎠ ⎝ = 1 − P(z < 2) = 0.0228 Número de vasos = 1000 × 0.0228 = 22.8 ≈ 23 d) Caso en que la probabilidad no se encuentra en la tabla, para ello es necesario realizar una interpolación lineal. 0.25 x k x μ = 200 {x < k } ⇒ P(x < k ) = 0.25 ⇒ P⎛⎜ z < k − 200 ⎞⎟ = 0.25 15 ⎠ ⎝ 0.25 probabilidad que no se encuentra en la tabla. -0.67 Z -0.68 0.2514 0.25 0.2483 0.2483 − 0.25 − 0.68 − z = − 0.68 − (− 0.67 ) 0.2483 − 0.2514 − 0.68 − z − 0.0017 = − 0.01 − 0.0031 ⎛ 17 ⎞ − 0.68 − z = −0.01⎜ ⎟ ⎝ 31 ⎠ z = −0.6745 190 ESTADÍSTICA Y PROBABILIDADES I k − 200 ⎞ ⎛ P⎜ z < ⎟ = 0.25 15 ⎠ ⎝ z=-0.6745 k − 200 = −0.6745 15 k = 15 × −0.6745 + 200 k = 189.88 ≈ 190ml. 4. El diámetro interno ya terminado de un anillo de pistón está normalmente distribuido con una media de 10 centímetros y una desviación estándar de 0.03 centímetros. a) ¿Qué proporción de anillos tendrá un diámetro interno que excede de 10.075 centímetros. b) ¿Cuál es la probabilidad de que un anillo de pistón tenga en diámetro interno entre 9.97 y 10.03 centímetros? c) ¿Por debajo de que valor de diámetro interno caerá el 18.5% de los anillos de pistón? Solución: X : V.A. diámetro interno del pistón μ =10cm. σ =0.03 cm. a) {X > 10.075} → P( X > 10.075) = 1 − P( X ≤ 10.075) = 1 − P(Z < 2.5) = 1 − 0.9938 = 0.0062 b) {9.97 < X < 10.03} → P(9.97 < X < 10.03) = P(−1 < z < 1) = 0.8413 − 0.1587 = 0.6826 c) La probabilidad dada 0.185 no se encuentra en la tabla hagamos una interpolación lineal para encontrar el valor k buscado. k − 10 ⎞ ⎛ P( X < k ) = 0.185 ⇒ P⎜ z < ⎟ = 0.185 0.03 ⎠ ⎝ 191 ESTADÍSTICA Y PROBABILIDADES I -0.88 Z -0.89 0.1894 0.0185 0.1867 0.185 0 x k μ = 10 x − 0.89 − z 0.1867 − 0.185 = − 0.89 − (− 0.88) 0.1867 − 0.1894 17 = −0.8963 27 k − 10 ⎞ k − 10 ⎛ P⎜ z < = −0.8963 → k = 9.973111 ≅ 9.9731 ⎟ = 0.185 ⇒ 0.03 ⎠ 0.03 ⎝ z = −0.89 − 0.01× z=0.8963 Rpta. P ( X < 9.9731) ≅ 0.185 192 ESTADÍSTICA Y PROBABILIDADES I Semana 15 ERRORES DE APROXIMACIÓN EN MEDICIONES USANDO LA DISTRIBUCIÓN NORMAL En la solución de problemas también se puede presentar error de aproximación en las mediciones. Así por ejemplo: si aproximamos a las error Centenas ± 50 Decenas ±5 Unidades ± 0.5 Décimas ± 0.05 Centésimas ± 0.005 Milésimas ± 0.0005 EJERCICIOS DE APLICACIÓN 5. Una compañía paga a sus empleados un salario promedio de $9.25 por hora con una desviación estándar de 60 centavos. Si los salarios están distribuidos aproximadamente en forma normal y los montos se cierran a centavos. a) ¿Qué porcentaje de los trabajadores reciben salarios entre $8.75 y $9.69 por hora inclusive? b) ¿el 5% por ciento más alto de los salarios por hora de empleado es mayor a que cantidad? Solución: X : V.A. salarios por hora que perciben los empleados μ =$9.25 σ =$0.60 e = ± 0.005 193 ESTADÍSTICA Y PROBABILIDADES I a) {8.75 ≤ X ≤ 9.69} → P(8.75 ≤ X ≤ 9.69) ≅ P⎛⎜ 8.75− 0.005− 9.25 < z < 9.69+ 0.005− 9.25⎞⎟ ⎝ 0.60 0.60 ⎠ ≅ P(− 0.84 < z < 0.74) = 0.7704 − 0.2005 ≅ 0.5699 → 56.99% b) P( X > k ) = 0.05 P( X > k ) = 1 − P( X ≤ k ) = 0.05 P( X ≤ k ) = 0.95 0.05 0.95 k xx k + 0.005 − 9.25 ⎞ k + 0.005 − 9.25 ⎛ = 1.645 P⎜ z < ⎟ = 0.95 ⇒ 0.60 0.60 ⎝ ⎠ 1.64 + 1.65 z= = 1.645 k = $10.232 2 ∴ P( x > 10.232 ) = 0.05 , es el salario mas alto por hora es k=10.232 6. Si un conjunto de observaciones están normalmente distribuidas, ¿Qué porcentaje de estas difiere de la media en a) Mas de 1.3 σ ? b) Menos de 0.52 σ ? Solución: X: V.A. tiene una distribución N ( x, μ , σ 2 ) a) La diferencia en valor absoluto X − μ ; P( X − μ > 1.3σ ); P( X − μ < 0.52σ ) P( X − μ > 1.3σ ) = 1 − P( X − μ < 1.3σ ) z−μ ⎛ ⎞ = 1 − P⎜ − 1.3 < < 1.3 ⎟ σ ⎝ ⎠ = 1 − P(− 1.3 < z < 1.3) = 1 − (0.9032 − 0.0968) = 0.1936 ∴ P( x − μ > 1.3σ ) = 19.36% 194 ESTADÍSTICA Y PROBABILIDADES I b) P ( X − μ < 0.52σ ) = P (− 0.52 < z < 0.52 ) = 0.6985 − 0.3015 = 0.3970 P ( X − μ < 0.52σ ) = 39.70% 7. La resistencia a la tensión de cierto componente metálico está normalmente distribuida con una media de 10000 kilogramo por centímetro cuadrado y una desviación estándar de 100 kilogramos por centímetro cuadrado. Las mediciones se registran y se redondean a 50 kilogramos. a) ¿Cuál es la proporción de estos componentes que exceden de 10150 kilogramos por centímetro cuadrado de resistencia a la fusión? b) Si las especificaciones requieren que todos los componentes tengan una resistencia a la tensión entre 9800 y 10200 kilogramos por centímetro cuadrado inclusive, ¿qué proporción de piezas se esperaría que se desecharan? Solución: X: V.A. resistencia a la tensión μ = 10000 Kg/cm2 σ =100 kg/cm2 Como las mediciones se redondean a los 50 kg/cm2 el error 50 e=± = ±25 2 {X > 1050} → P( X > 1050) = 1 − P( X ≤ 1050) a) 1050 + 25 − 10000 ⎞ ⎛ ≅ −1 − P⎜ z < ⎟ 100 ⎝ ⎠ ≅ 1 − P ( z < 1.75) ≅ 1 − 0.9599 P ( X > 1050 ) ≅ 0.0401 195 ESTADÍSTICA Y PROBABILIDADES I b) {9800≤ X ≤ 10200} → P(9800≤ X ≤ 10200) ≅ P⎛⎜ 9800− 25−1000< z < 10200+ 25−10000⎞⎟ 100 ⎝ 100 ≅ P(− 2.25 < z < 2.25) ≅ 0.9878 − 0.0122 ≅ 0.9756 Se espera que desechen: 1 − 0.9756 = 0.0244 → 2.44% PROPIEDADES IMPORTANTES: 1. 2. ( ) Por ser continua la distribución normal: N X , μ , σ 2 se cumple que: P(a < X < b ) = P(a ≤ X ≤ b ) = P(a < X ≤ b ) = P(a ≤ X ≤ b ) Se justifica por que la probabilidad en punto es cero, NO OCURRIENDO así en el caso discreto. P( X − μ < σ ) = 0.6826 indica que los datos se alejan de la media una desviación estándar. P( X − μ < 2σ ) = 0.9544 indica que los datos se alejan de la media dos desv. est. P ( X − μ < 3σ ) = 0.9974 indica que los datos se alejan de la media tres 3. 4. dev. est. Es poco común observar un valor de una población normal que se encuentre mas lejos de 2 desviaciones estándar de μ . Estos resultados serán importantes en el desarrollo de procedimientos de prueba de hipótesis. Los resultados que observamos en 2 con frecuencia se reporta en forma de porcentaje y se conocen como la regla empírica (la evidencia empírica ha mostrado que varios histogramas de datos reales pueden ser aproximados por curvas normales) Si la distribución en la población de una variable es (aproximadamente) normal, entonces. a) Alrededor de 68% de los valores están dentro de 1 desv. est. De la media. b) Alrededor de 95% de los valores están dentro de 2 desv. est. De la media. c) Alrededor de 99.7% de los valores están dentro de 3 desv. est. De la media. 196 ⎠ ESTADÍSTICA Y PROBABILIDADES I APROXIMACIÓN DE LA DISTRIBUCIÓN NORMAL A LA BINOMIAL Las probabilidades que se asocian con experimentos binomiales pueden obtenerse fácilmente cuando n es pequeña de la fórmula b(x, n, p). Si n es grande, es conveniente calcular las probabilidades binomiales por procedimientos de aproximación. La distribución binomial se aproxima bastante bien con la normal en problemas prácticos cuando la distribución discreta tiene forma de campana. Planteamos luego un teorema que permite utilizar áreas bajo la curva normal para aproximar propiedades binomiales cuando n es suficientemente grande. TEOREMA.- si X es una variable aleatoria binomial con media μ = np , varianza σ 2 = nqp, entonces la forma límite de la distribución de: x − np z= cuando n → ∞ es la normal estándar N (z ,0,1) npq • La aproximación a la normal es buena para resolver probabilidades binomiales siempre que p no este cercano a 0 o 1. La aproximación es excelente cuando n es grande y bastante buena para valores pequeños de n, si p esta razonablemente cercana a ½. Una guía para aplicar cuando puede utilizarse la aproximación normal es tener en cuenta que np o nq sean mayores o iguales a 5. • Para realizar la aproximación es necesario usar el factor corrección ± 0 .5 . 197 ESTADÍSTICA Y PROBABILIDADES I Los puntos medios son las marcas de clase del histograma, pasando la curva aproximadamente por los puntos medios de la parte superior de los rectángulos. EJERCICIOS DE APLICACIÓN 1. Supongamos que tenemos β (x,15,0.4) es decir es un experimento en donde n=15 y p=0.4 y consideremos que el número de éxitos varia entre 7 y 9 inclusive, se pide calcular la probabilidad. a) En forma exacta b) En forma aproximada Solución: X: V.A. sique una distribución binomial. μ =np=15(0.4)=6 σ = 15 × 0.4 × 0.6 = 1.897 a) 9 Valor exacto P(7 ≤ x ≤ 9) = ∑ β ( x,15,0.4 ) = P(7 ) + P(8) + P(9) x =7 ⎛15 ⎞ P(7 ) = ⎜⎜ ⎟⎟0.4 7 × 0.6 8 = 0.1771 ⎝7 ⎠ ⎛15 ⎞ P(8) = ⎜⎜ ⎟⎟0.48 × 0.67 = 0.1181 ⎝8 ⎠ 198 ESTADÍSTICA Y PROBABILIDADES I ⎛15 ⎞ P ( 9 ) = ⎜ ⎟ 0.49 × 0.66 = 0.0612 ⎝9 ⎠ P ( 7 ≤ x ≤ 9 ) = 0.3564 b) Valor aproximado, continuidad 0.5 {7 ≤ X usamos el factor de corrección por 9 + 0.5 − 6 ⎞ ⎛ 7 − 0.5 − 6 ≤ 9} → P(7 ≤ X ≤ 9) = P⎜ <z< ⎟ 1.897 ⎠ ⎝ 1.897 9.5 − 6 ⎞ ⎛ 6.5 − 6 ≅ P⎜ <z< ⎟ 1.897 ⎠ ⎝ 1.897 ≅ P(0.26 < z < 1.85) P (7 ≤ X ≤ 9) ≅ 0.3652 Como observamos, la aproximación de la curva normal proporciona un valor muy cercano al valor exacto de 0.3564. El grado de precisión, el cual depende también de que la curva concuerde con el histograma, se incrementará conforme n aumenta. 2. Una moneda se lanza 400 veces. Utilice la aproximación de la curva normal para encontrar la probabilidad de obtener: a) Entre 185 y 210 caras inclusive; b) Exactamente 205 caras; c) Menos de 176 o más de 227 caras. 199 ESTADÍSTICA Y PROBABILIDADES I Solución: X: V.A. de que salga cara p = 1/ 2 n = 400 μ = np = 400(1 / 2) = 200 σ = 400 × 1 / 2 × 1 / 2 = 10 210 − 200 + 0.5 ⎞ ⎛ 185 − 200 − 0.5 ≤ 210} ⇒ p⎜ <Z< ⎟ 10 10 ⎝ ⎠ P(− 1.55 < z < 1.05) = P( z < 1.05) − P( z < −1.55) = 0.8531 − 0.0606 P(− 1.55 < z < 1.05) = 0.7925 a) {185 ≤ X b) { X = 205} ⇒ P ( X = 205) = P ⎛⎜ c) { X < 176} ó { X > 227} ⇒ {P ( X < 176 ) ∪ ( X > 227 )} ⇒ P ( X < 176 ) + P ( X > 227 ) 205 − 0.5 − 200 205 + 0.5 − 200 ⎞ <z< ⎟ 10 10 ⎝ ⎠ P(0.45 < z < 0.55) = P( z < 0.55) − P( z < 0.45) = 0.7088 − 0.6736 P(0.45 < z < 0.55) = 0.0352 176 − 200 − 0.5 ⎞ ⎛ P( X < 176) = P⎜ z < ⎟ = P( z < −2.45) 10 ⎝ ⎠ P( X < 176) = 0.0071 227 − 200 + 0.5 ⎞ ⎛ P( X > 227 ) = 1 − P⎜ z < ⎟ = 1 − P( z < 2.75) = 1 − 0.9970 10 ⎠ ⎝ P( X > 227 ) = 0.0030 ⇒ P( X < 176) + P( X > 227 ) = 0.0071 + 0.0030 = 0.0101 3. Un sexto de los estudiantes que entran a una gran escuela del estado proviene de otros estados. Si los estudiantes se asignan aleatoriamente a los dormitorios, 180 en un edificio, ¿cuál es la probabilidad de que en un dormitorio determinado al menos una quinta parte de los estudiantes sea de otros estados? Solución: • X: V.A que los estudiantes sean de otro estado 1 • P= estudiantes de otros estados 6 • n = 180 dormitorios 200 ESTADÍSTICA Y PROBABILIDADES I • • 1 = 30 6 1 5 σ = npq = 180 × × = 5 6 6 μ = np = 180 × Al menos la quinta parte son de otros estados: {X ≥ 36} → P( X ≥ 36) = 1 − P( X < 36) 1 × 180 = 36, luego 5 36 − 0.5 − 30 ⎞ ⎛ ≅ 1 - P⎜ z < ⎟ 5 ⎝ ⎠ ≅ 1 − P( z < 1.1) ≅ 1 − 0.08643 P( X ≥ 36 ) = 0.1357 4. Un fabricante de medicamentos sostiene que cierta medicina cura una enfermedad de la sangre en el 80% de los casos. Para verificarlo los inspectores del gobierno utilizan el medicamento en una muestra de 100 individuos y deciden aceptar dicha afirmación si se curan 75 o más. a) ¿Cuál es la probabilidad de lo que se dice sea rechazado cuando la probabilidad de curación sea en efecto 0.80? b) ¿Cuál es la probabilidad de que la afirmación, sea aceptada por el gobierno cuando la probabilidad de curación sea menor cuando la probabilidad es 0.7? Solución: X: V.A curación de la medicina a una enfermedad p=0.8 n=100 a) μ = np = 100(0.8) = 80 σ = 100 × 0.8 × 0.2 = 4 Por uso del enunciado evento que sea rechazada {X < 75} → P( X < 75) = P⎛⎜ z < 75 − 0.5 − 80 ⎞⎟ 4 ⎝ ⎠ ≅ P(z < −1.38) ≅ 0.0838 201 ESTADÍSTICA Y PROBABILIDADES I b) P=0.7 n=100 μ = np = 100(0.70) = 70 σ = 100 × 0.70 × 0.30 = 4.58 Según enunciado sea aceptada la medicina con p=0.7 {X < 75} ∪ {z ≥ 75} → P(( X < 75) ∪ ( X ≥ 75))P(s ) P( X < 75) + P( X ≥ 75) = 1 P( X ≥ 75) = 1 − P( X < 75) ⎛ z < 75 - 0.5 - 70 ⎞ ≅ 1 - P⎜ ⎟ 4.58 ⎠ ⎝ ≅ 1 - P(z < 0.98) ≅ 1 − 0.8365 P( X ≥ 75) ≅ 0.1635 DISTRIBUCIÓN WEIBULL INTRODUCCIÓN Como acabamos de estudiar la distribución normal puede utilizarse para resolver muchos problemas de ingeniería y ciencia, pero existen numerosas situaciones que requieren diferentes tipos de funciones de densidad entre ellas las distribuciones gamma y exponencial. La distribución exponencial es un caso especial de distribución gamma. Ambas tienen un sin número de aplicaciones por ejemplo ambas juegan un papel importante en la teoría de colas, problemas de confiabilidad. El tiempo entre las llegadas en las instalaciones de servicio, el tiempo de falla de los componentes y sistemas eléctricos frecuentemente involucra la distribución exponencial. Como vemos la relación entre ellas es muy importante. En la actualidad con el avance tecnológico se permite diseñar muchos sistemas complicadas cuya operación, o tal vez seguridad depende de la confiabilidad de los diversos componentes que conforman el sistema. Por ejemplo un fusible puede dañarse, una columna de acero puede doblarse o un dispositivo sensor de calor puede fallar. Idénticos componentes sujetos a idénticas condiciones ambientales fallan en diferentes e impredecibles tiempos. Se ha comentado la importancia de las distribuciones gamma y exponencial que tienen en la estadística como herramientas a solucionar, tipos más específicos de problemas en ingeniería. 202 ESTADÍSTICA Y PROBABILIDADES I Otra distribución que se ha utilizado extensamente en años recientes para tratar tales problemas es la DISTRIBUCIÓN WEIBULL introducida por el físico sueco Waloddi Weibull en 1939. Distribución Weibull.- La variable aleatoria continua X tiene una distribución Weibull con parámetros α y β, si su función de densidad es: ⎧⎪αβ x β −1e −α x f ( x) = ⎨ ⎪⎩0 β x>0 , cualquier otro caso Donde α > 0 y β>0 Si consideramos α=1 y β = 1, 2, 3 logramos diferentes gráficos (β puede tomar otros valores) con β = 1, f(x) es una exponecial. β = 2 y β = 3 las figuras requieren una forma acampanada mostrando cierta asimetría. Como a toda función de densidad de probabilidad la caracteriza su media varianza. Determinemos su media por ejemplo: 00 μ = E ( X ) = ∫ xαβ x β −1e −α x 0 203 β ESTADÍSTICA Y PROBABILIDADES I Hagamos un cambio de variable U = αxβ, obtenemos: ∞ ⎛ 0 ⎝ μ = α −1/ β × ∫ U 1/ β e −U dU = α −1/ β Γ ⎜1 + 1⎞ β ⎟⎠ ∞ ⎛ 1⎞ Γ⎜⎜1 + ⎟⎟ = ∫ U −1 / β e −U du es la función gamma. 0 ⎝ β⎠ Luego, μ=α-1/β Γ (1 + 1/β) Empleando un método similar podemos la varianza que está por: σ =α 2 −2 / β 2 ⎧⎪ ⎛ 2⎞ ⎡ ⎛ 1 ⎞⎤ ⎫⎪ ⎨Γ⎜⎜1 + ⎟⎟ − ⎢Γ⎜⎜1 + ⎟⎟⎥ ⎬ ⎪⎩ ⎝ β ⎠ ⎣ ⎝ β ⎠⎦ ⎪⎭ EJERCICIOS DE APLICACIÓN • Supóngase que la vida útil de cierta clase de batería (en horas) es una variable aleatoria que tiene distribución de Weibull con α = 0.1 y β = 0.5. Calcúlese. a) La vida útil promedio de esta batería. b) La probabilidad de que la batería dure más de 300 horas. Solución: X : V.A. tiempo de vida a) Sustituyendo en la fórmula de la media, obtenemos: μ= (0,1)-2 Γ(3) = 200 horas b) P(X > 300) = • ∞ ∫ (0.05)x 300 − 0.5 − 0.1 x 0.5 e 0.5 dx = e −0.1( 300 ) = 0.177 Se demuestra que la función de la tasa de fallas está dada por Z(t) = αβtβ - 1 , t > 0 Si y solo si la distribución del tiempo para la falla es la distribución de Weibull. β f(t) = αβ t β -1e −α t , t > 0 204 ESTADÍSTICA Y PROBABILIDADES I Si consideramos β = 1 Z(t) constante Si β = 2 Si β = 3 si β > 1 Z creciente si 0 < β < 1 Z decreciente Z(t) es una lineal Z(t) es una cuadrática OBSERVACIÓN.- La distribución de Weibull representa un modelo apropiado para una ley de falla siempre que el sistema esté compuesto por cierto número de componentes y la falla se deba principalmente al defecto “mas grave” en un gran número de defectos del sistema. También utilizando la distribución de Weibull, podemos obtener una tasa de falla creciente y decreciente al hacer simplemente una elección apropiada del parámetro β. EJERCICIOS PROPUESTOS I. VARIABLES ALEATORIAS DISCRETAS 1. En un problema de una prueba aplicada a niños pequeños, se les pide que hagan corresponder cada uno de los tres dibujos de animales con la palabra que identifica al animal respectivo. Si un niño asigna aleatoriamente las tres palabras a los tres dibujos, encuentre la distribución de probabilidad para X el número de correspondencias correctas. 2. Suponga que se ha cargado un dado de modo que la probabilidad de que salga un número determinado es proporcional al mismo. Calcular las probabilidades de los eventos de un solo elemento y usarlas para calcular la probabilidad de ocurrencia de a) Un número par b) Un número mayor que cuatro 3. Los registros de una compañía de seguros de automóviles dan la siguiente información sobre accidentes; la probabilidad de que un 205 ESTADÍSTICA Y PROBABILIDADES I conductor asegurado tenga un accidente automovilístico es de 0.15. Si ocurre un accidente, el daño al vehículo es 20% de su valor en el mercado con probabilidad 0.80; 60% de su valor con probabilidad 0.12 y una perdida total con probabilidad 0.08. ¿Qué prima debe cobrar la compañía por un automovil de cuatro mil nuevos soles para que la ganancia esperada de la compañía sea cero? 4. ¿Cuáles de las funciones siguientes son distribuciones de probabilidad discretas? ⎧1 ⎪3 , X = 0 ⎪ ⎪2 a) p( X ) = ⎨ , X =1 3 ⎪ ⎪0 , para las demas X ⎪ ⎩ ⎧⎛ 5 ⎞⎛ 2 ⎞ X ⎛ 1 ⎞ 5− X ⎪⎜ ⎟⎜ ⎟ ⎜ ⎟ X = 0,1,2,3,4,5 b) p( X ) = ⎨⎜⎝ X ⎟⎠⎝ 3 ⎠ ⎝ 3 ⎠ ⎪ Para las demas X ⎩0 5. Si llueve, un vendedor de paraguas gana $30 al día, sino no llueve, pierde $6 al día. ¿Cuál es su esperanza matemática si la probabilidad de lluvia es de 0.3? 6. Supóngase que se realiza una sucesión de lanzamiento independientes con una moneda para la cual la probabilidad de obtener una cara en cualquiera de los lanzamientos es de 1/30 a) ¿Cuál es el número esperado de lanzamiento que se necesitaran para obtener 5 caras? b) ¿Cuál es la varianza del número de lanzamientos que se necesitaran para obtener 5 caras? 7. El gerente de un almacén de ropa para caballeros está interesado en el inventario de trajes, que en ese momento es de 30. El número de trajes vendidos a partir de este momento hasta el final de la temporada se distribuye como: ⎧ e −20 20 X ⎪ x = 0, 1,2,…,30 p( X ) = ⎨ x! ⎪ 0 Para todas las demás ⎩ 206 ESTADÍSTICA Y PROBABILIDADES I Encuentre la probabilidad de que le queden trajes sin vender al final de la temporada. 8. De una urna contiene 9 canicas de color azul y 3 de color negro, se extraen 8 sin reemplazo. Encontrar la probabilidad de obtener x canicas de color azul. 9. Supóngase que una urna contiene 7 bolas de color rojo y 3 de color azul. Si se selecciona 5 bolas aleatoriamente y sin reemplazo determine la función de la densidad del número de bolas de color rojo, que se obtienen. 10. Una variable aleatoria X puede tomar 4 valores con probabilidades ⎛⎜ 1 + 3x ⎞⎟⎠ ⎛⎜⎝1 − x ⎞⎟⎠ ⎛⎜⎝1 + 2x ⎞⎟⎠ ⎛⎜⎝1 − 4x ⎞⎟⎠ ⎝ ¿Para qué valores de X es esta una ; ; ; 4 4 4 4 distribución de probabilidades? DISTRIBUCIÓN BINOMIAL 11. Un ingeniero de control de tráfico informa que 75% de los vehículos que pasan por un punto de verificación tienen matrículas del estado. ¿Cuál es la probabilidad de que más de cuatro de los siguientes nueve vehículos no sean del estado? 12. Supóngase que la probabilidad de que una partícula emitida por un material radioactivo penetre en cierto campo es de 0.01. Si se emiten 10 partículas, ¿Cuál es la probabilidad de que sólo una de ellas penetre en el campo? 13. Entre personas que donan sangre a una clínica, 80% tiene Rh+; es decir tienen el factor Rhesus en la sangre. Cinco personas donan sangre en la clínica un día determinado. a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor Rh. b) Calcular la probabilidad de que cuando mucho cuatro de las cinco tengan sangre Rh+. 14. Un complejo sistema electrónico está construido con cierto número de componentes de apoyo en sus subsistencias. Un subsistema contiene cuatro componentes idénticos, cada uno con una probabilidad de 0.2 de fallar en menos de mil horas. El subsistema 207 ESTADÍSTICA Y PROBABILIDADES I funciona si dos o más componentes cualesquiera de los cuatro trabajan en forma adecuada. Además, se supone que los componentes operan de forma independiente. a) Encuentre la probabilidad de que exactamente dos de cuatro componentes resistan más de mil hora. b) Encuentre la probabilidad de que el sistema funcione por más de mil horas. 15. Un ingeniero de control de calidad inspecciona una muestra aleatoria de tres acumuladores de cada lote de 24 que están listos para ser embarcados. Si un lote contiene seis acumuladores con pequeños defectos. ¿Cuáles son las probabilidades de que la muestra del inspector: a) No contenga ninguna batería con defectos? b) Contenga sólo una batería defectuosa? c) Contenga al menos dos de las baterías con defectos leves? 16. Considérese que 50% de los empleados de una gran compañía están casados. Sea X el # de empleados casados. En una muestra aleatoria de 100 empleados, obténgase la media y la desviación típica de X. 17. Un empresa vende 4 artículos seleccionados al azar entre un lote grande del que se sabe que contiene 10% de piezas defectuosas. Sea X el # de piezas defectuosas de entre las 4 que se vendieron. El comprador del articulo regresa las piezas defectuosas para su reparación y el costo de la reparación es C=3X2+X+2 Calcular el costo de reparación esperado. 18. En un gran lote de bombas usadas, 20% no sirven y necesitan ser reparadas. Se manda a un mecánico con tres juegos, de refacciones, quien selecciona bombas al azar y las prueba una tras otra. Si funciona una bomba, prosigue con la siguiente; si no funciona, le instala uno de sus juegos de refacciones. Supóngase que tarda 10 minutos en probar si una bomba funciona o no, y 30 en probar una que no funciona. Calcular el valor esperado y la varianza del tiempo total que le llevara terminar con sus tres juegos. 19. Un vendedor de radios y televisores otorga créditos a sus clientes. Suponer que con anterioridad 10% de todos los deudores no pagaron y que el vendedor tuvo que absorber la perdida de cada venta; el 90% restante paga todos sus créditos y el vendedor tuvo una utilidad en 208 ESTADÍSTICA Y PROBABILIDADES I esas ventas. Suponer que ese vendedor tiene 10 televisores idénticos que va a vender individuadme e independientemente a crédito a 10 personas. Si el comprador no paga, la perdida es de $200; si el comprador paga, entonces su utilidad es de $100. a) ¿Cuál es la distribución del monto de la ganancia obtenida en esas 10 ventas? b) Cual es su ganancia esperada en esas 10 ventas? 20. Suponga que el gerente de una compañía manufacturera considera que tres de cada 10 personas que lean su folleto de los nuevos automóviles compraran uno en una de las distribuidoras. Si se selecciona aleatoriamente cinco personas que hayan leído el folleto, ¿cual es la probabilidad de que: a) Ninguna compre un auto? b) Las 5 compren un auto? c) Cuando mucho 3 compren uno? d) Al menos 3 compren uno? DISTRIBUCIONES DE POISSON 21. Un distribuidor vende semillas de cierta clase de tulipán rojo en paquetes de mil y sabe, por experiencia, que casi 1% de un gran número de semillas no serán de la clase deseada. ¿Cuál es la probabilidad de que un paquete dado contenga más de 1% de semillas de otra clase? 22. Un estacionamiento tiene dos entradas. Los automóviles llegan a la entrada I de acuerdo con una distribución de Poisson de tres por hora, y a la entrada II de acuerdo con una distribución de Poisson con una media de cuatro por hora. ¿Cuál es la probabilidad de que tres automóviles lleguen al estacionamiento durante una hora dada? (Se supone que el número de autos que llegan a las dos entradas son independientes) 23. Suponga que en promedio una de cada mil personas comete un error numérico al preparar su declaración de impuestos. Si se seleccionan al azar 10000 formas, encuentre la probabilidad de que seis, siete u ocho tengan error. 209 ESTADÍSTICA Y PROBABILIDADES I 24. El número de rayos gamma que emite por segundo cierta sustancia radiactiva es una variable aleatoria que tiene distribución de Poisson con λ = 5.8 . Si un detector deja de operar cuando hay mas de 12 rayos por segundo, cuál es la probabilidad de que este instrumento deje de funcionar durante un segundo cualquiera? 25. El arribo de camiones de carga a un muelle es un proceso de Poisson, con una tasa promedio de llegadas de dos por hora. Los camiones se descargan con un tasa promedio de tres por hora y el servicio de descarga continua ininterrumpidamente hasta que todos los camiones han sido descargados. a) ¿Cuál es el número promedio de camiones a los que se está descargando o que esperan ser descargados? b) ¿Cuál es el número promedio de camiones en la fila? c) ¿Cuál es el tiempo promedio que un camión debe esperar en la fila? d) ¿Cuál es la probabilidad de que no haya camiones en espera de ser descargados? 26. El número de llamadas telefónicas que entra a una central de edificio de oficinas es de cuatro por minuto en promedio. a) Calcular la probabilidad de que no lleguen llamadas en un determinado periodo de un minuto. b) Calcular la probabilidad de que por lo menos lleguen cuatro llamadas en un periodo de un minuto. c) Calcular la probabilidad de que por lo menos lleguen dos llamadas en un periodo determinado de dos minutos. 27. Se certifica la calidad de los discos para computadora pasándose por un certificador que cuenta el número de pulsos faltantes. Una determinada marca de discos para computadora tiene en promedio 0,1 pulsos faltantes por disco. a) Calcular la probabilidad de que al siguiente disco que se inspeccione no le falten pulsos. b) Calcular la probabilidad de que al siguiente disco que se inspeccione le falte más de un pulso. c) Calcular la probabilidad de que a ninguno de los discos inspeccionados le falten pulsos. 28. En un sistema de cómputo de tiempo compartido, el número de peticiones de telepuerto es de 0.2 por milisegundo, en promedio, y sigue una distribución de Poisson. 210 ESTADÍSTICA Y PROBABILIDADES I a) Calcular la probabilidad de que no lleguen peticiones durante el siguiente milisegundo. b) Calcular la probabilidad de que no lleguen peticiones durante los tres siguientes milisegundos. 29. Se ha observado en forma empírica que las muertes ocasionadas por accidentes de tráfico ocurren a razón de ocho por hora en los largos fines de semana feriados. En el supuesto de que estas muertes ocurren en forma independiente, calcular la probabilidad de que: a) Transcurra una hora sin que haya muertes. b) Transcurra un período de 15 minutos sin muertes. c) Transcurran cuatro períodos consecutivos, que no se traslapen, sin que hayan muertes. 30. Una panadería hace galletas con pedacitos de chocolate; un lote tiene mil galletas. Se agregan tres mil pedacitos de chocolate a la masa para un lote y se mezcla bien toda la masa. Si se elige al azar una galleta de un lote, a) ¿Cuál es la probabilidad de que no contenga ningún pedacito de chocolate? b) ¿Cuál es la probabilidad de que contenga tres pedacitos? c) ¿Cuántas galletas con un solo pedacito de chocolate podría haber en un lote? 31. En un restaurante preparan una ensalada que contiene en promedio cinco verduras diferentes. Encuentre la probabilidad de que la ensalada contenga más de cinco verduras. a) En un día determinado. b) En tres de los siguientes cuatro días. c) Por primera vez el cinco de abril. 32. Suponga que en promedio una de cada mil personas comete un error numérico al preparar su declaración de impuestos. Si se seleccionan al azar 10 mil formas y se examinan, encuentre la media y la varianza de la variable aleatoria x que representa el número de personas de entre 10 mil que comenten un error al preparar su declaración de impuestos. 33. La probabilidad de que un estudiante presente problemas de escoliosis (desviación lateral sufrida por la columna vertebral) en una escuela de 211 ESTADÍSTICA Y PROBABILIDADES I la localidad es de 0.004. De los siguientes 1875 estudiantes revisados, encuentre la probabilidad de que a) menos de 5 presenten este problema b) 8 , 9 o 10 presenten este problema 34. Suponga que 3% de los pernos hechos por una maquina son defectuosos y que aparece al azar durante la producción. Si se empaquetan 50 pernos por caja ¿cual es la aproximación de Poisson para la probabilidad de que cierta caja contenga k pernos defectuosos? 35. Se estima que el · de automóviles que pasa por un cruce particular por hora es de 25. Obtenga la probabilidad de que menos de 10 vehículos crucen durante cualquier intervalo de una hora suponga que el número de vehículos sigue una distribución de Poisson. II. VARIABLE ALEATORIA CONTINUA 1. ¿Qué valor debe tomar la constante k para que? 0≤ X ≤2 ⎧kX f (X ) = ⎨ para las demas X ⎩0 sea una función de densidad 2. Supóngase que la función de densidad de una variable aleatoria X es la siguiente: ⎧1 0≤ X ≤4 ⎪ X f ( X ) = ⎨8 ⎪⎩0 para las demas X a) Calcular el valor t tal que p( X ≤ t ) = 0.25 b) Calcular el valor t tal que p( X ≥ t ) = 0.25 3. Sea f(X) la función de densidad de una variable aleatoria X dada por: ⎧1 2 −3≤ X ≤ 3 ⎪ 9− X f ( X ) = ⎨ 36 ⎪⎩0 para las demas X ( a) b) c) ) P( X < 0) P(− 1 ≤ X ≤ 1) P( X > 2) 212 ESTADÍSTICA Y PROBABILIDADES I 4. El tiempo de vida útil, en días, de los frascos de cierto medicamento es una variable aleatoria que tiene la densidad: ⎧ 20000 X >0 ⎪ f ( X ) = ⎨ ( x + 100 )3 ⎪0 para las demas X ⎩ Encuentre la probabilidad de que un frasco de este medicamento tenga una vida útil de: a) Al menos 200 días. b) Cualquier duración entre 80 y 120 días. 5. La humedad relativa X, medida en cierto lugar, tiene una función de densidad de probabilidad dada por: ⎧cX 3 (1 - X ) 0 ≤ X ≤1 f (X ) = ⎨ para las demas X ⎩0 2 Encontrar el valor c que hace de f(X) una función de densidad. 6. Suponga que la variable aleatoria X tiene una función de densidad de probabilidad dada por: ⎧cxe − x / 2 , x>0 f (X ) = ⎨ para las demas X ⎩0 Encuentre el valor de c que hace de f(x) una función de densidad. 7. Supóngase que el error de fase de un dispositivo de rastreo tenga la siguiente densidad de probabilidad. π ⎧ 0< X < ⎪cos X f (X ) = ⎨ 2 ⎪⎩0 para las demas X Calcúlese la probabilidad de que el error de esta fase esté: a) Entre 0 y π 4 b) Mayor que π 3 213 ESTADÍSTICA Y PROBABILIDADES I 8. En cierta ciudad el consumo diario de energía eléctrica (millones de kilowatts-hora) es una variable aleatoria con densidad de probabilidad ⎧ 1 3 - 20x X >0 ⎪ X e f ( X ) = ⎨9 ⎪0 para las demas X ⎩ Si planta de energía de ciudad tiene una capacidad de 12 millones de kilowatts-hora, ¿cuál es la probabilidad de que el abastecimiento de energía sea inadecuado en un día cualquiera? 9. Por experiencia, el señor Arenas sabe que el precio más bajo de una obra de construcción puede considerarse como una variable aleatoria que tiene densidad uniforme: 2c ⎧3 < X < 2c ⎪ f ( X ) = ⎨ 4c 3 ⎪⎩0 para las demas X Donde c es su propia estimación del costo de la obra. ¿Qué porcentaje debe agregar el señor Arenas a su costo cuando presente ofertas a fin de maximizar su utilidad esperada? 1 se llama distribución de π 1+ x 2 Cauchy, la que fue introducida por Cauchy en 1853. Probar que esta distribución no tiene media. 10. La distribución de densidad f (x) = ( ) 11. Se X una variable con la siguiente función de distribución acumulativa ⎧0 ⎪X ⎪ ⎪8 F(X ) = ⎨ 2 ⎪X ⎪ 16 ⎪1 ⎩ X ≤0 0<X<2 2< X ≤4 X >4 a) obtener la función de densidad para x b) calcular p(1≤x≤3) c) calcular p(x≤1.5) 214 ESTADÍSTICA Y PROBABILIDADES I 12. Calcular a de modo que la función X ≤1 ⎧0 ⎪ 1⎞ ⎪ ⎛ F ( X ) = ⎨2 ⎜1 − ⎟ 1 < X ≤ a ⎪ ⎝ X⎠ ⎪⎩1 X >a Es una función de densidad acumulativa. Calcular p (− 1 ≤ X ≤ 1.5) 13. El tiempo de espera en horas, que tarda un radar en detectar 2 conductores sucesivos a alta velocidad es una variable aleatoria continua con una distribución acumulativa X <0 ⎧0 F(X ) = ⎨ −8 X X ≥0 ⎩1 − e Encuentre la probabilidad de esperar menos de 12 minutos entre dos conductores sucesivos. 14. Un autómata produce balines con diámetro X (en centímetros9. El diámetro X es una variable aleatoria con función de densidad 0.4 ≤ X ≤ 0.6 ⎧5 f (X ) = ⎨ Para las demas X ⎩0 Calcular el valor esperado del volumen de los balines. 15. El contenido de magnesio de una aleación es una variable aleatoria, dado por la siguiente función de densidad de probabilidad ⎧1 0≤ X ≤6 ⎪ f ( X ) = ⎨18 ⎪⎩0 Para las demas X La utilidad que se obtiene de esta aleación es p = 10 + 2 X a) Determine la distribución de probabilidades de p. b) ¿Cuál es la utilidad esperada? DISTRIBUCIÓN UNIFORME 16. El precio por inauguración de determinado tipo de mercancías se 1⎤ ⎡ 3 distribuye de manera uniforme en el intervalo ⎢35 ,44 ⎥ . 4⎦ ⎣ 4 215 ESTADÍSTICA Y PROBABILIDADES I a) ¿Cuál es la probabilidad de que algún día este precio sea menor que 40? b) ¿Cuál es la probabilidad de que algún día este precio sea entre 40 y 42? 17. La variable aleatoria X se distribuye uniformemente en (0,2). Obtenga la distribución de la variable aleatoria Y = 5 + 2 X 18. La variable aleatoria X esta distribuida uniformemente en (0,2) y la variable aleatoria Y tiene distribución exponencial con parámetro λ. Encontrar λ tal que P(X<1) = P(Y<1). 19. La cantidad diaria en litros de café despachada por una maquina ubicada en la sala de espera de un aeropuerto es una variable aleatoria X, la que tiene una distribución uniforme continua con a = 7 y b = 10. Encuentre la probabilidad de que en un determinado día la cantidad de café despachada por esta maquina sea: a) Cuando mucho 8.8 litros b) Mas de 7.4 litros, pero menos de 9.5 c) Al menos 8.5 litros 20. Una corriente eléctrica I fluctuante puede considerarse como una variable aleatoria distribuida uniformemente en el intervalo (9,11). Si esta corriente pasa por una resistencia de 2 ohm, encontrar la función de densidad de la potencia: P = 2I2. DISTRIBUCIÓN EXPONENCIAL 21. Se estima que el tiempo transcurrido hasta la falla del cinescopio de un televisor se distribuye exponencialmente con media de tres años. Una compañía ofrece garantía por el primer año en uso. ¿Qué porcentaje de las pólizas tendrá que pagar una reclamación? 22. En una investigación sismológica se observo que hay una relación Y=cex entre la intensidad de las vibraciones en un lugar de la tierra y la intensidad de los terremotos x en un epicentro, donde c depende de la distancia entre dicho lugar y el epicentro. Supongamos que x es una variable aleatoria con distribución exponencial por ⎧λe − λX X > 0. f (X ) = ⎨ Para las demas X ⎩0 216 ESTADÍSTICA Y PROBABILIDADES I Calcular la función de distribución acumulativa de variable Y. 23. La duración ( en horas) x de cierto componente electrónico es una variable aleatoria con la unción de densidad X ⎧ 1 -100 e X >0 ⎪ f ( X ) = ⎨100 ⎪0 Para las demas X ⎩ Tres de estos componentes trabajan independientes en una pieza de un equipo. El equipo falla si al menos 2 de los componentes fallan. Encuentre la probabilidad de que el equipo funcione al menos durante 200 horas sin fallar. 24. Un fabricante de un monitor de televisión comercial garantiza el cinescopio o tubo de imagen por un año (8760 horas).los monitores empleados en terminales de aeropuerto para programas de vuelo, están encendidos continuamente. La vida media de los tubos es de 20000 horas y siguen una densidad de tiempo exponencial. El costo de fabricación, venta y entrega para el fabricante es de $300 y el monitor se vende en el mercado en $400. Reemplazar un tubo que falla cuesta $150, incluyendo materiales y mano de obra. El fabricante no tiene obligación de sustituir el tubo si ya hubo una primera sustitución. ¿Cuál es la utilidad esperada del fabricante? 25. El kilometraje (en miles de kilómetros) que alcanzan los automovilistas con cierto tipo de neumático es una variable aleatoria con densidad de probabilidad. X ⎧ 1 - 20 X >0 ⎪ e f ( X ) = ⎨ 20 ⎪0 Para las demas X ⎩ Calcule las probabilidades de que uno de los neumáticos dure: a) A lo sumo 10 mil kilómetros b) Entre 16 mil y 24 mil kilómetros c) Al menos 30 mil kilómetros DISTRIBUCIÓN NORMAL 26. Una máquina despachadora de refrescos está ajustada para servir un promedio de 200 mililitros por vaso. Si la cantidad de refresco es 217 ESTADÍSTICA Y PROBABILIDADES I normalmente distribuida con una desviación estándar igual a 15 mililitros: a) ¿Qué fracción de los vasos contendrá más de 224 mililitros? b) ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros? c) ¿Cuántos vasos probablemente se derramarán si se utilizan vasos de 230 mililitros en los siguientes mil refrescos? d) ¿Debajo de que valor se obtiene el refresco 25% mas pequeño? ( ) 27. Supóngase que X tiene una distribución N μ , σ 2 . Determine c (como una función de μ , σ ), tal que p( X ≤ c ) = 2 p( X > c ) . 28. Una universidad espera recibir para el siguiente ciclo escolar 16 mil solicitudes de ingreso al primer semestre de licenciatura. Se supone que las calificaciones obtenidas para los aspirantes en la prueba pueden calcularse de manera adecuada por una distribución normal con la media 950 y varianza 10 mil si la universidad decide admitir 25% de todos los aspirantes que obtengan las calificaciones mas altas en la prueba. Seleccione la opción que da la calificación mínima que es necesario obtener en la prueba para ser admitido en la universidad. 29. La cantidad semanal que una compañía gasta en mantenimiento y reparaciones tiene una distribución normal N (400;20) . Si el presupuesto para cubrir los gastos de reparación para la semana siguiente es de $450; a) ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad supuesta? b) ¿De cuánto debe ser el presupuesto semanal para mantenimiento y reparaciones para que tan solo se rebase con una probabilidad de 0.1? 30. Los conductores que se fabrican para realizarse en determinado sistema de cómputo necesitan resistencias que varíen entre 0.12 y 0.14 ohm. Las resistencias reales medidas de los conductores que produce la compañía A tienen una distribución normal N (0.13;0.005) ohm. a) ¿Cuál es la probabilidad de que un conductor seleccionado al azar de la producción de la compañía A cumpla con las especificaciones? 218 ESTADÍSTICA Y PROBABILIDADES I b) Si se usan cuatro de estos conductores en el sistema y son de la compañía A, ¿Cuál es la probabilidad de que los cuatro cumpla con las especificaciones? 31. Las ausencias por enfermedad de los empleados de una empresa en un mes tienen una distribución norma N (200,20) horas. a) Calcular la probabilidad de que el mes próximo el ausentismo total por enfermedad sea menor que 150 horas. b) Para planear el programa del mes próximo, ¿Cuánto tiempo debe suponer darse el ausentismo por enfermedad, si aquella cantidad sólo se debe superar con una probabilidad de tan sólo 0.10? 32. La producción por hora de los trabajadores en una fábrica se considera distribuida normalmente con media de 240 unidades y desviación típica de 20 unidades. Considérese que en esta fábrica trabajan en la producción 10 mil trabajadores. a) ¿Cuántos trabajadores tienen una producción de más de 250 unidades por hora? b) Si cualquier trabajador que produzca menos de 200 unidades por hora debe recibir entrenamiento posterior, ¿Cuántos recibirán entrenamiento? 33. Una compañía paga a sus empleados un salario promedio de $9.25 por hora con una desviación estándar de 60 centavos. Si los salarios están distribuidos casi en forma normal y los montos se cierran a centavos: a) ¿Qué porcentaje de los trabajadores recibe salarios entre $8.75 y $9.69 por hora inclusive? b) ¿El 5% más alto de los salarios por hora de empleado es mayor a qué cantidad? 34. El diámetro interior de un anillo de pistón se distribuye normalmente con media de 12cm. Y desviación estándar de 0.02cm. a) ¿Qué fracción de los anillos de pistón tendrá diámetros que excederá de 12.05cm? b) ¿Qué valor de diámetro interior c tiene una probabilidad de ser excedido de 0.90cm? c) ¿Cuál es la probabilidad de que el diámetro interior se encuentre entre 11.95 y 12.05cm? 219 ESTADÍSTICA Y PROBABILIDADES I 35. Si la temperatura en grados Fahrenheit de cierta localidad se distribuye normalmente con una media de 68 grados y una desviación típica de 4 grados? ¿Cual es la distribución de la temperatura en grados en grados centígrados en la misma localidad? APROXIMACIÓN DE LA DISTRIBUCIÓN NORMAL A LA BINOMIAL 1. Un proceso para fabricar un componente electrónico tiene 1% de defectuosos. Un plan de control de calidad es seleccionar 100 artículos del proceso, y si ninguno está defectuoso el proceso continúa. Use la aproximación normal a la binomial para encontrar. a) La probabilidad de que el proceso continúe con el plan de muestreo que se describe; b) La probabilidad de que el proceso continúe aun si éste está mal (es decir, si la frecuencia de componentes defectuosos cambia a 5.0% de defectuosos). 2. Un proceso produce 10% de artículos defectuosos. Si se seleccionan al azar 100 artículos del proceso, ¿cuál es la probabilidad de que el número de defectuosos a) excede de 13? b) sea menor que 8? 3. La probabilidad de que un paciente se recupere de una delicada operación de corazón es 0.9. de los siguientes 100 pacientes que tienen esta operación, ¿cuál es la probabilidad de que a) sobrevivan entre 84 y 95 inclusive? b) sobrevivan menos de 86? 4. Investigadores de la Universidad George Washinton y del Instituto Nacional de Salud reportan que aproximadamente 75% de las personas creen que “los tranquilizantes funcionan muy bien para hacer que una persona esté más tranquila y relajada”. De las siguientes 80 personas entrevistadas, ¿cuál es la probabilidad de que a) al menos 50 sean de esta opinión? b) a lo más 56 tengan esta opinión? 5. Si 20% de los residentes de una ciudad de Estados Unidos prefiere un teléfono blanco sobre cualquier otro color disponible, ¿cuál es la probabilidad de que entre los siguientes 1000 teléfonos que se instalen en esta ciudad 220 ESTADÍSTICA Y PROBABILIDADES I a) entre 170 y 185 inclusive sean blancos? b) al menos 210 pero no más de 225 sean blancos? 6. Un fabricante de medicamentos sostiene que cierto medicamento cura una enfermedad de la sangre en promedio en 80% de los casos. Para verificar la aseveración, inspectores gubernamentales utilizan el medicamento en una muestra de 100 individuos y deciden aceptar la afirmación si 75 o más se curan. a) ¿Cuál es la probabilidad de que la afirmación se rehace cuando la probabilidad de curación es, de hecho, 0.8? b) ¿Cuál es la probabilidad de que el gobierno acepte la afirmación cuando la probabilidad de curación sea tan baja como 0.7? 7. Un sexto de los estudiantes hombres de primer ingreso que entran a una escuela estatal grande son de otros estados. Si los estudiantes se asignan al azar a los dormitorios, 180 en un edificio, ¿cuál es la probabilidad de que en un dormitorio dado al menos un quinto de los estudiantes sea de otro estado? 8. Una compañía farmacéutica sabe que aproximadamente 5% de sus píldoras anticonceptivas tienen un ingrediente que está por debajo de la dosis mínima, lo que vuelve ineficaz a la píldora. ¿Cuál es la probabilidad de que menos de 10 en una muestra de 200 píldoras sean ineficaces? 9. Estadísticas publicadas por la Administración Nacional de seguridad de Tránsito en Carreteras y el Consejo de Seguridad Nacional muestran que en una noche promedio de fin de semana, uno de cada 10 conductores está ebrio. Si se verifican 400 conductores al azar la siguiente noche de sábado, ¿cuál es la probabilidad de que el número de conductores ebrios sea a) menor que 32? b) más de 49? c) al menos 35 pero menos de 47? 10. Se lanza 180 veces un par de dados. ¿Cuál es la probabilidad de que ocurra en total de siete a) al menos 25 veces? b) entre 33 y 41 veces inclusive? c) exactamente 30 veces? 221 ESTADÍSTICA Y PROBABILIDADES I 11. Una compañía produce componentes para un motor. Las especificaciones de las partes sugieren que 95% de los artículos cumplen con las especificaciones. Las partes se embarcan en lotes de 100 a los clientes. a) ¿Cuál es la probabilidad de que más de 10 artículos estén defectuosos en un lote dado? b) ¿Cuál es la probabilidad de que más de 10 artículos estén defectuosos en un lote? DISTRIBUCIÓN DE WEIBULL 1. Supóngase que el tiempo de falla (en minutos) en ciertos componentes electrónicos, sujetos a vibraciones que tiene las distribución de Weibull con α = 1/5 y β = 1/3. a) ¿Cuánto puede esperarse que dure un componente? b) ¿Cuál es la probabilidad de que ese componente falle en menos de 5 horas? 2. Supóngase que la vida útil (en horas) de un semiconductor es un variable aleatoria que tiene distribución de Weibull con α = 0.025 y β = 0.500. ¿Cuál es la probabilidad de que el semiconductor aún funcionando después de 4 000 horas? Rta: 0.2057 3. Suponga que la vida útil, en años, de una batería para audífonos es una variable aleatoria que tiene una distribución Weibull con α = ½ y β = 2. a) ¿Cuánto tiempo se espera que dure esa batería? b) ¿Cuál es la probabilidad de que dicha batería siga funcionando después de 2 años? Rta: a) π 2 = 1.2533 , b) e-2 = 0.1353 4. La duración de un cierto sello para automóvil tiene la distribución Weibull con una taza de falla Z(t) = 1 . Encuentre la probabilidad t de que tal sello siga en uso después de 4 años. Rta: e-4 = 0.0183 222 ESTADÍSTICA Y PROBABILIDADES I Semana 16 DISTRIBUCIONES MUESTRALES Nos hemos ocupado de estudiar distribuciones específicas tanto discretas como continuas, se trata de distribuciones que se utilizan mucho en diversas aplicaciones que incluyen confiabilidad, control de calidad y muestreo. El tema es amplio nos concentraremos en muestras poblacionales y se estudian cantidades tan importantes como son la media muestral y la varianza muestral que son de vital importancia en inferencia estadística. A continuación damos algunas definiciones o significados muy comunes en esta parte del curso. Población.- Consiste en la totalidad de observaciones en las cuales se está interesado. Muestra.- Es un subconjunto de una población. Muestreo Aleatorio simple (MAS).- Denominado también muestreo irrestricto aleatorio, porque todos los elementos de la población tienen la misma posibilidad de ser elegidos. Muy usado por los investigadores, es importante destacar que forma la base de la mayor parte de los diseños de muestreo, así como de encuestas científicas que se llevan a cabo en la práctica. Muestreo probabilístico.- Los muestreo probabilísticos no indican como se extrae una muestra de cada caso. En el marco teórico del muestreo existen estimadores de punto y los de intervalo. A continuación se representa un esquema muy intuitivo de cómo se realiza un muestreo, para que sirve y los elementos, mas saltantes en la estimación de parámetros poblacionales e inferencia, Población (N) Técnica de muestreo Muestra (n) X1 X1 Inferencia Xn XN 223 ESTADÍSTICA Y PROBABILIDADES I Parámetros Estimación μ σ 2 ( μ≅X X → f x, μ , σ 2 σ 2 ≅ s2 s2 pˆ p ≅ pˆ p Estadísticos e≅ x−μ < ) Se determina conocida la distribución normal ó “t”. • • Extraemos una muestra para estimar lo parámetros poblacionales μ , σ 2 y p mediante los estimadores X , S 2 y p̂ respectivamente. Al estimar los parámetros poblacionales cometemos errores los cuales se determinan, conocida la distribución de la muestra. Las poblaciones pueden ser grandes o pequeñas. DEFINICIÓN.- La distribución de probabilidad de un estadístico recibe el nombre de distribución muestral. La distribución de probabilidad de X se llama distribución muestral de la media. La distribución muestral de un estadístico depende: del tamaño de la población del tamaño de las muestras y del método de selección. Supongamos que extraemos una muestra de una población normal; la distribución muestral de la media seguirá la misma distribución normal. Población (N) Muestra (n) X1 X1 XN Xn Métodos de Muestreo X → N ( X ,.μ X , σ X2 ) 224 ESTADÍSTICA Y PROBABILIDADES I ( ) X → N x, μ , σ 2 : EX = μ E(X − μ ) = σ 2 2 ⎛ X 1 + X 2 + .......... + X n ⎞ ⎟ n ⎝ ⎠ EX 1 + EX 2 + ............. + EX n = n μ + μ + ............... + μ = n μX = μ μ X = E( X ) = E⎜ ⎛ X 1 + X 2 + .......... + X n ⎞ ⎟ n ⎝ ⎠ V ( X 1 ) + V ( X 2 ) + ............. + V ( X n ) = n2 σ 2 + σ 2 + ..................... + σ 2 nσ 2 σ 2 = = 2 = n n2 n σ X2 = V ( X ) = V ⎜ σ X2 = • σ2 n En caso que la muestra aleatoria proceda de una población con distribución desconocida ya sea de una población infinita o finita. La distribución muestral de X sigue aproximadamente una distribución normal. ( X →≅ N X , μ X , σ X2 ) Este sorprendente resultado es una consecuencia inmediata del siguiente teorema que recibe el nombre de teorema del límite central. TEOREMA DEL LÍMITE CENTRAL (TLC).- Si X es la media de una muestra aleatoria de tamaño n que se toma de una población con media μ y varianza finita σ 2 , entonces la forma de la distribución de: X −μ →∞ Z= ⎯n⎯ ⎯→ N ( z;0;1) σ/ n conforme n→∞, es la distribución normal estandar N(Z;0;1) 225 ESTADÍSTICA Y PROBABILIDADES I OBSERVACIÓN: 1) si n ≥ 30 (muestra grande) la aproximación normal para X , generalmente será buena sin importar la forma de la población: 2) si n < 30 (muestra pequeña) la aproximación es buena solo si la población difiere mucho de una distribución normal. 3) Si se sabe que la población es normal la distribución muestral de X seguirá exactamente una distribución normal sin importar que tan pequeña sea la muestra. EJERCICIOS DE APLICACIÓN 1. Las alturas de 1000 estudiantes están distribuidas en forma normal con una media de 174.5cm. Y una varianza de 6.9cm. Si se sacan de esta población 200 muestras aleatorias de tamaño 25 y se registran las medias redondeándolas a décimas, determine: a) La media y el error estándar de la distribución muestral de X . b) El número de medias muestral que caen entre 172.5 y 175.8cm. inclusive. c) El número de media muestral que cae debajo de 172.0cm. Solución: • X: V.A. altura de estudiantes • Población: μ : 174.5cm. σ : 6.9cm • Muestra : n = 25 μ X = μ = 174.5 σX = • a) Error: e = ± σ n 0.1 = ±0.05 2 μ X = μ = 174.5cm. 6.9 σ σX = = = 1.38cm. Error estándar n 25 226 ESTADÍSTICA Y PROBABILIDADES I b) {172.5 ≤ X ≤ 175.8}⇒ P(172.5 ≤ X ≤ 175.8) 175.8 − 174.5 + 0.05 ⎞ ⎛ 172.5 − 174.5 − 0.05 = P⎜ <z< ⎟ 1.38 1.38 ⎝ ⎠ c) ( ) 172.0 − 174.5 − 0.05 ⎞ ⎛ p X < 172.0 = P⎜ Z < ⎟ 1.38 ⎝ ⎠ = P(Z < −1.85) = 0.0322 Número de medias = 200 x 0.0322=6.44 ≈ 6 2. Dada una población uniforme discreta. ⎧1 X = 2, 4,6 ⎪ f (x) = ⎨ 3 ⎪⎩0 en otro caso Encuentre la probabilidad de que una muestra aleatoria de tamaño 54 seleccionada con reemplazo, de una media muestral mayor que 4.1 pero menor que 4.4 Asuma de que las medias se redondean hasta la décimas. Solución: • X: V.A uniforme discreta • 3 μ = E ( X ) = ∑ xi f ( x i ) = Población: i =1 σ 2 = EX 2 − μ 2 = ∑ xi2 f ( xi ) − μ 2 = • Muestra: X = ?? σX = n = 54 • Error:; e = ± 0.1 = ±0.05 2 227 1 (2 + 4 + 6) = 4 3 ( ) 1 2 56 8 − 16 = 2 + 42 + 62 − 42 = 3 3 3 8/3 54 = 0.222 ESTADÍSTICA Y PROBABILIDADES I .05 − 4 4.4 − 0.05 − 4 ⎞ {4.1 < X < 4.4}→ P(4.1 < X < 4.4) = P⎛⎜ 4.1 +0.0222 <z< ⎟ 0.222 ⎝ = P(0.225 < z < 1.58) ⎠ = P(0.68 < z < 1.58) = 0.9429 − 0.7517 = 0.1912 3. Un cierto tipo de tornillo se fabrica con una resistencia de tensión promedio de 78.3 kilogramos y una desviación estándar de 5.6 kilogramos. ¿ como cambia la varianza de la media muestral cuando el tamaño de la muestra a) Aumenta de 64 a 196? b) Disminuye de 784 a 49? Solución: • X: V.A. tornillo con una determinada resistencia μ =78.3kg • Población: σ =5.6kg • Muestra: μ X = μ = 78.3 σ σX = n = 5.6 n n= 64 aumenta a n=196: σ X = a) 5.6 64 = 0.7; σ X = 5.6 196 = 0.4 disminuye n= 7.84 disminuye an=49: σ X = b) 5.6 784 = 0.2; σ X = 5.6 49 = 0.8 aumenta En conclusión el tamaño de la desviación estándar es inversamente proporcional a la muestra. 4. La variable aleatoria X que representa el número de cerezas en una empanada, tiene la siguiente distribución de probabilidad X P(x=x) 4 5 6 7 0.2 0.4 0.3 0.1 228 ESTADÍSTICA Y PROBABILIDADES I a) Encuentre la media μ y la varianza σ 2 de x. b) Encuentre la media c) muestras aleatorias de 36 empanadas de cereza Encuentre la probabilidad de que el número promedio de cerezas en 36 empanadas se menor que 5.5 μ X y la varianza σ X2 de la media X para Solución: • X: V.A. número de cereza en una empanada • Población: μ = EX = ∑ xi p( xi ) = 4(0.2) + 5(0.4) + 6(0.3) + 7(0.1) = 5.3 σ 2 = EX 2 − μ 2 = 4 2 (0.2) + 5 2 (0.4) + 6 2 (0.3) + 7 2 (0.1) − 5.3 2 • = 28.9 − 28.09 Muestra: n = 36 = 0.81 μ X = μ = 5.3 σ X2 = a) σ2 n = 0.81 = 0.0225 36 {X < 5.5}→ P(X < 5.5) = P⎛⎜ z < 5.50.−155.3 ⎞⎟ ( ) ⎝ = P( z < 1.33) ⎠ P X < 5.5 = 0.9082 ESTIMACIÓN • • En el desarrollo anterior hemos resaltado las propiedades de la media muestral y varianza muestral, utilizando los datos extraídos de la población. La estimación estadística consiste en utilizar los datos muestrales para determinar la media muestral, varianza muestral y proporción muestral, los cuales estiman respectivamente, la media, varianza y proporción poblacional permitiendo sacar conclusiones acerca de los parámetros de la población a partir de los estados experimentales, a esto se le denomina inferencia. 229 ESTADÍSTICA Y PROBABILIDADES I Población (N) Técnicas de muestreo Muestra (n) X1 X1 Xn XN Parámetros μ≅X μ σ σ ≅s 2 2 p Estadísticos Inferencia Estimación 2 p ≅ pˆ e≅ x−μ ( X → f x, μ , σ 2 ) 2 s pˆ INFERENCIA ESTADÍSTICA.- Son métodos en los cuales se pueden realizar inferencias o generalizaciones acerca de una población. Consideraremos el método clásico para estimar un parámetro poblacional. Existe otro método que no consideramos en esta sección es el método Bayesiano. Puntual Estimación Por Intervalos Inferencia Estadística Prueba de Hipótesis Predicción 230 ESTADÍSTICA Y PROBABILIDADES I Semana 17 MÉTODOS CLÁSICOS DE ESTIMACIÓN Hemos estudiado la importancia de la media muestral y varianza muestral el propósito es crear un fundamento que permita sacar conclusiones acerca de los parámetros poblacionales utilizando los datos experimentales. Por ejemplo el teorema del límite central proporciona información acerca de la distribución de la media muestra X . LA ESTIMACIÓN PUNTUAL.- Se refiere a la elección de un estadístico es decir un número calculado a partir de datos muestrales (y quizás de mas información) respecto del cual tenemos alguna esperanza o seguridad de que esté “razonablemente cerca” del parámetro que ha de estimar esto no es fácil pues no se conoce el parámetro y el valor del estadístico no es conocido hasta después de que la muestra se ha obtenido. Por ello solo podemos preguntar si en muestras repetidas, La distribución de los estadísticos tiene ciertas propiedades deseables parecidas a la de la cercanía”. Por ejemplo sabemos que μ X = μ luego podemos esperar que las medias de repetidas muestras aleatorias de una población determinada tengan como centro la media (μ ) de esta población y no estén alrededor de otro valor. Una estimación puntual de algún parámetro poblacional θ es un valor único θˆ del estadístico. PARÁMETROS POBLACIONALES ( θ ) μ σ V.A. ESTADÍSTICA ) (ESTIMADORES) H VALORES DE LA V.A. θˆ X S2 P̂ x s2 p̂ 2 P • • El estadístico que se usa para obtener la estimación puntual, recibe el nombre de estimador o función de decisión. Cuando usamos estimadores estamos sujetos a cometer errores. Así por ejemplo e = X − μ , cuanto mas pequeño es el error mejor estimación de μ mediante X . 231 ESTADÍSTICA Y PROBABILIDADES I • Debemos recordar que los parámetros poblacionales se consideran exentos de error. CUALIDADES QUE DEBE TENER UN BUEN ESTIMADOR PUNTUAL 1. 2. 3. 4. Insesgado Eficiente Consistente Asintótico 1. INSESGADO.- Se dice que un estimador estadístico Ĥ es un estimador insesgado del parámetro θ , si E Hˆ = θ De esta manera llamamos insesgado a un estadístico si “en promedio” sus valores son iguales a los del parámetro que supuestamente estima. ( ) Ejemplo: Los estimadores X , S 2 , Pˆ son insesgados respecto a los parámetros poblacionales. ( ) E X =μ E S2 =σ 2 E Pˆ = P 1. ( ) 2. () 3. ( ) Demostrar que E S 2 = σ 2 ( ) S2 = 1 n ∑ Xi − X n − 1 i =1 S2 = 1 n ∑ (X i − μ ) − X − μ n − 1 i =1 [ 2 ( )] 2 [ ( ) ( )] = 1 n ( X i − μ )2 − 2( X i − μ ) X − μ + X − μ ∑ n − 1 i =1 = 1 ⎡n ( X 1 − μ )2 − 2 X − μ ∑ ⎢ n − 1 ⎣ i =1 = 1 ( X i − μ )2 − 2n X − μ X − μ + n X − μ ∑ n −1 [ ( )∑ ( X ( )( i 232 i 2 2 ( ) ⎤ − μ )+ n X − μ ⎥ ⎦ ) ( )] 2 ESTADÍSTICA Y PROBABILIDADES I [ ( 1 ( X i − μ )2 − n X − μ ∑ n −1 = )] ( 2 ) 2⎤ 1 ⎡n 2 E ( X i − μ ) − nE X − μ ⎥ ∑ ⎢ n − 1 ⎣ i =1 ⎦ ( ) E S2 = = 1 ⎡ 2 σ2⎤ σ n − n ⎢ ⎥ n −1 ⎣ n ⎦ = 1 [n − 1]σ 2 n −1 ( ) ∴E S2 =σ 2 Hemos mostrado que el estimador S2 así definido es un estimador insesgado de σ 2 . Como ejercicio demostrar las otras dos proporciones. ESTIMADOR EFICIENTE: Si se consideran a todos los estimadores insesgados posibles de algún parámetro θ (parámetro poblacional) aquel con la varianza mas pequeña recibe el nombre de estimador mas eficiente de θ . Ejemplo: Consideremos dos estimadores insesgados ~ (Media): X , X : (mediana) ~ E X =μ , E X =μ f(x) ( ) σ = 2 X ( ) σ2 n , σ = 2 ~ X π σ2 σ 2 n 2 X σ σ X2 < σ X2~ 0 233 2 ~ X x ESTADÍSTICA Y PROBABILIDADES I (La varianza de la media es menor que la varianza de la mediana) ~ Al ser la varianza de X menor que la varianza de X (mediana) tomamos como estimador eficiente a la media X . ( ) ESTIMADOR SUFICIENTE: Se dice que un estimador es suficiente con relación a un parámetro si utiliza toda la información relevante de la muestra para calcularlo. ESTIMADOR CONSISTENTE: Cuando la probabilidad de que un estimador difiera del valor del parámetro, permanezca constante o sea muy pequeña a medida que el tamaño de la muestra se incremente, se dice que el estimador es consistente. ESTIMACIÓN POR INTERVALO Es probable que incluso el estimador insesgado más eficiente no estime el parámetro poblacional con exactitud. Es cierto que la población se incrementa con muestras grandes, pero no hay razón por la cual esperar que la estimación puntual de una muestra dada deba ser exactamente igual que el parámetro poblacional que se supone estima. Existen muchas situaciones por las cuales es preferible determinar un intervalo dentro del cual se esperaría encontrar el parámetro poblacional. Tal intervalo se conoce como una estimación por intervalo. • Consideremos una muestra de tamaño n ≥ 30 extraída de una población con varianza conocida σ 2 y deseamos estimar la media poblacional μ con una probabilidad 1-α de que μ sea estimada por X esto es X − μ que será a lo sumo Z α decir: X − μ ≤ Zα σ 2 n ↔ −Zα < 2 X −μ σ n La confianza 1 − α : 90%,95%,99% La desconfianza α : 10%,5%,1% 234 < Zα 2 σ 2 n es ESTADÍSTICA Y PROBABILIDADES I P⎛⎜ − Z α < Z < Z α ⎞⎟ = 1 − α 2 2 ⎠ ⎝ • • La confianza o nivel de confianza 1- α es la probabilidad asumida de que la media μ este contenida en el intervalo de confianza buscado en el experimento. La desconfianza α ó límite de confianza es lo raro que puede ocurrir en su experimento es decir hechos fortuitos o extraños. m100 95% m3 Población X m2 X X m1 Supongamos que extraemos una Muestra de tamaño n de una Población, con una confianza Del 95%. • • X θ =μ Estimaciones por intervalos de μ para diferentes muestras de tamaño n. De 100 intervalos 95 intervalos contienen a la media poblacional y 5 no la contienen. Las mi son las muestras de tamaño n y definen intervalos diferentes para μ . 235 ESTADÍSTICA Y PROBABILIDADES I INTERVALO DE CONFIANZA PARA CONOCIDA LA MEDIA CON VARIANZA ESTIMACIÓN MEDIA: Para estimar la media poblacional μ utilizaremos la distribución normal y la “t· de student I. normal II. “t” de student Estimación de la media poblacional μ utilizando la distribución normal. I. Z= X −μ σ N(Z,0,1) →∞ ⎯n⎯ ⎯→ N (Z ,0,1) n P⎛⎜ − Z α < Z 1 < Z α 2 ⎞⎟ = − α 2 ⎠ ⎝ − Z α < Z1 < Z α 2 α 1−α 2 2 2 X −μ − Zα < σ 2 IC : X − Z α < Zα n σ n 2 X − Zα σ 2 n 2 < μ < X + Zα 1) e = X − μ ≤ Z α 2) e ≤ Zα α σ n 2 − Zα x 2 e μ X n ⇒ μ 2 n , error σ 2 σ 2 Zα 0 ⎛ Zα σ n≥⎜ 2 ⎜ e ⎝ ⎞ ⎟ ⎟ ⎠ X + Zα 2 236 , tamaño de muestra σ 2 n ESTADÍSTICA Y PROBABILIDADES I 3) L = X + Zε σ 2 ⎛ σ ⎞ σ ⎟⎟ ∴ L = 2Z α , longitud del intervalo − ⎜⎜ X − Z α 2 2 n n ⎝ n⎠ ( ) 4) Error estándar de X ; e X = σ n EJEMPLO DE APLICACIÓN 1. Un fabricante produce focos que tienen un promedio de vida de distribución aproximadamente normal y una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una vida promedio de 780 horas. a) Encuentre el intervalo de confianza del 95%, 96%, 98% para la media población de todos los focos que produce la empresa. b) Que tan grande se requiere que sea una muestra. Si se desea tener una confianza del 94% de la media poblacional, esté dentro de las 10 horas del promedio real. Solución: • X: variable aleatoria tiempo de vida de focos fabricados • X → N(X, μ , σ 2 ) • Población: μ =? σ =40 horas • Muestra: n=30 X =780 horas • Confianza: 1 − α = 0.95 ⇒ α = 0.05 α = 0.025 ⇒ Z 0.025 = −1.96 2 IC : X − Zα 780 − 1.96 × α 2 n < μ < X + Zα σ 2 n 40 40 < μ < 780 + 1.96 × 30 30 ∴ 765,69 < μ < 794.31 237 ESTADÍSTICA Y PROBABILIDADES I Adicionalmente podemos calcular el error y el tamaño de muestra que aproximadamente será la misma. Error: e = Zα σ 2 n →e 1.96 × 40 30 = 14.3138 Tamaño muestra e= Zα σ ⎛ Zα σ 2 →n≥⎜ 2 ⎜ e n ⎝ 2 ⎞ ⎟ = (5 − 48)2 = 30 ⎟ ⎠ Adicionalmente determinar el IC (intervalo de confianza) para la media con el 96%, 98% 94% y error respectivo. b) Consideremos la confianza del 94% 1 − α = 0.94 → α = 0.06 Datos: α = 0.03 → Z = 0.03 2 −1.89 − X 0.0294 − 0.03 −1.89 − X −0.0006 = ⇒ = −1.89 − (−1.88) 0.0294 − 0.0301 −0.01 −0.0007 ⎛6⎞ −1.89 − X = −0.01⎜ ⎟ ⇒ X = −1.88143 ⎝7⎠ e = 10 = Z 0.03 × σ n , Z 0.03 = −1.88143 2 ⎛ −1.88143 × 40 ⎞ n=⎜ ⎟ = 56.6364 ≈ 57 10 ⎝ ⎠ ∴ n = 57 238 ESTADÍSTICA Y PROBABILIDADES I 2. Un supervisor intenta utilizar la media de una muestra aleatoria de tamaño n=150 para estimar la aptitud mecánica promedio (la cual se mide cierta prueba) de los obreros de la línea de ensamblado en una gran industria. Si por su experiencia puede suponer que σ = 6.2 para tales datos, ¿Qué podemos asegurar con una probabilidad de 0.99 sobre la medida máxima de este error? Solución: • X: V.A. aptitud en la prueba • n = 150 • σ = 6.2 • confianza 1 − α = 0.99 → α = 0.01, α = 0.005, 2 e ≤ Zα σ 6.2 = 1.30 n 150 En consecuencia el supervisor puede asegurar con una probabilidad de 0.99 de que su error será a lo sumo 1.30 3. 2 ⇒ e = 2575 × Z 0.005 = −2.575 → simetriaZ0.995 = 2.575 Para estimar el tiempo promedio que lleve ensamblar cierto componente de una computadora, el supervisor de una empresa electrónica tomó el tiempo que 40 técnicos tardan en ejecutar esta tarea, obteniendo su media de 12.73 minutos y una desviación estándar de 2.06 minutos. a) ¿Qué podemos decir con una confianza del 99%, acerca del error máximo si X = 12.73 se utiliza como estimación puntual del tiempo medio que se requiere para realizar la tarea? b) Utilice los datos para construir un intervalo de confianza del 98% para el tiempo medio que lleva ensamblar el componente de la computadora? c) ¿con que confianza podemos asegurar que la media muestral no difiere de la media real por mas de 30 segundos? d) Calcular el error estándar Solución: • X: V.A. tiempo en ensamblar • n = 40 • X = 12.73 minutos • σ = 2.06 minutos 239 ESTADÍSTICA Y PROBABILIDADES I a) 1 − α = 0.99 →= 0.01, α = 0.005, Z 0.005 = 2.575 e = X − μ ≤ 2.575 × ⇒ e = 0.8387 de min uto = 50.3segundos 2 2.06 40 El error seria de aproximadamente de 50.3 segundos. b) IC: X − Z 0.01 σ n < μ < X + Z 0.01 σ n 1 − α = 098 → α = 0.02, α = 0.01, Z 0.01 no se encuentra en la 2 tabla, tenemos que interpolar. − 2.32 − 0.0102 ← X − 0.01 → − 2.33 − 0.0099 − 2.33 − X 0.0001 1 = ⇒ X = −2.33 + 0.01 × − 0.01 0.0006 6 = -2.3283 Z 0.01 = −2.3283 Simetría Z 0.99 = 2.3283 12.73 − 2.3283 × 2.06 40 < μ < 12.73 + 2.3283 × 2.06 40 11.972 < μ < 13.488 Tenemos la confianza del 98% que la media real se encuentra en el intervalo 12.73 minutos que lleva ensamblar el componente de la computadora. c) Se nos minutos ⇒ pide 1 − α , usemos Zα σ 2 n e = X − μ = Zα σ 30 2 = 0.5 Zα = 0.5 × 40 = 1.53508 = 1.54; P(Z < 1.54 ) = 0.9382 2.06 1−α = 0.9382 ⇒ α 2 2 2 = 0.0618, α = 0.1236 240 , = 0.5 n 60 ESTADÍSTICA Y PROBABILIDADES I La confianza es 1 − α = 87.64% 0.0618 0.0618 0.8764 0 d) 4. σX = σ n = 2.06 40 = 0.3257 de minuto =19.54 seg. Una maquina despachadora de refrescos esta ajustada de tal manera que la cantidad de líquido despachada se distribuye aproximadamente en forma normal con una desviación estándar igual que 0.15 decilitros. a) Encuentre un intervalo de confianza del 95% para la media de todos los refrescos que sirve esta máquina si una muestra aleatoria de 36 refrescos tiene un contenido promedio de 2.25 decilitro. b) ¿Qué tan grande se requiere que sea una muestra si se desea tener una confianza del 95% de que la media muestral estará dentro de 0.09 decilitros del promedio real? Solución: • X.V.A. refrescos despachados • Población: μ =?? σ =0.15 dcl • Muestra: n =36 X =2.25 • Confianza: 1 − α = 0.05 ⇒ Z 0.025 = −1.96 → simetriaZ 0.975 = 1.96 a) X − Z 0.975 × σ n ⇒ 2.25 − 1.96 × b) e = Zα σ n 0.15 0.15 < μ < 2.25 + 1.96 × ⇒ 2.20 < μ < 2.30 36 36 ⎛ Zα σ ⇒n=⎜ 2 ⎜ e n ⎝ σ 2 < μ < X + Z 0.0975 2 2 ⎞ ⎟ = ⎛⎜ 1.96 × 0.15 ⎞⎟ = 10.67 ≅ 11 ⎟ ⎝ 0.09 ⎠ ⎠ 241 ESTADÍSTICA Y PROBABILIDADES I 242 ESTADÍSTICA Y PROBABILIDADES I Semana 18 INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA NO CONOCIDA INTRODUCCIÓN: Cuando la varianza poblacional no es conocida utilizamos la distribución de “t” de “student” (W.S. Gosset, 1908), para tamaños de muestra n<30. El estadístico T definido por X − μ / S / n genera una función de densidad de probabilidad h(t). Como σ 2 no se conoce se estima mediante S2, entonces: ( ) Γ[(v + 1) / 2] ⎛ t 2 X −μ ⎜1 + → h(t ) = T= S v Γ(v / 2 ) πv ⎜⎝ n ⎞ ⎟⎟ ⎠ − (v +1) / 2 −∞ <t < ∞ La distribución h(t) se desvia en forma apreciable cuando los grados de libertad v =n-1 son pequeños. • • El estadístico t definido resulta de una muestra aleatoria seleccionada de una población normal, con varianza σ 2 no conocida, siendo estimada por S2. X −μ Z Normal estándar: Z = T= σ V / n −1 n Ji- cuadrado con v = n − 1 grados de libertad; (n − 1)S 2 V = 2 σ • • Al muestrear poblaciones normales, puede mostrarse que X y S2 son independientes y en consecuencia lo son Z y V. Esperanza matemática o valor esperado E(T)=0 • Varianza Var (T ) = • • ν , ∀ν > 2 ν ′2 ⎛ ν ⎞ lim Var (T ) = lim ⎜ =1 ν →∞ ν →∞ ν − 2 ⎟ ⎝ ⎠ Distribución t ≅ N(Z; 0,1) 243 ESTADÍSTICA Y PROBABILIDADES I v=∞ h(t) v=9 v=5 v=3 t 0 Curvas de desviación para v=3, v =5, v =9, v = ∞ (Normal) Determinación del intervalo de confianza h(t) α − tα α 1−α 2 0 2 t < tα ⇒ P⎛⎜ − tα < t < tα ⎞⎟ = 1 − α 2 2 2 ⎠ ⎝ p⎛⎜ − tα < t < tα ⎞⎟ = 1 − α 2 2⎠ ⎝ ⎛ ⎞ ⎜ ⎟ X −μ < t(α ) ⎟ = 1 − α P⎜ − t (α ) < S 2 2 ⎜ ⎟ n ⎝ ⎠ 244 tα 2 t 2 ESTADÍSTICA Y PROBABILIDADES I X −μ IC : −t (α ) < < t (α ) ⇒ 2 2 s n x − tα S 2 n < μ < X + tα S 2 n Error: Tamaño de muestra: 2 tα S tα S ⎛ tα S ⎞ e≤ 2 ⇒n≥⎜ 2 ⎟ e= X −μ ≤ 2 ; ⎜ e ⎟ n n ⎝ ⎠ Longitud de intervalo Error estándar estimado ∧ S S L = 2tα s.e. X = 2 n n OBSERVACIÓN: Si no se nos fija la confianza el investigador tendría que asumirla. ( ) EJERCICIOS DE APLICACIÓN 1. Una compañía manufacturera asegura que las baterías utilizadas en sus juegos electrónicos duran un promedio de 30 horas, Para conservar este promedio se prueban 16 baterías mensualmente. Si el valor calculado de t cae entre –t0.025 y t0.025, la compañía esta satisfecha con su afirmación. ¿Qué conclusión sacaría la empresa de una muestra que tiene una media X = 27.5 horas y una desviación estándar S=5 horas? Suponga que la distribución de las duraciones de las baterías es aproximadamente normal. Solución: • X: V.A. duración de batería • Población: μ = 30 σ 2 = ?? • Muestra: • X = 27.5 S =5 Confianza 1 − α = 0.95 ⇒ α n = 16 2 = 0.025 ⇒ t 0.025 = +2.131 , por simetría t 0.975 = −2.131 v = 16 − 1 = 15 t ∈ − t 0.025 , t 0.025 = − 2.131,2.131 t= 2.5 X − μ 27.5 − 30 = =− = −2, estadístico de prueba. 5 S S 4 16 n 245 ESTADÍSTICA Y PROBABILIDADES I 0.025 t = −2 ∈ − 2.131,2.131 0.025 -2.131 0 2.131 t Conclusión.- La empresa esta satisfecha con su afirmación, por que el estadístico de prueba se encuentra dentro del intervalo. 2. Un instituto de investigación nutricional indica que el consumo regular de cereales pre endulzado contribuye a la caída de los dientes, enfermedades del corazón y otros procesos degenerativos. En una muestra aleatoria de 20 porciones sencillas de un cereal el contenido promedio de azúcar fue de 11.3 gramos con desviación estándar de 2.45 gramos. Suponiendo que los contenidos de azúcar están distribuidos normalmente, determine el intervalo de confianza del 95% para el contenido promedio de azúcar de porciones sencillas de dicho cereal. Solución: • X: V.A. consumo de cereal pre endulzado • Población: μ = ? σ =? • Muestra: n = 20 X = 11.3 S = 2.45 • Confianza: 1 − α = 0.95 → t0.025 = 2.093 v = 20 − 1 = 19 Intervalo: X − t 0.025 S n < μ < X + t 0.025 S n ⇒ 11.3 − 2.093 × 10.15 < μ < 12.45 246 2.45 20 < μ < 11.3 + 2.093 × 2.45 20 ESTADÍSTICA Y PROBABILIDADES I 3. Una maquina produce piezas metálicas de forma cilíndrica, Se toma una muestra de piezas cuyos diámetro son: 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Encuentre un intervalo de confianza del 99% para el diámetro promedio de piezas de esta máquina, si se supone una distribución aproximadamente normal. Solución: • X: V.A. diámetro de piezas en centímetros • Población: μ = ? σ =? • Muestra: n = 9 X = ?? S = ?? • Confianza: 1 − α = 0.99 → α = 0.005 t 0.005 = 3.355 2 v = 9 −1 = 8 Utilizando datos calculamos la media muestral y varianza muestral. ∑ X i = 9.05 = 1.0056 X = n 9 S 2 ∑X = 2 i − (∑ X i ) / 9 2 9 −1 9.1051 − (9.05) / 9 = = 0.0006028 8 2 S = 0.0246 IC : X − t 0.005 S n 1.0056 − 3.355 × < μ < X + t 0.005 0.0246 S n < μ < 1.0056 + 3.355 × 0.0246 9 0.978 < μ < 1.033 9 Tenemos el 99% de confianza que el intervalo <0.978, 1.033> contiene el diámetro promedio real. t ×S • Podemos calcular el error e = X − μ ≤ 0.005 ⇒ e = 0.0275 n ∧ S 0.0246 • El error estándar estimado de X = e.s X = = = 0.0082 n 9 ( ) 247 ESTADÍSTICA Y PROBABILIDADES I PRUEBA DE HIPÓTESIS PARA LA MEDIA μ Se trata de pruebas para decidir a partir de la información que proporciona una muestra aleatoria, si lo que se afirma respecto de la distribución de una variable es verdadera o falsa. Elementos que intervienen en la hipótesis: H0: Hipótesis nula, lo cual generalmente se asume como verdadera y se relacional con la población. H1: Hipótesis alternativa, surge como una contraposición a la Hipótesis nula para ello se extrae una muestra de la población. α : Nivel de significancia, pequeño que se relaciona con lo raro que podría ocurrir en un experimento estadístico. ERRORES DE TIPO I Y II.- Como las pruebas de hipótesis se basan en la información obtenida en una muestra aleatoria, es posible que se cometan errores. Estos errores pueden ser de los tipos. El error de tipo I.- Que se comete al rechazar la hipótesis nula siendo esta verdadera. El error de tipo II.- Que se comete al aceptar la hipótesis nula siendo esta falsa. Estado real de la prueba Decisión H0 verdadera H1 falsa Rechazar H0 Error de tipo I Aceptar H0 Error de tipo II Como no se sabe a ciencia cierta el estado real, es imposible medir exactamente los errores que se puedan cometer, sin embargo la probabilidad proporciona cierta información acerca de estos posibles errores. A la probabilidad de cometer el tipo I se denotan con α mientras que la probabilidad de cometer el error de tipo II se denota con β . α = P [ rechazar H 0 H 0 es verdadera β = P[ aceptar H 0 H 0 es falsa ] 248 ] ESTADÍSTICA Y PROBABILIDADES I • NIVEL DE SIGNIFICACIÓN DE LA PRUEBA.- A la probabilidad α , de cometer el error de tipo I, se le llama nivel de dignificación de la prueba. Vemos que es posiblemente controlar el nivel de significación α , lo que significará de alguna manera una medida de la confiabilidad de la decisión de rechazar la hipótesis nula y aceptar la alternativa (ello justificará la elección de hipótesis como aquella que se desea probar). Por ello cuando no sea posible rechazar la hipótesis nula será preferible indicar que “no existe suficiente información como para rechazar la hipótesis nula”. De igual manera β es una medida de confiabilidad de la decisión de aceptar la hipótesis nula; sin embargo, no es posible en general controlar este valor. • ESTADÍSTICO DE PRUEBA.- Indica de alguna manera el grado de discrepancia entre la hipótesis nula y los datos observados. Cuando el grado de discrepancia sea grande se rechazará la hipótesis nula de otra manera no se rechazará. X −μ X −μ Z= , n ≥ 30 ó t= , n < 30 σ S n n EJERCICIOS DE PROPUESTOS TEOREMA DE LÍMITE CENTRAL: Se tiene 99 instrumentos electrónicos idénticos I1, …, I99, que se usan 1. en una maquina de la manera siguiente: tan pronto como I1 falla comienza a funcionar I2, y así sucesivamente. Si Tk es la duración, en horas, de Ik, k = 1,…, 99 y se considera que la esperanza y la desviación estándar son: 100 y 2, respectivamente, hallar la probabilidad de que el tiempo total de duración T de la maquina sea mayor que 10,000 horas cuando se han sustituido los 99 instrumentos electrónicos. 2. Una maquina automática envasa arroz en bolsas en una cantidad cuyo peso tiene una esperanza igual a 1 Kg. y una desviación estándar de 0.01 kg. Una segunda maquina empaca las bolsas en paquetes de 50 cada uno. Con el fin de verificar si el numero de bolsas en cada paquete es exacto, se decide que si el peso de cada uno de estos esta entre 49.8 y 50.2 Kg., se acepta que el paquete tiene 50 bolsas, de otro modo se rechaza. 249 ESTADÍSTICA Y PROBABILIDADES I 3. Se desea fabricar cuerdas de fibras de nylon de tal manera que puedan soportar sin romperse 1000 Kg. Como mínimo cada fibra tiene una resistencia media de 10 kg. Y una desviación estándar de 0.1 kg.¿Con cuántas fibras se debe formar cada cuerda de tal manera que se cumplan las exigencias con una probabilidad igual a 0.99? 4. Cien clientes harán uso de los terminales de una gran computadora. Se ha determinado que en promedio cada cliente usara la computadora 30 minutos por cada hora. Hallar el número k de terminales que deberán colocarse de tal modo que en cualquier instante t el número de terminales sea insuficiente con probabilidad 0.05. 5. La oficina de trabajo indica que en promedio los obreros estatales ganan 500 nuevos soles con una desviación estándar de 20 nuevos soles. Al tomar 81 obreros al azar, ¿qué probabilidad hay de que la media de los 81 salarios sea menor que 450 nuevos soles? Rpta. 0. 6. Se desea estimar el salario promedio de los padres de familia de un cierto colegio. Si se supone que la desviación estándar de los salarios es 10 nuevos soles y se seleccionan al azar 64 padres de familia, a) hallar la probabilidad de que la diferencia en valor absoluto entre la media del grupo tomado al azar y la verdadera media no exceda a 3 nuevos soles. b) ¿Cuántos padres de familia deberán seleccionarse para que con probabilidad 0.95 la media en el grupo escogido difiera en valor absoluto de la verdadera media en a lo más 3.3 nuevos soles? Rpta. a) 0.9836. b) 36, aproximadamente. 7. En una fábrica se hacen resistencia las cuales se usan dos a la vez en la construcción de ciertos aparatos. Cada resistencia es defectuosa con probabilidad 0.1 y no defectuosa con probabilidad 0.9. Cada aparto proporciona una ganancia de $1 si ambas resistencias son buenas, $0 si solo una resistencia es defectuosa y - $10 si ambas resistencias son defectuosas. Hallar aproximadamente la probabilidad de que 1,000 aparatos vendidos produzcan por lo menos $800 de ganancia. Sug. Hallar la media y la varianza de la ganancia y luego aplicar el TLC. 250 ESTADÍSTICA Y PROBABILIDADES I 8. Una compañía de seguros se dispone asegurar 36 personas contra un determinado riesgo. Si llamamos con Xi a la suma que la compañía tendrá que pagar al cliente i, ( Xi puede ser 0) y si el promedio que se paga al producirse una contingencia es E(Xi) = 1000 y la varianza es V(X) = 2500 para todo i; hallar el valor C que debe cobrarse como prima a cada cliente si se desea ganar por lo menos $10,000 con probabilidad igual a 0.95. Rpta. C ≥ 1291.49 9. En cada operación que realiza una computadora, aproxima el resultado al entero mas próximo cometiendo un error que es una variable aleatoria con distribución uniforme de media 0 y de rango 4. Si se ejecutan 50 operaciones, ¿Cuál es la probabilidad de que la suma de los errores esté entre -4 y 4? Rpta. Si Xi indica cada error, calcular, usando el teorema del límite 50 central P ( −4 ≤ y ≤ 4 ) , en donde Y es ∑ X i i =1 10. El tiempo que demora una persona en hablar por teléfono es una variable aleatoria con media 3 minutos y desviación estándar 0.50 minutos. Hallar la probabilidad de que • El tiempo total que demoran 49 personas sea mayor que 150 minutos • El promedio del tiempo que demoran 64 personas sea mayor que 3.5 minutos. • Si por cada minuto se paga $0.50 y el costo fijo por llamada es igual a $0.80, calcular la probabilidad de que el costo al realizar 36 llamadas sea mayor que $45. 11. Si X1,…, X100 son variables aleatoria independientes e idénticamente distribuidas, con función de densidad: f(x) = e-x, x ≥ 0 ⎡ 100 ⎤ Hallar aproximadamente P ⎢ ∑ X i > 115⎥ ⎣ i =1 ⎦ Rpta. 0.0668 12. La función de densidad de una variable aleatoria X es ⎧ x + 1 si − 1 ≤ x ≤ 0 f ( x) = ⎨ ⎩− x + 1 si 0 ≤ x ≤ 1 251 ESTADÍSTICA Y PROBABILIDADES I a) Hallar P ( 3 ≤ T ≤ 5 ) , en donde T corresponde a la suma de las variables aleatorias independientemente: X1,…………X36, todas ellas con la misma distribución que X. b) Hallar P − 0.1 < T < 0.1 , en donde T es el promedio de las variables aleatorias, X1 , X2 ,…, X36 ( ) INTERVALOS DE CONFIANZA PARA LA MEDIA USANDO LAS DISTRIBUCIONES NORMAL Y t DE STUDENT 1. Se ha determinado que la cantidad de nicotina que tiene los cigarrillos de cierta marca tiene distribución normal con desviación estándar igual a 1 miligramo. Para estimar a la media de la cantidad de nicotina por cigarrillo de toda la producción, se tomó una muestra de tamaño 25 y se construyo el intervalo de confianza [9.6080, 10.3920]. ¿Con que nivel de confianza se ha construido el intervalo? Rpta.95% 2. Algunos vecinos de un distrito se quejan de que el paquete de “un kilo” de café que se vende en los mercados del lugar no concuerda con el peso indicado. Los vendedores de este producto dicen que es posible que esto suceda pero que la media de todos los paquetes de 1 kg. La municipalidad del distrito para dilucidar este problema, tomó una muestra de 100 paquetes registrándose una media de 990 gr. y una desviación estándar de 40 gr. Usando un intervalo de confianza al nivel del 95%, ¿Qué puede concluir la municipalidad? 3. Una muestra de 200 cuentas de ahorro en cierto distrito mostró que había un incremento medio del 7.2% en los montos de las cuentas del ahorro en los últimos doce meses con una desviación estándar de 5.6%. Usando un intervalo de confianza al 95%, estimar la media del incremento porcentual en el monto de las cuentas de ahorro en los últimos doce meses para todos los ahorristas en el distrito. Establecer un límite para el error de estimación al 95%. Rpta. Intervalo para el incremento: [6.4239, 7.9761], limite para el error = 0.7761. 4. Con la finalidad de estimar el promedio de los sueldos de un sector de trabajadores se tomo una muestra de tamaño 100 y se obtuvo una media muestral igual a 400. Hallar el intervalo de confianza al nivel 95% para la media de todos los sueldos si se supone que la 252 ESTADÍSTICA Y PROBABILIDADES I distribución de estos es normal con desviación estándar 30. ¿Cuál es el máximo error que se comete al nivel de confianza del 99% si la media de los sueldos se estima con la media muestral? 5. Un grupo de control de calidad de una industria muestra diariamente la línea de producción de un determinado artículo y calcula un intervalo al nivel de confianza del 95% para la longitud media de las piezas producidas en el día. Se han calculado 15 de tales intervalos. a) Sea X el número (desconocido) de los intervalos que en efecto cubren la longitud media desconocida de las piezas producidas en el día. ¿Cuál es la distribución para X? b) Calcular la probabilidad aproximada de que 12 de los quince intervalos cubran la media verdadera. Rpta. b) 0.03073. 6. Cinco determinaciones del PH de una solución dieron los siguientes resultados: 7.29, 7.95, 7.95, 7.50 y 7.94. Hallar un intervalo de confianza al 99% de la media de todas las determinaciones del PH de la misma solución, si se supone que la variable de las determinaciones del PH es normal. Sug. Usar el intervalo de confianza para la media de una población normal con varianza desconocida. 7. Una fabrica trabaja con dos maquinas de tipo A y con una maquina de tipo B. el tiempo que se utiliza para reparar la maquina A por semana tiene distribución normal con media μ, desconocida y varianza σ2 conocida, mientras que para la maquina B la distribución es normal con media μ2, desconocida, y varianza 2 σ12. Luego, el tiempo total semanal esperado de reparación es 2μ1 + μ2. Si se consideran una muestra aleatoria de m tiempos de reparación para cada maquina de tipo A y una muestra aleatoria de n tiempos de reparación para la maquina B, construir un intervalo al nivel de confianza del 95 % para el tiempo total esperado de reparación. 8. Para estimar la resistencia media de las barras de hierro que se utilizan en cierta construcción, una compañía desea conocer el número n de barras que debe escoger de tal modo que se garantice que existirá un riesgo de 0.01 de sobrepasar el error de 5 kg. Al estimar la media de todas las barras mediante la media muestral. Si la desviación estándar es 20 kg., hallar n. Rpta. 107 253 ESTADÍSTICA Y PROBABILIDADES I 9. Hallar el tamaño de muestra que se debe tener tomar para estimar la media de una poblacional normal de modo que la media poblacional no difiera de la media en más del 20% de la desviación estándar, con probabilidad 0.95. Rpta. 96. 10. Se planea una encuesta para conocer el tiempo que los niños ven televisión. Un estudio previo mostró que el tiempo promedio por semana es cerca de 15 horas con una desviación estándar de 5 horas. Se desea estimar el tiempo promedio por semana con una precisión de 0.5 horas, al nivel de confianza del 99%. Si el costo de administración de la encuesta es de $ 500, más $3 por entrevista, ¿Cuál es el costo total que se debe presupuestar para la encuesta? Rpta. 2498 11. Una muestra aleatoria de 81 personas tomadas del total de 225 egresados de la carrera de administración recibe un sueldo promedio inicial de $900 mensuales con una desviación estándar de $ 100. Calcule un intervalo al 95% de nivel de confianza para el sueldo promedio inicial de los 225 graduados. 12. Hallar un intervalo de confianza al nivel del 95% para el ingreso total mensual de una comunidad que tiene 500 familias si en una muestra de 100 familias se obtuvo un ingreso mensual promedio de 30000 nuevos soles. Suponer que los ingresos tienen aproximadamente distribución normal con desviación estándar igual a 5000 nuevos soles. Rpta. [14510000, 15490000] 254 ESTADÍSTICA Y PROBABILIDADES I TABLAS ESTADÍSTICAS TABLA 1.- Distribución Normal Estandar TABLA 2.- Distribución t de Student 255 ESTADÍSTICA Y PROBABILIDADES I 256 ESTADÍSTICA Y PROBABILIDADES I TABLA 1.- Distribución Normal Estandar 257 ESTADÍSTICA Y PROBABILIDADES I 258 ESTADÍSTICA Y PROBABILIDADES I TABLA 2.- Distribución t de Student 259 ESTADÍSTICA Y PROBABILIDADES I 260 ESTADÍSTICA Y PROBABILIDADES I BIBLIOGRAFÍA 1. CANEVOS, GEORGE, (1992) Probabilidad y Estadística Aplicaciones y Economía Edit. Mc-Graw Hill. México. 2. GARCÍA ORÉ, CELESTINO, (1997) Distribuciones y Estadística Inferencial Concytec. 3. MASON Y LIND, (1998). Estadística para Administración y Economía. Edit. Alfaomega – México. 4. MENDEN HAALL, WILLIAM – SYNCINACH, TERRY. Estadística Aplicada a la Ciencia e Ingeniería. Mc Graw-Hill. 5. MITAC MEZA, MÁXIMO. (1990). Tópicos de Estadística Descriptiva y Probabilidad. Editorial San Marcos. 6. MOYA, RUFINO – GREGORIO SASOVIA, (1998) Probabilidad e Inferencia Estadística. Edit. San Marcos – Perú. 7. VÉLIZ CAPUÑAY, CARLOS. (1998). Estadística Aplicaciones. Impreso en Lima-Perú. 8. WALPOLE, RONAL E. Y RAYMUNDO H. MYRES, (1992) Probabilidad y Estadística. Edit. Mc-Graw Hill – Interamericana de México. 261