MATEMATICAS PARA ING - Universidad Tecnológica de la Selva

MATEMÁTICAS PARA INGENIEROS GUÍA DEL PROFESOR SECRETARÍA DE EDUCACIÓN PÚBLICA SUBSECRETARÍA DE EDUCACIÓN SUPERIOR E INVESTIGACIÓN CIENTÍFICA SUBSISTEMA DE UNIVERSIDADES TECNOLÓGICAS COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS ELABORÓ: APROBÓ: Revisión no. 0. GRUPO DE DIRECTORES DE LA CARRERA DE PROCESOS AGROINDUSTRIALES. REVISÓ: COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS FECHA DE ENTRADA EN VIGOR: Fecha de revisión: septiembre, 2003. Página 1 de 1907 COMISIÓN ACADÉMICA NACIONAL DEL ÁREA AGRO-INDUSTRIAL ALIMENTARIA. SEPTIEMBRE 2003 F-CADI-SA-MA-11-GP-A 1 I. DIRECTORIO DR. REYES TAMES GUERRA SECRETARÍO DE EDUCACIÓN PÚBLICA DR. JULIO RUBIO OCA SUBSECRETARIO DE EDUCACIÓN SUPERIOR E INVESTIGACIÓN CIENTÍFICA DR. ARTURO NAVA JAIMES COORDINADOR GENERAL DE UNIVERSIDADES TECNOLÓGICAS RECONOCIMIENTOS ING. JAVIER TOCHIHUITL VÁZQUEZ UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ ING. DIEGO A. GARCÍA RODRÍGUEZ UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ ING. VICTOR MORALES GUZMÁN UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ ING. MA. DEL ROSARIO ROSAS C. UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ ING. ANGELINA ALONSO CAMPOS UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ T.S.U. JANET BLANCAS UNIVERSIDAD TECNOLÓGICA DE XICOTEPEC DE JUÁREZ MATEMÁTICAS PARA INGENIEROS D.R.  20001 ESTA OBRA, SUS CARACTERÍSTICAS Y DERECHOS SON PROPIEDAD DE LA: COORDINACIÓN GENERAL DE UNIVERSIDADES TECNOLÓGICAS (CGUT) FRANCISCO PETRARCA No. 321, COL. CHAPULTEPEC MORALES, MÉXICO D.F. LOS DERECHOS DE PUBLICACIÓN PERTENECEN A LA CGUT. QUEDA PROHIBIDA SU REPRODUCCIÓN PARCIAL O TOTAL POR CUALQUIER MEDIO, SIN AUTORIZACIÓN PREVIA Y POR ESCRITO DEL TITULAR DE LOS DERECHOS. ISBN (EN TRÁMITE) IMPRESO EN MÉXICO. 2 ÍNDICE # CONTENIDO PÁGINA I. DIRECTORIO Y RECONOCIMIENTOS 2 II. ÍNDICE 3 III. INTRODUCCIÓN DE LA ASIGNATURA 4 IV. UNIDADES TEMÁTICAS UNIDAD I. UNIDAD II. UNIDAD III. UNIDAD IV. UNIDAD V. UNIDAD VI. UNIDAD VII. INTRODUCCIÓN ORGANIZACIÓN Y PRESENTACIÓN DE DATOS MEDIDAS DESCRIPTIVAS MODELOS PROBABILÍSTICOS PRUEBAS DE HIPÓTESIS ANÁLISIS DE LA VARIANZA REGRESIÓN LINEAL 5 51 72 95 111 130 148 V. REFERENCIAS 177 VI. GLOSARIO 177 VII. ANEXOS 178 Ejercicios 3 III. INTRODUCCIÓN DE LA ASIGNATURA Dentro de las asignaturas que corresponden al Área de Ciencias Básicas Aplicadas para la formación de Técnico Superior Universitario en Procesos Agroindustriales encontramos la de Matemáticas para ingenieros. Dicha asignatura tiene el objetivo de: aplicar herramientas estadísticas en el análisis de información que se genera de mediciones de procesos alimentarios, para proponer soluciones en problemas de control de calidad e interpretar resultados de experimentos realizados, para formular conclusiones con nivel de escala probable. El programa que comprende está asignatura esta formada por siete unidades. La primera corresponde a una introducción a la Probabilidad, la segunda a la Organización y presentación de datos, la tercera a Medidas descriptivas, la cuarta a Modelos probabilísticos, la quinta a Pruebas de hipótesis, la sexta a Análisis de la varianza y la séptima a Regresión lineal. La asignatura de Matemáticas para ingenieros tiene como finalidad el estudio de la Probabilidad y Estadística, así como sus aplicaciones a la resolución de problemas directamente ligados con la carrera de Procesos Agroindustriales, los cuales están enfocados hacia el conocimiento de la estadística propiamente que se utiliza en las empresas. Considerando que las herramientas del control estadístico del proceso para la toma de decisiones son conocimientos fundamentales para el futuro Técnico Superior Universitario. 4 CAPITULO 1 INTRODUCCIÓN A LA PROBABILIDAD INTRODUCCIÓN El alumno abordará en esta unidad temática los conceptos de probabilidad, aplicándolo al experimento aleatorio y espacio muestral. Conocerá y distinguirá una población de datos, determinando su muestra, ordenando los datos, tabulándolos y graficando estos datos para su interpretación; estas herramientas estadísticas apoyaran a su formación, ya que podrá ordenar e interpretar un conjunto de datos. OBJETIVO Y CRITERIOS DE APRENDIZAJE 1. - Ilustrar el concepto de experimento aleatorio con el del espacio muestral. 1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral. Página 7 7 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1 Distinguir el concepto de experimento aleatorio con el del espacio muestral. OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Definir el concepto de población y muestra 2.1 Distinguir el concepto de población y muestra. 16 16 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 2.1.1. Usar el concepto de población y muestra OBJETIVO Y CRITERIOS DE APRENDIZAJE 3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa. 3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 3.1.1. Utilizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa. OBJETIVO Y CRITERIOS DE APRENDIZAJE 4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa. 4.1 Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia relativa... DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 4.1.1. Emplear la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro OBJETIVO Y CRITERIOS DE APRENDIZAJE 5. Definir el Teorema de Bayes 27 27 32 32 45 5 5.1 Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren probabilidades subjetivas. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 5.1.1. Emplear en problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el teorema de Bayes en su solución. 45 DEMOSTRACIÓN DE HABILIDADES FINALES Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible. Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o datos de muestras Pa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro. Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución 6 TEMA 1 Objetivo de aprendizaje. 1. Ilustrar y relacionar el concepto de experimento aleatorio con el del espacio muestral. Criterio de Aprendizaje. 1.1 Diferenciar el concepto de experimento aleatorio con el del espacio muestral. Didáctica de enseñanza. Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible. La historia de la probabilidad comienza en el siglo XVII cuando Fermat y Pascal tratan de resolver algunos problemas relacionados con los juegos de azar. Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el caballero De Méré y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar. Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, se publicaron varios documentos de este tipo. Jakob Bernouilli (1654-1705) Ars Conjectandi (publicado en 1713 aunque escrito sobre 1690) y Auguste De Moivre (1667-1754) contribuyeron de forma importante a este desarrollo. En 1812 Pierre Laplace publicó Théorie analytique des probabilités en el que expone un análisis matemático sobre los juegos de azar. Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como una forma de matemática. A principios del siglo XX el matemático ruso A. Kolmogorov la definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad es parte de una teoría más amplia como es la teoría de la medida. En estas notas, entenderemos por experimento aleatorio cualquier situación que, realizada en las mismas condiciones, sea imposible de predecir el resultado que obtengamos. Experimento Aleatorio: Es aquel que se realiza sin tener el conocimiento previo de los resultados que se obtendrán del mismo. Serán experimentos aleatorios, por ejemplo, los siguientes:     Lanzar un dado y considerar el resultado obtenido Extraer una carta (o varias) de una baraja Lanzar dos dados y hallar la suma de cada una de las caras obtenidas Se lanza una moneda. Si sale cara se extrae de una urna U 1, con una determinada composición de bolas de colores, una bola y si sale cruz de extrae de una urna U 2, con otra determinada composición de bolas de colores, una bola. A continuación se considera el color de la bola extraído. 7 Los tres primeros son ejemplos de experimentos aleatorios simples y el último un ejemplo de experimento aleatorio compuesto Se definen las siguientes operaciones con sucesos de un determinado experimento aleatorio  Unión de dos sucesos A, B es el suceso que se verifica si se verifica A o se verifica B o ambos. La unión de los sucesos A y B la designaremos por (A o B) (cuando no haya lugar a confusión lo expresaremos sin paréntesis es decir A o B)  Intersección de dos sucesos A, B es el suceso que se verifica si se verifica A y se verifica B. La intersección de los sucesos A y B la designaremos por (A y B) (cuando no haya lugar a confusión lo expresaremos sin paréntesis es decir A y B)  Diferencia de dos sucesos A, B es el suceso que se realiza cuando se realiza A y no B. La diferencia de los sucesos A y B la designaremos por A - B = (A y Bc ) Igualmente podemos considerar la diferencia B - A Lanzamos un dado y consideramos los sucesos A = {“obtener número par”} = {2, 4, 6} B = {“obtener múltiplo de 3”} = {3, 6} Puedes comprobar las operaciones unión, intersección y diferencias de dichos sucesos pasando el ratón sobre los correspondientes diagramas Unión: {“números pares o múltiplos de 3”} = {2, 3, 4, 6} Intersección: {“números pares y múltiplos de 3”} = {6} 8 Diferencia B - A {“múltiplos de 3 y no números pares”} = {3} Diferencia A - B {“números pares y no múltiplos de 3”} = {2, 4} Puedes comprobar las diferencias simétricas pasando el ratón sobre el diagrama Se lanza una moneda tres veces y se consideran los sucesos A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++} B = {“sale alguna cara”} = {ccc, cc+, c+c, c++, +cc, +c+, ++c} Unión (A o B) = {“salen al menos dos cruces o sale alguna cara”} = {+++, c++, +c+, ++c, ccc, cc+, c+c, +cc} Intersección (A y B) = {“salen al menos dos cruces y sale alguna cara”} = {c++, +c+, ++c} Diferencias A - B = (A y Bc) = {“salen al menos dos cruces y no sale alguna cara”} B - A = (B y Ac) = {“sale alguna cara y no salen al menos dos cruces”} Algunas consideraciones básicas con sucesos que serán útiles para la resolución de problemas  Sucesos incompatibles y complementarios 9 Si A es un suceso de un determinado experimento aleatorio cuyo espacio muestral es E, entonces A y su complementario son incompatibles, es decir (A y Ac) = Ø Además (A o Ac) = E Si lanzamos un dado y A es el suceso A = {“obtener múltiplo de 3”} = {3, 6} Entonces Ac = {“no obtener múltiplo de 3”} = {1, 2, 4, 5} por lo que (A o Ac) = {1, 2, 3, 4, 5, 6} = E y (A y Ac) = Ø  Dos sucesos complementarios son incompatibles, pero el recíproco no es cierto, es decir dos sucesos incompatibles no tienen por qué ser complementarios. Por ejemplo, los sucesos A = {“obtener múltiplo de 3”} = {3, 6} y B = {“obtener múltiplo de 5”} = {5} son incompatibles pero no complementarios. Dados dos sucesos A y B de un determinado experimento aleatorio que no sean incompatibles los sucesos (A - B), (B - A) y (A y B) son incompatibles Además podemos expresar tanto A como B como unión de dos sucesos incompatibles A = (A - B) o (A y B) B = (B - A) o (A y B) También podemos expresar el suceso (A o B) como unión de tres sucesos incompatibles (A o B) = (A - B) o (A y B) o (B - A)  Suceso contenido en otro 10 Consideremos el experimento aleatorio consistente en lanzar tres monedas y los sucesos A = {“salen al menos dos cruces”} = {c++, +c+, ++c, +++} B = {“salen dos cruces”} = {c++, +c+, ++c} El suceso B es un subconjunto del suceso A. Si se verifica A necesariamente se verifica B. En este sentido, diremos que el suceso B está contenido en el suceso A. Es interesante observar en el caso anterior que se verifican las inclusiones siguientes: (A y B) está contenido en A (A y B) está contenido en B  Leyes de De Morgan Dos propiedades importantes que, a veces, resultan útiles en la resolución de problemas son las siguientes: El complementario de la unión de dos sucesos es la intersección de los complementarios de dichos sucesos (A o B) c = Ac y Bc 1. El complementario de la intersección de dos sucesos es la unión de los complementarios de dichos sucesos (A y B) c = Ac o Bc Consideremos el experimento aleatorio consistente en lanzar dos dados (o un dado dos veces) y sumar la puntuación obtenida. E = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} El conjunto formado por todas las posibles sumas que pueden obtenerse se denomina Espacio Muestral de dicho experimento aleatorio y suele designarse por E. Cada uno de los elementos de E es un suceso elemental. A partir de dicho subconjunto podemos considerar distintos subconjuntos de E.         A = {2, 4, 6, 8, 10, 12} = {“obtener suma par”} B = {2, 5, 7, 11} = {“obtener una suma que sea número primo”} C = {10, 11, 12} = {“obtener una suma mayor o igual que 10”} D = {3, 6, 9, 12} = {“obtener suma múltiplo de 3”} F = {2, 3} = {“que la suma que sea 2 ó 3”} Ø = {“obtener una suma mayor que 15”} suceso imposible E = {“Obtener una suma mayor o igual que 2 y menor o igual que 12”} suceso seguro M = {7} = {“Obtener un 7”} Entre los sucesos apuntados, existen sucesos simples (o elementales) (por ejemplo el M) y otros sucesos compuestos constituidos por varios sucesos elementales. El conjunto de todos estos sucesos, incluidos los sucesos seguro e imposible, se denomina Espacio de Sucesos (constituido por todos los subconjuntos que pueden formarse a partir del espacio muestral E) que suele designarse por P (E). 11 Puede probarse que si el número de elementos de E es n, entonces P (E) tiene 2 n elementos. A veces, suele ser útil utilizar un gráfico como el de la figura para hallar el espacio muestral de un determinado experimento aleatorio. El diagrama de árbol de la figura corresponde al experimento aleatorio de lanzar una moneda tres veces (o tres monedas) y considerar el resultado obtenido. El espacio muestral se obtiene fácilmente sin más que ir recorriendo todas las ramas y es E = {CCC, CC+, C + C, C++, +CC, + C +, ++C, +++} Son sucesos de dichos experimento aleatorio  A = {CCC, CC +, C + C, C++, +CC, +C +, ++C} = {“obtener al menos una cara”}  B = {CC+, C + C, +CC} = {“obtener dos caras”}  Ø = {“obtener 5 cruces”} suceso imposible  C = {C++, + C +, ++C, +++} = {“obtener más cruces que caras”} Se considera el experimento aleatorio consistente en lanzar una moneda. Si sale cara se extrae de una urna que contiene bolas azules y rojas una bola y si sale cruz se extrae una bola de otra urna que contiene bolas rojas y verdes. El espacio muestral de dicho experimento aleatorio es E = {(C, R), (C, A), (+,R), (+,V)} 12 El espacio de sucesos consta de 2 4 = 16 elementos que son P (E) = {{(C, R)}, {(C, A)}, {(+, R)}, {(+, V)}, {(C, R), (C, A)}, {(C, R), (+, R)}, {(C, R), (+, V)}, {(C, A), (+, R)}, {(C, R), (+, V)}, {(+, R), (+, V)}, {(C, R), (C, A), (+, R)}, {(C, R), (C, A), (+, V)}, {(C, R), (+, R), (+, V)}, {(C, A), (+, R), (+, V)}, Ø, E} Experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces). Espacio muestral del experimento aleatorio consistente en el lanzamiento de dos dados (o un dado dos veces) y observar el resultado Como E tiene 36 elementos el espacio de sucesos tiene 236 sucesos. En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida sea 7” es S = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} 13 En el experimento aleatorio del lanzamiento de dos dados, el suceso “la suma obtenida es número primo” es S = {(1,1), (1,2), (2,1), (1,4), (2,3), (3,2), (4,1), (1,6), (2,5), (3,4), (4,3), (5,2), (6,1), (5,6), (6,5)} En el experimento aleatorio del lanzamiento de dos dados, el suceso “en los dos lanzamientos se obtiene número primo” es S = {(2,2), (2,3), (2,5), (3,2), (3,3), (3,5), (5,2), (5,3), (5,5),} Complementario de un suceso A es el suceso que se verifica si no se verifica A. El complementario de A, lo designamos por Ac y también por (no A) En el experimento aleatorio consistente en lanzar dos dados y considerar la suma de ambos, los sucesos {“obtener suma par”} y {“obtener suma impar”} son complementarios. También son complementarios los sucesos {“obtener suma mayor o igual que 5”} y {“obtener suma menor que 5”}.  En el experimento aleatorio consistente en lanzar dos monedas los sucesos {“obtener al menos una cara”} y {“no obtener ninguna cara”} son complementarios. 14 El complementario del suceso A = {“en los dos lanzamientos se obtiene número primo”} (en amarillo) es el suceso B = {“en alguno de los dos lanzamientos (o en ambos) no se obtiene número primo”} (en verde) Evidencia parcial Ta. 1 Realizar ejercicios de experimentos aleatorios y obtener el espacio muestral posible. Evaluación parcial Entrega de Ta.1 15 TEMA 2 Objetivo de aprendizaje. 2. Definir el concepto de población y muestra. Criterio de Aprendizaje. 2.1 Distinguir el concepto de población y muestra. Didáctica de enseñanza.  Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar. Una población está determinada por sus características definitorias. Por lo tanto, el conjunto de elementos que posea esta característica se denomina población o universo. Población es la totalidad del fenómeno a estudiar, donde las unidades de población poseen una característica común, la que se estudia y da origen a los datos de la investigación.  Muestra: es un subconjunto de la población a estudiar, el cual es necesario que sea representativo de toda la población. Entonces, una población es el conjunto de todas las cosas que concuerdan con una serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una población. Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la información recolectada depende en gran manera de la forma en que fue seleccionada la muestra. Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra representativa de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las características que definen la población de la que fue extraída, lo cual nos indica que es representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra. Leyes del método de muestreo. El método de muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las cuales son:  Ley de los grandes números: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la relación entre las veces que se produce el suceso y la cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la probabilidad P.  Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación entre el número de casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son igualmente posibles. El método de establecer la probabilidad es lo que se denomina cálculo de probabilidad. De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más directamente al método de muestreo: 16  Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las características del grupo más grande.  Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte igual del mismo grupo, varíe en dirección opuesta.  Ley de la permanencia de los números pequeños: si una muestra suficientemente grande es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con características raras, es de esperar encontrar igual proporción en la segunda muestra. Tipos de muestras. Muestreo aleatorio simple: la forma más común de obtener una muestra es la selección al azar. Es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios. Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la población. La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio. Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una cuota para las diferentes categorías y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe ser proporcional a la población, y en ella deberán tenerse en cuenta las diferentes categorías. El muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la selección de las categorías. Muestreo intencionado: también recibe el nombre de sesgado. El investigador selecciona los elementos que a su juicio son representativos, lo que exige un conocimiento previo de la población que se investiga. Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas. Muestreo tipo: la muestra tipo (master simple) es una aplicación combinada y especial de los tipos de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituirá el módulo general del cual se extraerá la muestra definitiva conforme a la necesidad específica de cada investigación. Para ilustrar, tomemos el siguiente ejemplo: Supóngase que se tienen que estudiar las edades una población de radioescuchas, por ser tan grande la cantidad de ellos, solamente se encuestan a 350 de ellos, los cuales en este caso serán la muestra de dicha población. 17 Las muestras representativas de su población son aquellas que poseen las mismas características de la población que se desea estudiar. Las poblaciones pueden ser finitas o infinitas Poblaciones infinitas: Todos los juegos o fenómenos cuyos resultados están indeterminados cuantitativamente ó aquellas poblaciones que por su gran número de elementos, resulta prácticamente imposible trabajar con todos ellos. Poblaciones finitas: Todos los juegos o fenómenos cuyos resultados están determinados cuantitativamente, ya que se pueden conocer cantidades específicas. Función: Es establecer una relación entre dos elementos distintos, como son población y tiempo, con base en esto podemos decir que la población esta en función del tiempo: p= f (t), también recibe el nombre de función explícita, y consta de una variable independiente (t), y una variable dependiente(p).Así podemos decir que B= a una función implícita ya que consta de dos variables independientes (p,t), esto quiere decir: que B esta en función del paso del tiempo, es decir : B=f(p.t). Gráfica: Una gráfica es una representación de la relación entre variables, muchos tipos de gráficos aparecen en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la de representar los valores tabulados obtenidos de los muestreos o los datos del total de la población. Constante: Un elemento constante es aquel que durante un intervalo definido siempre va a valer lo mismo, conservando sus características. Variable: Es un elemento que durante un intervalo definido se va a comportar de distintas formas. Las variables que se manejan en estadística moderna son aleatorias. Variable Aleatoria: Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio. Existen Variables continuas y Variables discretas. Variable Continua: Es un rango que puede concebirse como un continuo de valores. Variables discretas: Son aquellas que toman determinado valor exacto como: El No. De hijos de una familia. Ecuación: Las ecuaciones son enunciados del tipo A = B donde A = miembro ó lado izquierdo, y B = miembro derecho al cual se le pueden hacer una serie de operaciones. Filas de datos: Consiste en datos que no han sido ordenados y que simplemente han sido tomados como tal. Un ejemplo sería: Estatura de los estudiantes, que posteriormente se agrupan numéricamente. Ordenación: Consiste en ordenar datos en forma creciente y decreciente y la diferencia entre el mayor y el menor de los datos recibe el nombre de rango. Distribución de frecuencia: 18 Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías, y determinar el número de individuos que pertenecen a cada clase llamado frecuencia de clase. Una disposición tabular de los datos por clases junto con las frecuencias correspondientes de clase se llama distribuidores de frecuencia o tablas de frecuencia. Tipos de intervalos: Un intervalo de clase que, al menos en teoría carece de Limite Superior o Limite Inferior indicado. Se llama intervalo de Clase Abierto, ejemplo: refiriéndonos a edades de 65 años o más. Muestras con remplazamiento y sin remplazamiento Supóngase que f(x) es una población, donde X1, X2, X3... Xn son las muestras. Se dice que es una muestra X1 sin remplazamiento, si X1 se analiza sin regresarla a la población, si por el contrario se analiza la muestra y se regresa a la población antes de realizar cualquier otro experimento, será una muestra con remplazamiento. Ejemplo 1) Supóngase que se tienen 12 canicas 4 ROJAS 4 VERDES 4 NEGRAS ¿Qué probabilidad existe de extraer una canica roja, con remplazamiento y sin remplazamiento? a) Con remplazamiento: 4 / 12 b) Sin remplazamiento: 4 / 11 Variables aleatorias ó muestras aleatorias Suponga una población f(x) donde X1, X2, X3,...,Xn son las muestras. X1 X2 X3 X4 Xn Se llama muestreo sin reemplazo cuando de una población tomamos X muestras sin devolverlas. Se llama muestreo con reemplazo cuando una población f ( x ) toma una o varias muestras ingresándola a la población. Suponga una población f( x ) donde f( x ) son 1000 resistencias de diferentes valores, si tomamos de muestras 10 resistencias las analizamos y posteriormente las regresamos estamos hablando de muestras con remplazamiento, esto sería un ejemplo de población infinita que resulta de una población finita. Muestras Aleatorias: 19 Lógicamente la confiabilidad de las conclusiones extraídas concernientes a una población depende de si la población ha sido escogida correctamente de tal modo de que represente la población lo suficientemente bien, uno de los problemas importantes de la diferencia estadística es como recoger una muestra. Una forma de hacer esto para poblaciones finitas es asegurarse de que cada miembro de la población tenga igual oportunidad de encontrarse en la muestra lo cual se conoce como muestra Aleatoria. Ejemplos de Población, muestra y conceptos Ejemplo 1: Determine si se trata de población finita o infinita: a) Población de libros de la biblioteca de la UT. Población finita, porque el número de libros se puede contar. b) Población de varones de México entre 18 y 22 años. La población es muy grande pero se puede contar por lo tanto es finita. Para contabilizar el número de varones entre 18 y 22 años se puede recurrir al INEGI, que es la oficina de censo de la población y la vivienda y se podría obtener la información requerida. c) Población de todas las personas que podrían tomar aspirinas. La población es infinita. d) Población de todos los focos de 40 watts que serán producidos por la compañía Sylvania. La población es infinita, no puede predecirse cual será la producción. Ejemplo 2: a) Escribe mínimo 3 ejemplos de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD): VA ===> Personalidad, carácter, paciencia, I.D. de cada alumno (aunque es un número entero es atributo de una persona), número de empleado, RFC. VCC ===> Edad, peso, altura, estatura, temperatura, calificaciones, promedio, medida de inteligencia. VCD ===> Hijos, propiedades, 1 año, número de parientes, número de producción de autos, número de alumnos, número de calculadoras vendidas, carreras, universidades, unidades de las materias b) Una muestra que consta de 4 personas en un gimnasio fue cuestionada sobre "el color de short que gustaba vestir para hacer ejercicio", la "marca" y la "talla" que usa. Los datos recolectados fueron: Short de color rojo, verde, negro y azul. Estos datos fueron reescritos con clave: Verde = 2, lila = 3 y azul = 3, rojo = 4 Las tallas fueron: 38, 32, 36, 34 20 Las marcas fueron: Cristian Dyor, Guess, Love y Patito respectivamente. Detectar las variables, el promedio de cada variable y el tipo de variable. Solución: P1) Se detectan las variable V1 = Color del short V2 = Marca V3 = Talla P2) La V1 (Color del short) es cualitativa multinomial. P3) Promedio A pesar de que los datos fueron reescritos como 1, 2, 3, 4, no tendría sentido encontrar el promedio de la muestra sumando y dividiendo entre 4: (verde + lila + azul + rojo)/4 o como (1 + 2 + 3 + 4)/4. Esto último a pesar de ser un número sigue siendo variable cualitativa y el resultado del promedio no tiene sentido. P4) La V2 (Marca) es cualitativa multinomial. P5) Promedio. Obtener el promedio de las marcas no tiene sentido. P6) La V3 (Talla) es cuantitativa discreta. P7) Promedio. (38 + 32 + 36 + 34)/4 = 35 Ejemplo 3: a) Un fabricante de medicamentos está interesado en la proporción de personas que padecen hipertensión (presión arterial elevada) cuya condición pueda ser controlada por un nuevo producto desarrollado por la empresa. Se condujo un estudio en el que participaron 5000 personas que padecen de hipertensión, y se encontró que 80% de las personas pueden controlar su hipertensión con el medicamento. Suponiendo que las 5000 personas son representativas del grupo de hipertensión, conteste las siguientes preguntas: 1) ¿Cuál es la población? 2) ¿Cuál es la muestra? 3) Identifique el parámetro de interés 4) Identifique la estadística y proporcione su valor 5) ¿Se conoce el valor del parámetro? Solución: 1) ¿Cuál es la población? Todas las personas que padecen hipertensión (presión arterial elevada), cuya presión pueda ser controlada por un nuevo producto desarrollado por la empresa. 2) ¿Cuál es la muestra? Un estudio de 5000 personas que padecen de hipertensión. 21 3) Identifique el parámetro de interés. La proporción de la población que padecen hipertensión y que puede ser controlada por un nuevo producto desarrollado por la empresa. Dicho de otra manera, es la proporción de la población para la que es eficaz el medicamento. 4) Identifique la estadística y proporcione su valor. La proporción de la población para la que es eficaz el medicamento es del 80%. 5) ¿Se conoce el valor del parámetro? No se conoce y difícilmente se puede encontrar. b) Un comunicólogo desea calcular el "rating" del noticiario de "Joaquín López Doriga". Se condujo un estudio en el que participaron 1000 televidentes, y se encontró que el 60% de las personas ven el noticiario. Suponiendo que las 1000 personas son representativas del grupo de televidentes, conteste las siguientes preguntas: 1) ¿Cuál es la población? 2) ¿Cuál es la muestra? 3) Identifique el parámetro de interés 4) Identifique la estadística y proporcione su valor Solución: 1) ¿Cuál es la población? Todos los televidentes. 2) ¿Cuál es la muestra? Un estudio de 1000 televidentes. 3) Identifique el parámetro de interés. El "rating" del noticiario de” Joaquín López Doriga". O la proporción de la población que ve el noticiario de” Joaquín López Doriga". 4) Identifique la estadística y proporcione su valor. La proporción de la población que ve el noticiario de” Joaquín López Doriga" es del 60%. c) Un técnico de control de calidad selecciona piezas ensambladas de una línea de montaje y registra la siguiente información de cada pieza: A: Defectuosa o no defectuosa B: El número de identificación del trabajador que ensambló la pieza C: El peso de la pieza 1) ¿Cuál es la población? 2) La población ¿es finita o infinita? 3) ¿Cuál es la muestra? 4) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD): Solución: 1) ¿Cuál es la población? Todas las piezas ensambladas de una línea de montaje. 22 2) La población ¿es finita o infinita? Infinita. 3) ¿Cuál es la muestra? Las piezas seleccionadas y ensambladas de una línea de montaje. 4) Clasifique las respuestas para cada una de las tres variables como variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD): A: Defectuosa o no defectuosa. VA. Variable atributiva binomial. B: El número de identificación del trabajador que ensambló la pieza. VA. Variable atributiva Multinomial. C: El peso de la pieza. VCC. d) Se hizo un estudio con 500 estudiantes de la UDLA y se registro la siguiente información de cada uno: A: Número de identificación (ID) B: Edad C: Estatura D: Asiste "Si" o "No" a discotecas los jueves en la noche Suponiendo que los 500 estudiantes son representativos de este estudio, se encontró que el 70 % asiste a discotecas los jueves en la noche. Conteste las siguientes preguntas 1) ¿Cuál es la población? 2) ¿Cuál es la muestra? 3) Identifique el parámetro de interés. 4) Identifique la estadística y proporcione su valor. 5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD). Solución: 1) ¿Cuál es la población? Todos los estudiantes de la UT. 2) ¿Cuál es la muestra? 500 Número de estudiantes de la UT. 3) Identifique el parámetro de interés. La proporción de la población que asiste a una discoteca. 4) Identifique la estadística y proporcione su valor. La proporción de la población que asiste a una discoteca cuyo porcentaje es del 70%. 5) Clasifique las respuestas para cada una de las tres variables como de variables cualitativas o atributivas (VA), de variables cuantitativas continuas (VCC), y variables cuantitativas discretas (VCD). A: Número de identificación (ID). VA. Variable atributiva Multinomial. 23 B: Edad. VCC C: Estatura. VCC D: Asiste "Si" o "No" a discotecas los jueves en la noche. Variable atributiva Binomial. Número de estudiantes de la UT que va a las discotecas los jueves en la noche. Al contabilizar las respuestas "Si" o "No" asiste a discotecas los jueves en la noche, se convierte en el número de estudiantes que va las discotecas. VCD e) Un estudio está interesado en determinar algo sobre el promedio del valor en $ de las computadoras que pertenecen al cuerpo docente de la UT. Diga: 1) ¿Cuál es la población? 2) La población es ¿finita o infinita? 3) Dar una muestra 4) ¿Cuál es la variable? 5) ¿Que tipo de variable es la variable? 6) Dar un dato 7) Dar todos los datos de la muestra 8) ¿Cuál es el experimento? 9) ¿Cuál es el parámetro? 10) ¿Cuál es la estadística que se encuentra? Solución: 1) ¿Cuál es la población? Colección de todas las computadoras que pertenecen a todos los miembros del cuerpo docente de la universidad. 2) La población es ¿finita o infinita? El número de profesores de la UT puede contarse, por lo que se trata de una población finita. 3) Dar una muestra Cualquier subconjunto de esa población. Por ejemplo, todas las computadoras que pertenecen a los profesores del departamento de Ingeniería en Sistemas Computacionales. 4) ¿Cuál es la variable? "El valor en $ de cada computadora en particular" 5) ¿Que tipo de variable es la variable? Variable cuantitativa continua (VCC) 6) Dar un dato Por ejemplo la computadora de la "Doctora Pilar Gómez" que está valuada en $15,000. 7) Dar todos los datos de la muestra 9 personas constituyen el departamento de Ingeniería en Sistemas Computacionales, cuyas computadoras valen: $15000, $20000, $18000, $35000, $22000, $16000, $30000, $25000, $8000 8) ¿Cuál es el experimento? 24 Los métodos aplicados para seleccionar las computadoras que integran la muestra y determinar el valor de cada computadora de la muestra. El método aplicado fue preguntando a cada miembro del departamento. Otra forma de realizarlo sería preguntando por medio de un memorándum o por medio de un e-mail. 9) ¿Cuál es el parámetro? Es sobre el que se está buscando información, es decir, el promedio del valor de todas las computadoras de la población: prom = (15000 + 20000 + 18000 + 35000 + 22000 + 16000 + 30000 + 25000 + 8000)/9 = prom = $21,000 10) ¿Cuál es la estadística que se encuentra? Es el valor promedio de todas las computadoras de la muestra f) La siguiente tabla representa las características de todos los empleados de tiempo completo de la fábrica de Shampoo "Patito" al 1o. de enero del año en curso. No. de Empleados Color Sexo Puesto empleado ojos Años de Salario Servicio Anual en $ 1 Ana azul M Ingeniero 2 2 Miguel café H Comunicólogo 10 70000 3 Andrea negro M Mecánico 23 65000 4 Jorge negro H Secretaria 5 20000 5 Eva azul Obrera 8 18000 6 Alejandro verde H Vigilante 10 14000 7 Teresa negro M Obrera 2 18000 8 Susana café Conserje 7 12000 M M 70000 Diga: 1) ¿Cuál es la población? 2) La población es ¿finita o infinita? 3) Dar una muestra 4) ¿Cuál es la(s) variable(s)? 5) ¿Que tipo de variable(s) es (son)? 6) Dar un dato 7) Dar todos los datos de una muestra Solución: 1) ¿Cuál es la población? Es posible obtener en este ejemplo varias poblaciones, dado que hay 6 variables (los encabezados de las columnas), esta tabla contiene 6 poblaciones. Las poblaciones son: Población de empleados por Número de empleado , la población de empleados por Color ojos, la población de empleados por Sexo, la población de empleados por Puesto, la población de empleados por Años de Servicio y la población de empleados por Salario Anual. 25 2) La población es ¿finita o infinita? Todas las poblaciones constan de 8 empleados por lo que es finita. 3) Dar una muestra Los últimos 3 salarios de la población de empleados por Salario Anual. 4) ¿Cuál es la(s) variable(s)? Los encabezados de las columnas 1 y de la 2 a la 6 muestran algunas características de las unidades elementales (personas) que son precisamente las variables: número de empleado, color de ojos, sexo, puesto, Años de Servicio y Salario Anual. 5) ¿Que tipo de variable(s) es (son)? Variables Cualitativas: Número de empleado, color de ojos, sexo, puesto. Variables Cualitativas Binomial: sexo Variables Cualitativas Multinomiales: Número de empleado, color de ojos, puesto. Variables Cuantitativas: Años de Servicio y Salario Anual. Variables Cuantitativas Discretas: No hay. Variables Cuantitativas Continuas: Años de Servicio y Salario Anual. 6) Dar un dato Sueldo anual = $65000 7) Dar todos los datos de una muestra Los últimos 3 salarios de la población de empleados por Salario Anual, son: $1400, $18000, $12000 26 TEMA 3 Objetivo de aprendizaje. 3. Definir el concepto de probabilidad y relacionarlo con el de frecuencia relativa. Criterio de Aprendizaje. 3.1 Analizar el concepto de probabilidad y relacionarlo con el de frecuencia relativa Didáctica de enseñanza. Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o datos de muestras Supóngase un experimento cualquiera, por ejemplo, el número dos en el lanzamiento de un dado. El conjunto de todos los resultados posibles se llama universo o espacio de la muestra, en este caso, los números de 1 a 6 en el lanzamiento del dado en cuestión. Usualmente se utiliza el concepto de frecuencia para ilustrar el concepto de probabilidad. Supóngase que se estudian n resultados de un experimento, de los cuales m se consideran ocurrencias exitosas de un resultado deseado, E y P(E) denota la probabilidad de ocurrencia de dicho resultado; la relación entre el número de resultados exitosos m y el número de resultados posibles n, es una medida aproximada de la probabilidad de ese resultado, es decir: Esto es rigurosamente cierto cuando n es muy grande. Más formalmente, se deberá escribir así: Donde: P(E): Probabilidad que el resultado E ocurra. E: Resultado que interesa analizar. M: Número de veces que ocurre E. n: Número de veces que se ejecuta el experimento. Por ejemplo, si se desea saber cuál es la probabilidad de ocurrencia de que aparezca el número 2 en la cara superior cuando se lanza un dado, se podrían hacer lanzamientos seguidos y anotar cuántas veces aparece cada número, en particular el 2. Si esto se repite varias veces, entonces la relación entre el número de veces que apareció el 2 y el número de lanzamientos será un estimativo de la probabilidad. Esta frecuencia relativa tiende a un número; en el caso de un dado que no esté cargado, esta frecuencia tiende a 1/6. Una variable aleatoria está definida por una función que asigna un valor de dicha variable aleatoria a cada punto del universo. Por ejemplo, la variable aleatoria puede ser el valor que aparezca en la cara superior del dado, o el cuadrado de este valor, etc. En este ejemplo, E=2, m es el número de veces que aparece el número 2 y n es el número de lanzamientos. Propiedades básicas de la probabilidad 27 A continuación se presentan algunas propiedades básicas de la probabilidad. 1) La probabilidad de un resultado del universo es una cantidad menor o igual que uno y mayor o igual que cero. Esto se explica porque la probabilidad está definida por la proporción entre un número de casos “exitosos” y el número total de casos. El número de casos “exitosos” es menor que el número total de casos. Ejercicio Lanzar una moneda 50 veces. Construir y completar en la hoja de cálculo la siguiente tabla de ejemplo: Construir una gráfica de los resultados con n en las abcisas y m/n en las ordenadas, como se ilustra a continuación. FRECUENCIA RELATIVA ACUMULADA DEL LANZAMIENTO DE UNA MONEDA 2) La probabilidad de un resultado que no puede ocurrir, o sea que no pertenece al universo, es cero. 3) La probabilidad del universo es uno. Es decir, la probabilidad de que ocurra alguno de los resultados de todo el conjunto posible de ellos es P(E1+E2+...+Em) y es igual a 1, donde (E1,E2,...,Em), son todos los resultados posibles, mutuamente excluyentes y exhaustivos del universo. Nota: Se dice que unos resultados son mutuamente excluyentes cuando la ocurrencia de cualquiera de ellos elimina la ocurrencia de cualquier otro. Todos los resultados posibles mi suman n, o sea: 28 m1+m2+m3+...mk = n (3) Si esta ecuación se divide por n, entonces la suma de las frecuencias relativas es igual a 1. m1/n+m2/n+m3/n+...mk/n = n/n = 1 Así pues en el límite: (4) P(E1)+P(E2)+P(E3)+...P(Ek) = 1 (5) 4) Si E y F son resultados mutuamente excluyentes, o sea que sólo uno de ellos puede ocurrir, entonces la probabilidad de que ocurra E o F es P (E+F) = P (E) + P(F). Nuevamente, en el lanzamiento de un dado de seis caras numeradas de 1 a 6, sólo un número aparecerá en la cara superior, por lo tanto, los resultados (E2) y (E6), o sea que aparezca 2 en un caso o que aparezca 6 en el otro, son resultados mutuamente excluyentes. La probabilidad de que ocurra E2 o E6 es de 1/6+1/6 o sea, 1/3. 5) Si E y F son resultados independientes, esto es, que la ocurrencia de uno no afecta la ocurrencia del otro, la probabilidad de que ocurran simultáneamente P(EF), es P(E) x P(F). Tomando como ejemplo el dado de seis caras, el hecho que en el primer lanzamiento del dado aparezca un 2, no influye para que en el segundo lanzamiento aparezca cierto número; los lanzamientos son resultados independientes. Entonces, la probabilidad de que en el primer lanzamiento aparezca un 2 y en el segundo aparezca un 6 será 1/6x1/6, o sea, 1/36. NOTA: Obsérvese que cuando se trata de resultados mutuamente excluyentes y se desea saber la probabilidad de que uno de los dos ocurra, se expresa con frases ligadas por o; en el caso de resultados independientes y si se desea calcular la probabilidad de que ambos ocurran, las frases se ligan con y. Estas propiedades son formales pero coinciden con las nociones intuitivas de probabilidad. Eventos y sus probabilidades En la realidad los hechos no son tan simples como en el ejemplo del dado. Ocurren combinaciones que complican un poco la situación. El cálculo de sus probabilidades es más complejo. Eventos y sus probabilidades La realidad es compleja y ocurren combinaciones de resultados; la combinación de varios resultados origina un evento. A través de un ejemplo se ilustrará esta idea. Ejemplo Supóngase que se desea analizar los resultados de una inversión $1.000 a tres años. El resultado de cada año es la ocurrencia de un ingreso por valor de $600 o $0. Los resultados posibles son: (NNN) = m1 (NNS) = m2 (NSN) = m3 (NSS) = m4 (SNN) = m5 (SSN) = m6 (SNS) = m7 (SSS) = m8 El orden de las letras se refiere año 1, 2 ó 3 y S indica si hay ingreso y N si no lo hay. 29 (NSS) significa un flujo de caja como este: Y así para los demás casos. Las probabilidades de que el resultado sea cero son: P(N)1 = ,3 P(N)2 = ,3 P(N)3 = ,3 NOTA: Se supone que los eventos son independientes entre sí. Esto significa que el resultado positivo de un año no influye en la probabilidad de que, en los años siguientes, el resultado sea también positivo. Esto en la realidad puede que no ocurra. Sin embargo, para efectos del análisis, se hará caso omiso de esta consideración. Entonces, las probabilidades asociadas a cada resultado combinado son: Estos resultados se denominarán puntos. Los eventos serán una combinación cualquiera de puntos. Así se puede pensar en el evento, “por lo menos un año con ingreso”, el cual incluiría los puntos m2, m3, 30 m4, m5, m6, m7 y m8, o en el evento “a lo sumo un año con ingreso cero”, el cual incluiría los puntos m4, m6, m7 y m8. Si la probabilidad de que ocurra el ingreso es diferente a 70%, hay que introducir los valores adecuados en los cálculos. La probabilidad de estos eventos será la suma de la probabilidad de los puntos. En el primer evento, la probabilidad será de: 0,063+0,063+0,147+0,063+0,147+0,147+0,343 = 0,973 En el segundo caso de: 0,147+0,147+0,147+0,343 = 0,784 Evidencia parcial Ta. 2 Realizar ejercicios donde se estime frecuencias relativas a partir de experimentos aleatorios y/o datos de muestras Evaluación parcial Entrega de Ta.2 31 TEMA 4 Objetivo de aprendizaje. 4. Definir el concepto de probabilidad y relacionarlo con el de la frecuencia relativa. Criterio de Aprendizaje. 4.1. Diferenciar el concepto de probabilidad y relacionarlo con el de la frecuencia relativa. Didáctica de enseñanza. Pa. 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro. Probabilidad condicional Generalmente hablando, la probabilidad condicional de un evento A dado otro evento B, denotada P(A|B) es la probabilidad de que el evento A ocurra cuando sabemos que el evento B ocurrió. Esta es razón por la cual se llama condicional a esta probabilidad. La probabilidad de que el evento A ocurra está condicionada por la ocurrencia de B. Esta información adicional sobre A se incluye en el cómputo de su probabilidad condicional cuando analizamos los resultados posibles que se pueden observar cuando sabemos que B ha ocurrido. Probabilidad condicional como la razón de dos áreas En algún punto de nuestras vidas, hemos jugado tirando dardos a un tablero. Supongamos que tenemos un tablero como el de al lado y tiramos un dardo. Usualmente, mientras más cerca del centro aterrice el dardo más puntos anotamos. Si sabemos que el dardo aterrizó en A, ¿cuán probable es que haya aterrizado en B? Por simplicidad, supondremos que tenemos muy buena puntería y que el dardo siempre cae en el tablero S. Esto significa que la probabilidad de que el dardo aterrice en el tablero es 1. Suponemos además, que S, A, B, C se refieren a los discos completos y no tan sólo a la franja. Así S es un disco que contiene al disco A, el que a su vez incluye el disco B. Este último incluye el disco C. Podemos relacionar la probabilidad de que un dardo aterrice en cualquier región directamente al área de la región. Les asignaremos probabilidades a las varias regiones en la tabla tomando la razón del área de la región al área del tablero. Esta asignación es razonable, ya que mientras más grande es la región, más probable debe ser que el dardo aterrice allí. Estamos considerando el área del tablero S como una unidad contra la cual comparar las otras áreas, además, si comparamos el área de S consigo misma obtendremos una razón de 1, por esto es razonable decir que el área de S es igual a su probabilidad, 1. Con esta suposición, el área de cada disco es igual a la probabilidad de que el dardo caiga en el disco. 32 Denotaremos el evento que el dardo aterrice en la región S, A, B o C por el nombre de la región. Supongamos que la razón del área de región A a S es 1/2, de la región B a S es 1/10 y de la región C a S es 1/60. Según la asignación de probabilidad que hicimos, tenemos que P(A) = 1/2, P (B) = 1/10, P (C) = 1/60 y P (S) = 1. Ahora hacemos el siguiente experimento: igual que con el juego de colocar la cola al burro, nos vendamos los ojos y lanzamos el dardo. Un juez nos dice que aterrizó en la región A. Entonces preguntamos ¿cuál es la probabilidad de que haya aterrizado en B? Si no hacemos uso del hecho de que el dardo aterrizó en A, contestaremos la probabilidad buscada es 1/10. Pero sabemos que el dardo aterrizó en A, que B está contenido totalmente en A y que el área de B es una quinta parte del área de A, entonces la respuesta correcta es 1/5, estableciendo que P (B|A) = (1/10)/(1/2) = 1/5. Esta expresión se justifica con el siguiente argumento. Como sabemos que el dardo ha aterrizado en A, el área de A ahora llega a ser una nueva unidad contra la cual medir otras áreas, esto explica el denominador. El numerador corresponde al área en común de las regiones A y B. Dado el hecho que el dardo aterrizó en A, la única manera en que el dardo puede aterrizar también en la región B es que haya aterrizado en ambas regiones. Ahora la región B está contenida en la región A, por lo cual A∩B= B y P (A∩B) = P (B). Pregunta ¿Cuál es la probabilidad que el dardo haya aterrizado en A si sabemos que aterrizó en B? Como sabemos que B está contenido totalmente en A, vemos que si el dardo aterriza en B entonces tiene que haber aterrizado en A. Siguiendo este razonamiento tenemos: P (A|B)= (área de A también en B)/ (área de B)= (área de B)/ (área de B)= 1. Pregunta Si el dardo aterrizó fuera de B, ¿cuál es la probabilidad que haya aterrizado en C? Un tablero general de dardos El tablero de la derecha nos presenta una situación más general. En este caso ninguna región (excepto S) contiene totalmente cualquier otra región, pero los argumentos todavía son válidos. Supongamos que las áreas de S, A, B y C son como antes. Supongamos ahora que el área en la intersección de las regiones A y B es 1/ 30. Todavía podemos preguntar las mismas preguntas. 33 Para calcular P (B|A) debemos darnos cuenta de que B tiene un pedazo pequeño en común con la región A. Este pedazo tiene área igual a 1/ 30. Si sabemos que el dardo aterrizó en A, para que haya caído en B, debe haber aterrizado en esta pequeña región en común. La región A es nuestra unidad de comparación. Comparamos el área en la intersección de A y B con el área de A para obtener nuestra contestación. Así P (B|A) es igual a la proporción (1/ 30) / ( 1/2)= 1/ 15. Este resultado se puede interpretar como el número de veces que la región en común entre A y B cabe en la región A. La respuesta a P (A|B) no es tan fácil de hallar como antes. Sabemos ahora que el dardo aterriza en la región B. Debemos hallar la proporción del área de la intersección de A y B al área de B. Ahora la región B es nuestra unidad y así P (A|B) es igual a (1/30) / (1/10)= 1/3. Un ejercicio fácil de resolver es hallar P (A|C). Como A y C son disjuntos, si el dardo aterrizó en C sabemos que es imposible que haya aterrizado también en A, por esta razón la probabilidad buscada debe ser cero. Una representación relacionada Otra forma de representar la probabilidad condicional se puede ver en el siguiente ejemplo. Supongamos que tomamos una muestra al azar de 100 estudiantes y obtenemos los siguientes resultados: 15 mujeres reciben ayuda económica y trabajan 45 mujeres reciben ayuda económica 20 mujeres trabajan 55 de los estudiantes son mujeres 25 estudiantes reciben ayuda económica y trabajan 60 estudiantes reciben ayuda económica 40 estudiantes trabajan Se puede traducir estos datos en proporciones o porcentajes y representar en un diagrama de Venn tal como a la derecha. El conjunto W representa todas las mujeres en la muestra, F el conjunto representa los estudiantes que reciben ayuda económica y J el conjunto de estudiantes en la muestra que trabajan. 34 Nos proponemos seleccionar al azar una persona de estos 100 estudiantes en la muestra. Entonces podemos hablar acerca de la probabilidad que la persona seleccionada es una mujer, por ejemplo. Sin temor a confundirnos, usaremos los nombres F, J y W para denotar el evento que la persona seleccionada recibe ayuda económica, trabaja o es una mujer, respectivamente. Entonces P (W)= .30 + .05 + .05 + .15 = .55, por ejemplo. De este diagrama de Venn podemos contestar rápidamente muchas preguntas que a primera vista parecen ser muy complicados, tal como, ¿qué proporción de estudiantes son mujeres que no trabajan y reciben ayuda económica? Esta pregunta es equivalente a encontrar P (W y F y no J). La solución, .30 se encuentra en la intersección de los tres conjuntos W, no J, F. La probabilidad condicional se ve en situaciones donde queremos saber, por ejemplo‚ qué proporción de estudiantes que trabajan son mujeres. Esto es equivalente a encontrar P (W | J). La proporción de estudiantes que trabajan es .40, la proporción de mujeres que trabajan es .20. De esta manera la proporción de mujeres de entre todos los estudiantes que trabajan‚ es .20/ .40= .50, es decir, la mitad de los estudiantes que trabajan son mujeres. Igual a las ideas desarrolladas previamente podemos escribir la solución como P (W | J ) = P (W y J)/ P (J) = .20/ .40 = .50. El diagrama de Venn que representa los resultados obtenidos en la encuesta parece también un tablero de dardos. La probabilidad de que el dardo caiga en cualquiera de esas regiones está dada por la proporción de estudiantes representados en esa región. Probabilidad condicional y el conteo de resultados Lanzamos dos dados balanceados, uno rojo y el otro verde. El espacio muestral de este experimento consta de 36 pares ordenados tal como en la tabla más abajo. Dejemos que R y G denoten el valor observado en la cara del dado rojo y en el dado verde, respectivamente y X la suma de los valores observados, es decir, X = R + G. Si suponemos que los dados están balanceados, entonces los 36 resultados distintos del experimento son igualmente probables. Por la forma como se lleva a cabo el experimento, vemos que el valor observado en un dado no está relacionado con el valor en el otro dado, es decir. El valor obtenido en un dado es independiente del obtenido en el otro. De estas suposiciones tenemos que P (R = r) = P (G = g) = 1/ 6 y que P (R= r, G= g)= 1/ 36 para r, g= 1,2, ..., 6. En esta situación muchas preguntas acerca de la probabilidad de eventos particulares se pueden reducir a contar el número de elementos en el conjunto apropiado. 35 Espacio muestral de los resultados al tirar dos dados Pregunta Encontremos la probabilidad que el número de puntos en el dado rojo es menor o igual a 3: P(R 3). Para encontrar esta probabilidad debemos contar el número de pares en la tabla para los cuales R ≤ Vemos que hay 18 de estos pares de un total de 36 pares posibles así obtenemos P (R ≤ 1/2. Pregunta ¿Cuál es la probabilidad que la suma X de los valores observados en los dos dados es menor de 6, es decir, P (X< 6)? El número de pares donde observamos esta situación es 10, de un total de 36 pares posibles, por eso debemos tener P(X < 6) = P (X ≤ Supongamos estás en tu casa y un amigo te invita a jugar un juego donde se lanzan dos dados, tal como Parchís. A ti te interesa que la suma de los puntos en los dados sea 9. Tiras los dados, pero no miras el resultado. Tu amigo te dice que la suma de los dados es mayor de 7. ¿Te dice algo este dato? ¿Cuáles son ahora tus oportunidades de haber obtenido 9? Si hubiera dicho que la suma era menor de siete sabrías de seguro que perdiste. Necesitamos calcular P ( X= 9 | X> 7). Antes de tirar los dados, sabías que la probabilidad de ganar, P(X=9) era igual a 4/ 36. ¿Cambió esto? En la Tabla 2 están señalados todos los pares donde X > 7 y los pares donde X = 9. Regiones donde X > 7 y X = 9 36 Como sabemos que X > 7 el resultado observado debe estar dentro del triángulo azul. Allí hay 15 pares distintos de los cuales cuatro son consistentes con X= 9, por esto P (X = 9| X> 7)= 4/ 15‚ esto significa que tus oportunidades de haber ganado han aumentado. El resultado se puede obtener de la siguiente forma. La proporción de pares donde X > 7 es 15/ 36. La proporción de pares donde X > 7 y X = 9 es 4/ 36, siguiendo las ideas anteriores tenemos que P ( X = 9| X > 7) = (4/36) ¸ (15/ 36) = 4/ 15. Igual que antes esta representación se asemeja a un tablero de dardos y el resultado se obtiene al comparar el "área" de la región que representa X = 9 con el "área" de la región que representa X > 9. De igual manera, también se asemeja a un diagrama de Venn. Considera la probabilidad de que en el dado Rojo se observe un tres si sabemos que la suma de los dados es 5, es decir, P (R = 3 | X= 5). De la Tabla 1 se puede ver que P (X = 5)= 4/ 36, P (R = 3)= 6/ 36 y P( X = 5 y R = 3) = 1/36. La suma X es igual a cinco sólo cuando se observa uno de los cuatro pares: (1,4), (2,3), (3,2), (4,1). De esos, sólo uno es compatible con que el dado rojo sea igual a 3, por esta razón, P (R = 3| X= 5)= 1/ 4. Este resultado implica que el evento {R = 3} afecta la probabilidad de que el evento {X = 5} ocurra. Antes de hacer el experimento, la probabilidad de observar {R=3} es 1/6, pero ahora sabemos que {X=5} ocurrió y por lo tanto la probabilidad de observar {R=3} es ahora 1/4. Pregunta ¿Qué hubiera pasado si el evento que condiciona hubiera sido X= 7? De la tabla se puede ver que P (R = 3 | X = 7) = 1/6 = P (R = 3). Es decir, el saber que {X=7} ocurrió no nos ofrece información alguna sobre la probabilidad de que {R=3} ocurra. Probabilidad condicional y árboles Otra manera natural y útil de estudiar probabilidad condicional es por medio de una estructura de árbol. Esta forma de visualizar el experimento es particularmente pertinente cuando éste se ejecuta en etapas. Toma por ejemplo el experimento de seleccionar a la vez dos canicas al azar de una caja que contiene 2 rojas y 3 azules. Este experimento es equivalente al de seleccionar al azar una canica, y entonces, sin reemplazar la primera, seleccionar al azar otra canica. Este proceso se puede visualizar fácilmente por medio de un árbol. En cada nodo del árbol representamos el número de canicas rojas y azules que quedan en la caja. Las ramas que emanan de cada nodo representan los dos resultados posibles que se pueden obtener cuando se selecciona una canica al azar: rojo o azul. Cada rama es rotulada por el resultado obtenido y por la probabilidad condicional de observar ese resultado. Los nodos al final representan los estados finales posibles que podemos obtener como resultado del experimento. Estos nodos finales se llaman hojas. 37 Diagrama de árbol que ilustra el experimento de seleccionar dos canicas de una caja Pregunta ¿Cuál es la probabilidad que la segunda canica seleccionada sea roja dado que la primera es azul? Si la primera canica fue azul, ahora quedan en la caja dos canicas rojas y dos azules. De ahí seleccionamos otra canica. La probabilidad de que una canica seleccionada de esa caja sea roja es 2/4. Para facilitar el trabajo denotamos el evento de que la primera canica seleccionada es roja por R1 y el evento de que la segunda sea roja por R2. Hacemos lo propio para las canicas azules. Esta representación es útil para encontrar probabilidades conjuntas y marginales. Por ejemplo, la probabilidad que la primera canica sea roja y la segunda azul, denotada P (R1 y B2) es el producto de las probabilidades que rotulan el camino de la raíz del árbol y que son consistentes con los resultados R1 y B2. Entonces P (R1 y B2) = 2/5 x 3/4 = 6/20. Si nos interesamos por la probabilidad marginal de que la segunda canica sea roja, P(R2), tenemos que darnos cuenta de que hay dos caminos posibles en que la segunda canica es roja. Estos dos caminos dependen del resultado que se observó cuando seleccionamos la primera canica, que pudo haber sido rojo o azul. Así observamos una canica roja en la segunda selección cuando cualquiera de los dos eventos conjuntos (B1 y R2) ó (R1 y R2) ocurren. Estos son eventos son disjuntos por lo cual P ( R2 ) = P (B1 y R2) + P (R1 y R2) = 6/20+ 2/20 = 8/20. Los árboles son especialmente útiles para encontrar probabilidades condicionales tal como P( R1 | B2 ). Esta probabilidad se puede entender si pensamos en un experimento donde escogemos una canica al azar, sin mirarla, la escondemos y luego seleccionamos al azar otra canica. Si la segunda canica seleccionada es azul, ¿cuál es la probabilidad que la canica que escogimos primero era roja? Una forma de contestar esta pregunta es usando la Regla de Bayes, que aún no hemos estudiado. Otra forma es la siguiente. Imaginemos que antes de comenzar el experimento quitamos una canica azul. Esa será la canica azul que escogeremos como segunda selección, la hemos reservado de antemano. Ahora, en esta caja imaginaria hay 2 canicas rojas y 2 azules, por esta razón la probabilidad P (R1 | B2) debe ser igual a (número de canicas rojas) / (número total de canicas) = 2/4. Probabilidad condicional en general Estos ejemplos motivan la definición matemática de probabilidad condicional de que un evento A ocurra cuando sabemos que el evento B ocurrió como: Pregunta Verifica que la medida P( • | B) satisface los axiomas de probabilidad, es decir, si B es un evento fijo en el espacio muestral S, entonces P( • | B) es una medida de probabilidad. Con la representación del árbol vimos como obtener la probabilidad conjunta de dos eventos A, B. Por ejemplo, vimos que para obtener la probabilidad de que la primera canica fuera roja y la segunda fuera azul, P(R1 y B2) multiplicamos P ( B2 | R1 ) por la cantidad P (R1) a lo largo de las ramas apropiadas 38 del árbol. Esta operación se justifica ahora por nuestra definición de probabilidad condicional. Si A, B son dos eventos cualquiera en un espacio muestral S, tenemos la regla de multiplicación. Teorema 1 (Regla de multiplicación) Si A , B son dos eventos cualquiera en un espacio muestral S donde P(B) > 0, tenemos P(A y B) = P(A | B) P(B). Prueba Usa la definición de probabilidad condicional. Ejemplo 1 Tienes los cuatro ases de la baraja en tus manos {A♠, A♣, A♥, A♦}. Sabemos que dos de esas barajas son rojas y las otras dos son de color negro. Sin mirar, un amigo selecciona una baraja primero luego de las restantes tres selecciona una segunda baraja. Queremos encontrar la probabilidad del evento que ambas barajas seleccionadas sean rojas, {A♥, A♦}. La única forma en que ambas barajas serán rojas es que la primera sea roja y dado que la primera fue roja, la segunda debe ser roja también. La probabilidad de que la primera sea roja es 2/4. Si la primera fue roja, la probabilidad de que la segunda sea roja es entonces 1/3. Por lo tanto P(ambas barajas son rojas)=2/4 ´ 1/3 = 2/12. Pregunta Enumera el espacio muestral de este experimento. ¿Cuál representación sería más útil? Expresa el problema del Ejemplo 1 en forma de símbolos, usando la regla de multiplicación. Ejemplo 2 El almacén de la UT recibe 100 togas para su graduación. El fabricante había llamado a la escuela para anticiparle que entre esas 100 togas hay 10 que son de un tamaño equivocado, muy pequeñas para estudiantes de escuela superior. Seleccionamos dos togas al azar. ¿Cuál es la probabilidad de que ambas sean muy pequeñas? Seguimos el mismo argumento de arriba para resolver este ejercicio. La probabilidad de que la primera seleccionada sea muy pequeña es 10/100. Una vez seleccionada la primera toga pequeña, seleccionamos la siguiente toga de las restantes 99, de las cuales ahora 9 son muy pequeñas. Así, la probabilidad de que ambas sean muy pequeñas es 10/100 ´ 9/99. ¿Qué tal si seleccionamos 3 togas? ¿Cuál es la probabilidad de que las tres sean muy pequeñas? Podemos representar este experimento con un árbol que tiene 8 ramas (¿cómo?). Esto nos permite extender el argumento de antes. En este caso la probabilidad deseada es 10/100 ´ 9/99 ´ 8/98. Esta situación facilita el generalizar la regla de multiplicación. Para facilitar la discusión representemos por T1 el evento de que la primera toga sea muy pequeña, por T2 el evento de que la segunda sea muy pequeña y por T3 el evento de que la tercera toga sea muy pequeña. Vemos que 10/100 es la probabilidad de que la primera toga sea pequeña, es decir P( T1 ). El valor 9/99 representa la probabilidad de que la segunda sea pequeña si la primera fue pequeña, P( T2 | T1 ). El valor 8/98 es un poco más complicado. Para obtener la tercera toga pequeña en sucesión, debimos haber seleccionado la primera y la segunda togas pequeñas, así, 8/98 es el resultado de calcular P( T3 | T1 y T2 ). La probabilidad de que las tres togas sean pequeñas es entonces P( T1 y T2 y T3 ) = P( T1 ) P( T2 | T1) P( T3 | T1 y T2 ). Este resultado se puede escribir ahora como un teorema. 39 Teorema 2 Sean A, B, C eventos cualquiera en un espacio muestral S tal que P(A) > 0 y P(A∩B) > 0. Entonces P( A∩B∩C ) = P(A) P(A | B) P(C | A∩B). Prueba. P( A∩B∩C ) = P( (A∩B)∩C ) = P( C | A∩B) P(A∩B), usando la regla de multiplicación para los eventos C y A∩B. Usamos nuevamente esa regla para calcular P( A∩B ) = P(A | B) P(B) y sustituimos arriba para obtener el resultado. Pregunta Usa inducción matemática para generalizar esta regla para n eventos. 40 Práctica 1 Elaborar ejercicios donde se emplee la fórmula de probabilidad condicional en problemas del ámbito profesional donde la ocurrencia de un evento dependa de otro. Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. 1. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar y anota su color. a. Representa el experimento usando un árbol. b. Enumera el espacio muestral. c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica seleccionada: i. sea negra. ii. sea blanca. iii. no sea negra iv. sea blanca o negra v. sea negra y blanca. d. Ilustra los eventos de arriba en el árbol que representa el experimento y en un diagrama de Venn. e. Encuentra la probabilidad de que la canica seleccionada: i. sea negra. ii. sea blanca. iii. no sea negra iv. sea blanca o negra v. sea negra y blanca. 2. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar, anota su color y devuélvela a la caja. Selecciona otra canica y anota su color. a. Representa el experimento usando un árbol. b. Enumera el espacio muestral. c. Encuentra la probabilidad de que la primera canica seleccionada: i. sea negra. ii. sea blanca. iii. no sea negra iv. sea blanca o negra v. sea negra y blanca. d. Usa la notación y operaciones de conjuntos para representar el evento de que: i. ambas canicas seleccionadas sean negras. ii. una de las canicas seleccionadas sea blanca. iii. ninguna canica sea blanca. iv. la segunda canica sea blanca si la primera fue negra. v. la primera canica sea blanca si la segunda no fue blanca. vi. la segunda canica es blanca. e. Encuentra la probabilidad de que: i. ambas canicas seleccionadas sean negras. ii. una de las canicas selecionadas sea blanca. iii. ninguna canica sea blanca. iv. la primera canica es blanca y la segunda es negra, 41 v. la segunda canica sea blanca si la primera fue negra. vi. la primera canica sea blanca si la segunda no fue blanca. f. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda canica sea blanca? Explica. g. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica. 3. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar, anota su color, esta vez no la devuelvas a la caja. Selecciona otra canica y anota su color. a. Enumera el espacio muestral. b. Encuentra la probabilidad de que: i. ambas canicas seleccionadas sean negras. ii. una de las canicas seleccionadas sea blanca. iii. ninguna canica sea blanca. iv. la primera canica no es ni blanca ni negra. v. la primera canica es blanca y la segunda es negra. vi. la segunda canica sea blanca si la primera fue negra. vii. la primera canica sea blanca si la segunda no fue blanca. viii. la segunda canica es blanca. c. ¿En qué se distingue este experimento del efectuado en el problema número 2? d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda canica sea blanca? Explica. e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica. 4. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas del mismo color de la canica seleccionada. Selecciona otra canica y anota su color. a. Representa el experimento usando un árbol. b. Enumera el espacio muestral. c. Encuentra la probabilidad de que: i. ambas canicas seleccionadas sean negras. ii. una de las canicas seleccionadas sea blanca. iii. ninguna canica sea blanca. iv. la primera canica no es ni blanca ni negra. 42 v. la primera canica es blanca y la segunda es negra. vi. la segunda canica sea blanca si la primera fue negra. vii. la primera canica sea blanca si la segunda no fue blanca. viii. la segunda canica sea negra. d. ¿Es el evento de que la primera canica sea negra independiente del evento de que la segunda canica sea blanca? Explica. e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica. 5. Considera una caja con seis canicas. Dos de las canicas son blancas, una es roja y las restantes son negras. Selecciona una canica al azar, anota su color, devuélvela a la caja y añade a la caja dos canicas del mismo color de la canica seleccionada. Selecciona otra canica y anota su color. a. Representa el experimento usando un árbol. b. Enumera el espacio muestral. c. Encuentra la probabilidad de que: i. ambas canicas seleccionadas sean rojas. ii. una de las canicas seleccionadas sea blanca. iii. ninguna canica sea blanca. iv. la primera canica no es ni blanca ni negra. v. la primera canica es blanca y la segunda es roja. vi. la segunda canica sea roja si la primera fue roja. vii. la primera canica sea negra si la segunda no fue blanca. viii. las dos canicas sean de colores distintos. ix. las dos canicas sean del mismo color. x. la segunda canica sea negra. d. ¿Es el evento de que la primera canica sea roja independiente del evento de que la segunda canica sea blanca? ¿Son estos eventos mutuamente excluyentes? Explica. e. ¿Son los eventos {la primera canica es negra}, {la segunda canica es blanca} mutuamente excluyentes? Explica. 6. Considera una caja con cinco canicas. Dos de las canicas son blancas y las restantes son negras. A la misma vez, selecciona dos canicas al azar y anota sus colores. a. Representa el experimento usando un árbol. b. Enumera el espacio muestral. c. Usa la notación y operaciones de conjuntos para representar el evento de que las canicas seleccionadas: i. ambas sean negras. ii. ninguna sea negra. iii. sean de colores distintos. d. Ilustra los eventos de arriba en el árbol que representa el experimento. e. Encuentra la probabilidad de que las canicas seleccionadas: i. ambas sean negras. ii. ninguna sea blanca. 43 iii. sean de colores distintos. f. ¿Tiene alguna relación este problema con el número 3 arriba? Explica. Hacemos un experimento con dos cajas. La caja A tiene siete canicas. En esta caja, dos de las canicas son blancas, tres son rojas y dos son negras. La caja B tiene seis canicas. Cuatro de las canicas en B son rojas y dos son negras. Se tira un dado para decidir de cuál caja se selecciona una canica al azar. Si se observa el evento {1,2,3,4} se selecciona una canica de la caja A. En el caso de observar el evento {5,6} se selecciona al azar una canica de la caja B. a. Representa el experimento usando un árbol. b. Enumera el espacio muestral. c. Usa la notación y operaciones de conjuntos para representar el evento de que la canica seleccionada: i. sea negra. ii. no sea roja. iii. sea negra ó blanca. iv. provenga de la caja A v. sea roja y venga de la caja B. vi. sea blanca y venga de la caja B. d. Ilustra los eventos de arriba en el árbol que representa el experimento. e. Encuentra la probabilidad de que la canica seleccionada: i. sea negra. ii. no sea roja. iii. sea negra ó blanca. iv. provenga de la caja A v. sea roja y venga de la caja B. vi. sea blanca y venga de la caja A. vii. sea negra dado que viene de la caja B. viii. sea blanca dado que viene de la caja B. ix. haya provenido de la caja B dado que es blanca. x. haya provenido de la caja A dado que es roja. f. ¿Puedes generalizar tus resultados en ix y x? Explica. 44 TEMA 5 Objetivo de aprendizaje. 5. Definir el Teorema de Bayes. Criterio de Aprendizaje. 5.1. Utilizar el teorema de Bayes en problemas del ámbito profesional que involucren probabilidades subjetivas. Didáctica de enseñanza. Pa. 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución Un problema que nos sirve de introducción En el distrito universitario de Jauja los estudiantes se distribuyen entre las tres carreras que pueden cursarse del siguiente modo: el 20% estudian arquitectura, el 35% medicina y el 45% economía. El porcentaje de alumnos que finalizan sus estudios en cada caso es del 5%, 12% y del 18%. Elegido un alumno al azar determinar la probabilidad de que haya acabado los estudios. Como Sea T el suceso "finalizar los estudios". Como E = A1 o A2 o A3 T = (T y E) = T y (A1 o A2 o A3) = = (T y A1) o (T y A2) o (T y A3) Resulta p(T) = p(T y A1) + p(T y A2) + (T y A3) Y por tanto p(T) = = p(A1) × p(T/A1) + + p(A2) × p(T/A2) + + p(A3) × p(T/A3) Vemos todo esto mediante un diagrama de flujo y calculamos la probabilidad de que un alumno elegido al azar haya terminado los estudios. Si A1, A2, y A3 son, respectivamente, los sucesos "estudiar arquitectura", "estudiar medicina" y "estudiar economía" resulta p(Ai) = 1 Y los sucesos A1, A2, y A3 son incompatibles (no existen estudiantes que cursen dos carreras). Además 45 E = A1 o A2 o A3 En estas condiciones podemos aplicar el razonamiento de la columna de la izquierda. A partir del razonamiento anterior podemos enunciar el siguiente teorema que es conocido como teorema de la probabilidad total Si los sucesos A1, A2, A3 ... An son una partición ( ) del espacio Muestral E y T un suceso de S, entonces Otro ejemplo y una pregunta 46 La fábrica de enlatados PI S.A. produce 5000 envases diarios. La máquina A produce 3000 de estos envases, de los que el 2% son defectuosos y la máquina B produce los 2000 restantes de los que se sabe que el 4% son defectuosos. Determinar la probabilidad de que un envase elegido al azar sea defectuoso. Si D es el suceso "seleccionar un envase defectuoso" y (no D) = "seleccionar un envase no defectuoso", el diagrama siguiente nos muestra el camino Aplicando el teorema anterior resulta: p(D) = p(A y D) + p(B y D) = p(A) × p(D/A) + p(B) × p(D/B) = 0,028 Y ahora la pregunta ¿Si el envase seleccionado es defectuoso, qué probabilidad hay de que proceda de la máquina A? ¿Y de la B? Es decir, sabemos que la botella seleccionada es defectuosa La respuesta a dicha cuestión viene dada por la denominada fórmula de Bayes Probabilidad de que provenga de la máquina A Calculamos la probabilidad p(A/D) es decir, la probabilidad de que provenga de la máquina A en el supuesto que el envase es defectuoso: Probabilidad de que provenga de la máquina B Calculamos la probabilidad p(B/D) es decir, la probabilidad de que provenga de la máquina B en el supuesto que el envase es defectuoso: Las expresiones 47 Son las de la "fórmula de Bayes" para cada uno de las preguntas formuladas. Estas expresiones pueden generalizarse fácilmente para un conjunto finito de sucesos con las condiciones indicadas. Podemos hacernos ahora varias preguntas que son fáciles de contestar. Por ejemplo:  ¿Si el envase no es defectuoso, qué probabilidad hay de que provenga de la máquina A?. ¿Y de la B?. O bien, teniendo en cuenta el primer ejercicio, ¿si un alumno seleccionado ha finalizado la carrera, qué probabilidad hay que haya estudiado arquitectura?. ¿Y medicina? Y además ya estamos en condiciones de resolver el problema enunciado en la portada. Thomas Bayes nació en Londres, Inglaterra. Su padre fue ministro presbiteriano. Posiblemente De Moivre fue su maestro particular, pues se sabe que por ese entonces ejercía como profesor en Londres. Bayes fue ordenado ministro presbiteriano y muere en 1761. Sus restos descansan en el cementerio londinense de Bunhill Fields. La traducción de la inscripción en su tumba es Reverendo Thomas Bayes. Hijo de los conocidos Joshua y Ann Bayes. 7 de abril de 1761. En reconocimiento al importante trabajo que realizó Thomas Bayes en probabilidad. Su tumba fue restaurada en 1969 con donativos de estadísticos de todo el mundo. Miembro de la Royal Society desde 1742, Bayes fue uno de los primeros en utilizar la probabilidad inductivamente y establecer una base matemática para la inferencia probabilística. Publicó los trabajos: Divine Providence and Government Is the Happiness of His Creatures (1731) An Introduction to the Doctrine of Fluxions, and a Defence of The Analyst (1736) En 1763, dos años después de su muerte, se publica Essay Towards Solving a Problem in the Doctrine of Chances, en el que trataba el problema de las causas a través de los efectos observados, y donde se enuncia el teorema que lleva su nombre. El trabajo fue entregado a la Royal Society por Richard Price y es la base de la técnica bayesiana. 48 En una urna hay 5 bolas, 3 azules y 2 verdes. Se saca una bola de la urna y sin mirarla, se guarda. A continuación se vuelve a sacar otra bola que es verde. ¿Cuál es la probabilidad de que la primera haya sido verde?. Y si la segunda hubiera sido azul, ¿cuál es la probabilidad de que la primera sea verde?. ¿Y azul?. Un diagrama nos aclara la situación En donde (A1 y A2), es el suceso "sacar azul la primera bola y azul la segunda" y análogamente los restantes (A1 y V2), (V1 y A2), (V1 y V2). Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido verde) Aplicamos el teorema de Bayes y resulta: Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido azul) Aplicamos el teorema de Bayes y resulta: Probabilidad de que la primera haya sido azul (en el supuesto que la segunda ha sido azul) Aplicamos el teorema de Bayes y resulta: 49 Práctica 2 Elaborar ejercicios donde se planteen problemas del ámbito profesional que involucren probabilidades subjetivas y aplicar el Teorema de Bayes en su solución Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. 1) Los alumnos de la Universidad Tecnológica, proceden de 3 localidades A, B y C, siendo un 20% de A, un 30% de B y el resto de C. El 80% de los alumnos de A cursa 1º cuatrimestre y el resto 4º. El 50% de los alumnos de B cursa 1º cuatrimestre y el resto 4º. El 60% de los alumnos de C cursa 1º cuatrimestre y el resto 4º. (a) Seleccionado, al azar, un alumno la Universidad Tecnológica, ¿cuál es la probabilidad de que sea de 4º? (b) Si elegimos, al azar, un alumno la Universidad Tecnológica y éste es un alumno de 1º, ¿cuál es la probabilidad de que proceda de la localidad B? 2) Según la estadística de los resultados en las Prueba de Acceso en una provincia andaluza, en septiembre de 2001, el número de alumnas presentadas es de 840, de las que han aprobado un 70%, mientras que el número de alumnos presentados es 668, habiendo aprobado un 75% de estos. (a) Elegida, al azar, una persona presentada a las Pruebas, ¿cuál es la probabilidad de que haya aprobado? (b) Sabiendo que una persona ha aprobado, ¿cuál es la probabilidad de que sea varón? 50 CAPITULO 2 ORGANIZACIÓN Y PRESENTACIÓN DE DATOS INTRODUCCIÓN El propósito de la presente unidad es que el alumno adquiera la habilidad para ordenar y tabular datos, construyendo con ellos diversas gráficas que le permitirán calcular sus medidas de tendencia central y dispersión, así como utilizar los fundamentos matemáticos de probabilidad para resolver algunos problemas de Procesos Agroindustriales que se presentan en las empresas. OBJETIVO Y CRITERIOS DE APRENDIZAJE 1- . Reconocer los métodos tabulares de presentación de datos. 1.1. . Ilustrar y describir tablas de frecuencias relativas y absolutas. 1.2. . Ilustrar y describir tablas para representar dos conjuntos de datos. Página 52 52 52 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1. Utilizar las tablas de frecuencias relativas y absolutas, de datos. 1.2.1. Utilizar tablas para representar dos conjuntos de datos. OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Diferenciar los métodos gráficos empleados para organizar datos 2.1. Ilustrar los métodos gráficos empleados para organizar datos. 60 60 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 2.1.1 Utilizar métodos gráficos empleados para organizar datos. DEMOSTRACIÓN DE HABILIDADES FINALES Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así como también tablas para representar dos conjuntos de datos. Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias. 59 70 51 TEMA 1 Objetivo de aprendizaje. 1. Reconocer los métodos tabulares de presentación de datos. Criterio de Aprendizaje. 1.1. Ilustrar y describir tablas de frecuencias relativas y absolutas. 1.2. Ilustrar y describir tablas para representar dos conjuntos de datos. Didáctica de enseñanza. Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así como también tablas para representar dos conjuntos de datos. Consideremos una población estadística de n individuos, descrita según un carácter o variable C cuyas modalidades han sido agrupadas en un número k de clases, que denotamos mediante Para cada una de las clases ci, . , introducimos las siguientes magnitudes: Frecuencia absoluta De la clase ci es el número ni, de observaciones que presentan una modalidad perteneciente a esa clase. Frecuencia relativa De la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total de observaciones, es decir Obsérvese que fi es el tanto por uno de observaciones que están en la clase ci. Multiplicado por 100% representa el porcentaje de la población que comprende esa clase. Frecuencia absoluta acumulada Ni, se calcula sobre variables cuantitativas o cuasicuantitativas, y es el número de elementos de la población cuya modalidad es inferior o equivalente a la modalidad ci: Frecuencia relativa acumulada Fi, se calcula sobre variables cuantitativas o cuasicuantitativas, siendo el tanto por uno de los elementos de la población que están en alguna de las clases y que presentan una modalidad inferior o igual a la ci, es decir, Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que 52 O lo que es lo mismo, Frecuencia absoluta (ni): Número de elementos que presentan la clase xi. Frecuencia relativa: . Frecuencia absoluta acumulada: . Frecuencia relativa acumulada: Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias correspondientes a cada una de ellas. Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente: Modali. Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu. C ni fi Ni Fi c1 n1 ... ... cj nj ... ... ck nk n N1 = n1 ... ... ... ... ... ... Nk = n Fk = 1 1 Ejemplo Calcular los datos que faltan en la siguiente tabla: li-1 -- li ni fi Ni 53 0 -- 10 60 f1 10 -- 20 n2 0,4 N2 20 -- 30 30 f3 30 -- 100 n4 0,1 N4 100 -- 200 n5 f5 60 170 200 n Solución: Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n=200. Como N3=170 y n3=30, entonces N2=N3-n3=170-30=140. Además al ser n1=60, tenemos que n2=N2-n1=140-60=80. Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa correspondiente: Así: N4=n4+N3=20+170 =190. Este último cálculo nos permite obtener n5=N5-N4=200-190=10. Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas: Escribimos entonces la tabla completa: li-1 -- li ni fi Ni 0 -- 10 60 0,3 60 10 -- 20 80 0,4 140 20 -- 30 30 0,15 170 30 -- 100 20 0,1 100 -- 200 10 190 0,05 200 200 54 Elección de las clases En cuanto a la elección de las clases, deben seguirse los siguientes criterios en función del tipo de variable que estudiemos:  Cuando se trate de variables cualitativas o cuasicuantitativas, las clases ci serán de tipo nominal;  En el caso de variables cuantitativas, existen dos posibilidades: o o Si la variable es discreta, las clases serán valores numéricos ; Si la variable es continua las clases vendrán definidas mediante lo que denominamos intervalos. En este caso, las modalidades que contiene una clase son todos los valores numéricos posibles contenidos en el intervalo, el cual viene normalmente definido de la forma O bien En estos casos llamaremos amplitud del intervalo a las cantidades ai = li-li-1 Y marca de clase ci, a un punto representativo del intervalo. Si éste es acotado, tomamos como marca de clase al punto más representativo, es decir al punto medio del intervalo, La marca de clase no es más que una forma abreviada de representar un intervalo mediante uno de sus puntos. Por ello hemos tomado como representante, el punto medio del mismo. Esto está plenamente justificado si recordamos que cuando se mide una variable continua como el peso, la cantidad con cierto número de decimales que expresa esta medición, no es el valor exacto de la variable, sino una medida que contiene cierto margen de error, y por tanto representa a todo un intervalo del cual ella es el centro. En el caso de variables continuas, la forma de la tabla estadística es la siguiente: Interv. M. clase Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum. C ni l0 -- l1 c1 n1 ... ... ... lj-1 -- lj cj nj ... ... ... lk-1 -- lk ck nk n fi ... ... Ni Fi N1 = n1 F1 = f1 ... ... Nj= Nj-1+nj Fj = Fj-1 + fj ... ... Nk=n Fk =1 1 55 Elección de intervalos para variables continuas A la hora de seleccionar los intervalos para las variables continuas, se plantean varios problemas como son el número de intervalos a elegir y sus tamaños respectivos. La notación más común que usaremos para un intervalo sea El primer intervalo, l0 -- l1, podemos a cerrarlo en el extremo inferior para no excluir la observación más pequeña, l0 Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos. El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto tomaremos un k que nos permita trabajar cómodamente y ver bien la estructura de los datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados: Por ejemplo si el número de observaciones que tenemos es n=100, un buen criterio es agrupar las observaciones en intervalos. Sin embargo si tenemos n=1.000.000, será mas razonable elegir intervalos, que . La amplitud de cada intervalo ai = li -li-1 Suele tomarse constante, considerando la observación más pequeña y más grande de la población (respectivamente y ) para calcular la amplitud total, A, de la población A= lk - l0 de forma que la amplitud de cada intervalo sea: Así la división en intervalos podría hacerse tomando: 56 Observación Podría ocurrir que la cantidad a fuese un número muy desagradable a la hora de escribir los intervalos (ej. a=10,325467). En este caso, es recomendable variar simétricamente los extremos, , de forma que se tenga que a es un número más simple (ej. a=10). Recorrido: Amplitud: ai= li - li-1 Marca de clase: Frecuencias rectificadas: ; Ejemplo Sobre un grupo de n=21 personas se realizan las siguientes observaciones de sus pesos, medidos en kilogramos: 58 42 51 54 40 39 49 56 58 57 59 63 58 66 70 72 71 69 70 68 64 Agrupar los datos en una tabla estadística. Solución: En primer lugar hay que observar que si denominamos X a la variable ``peso de cada persona'' esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una tabla estadística, esto se ha de hacer agrupándolos en intervalos de longitud conveniente. Esto nos lleva a perder cierto grado de precisión. Para que la perdida de información no sea muy relevante seguimos el criterio de utilizar intervalos (no son demasiadas las observaciones). En este punto podemos tomar bien k=4 o bien k=5. Arbitrariamente se elige una de estas dos posibilidades. Por ejemplo, vamos a tomar k=5. Lo siguiente es determinar la longitud de cada intervalo, ai . Lo más cómodo es tomar la misma longitud en todos los intervalos, ai=a (aunque esto no tiene por qué ser necesariamente así), donde 57 Entonces tomaremos k=5 intervalos de longitud a=6,6comenzando por l0=xmin=39 y terminando en l5=33: Intervalos M. clase f.a. li-1 -- li f.r. f.a.a. ci ni fi 42,3 3 0,1428 3 0,1428 i=2 45,6 -- 52,2 48,9 2 0,0952 5 0,2381 i=3 52,2 -- 58,8 55,5 6 0,2857 11 0,5238 i=4 58,8 -- 65,4 62,1 3 0,1428 14 0,6667 i=5 65,4 -- 72 7 0,3333 21 i=1 39 -- 45,6 68,7 Ni f.r.a. Fi 21 Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades más simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir l0 y l5 no es muy estricta podemos hacer la siguiente elección: ya que así la tabla estadística no contiene decimales en la expresión de los intervalos, y el exceso d, cometido al ampliar el rango de las observaciones desde A hasta A', se reparte del mismo modo a los lados de las observaciones menores y mayores: Intervalos M. clase f.a. li-1 -- li f.r. f.a.a. Ni f.r.a. ci ni fi Fi i=1 38 -- 45 41,5 3 0,1428 3 0,1428 i=2 45 -- 52 48,5 2 0,0952 5 0,2381 i=3 52 -- 59 55,5 7 0,3333 12 0,5714 i=4 59 -- 66 62,5 3 0,1428 15 0,7143 i=5 66 -- 73 69,5 6 0,2857 21 21 58 Evidencia parcial Ta. 3 Realizar ejercicios, organizando datos en tablas de frecuencia relativas y absolutas de datos, así como también tablas para representar dos conjuntos de datos. Evaluación parcial Entrega de Ta.3 59 TEMA 2 Objetivo de aprendizaje. 2. Diferenciar los métodos gráficos empleados para organizar datos. Criterio de Aprendizaje. 2.1. Ilustrar los métodos gráficos empleados para organizar datos. Didáctica de enseñanza. Pa. 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias. Gráficos para variables cualitativas Los gráficos más usuales para representar variables de tipo nominal son los siguientes: Diagramas de barras: En la siguiendo la figura, representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura posterior. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas. Figura: Diagrama de barras para una variable cualitativa. Figura: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias relativas). 60 Diagramas de sectores Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa . Figura: Diagrama de sectores. El arco de cada porción se calcula usando la regla de tres: Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular, al igual que en la figura anterior. Sean los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las áreas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir: 61 Figura: Diagrama de sectores para comparar dos poblaciones Pictogramas Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la siguiente figura. Figura: Pictograma. Las áreas son proporcionales a las frecuencias. El escalamiento de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de 62 comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una explicación compleja. Gráficos para variables cuantitativas Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas: Diagramas diferenciales: Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada. Diagramas integrales: Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas. Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben. Gráficos para variables discretas Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la figura del ejercicio siguiente. Ejemplo Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniéndose los siguientes resultados: Representar gráficamente el resultado. Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades: Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada punto del eje de abcisas. 63 xi ni fi 0 1 1/8 1 1/8 1 3 3/8 4 4/8 2 3 3/8 7 7/8 3 1 1/8 8 8/8 n=8 Ni Fi 1 Ejemplo Clasificadas 12 familias por su número de hijos se obtuvo: Número de hijos (xi) 1 2 3 4 Frecuencias (ni) 1 3 5 3 Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente. Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual: Variable F. Absolutas F. Relativas F. Acumuladas xi ni fi Ni 1 1 0,083 1 2 3 0,250 4 3 5 0,416 9 4 3 0,250 12 12 1 64 Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra en la figura siguiente. Como puede verse es idéntico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información procedente de las columnas xi y Ni. Figura: Diagramas de frecuencias para una variable discreta Gráficos para variables continuas Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias. Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos. El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante líneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de las gráficas sobre un intervalo son idénticas. Veanse ambas gráficas diferenciales representadas en la parte superior de la figura siguiente. 65 El diagrama integral para una variable continua se denomina también polígono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma. Véase la parte inferior de la figura siguiente, en la que se representa a modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente: Intervalos ci ni Ni 0 -- 2 1 2 2 2 -- 4 3 1 3 4 -- 6 5 4 7 6 -- 8 7 3 10 8 - 10 9 2 12 12 Figura: Diagramas diferenciales e integrales para una variable continua. 66 Ejemplo La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos: Duración en horas Número de tubos 300 -- 500 50 500 -- 700 150 700 -- 1.100 275 más de 1.100 25 Total 500    Representar el histograma de frecuencias relativas y el polígono de frecuencias. Trazar la curva de frecuencias relativas acumuladas. Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas. Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una variable continua se tratase. La consecuencia es una ligera perdida de precisión. El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas. Antes de realizar el histograma conviene hacer una observación importante. El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un rectángulo de base doble (lo que reduce su altura a la mitad). Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura del histograma. Los gráficos requeridos se representan en las figuras siguientes. Intervalos ai ni 300 -- 500 200 50 0,10 0,10 0,10 500 -- 700 200 150 0,30 0,30 0,40 700 -- 1.100 400 275 0,55 0,275 0,95 1.100 -- 1.300 200 25 fi fi ' 0,05 0,05 Fi 1,00 n=500 67 Figura: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en todos con fisalvo en el intervalo 700 -- 1.100 en el que es doble a la de los demás. ya que la amplitud de ese intervalo Figura: Diagrama acumulativo de frecuencias relativas Por otro lado, mirando la figura anterior se ve que sumando frecuencias relativas, hasta las 900 horas de duración hay 0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos. Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas. Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es , redondeando, 338 tubos. 68 Tabla: Principales diagramas según el tipo de variable. Tipo de variable Diagrama V. Cualitativa Barras, sectores, pictogramas V. Discreta Diferencial (barras) Integral (en escalera) V. Continua Diferencial (histograma, polígono de frecuencias) Integral (diagramas acumulados) 69 Práctica 3 Elaborar, organizar datos y construir diagramas de puntos histogramas y polígonos de frecuencias. Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. A) En el siguiente conjunto de datos, se proporcionan los diámetros de melocotones (Prunus persica L. Batsch.) en centímetros 4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5. 1. Construir una distribución de frecuencia, de diámetros. 2. Encontrar las frecuencias relativas. 3. Encontrar las frecuencias acumuladas. 4. Encontrar las frecuencias relativas acumuladas. 5. Dibujar un histograma con los datos. 6. ¿Por qué se ha utilizado un histograma para representar estos datos, en lugar de una gráfica de barras? B) Una empresa maltera recibe mensualmente 50 lotes de cebada, los cuales se les mide su peso hectolítrico (lb/bu), y se les clasifica según la siguiente tabla: Estado Buen estado Aceptable Aceptable con restricciones Rechazo Rango de aceptabilidad (lb/bu) 54 - 56 51 - 53 48 - 50 Todo aquel fuera de los tres rangos anteriores Los datos obtenidos son los siguientes: 55.8, 48, 54, 50, 51, 50, 56, 58, 59, 49, 49.9, 55, 58, 60, 45, 58, 59, 52, 54, 56, 48, 49, 56, 51, 52, 48, 59, 53, 51, 50, 58, 56, 54, 57, 56, 52, 49, 46, 56, 45, 49, 58, 59, 52, 56, 54, 52, 57, 49, 56 1. Construir una distribución de frecuencia. 2. Encontrar las frecuencias relativas. 3. Encontrar las frecuencias acumuladas. 4. Encontrar las frecuencias relativas acumuladas. 70 5. Elige y elabora un gráfico con los datos, que ayuden a interpretar los el conjunto de datos. 6.- ¿Cuáles son las ventajas de realizar gráficos de un conjunto de datos? 71 CAPITULO 3 MEDIDAS DESCRIPTIVAS INTRODUCCIÓN En este capítulo se abordarán las medidas de tendencia central, que se conocen como medidas de posición, se refieren al punto medio de una distribución. Generalmente el objetivo principal de las medidas de tendencia central es describir las características típicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque la acumulación más alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central más comunes son: La media aritmética (comúnmente conocida como media o promedio); la mediana: la cual es el puntaje que es ubica en el centro de una distribución; la moda (que es el puntaje que se presenta con mayor frecuencia en una distribución); entre otras. OBJETIVO Y CRITERIOS DE APRENDIZAJE Página 1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y moda. 1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de datos. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1. Calcular y obtener la media aritmética, mediana y moda de un conjunto de datos. 74 OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación. 2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación de una muestra de datos y de una tabla de frecuencias. 2.1.1. Calcular y obtener de una muestra de datos y de una tabla de frecuencias: amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación. OBJETIVO Y CRITERIOS DE APRENDIZAJE 3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de dispersión 3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 3.1.1. Aplicar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza. OBJETIVO Y CRITERIOS DE APRENDIZAJE 4. Definir el concepto de covarianza y correlación 4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y 74 79 79 84 84 87 87 72 determinar si las dos están relacionadas. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 4.1.1. Calcular y obtener la covarianza y correlación de dos muestras de datos y determinar si las dos están relacionadas. DEMOSTRACIÓN DE HABILIDADES FINALES Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda. Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación. Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos. 78 83 86 92 73 TEMA 1 Objetivo de aprendizaje. 1. Definir y explicar los conceptos y fórmulas de la media aritmética, mediana y moda. Criterio de Aprendizaje. 1.1. Practicar y analizar la media aritmética, mediana y moda de un conjunto de datos. Didáctica de enseñanza. Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda. Media aritmética Es el promedio más comúnmente usado, este puede ser simple o ponderado. La media aritmética simple esta dada por la formula Σ X/n y que significa: la suma de todos los valores y el resultado se divide entre el número de observaciones; y que además el valor de la media representa un valor con respecto a toda la información. Una muestra de una población consiste en n observaciones, con una media de x. Las medidas que calculamos para una muestra se conocen como estadística. La notación es diferente cuando calculamos medidas para la población entera, es decir, para el grupo que contiene a todos los elementos que estamos describiendo. La media de una población se simboliza con μ. El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo general, en estadística se utilizan letras del alfabeto latino para simbolizar la información sobre las muestras y letras del griego para referirnos a la información sobre poblaciones. Por ejemplo: Media de una serie de datos. 10, 13, 10, 13, 14, 10, 13, 10, 15 Media de la población: μ = ∑x / N Para calcular esta media, sumamos todas las observaciones. Los estadísticos se refieren a este tipo de datos como datos no agrupados. Media Aritmética Ponderada o media de datos agrupados Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar "pesos" o "ponderaciones" de acuerdo a la importancia de cada dato. 74 Una distribución de frecuencias consta de datos agrupados en clases. Cada valor de una observación cae dentro de alguna de las clases. No sabemos el valor individual de cada observación. A partir de la información de la tabla, podemos calcular fácilmente una estimación del valor de la media de estos datos agrupados. Para encontrar la media aritmética de datos agrupados, primero calculamos el punto medio de cada clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades. Después, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos todos los resultados y dividimos esta suma entre el número total de observaciones de la muestra. .μ= ∑ (f x) / n f = frecuencia de observaciones de cada clase x= punto medio de cada clase de la muestra n = número de observaciones de la muestra En la serie del ejemplo anterior aparecen los números; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderación y se suman estos productos, se obtendrá la misma suma que si se hubieran sumado uno por uno Sin ponderar Cálculo ponderado Número x Número x Frecuencia Producto (fx) 10 10 4 40 13 13 3 39 14 14 1 14 15 15 1 15 9 108 Suma = 52 52/4 = 13 108/9 = 12 Mediana La mediana es un solo valor calculado a partir del conjunto de datos que mide la observación central de éstos. Esta sola observación es la más central o la que está más en medio en el conjunto de números. La mitad de los elementos están por encima de este punto y la otra mitad está por debajo. Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el arreglo es la mediana. Si hay un número par de observaciones, la mediana es el promedio de los dos elementos de en medio. Mediana = (n + 1) / 2 A continuación se muestran los criterios para construir la mediana: 75  Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado.  Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato.  Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que existen dos valores medios, en tal caso, la mediana es el promedio de los valores. Algunas propiedades de la mediana son: 1.- Es única. 2.- Es simple. 3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media. Por ejemplo: Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 Para la obtención de la mediana se deberán de ordenar. Tomemos el criterio de orden ascendente con lo que, se tiene: 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4, Se observa que el número de datos es igual a 15 datos, siendo el número de datos impar se elige el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1. Ejemplo 2. 3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5 Se observa que el número de datos es par, por los que se promedian los dos valores centrales es decir el 5 y el 16 y el valor obtenido será la mediana del conjunto de datos. Mediana a partir de datos agrupados: 1. Encontrar qué observación de la distribución está más al centro (Mediana = (n + 1) / 2). 2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento más central. 3. Determinar el número de elementos de la clase y la localización de la clase que contiene al elemento mediano. 4. Determinar el ancho de cada paso para pasar de una observación a otra en la clase mediana, dividiendo el intervalo de cada clase entre el número de elementos contenido en la clase. 5. Determinar el número de pasos que hay desde el límite inferior de la clase mediana hasta el elemento correspondiente a la mediana. 6. Calcular el valor estimado del elemento mediano multiplicando el número de pasos que se necesitan para llegar a la observación mediana por el ancho de cada paso. Al producto sumarle el valor del límite inferior de la clase mediana. 7. Si existe un número par de observaciones en la distribución, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso número 6. Un método más sencillo: 76 Med = {[(n + 1) / 2 – (F + 1)] / fm} w + Lm Donde: n = número total de elementos de la distribución F = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana fm = frecuencia de la clase mediana w = ancho de intervalo de clase Lm = límite inferior del intervalo de clase mediano Moda La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos con mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda para un conjunto de datos. La notación más frecuente es la siguiente: Mo . Esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un dato repetido se dice que es multimodal y un último caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal. La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana, pues en realidad no se calcula mediante algún proceso aritmético ordinario. La moda es aquel valor que más se repite en el conjunto de datos. En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor más frecuente del conjunto de datos. Es por esta razón que rara vez se utiliza la moda de un conjunto de datos no agrupados como medida de tendencia central. Por esta razón, siempre que se utiliza la moda como medida de tendencia central de un conjunto de datos, debemos calcular la moda de datos agrupados (buscar la clase modal). Ejemplos: 1.- Determinar la moda del siguiente conjunto de datos: a).- 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3 La moda de este conjunto de datos es igual a 3 y si considera unimodal b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3 Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por lo que la muestra es bimodal c).- 1, 2, 3, 4, 5, 6, 7, 8, 9 La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal. Moda de datos agrupados: Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos poner que la moda está localizada en la clase que contiene el mayor número de elementos, es decir, en la clase que tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal: 77 Mo = Lmo + [d1 / (d1 + d2 )] w Lmo = límite inferior de la clase modal. d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por debajo de ella. d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella. w = ancho del intervalo de la clase modal. Evidencia parcial Ta. 4 En base a un conjunto de datos, calcular la media aritmética, mediana y moda. Evaluación parcial Entrega de Ta.4 78 TEMA 2 Objetivo de aprendizaje. 2. Definir y explicar las fórmulas y conceptos de amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación. Criterio de Aprendizaje. 2.1. Practicar y analizar amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación de una muestra de datos y de una tabla de frecuencias. Didáctica de enseñanza. Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación Las medidas de tendencia central son de un gran valor representativo para una masa de observaciones. Pero el valor de esas medidas dependerá de cuan variable sea la masa de información. Por eso se establecen medidas que tratan de explicar la dispersión de los datos y son: la desviación estándar, el coeficiente de variación, el error estándar y los límites de confianza. Una medida de dispersión conveniente deberá tomar en consideración todos los datos de la serie sopesando cada dato por su distancia al centro de la distribución. Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La dispersión es importante porque: 1. Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. 2. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. 3. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes. Rango Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes:  No utiliza todas las observaciones (sólo dos de ellas);  Se puede ver muy afectada por alguna observación extrema;  El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye. 79 Desviación media Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces Si los datos están agrupados en una tabla estadística es más sencillo usar la relación Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geométrico, la distancia que induce la desviación media en el espacio de observaciones no es la natural (no permite definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la población. Varianza Para calcular la varianza de una población, dividimos la suma de las distancias al cuadrado entre la media y cada elemento de la población entre el número total de observaciones de dicha población. =  (x - μ)2 / N = varianza de la población. x = elemento u observación. μ = media de la población. N = número total de elementos de la población. Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son intuitivamente claras o fáciles de interpretar. Por esta razón, tenemos que hacer un cambio significativo en la varianza para calcular una medida útil de la desviación, que sea menos confusa. Esta medida se conoce como la desviación estándar, y es la raíz cuadrada de la varianza. La desviación estándar, entonces, está en las mismas unidades que los datos originales. La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la manera de simbolizarla es . Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza 80 La varianza es una medida primaria de variabilidad utilizada en varias pruebas estadísticas. Su cálculo es simplemente elevar al cuadrado la desviación estándar. Desviación estándar La desviación estándar es la medida de dispersión mas usada en estadística, tanto en aspectos descriptivos como analíticos. En su forma conceptual, la desviación estándar se define así: Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media. Desviación estándar para datos sin agrupar Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las desviaciones de la media. Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula: La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con escalas de intervalos o razones. A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogéneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad. La raíz cuadrada de un número positivo puede ser tanto positiva como negativa. Cuando tomamos la raíz cuadrada de la varianza para calcular la desviación estándar, los estadísticos solamente consideran la raíz cuadrada positiva. La desviación estándar nos permite determinar, con un buen grado de precisión, dónde están localizados los valores de una distribución de frecuencias con relación a la media. El teorema de Chebyshev dice que no importa qué forma tenga la distribución, al menos 75% de los valores caen 81 dentro de + 2 desviaciones estándar a partir de la media de la distribución, y al menos 89% de los valores caen dentro de + 3 desviaciones estándar a partir de la media. Con más precisión:  Aproximadamente 68% de los valores de la población cae dentro de + 1 desviación estándar a partir de la media.  Aproximadamente 95% de los valores estará dentro de + 2 desviaciones estándar a partir de la media.  Aproximadamente 99% de los valores estará en el intervalo que va desde tres desviaciones estándar por debajo de la media hasta tres desviaciones estándar por arriba de la media. Resultado estándar: La desviación estándar es también útil para describir qué tan lejos las observaciones individuales de una distribución de frecuencias se apartan de la media de la distribución. Una medida que se conoce como resultado estándar nos da el número de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media: Resultado estándar = (x - μ ) /s Cálculo de la varianza y la desviación estándar utilizando datos agrupados: =  f(x -  )2 / N = varianza de la población. x = punto medio de cada una de las clases.  = media de la población. N = número total de elementos de la población. f = frecuencia de cada una de las clases. Desviación estándar de una muestra: Para calcular la varianza y la desviación estándar de una muestra, utilizamos las mismas fórmulas, sustituyendo  por y N con n – 1. s2 =  (x - )2 / (n – 1) ¿Por qué utilizamos n – 1 como denominador en lugar de N? Los especialistas en estadística pueden demostrar que si tomamos muchas muestras de una población dada, si encontramos la varianza de la muestra para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el valor de la varianza de la población, a menos que tomemos n – 1 como denominador de los cálculos. Coeficiente de variación Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de 82 variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación. El coeficiente de variación es una medida relativa de dispersión que nos permite hacer comparaciones de diferentes grupos con diferentes unidades de medida o diferentes magnitudes y obtener mejores conclusiones. Evidencia parcial Ta. 5 En base a una muestra de datos y una tabla de frecuencias calcular amplitud o rango, desviación media, varianza, desviación Estándar y coeficiente de variación Evaluación parcial Entrega de Ta.5 83 TEMA 3 Objetivo de aprendizaje. 3. Enunciar las ventajas y desventajas de las medidas de tendencia central y de dispersión Criterio de Aprendizaje. 3.1 Analizar las medidas de tendencia central de un conjunto de datos de acuerdo a su naturaleza Didáctica de enseñanza. Pa.4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación. Ventajas y desventajas de la media aritmética. La media aritmética, en su carácter de un solo número que representa a un conjunto de datos completo, tiene importantes ventajas: Se trata de un concepto familiar para la mayoría de las personas y es intuitivamente claro. 1. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es única debido a que cada conjunto de datos posee una y sólo una media. 2. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos. Desventajas: 1. Puede verse afectada por valores extremos que no son representativos del resto de los datos. 2. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro cálculo. 3. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala. La media aritmética, a menudo, puede mal interpretarse si los datos no entran en un grupo homogéneo. Ventajas y desventajas de la mediana: Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de datos – incluso a partir de datos agrupados con clases de extremo abierto – a menos que la mediana entre en una clase de extremo abierto. Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar de números. Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que utilizan la media. Debido a que la mediana es una posición promedio, debemos ordenar los datos antes de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran número de elementos. Por consiguiente, si deseamos utilizar una estadística de muestra para estimar un parámetro de población, la media es más fácil de usar que la mediana. 84 Ventajas y desventajas de la moda: La moda, al igual que la mediana, se puede utilizar como una posición central para datos tanto cualitativos como cuantitativos. También, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor más frecuente del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qué tan grandes o qué tan pequeños sean los valores del conjunto de datos, e independientemente de cuál sea su dispersión. La podemos utilizar aun cuando una o más clases sean de extremo abierto. Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se presenten más de una vez. En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta el mismo número de veces. Otra desventaja consiste en que cuando los datos contienen dos, tres o más modas, resultan difíciles de interpretar y comparar. Comparación entre la media, la mediana y la moda. Cuando trabajamos un problema de estadística, debemos decidir si vamos a utilizar la media, la mediana o la moda como medidas de tendencia central. Las distribuciones simétricas que sólo contienen una moda, siempre tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia central, pues ya está hecha la selección. En una distribución positivamente sesgada (es decir, sesgada hacia la derecha), la moda todavía se encuentra en el punto más alto de la distribución, la mediana está hacia la derecha de la moda y la media se encuentra todavía más a la derecha de la moda y la mediana. En una distribución negativamente sesgada, la moda sigue siendo el punto más alto de la distribución, la mediana está hacia la izquierda de ella y la media se encuentra todavía más a la izquierda de la moda y la mediana. Cuando la población está sesgada negativa o positivamente, con frecuencia la mediana resulta ser la mejor medida de posición, debido a que siempre está entre la moda y la media. La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media. La selección de la media, la mediana o la moda, en ocasiones, depende de la práctica común de una industria en particular (salario medio de los obreros, precio mediano de una casa, familia modal para el diseño de automóviles). 85 Práctica 4 En base a un conjunto de datos calcular: media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación. Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. 1. Encuentre la media aritmética, mediana y moda; elaborar tabla de frecuencias y obtener: rango, desviación media, desviación estándar, varianza y coeficiente de variación; de los siguientes conjuntos de datos: a) 3, 4, 4, 6, 6, 6, 8, 8, 12 b) 8, 40, 48, 62, 65, 65, 80, 83, 92 c) 27 25 30 33 25 34 34 27 30 30 32 31 26 31 29 30 32 30 33 32 d) Se evalúa la calidad de mermelada de guayaba, según los expertos el mínimo puntaje para que una mermelada fuese considerada de buena calidad era si calificaba con 169.5 puntos de 190 posibles evalué los siguientes datos de 60 muestras analizadas. 161 168 170 172 177 161 168 170 172 177 162 169 170 172 178 162 169 171 172 180 165 169 171 172 180 165 169 171 172 181 165 169 171 175 181 165 169 171 175 185 165 170 171 175 185 165 170 171 175 185 166 170 171 176 189 166 170 172 176 189 86 TEMA 4 Objetivo de aprendizaje. 4. Definir el concepto de covarianza y correlación Criterio de Aprendizaje. 4.1. Practicar y analizar la covarianza y correlación de dos muestras de datos y determinar si las dos están relacionadas. Didáctica de enseñanza. Pa. 5 Calcular y obtener covarianza y correlación de un conjunto de datos. Si observamos con atención los términos vemos que las cantidades La covarianza y van al cuadrado y por tanto no pueden ser negativas. , es una manera de generalizar la varianza y se define como: Como se ve, la fórmula es muy parecida a las de las varianzas. Es sencillo comprobar que se verifica la siguiente expresión de , más útil en la práctica: Proposición Si las observaciones no están ordenadas en una tabla de doble entrada, entonces se tiene que 87 o lo que es lo mismo Ejemplo Se han clasificado 100 familias según el número de hijos varones ( ) o hembras ( siguiente: 0 1 2 3 4 0 4 6 9 4 1 1 5 10 7 4 2 2 7 8 5 3 1 3 5 5 3 2 1 4 2 3 2 1 0 ), en la tabla 1. Hallar las medias, varianzas y desviaciones típicas marginales. 2. ¿Qué número medio de hijas hay en aquellas familias que tienen 2 hijos? 3. ¿Qué número medio de hijos varones hay en aquellas familias que no tienen hijas? 4. ¿Qué número medio de hijos varones tienen aquellas familias que a lo sumo tienen 2 hijas? 5. Hallar la covarianza Solución: En primer lugar, definimos las variables X= número de hijos varones, e Y=número de hijas y construimos la tabla con las frecuencias marginales, y con otras cantidades que nos son útiles en el cálculo de medias y varianzas: 88 y1 y2 y3 y4 y5 0 1 2 3 4 4 6 9 4 1 24 0 0 0 5 10 7 4 2 28 28 28 44 7 8 5 3 1 24 48 96 62 5 5 3 2 1 16 48 144 63 2 3 2 1 0 8 32 128 40 23 32 26 14 5 100 156 396 209 0 32 52 42 20 146 0 32 104 126 80 342 de este modo, las medias marginales son Calculamos después las varianzas marginales que nos dan directamente las desviaciones típicas marginales, El número medio de hijas en las familias con 2 hijos varones se obtiene calculando la distribución condicionada de 89 n3j n3j yj 7 0 8 8 5 10 3 9 1 4 24 31 Del mismo modo, el número medio de hijos varones de las familias sin hijas, se calcula con la distribución condicionada ni1 ni1 xi 4 0 5 5 7 14 5 15 2 8 23 42 El número medio de hijos varones en las familias que a lo sumo tienen dos hijas, se calcula usando las marginales de la tabla obtenida a partir de las columnas y1, y2 e y3 90 ni1 ni2 ni3 ni1+ni2+ni3 (ni1+ni2+ni3) xi 4 6 9 19 19 5 10 7 22 22 7 8 5 20 40 5 5 3 13 39 2 3 2 7 28 81 129 La covarianza es: 91 Práctica 5 Calcular y obtener covarianza y correlación de un conjunto de datos. Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. 1) Las siguientes notas, son las calificaciones de 25 alumnos en las asignaturas de Matemáticas y Termodinámica: B 4 5 5 5 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9 9 9 Q 3 5 5 6 7 7 7 7 7 7 8 8 8 7 7 8 8 8 8 8 8 8 1 0 1 0 1 0 1 0 a) Obtener la tabla de frecuencias conjunta. b) ¿Qué proporción de alumnos obtienen más de un cinco en ambas asignaturas? ¿Qué proporción de alumnos obtienen más de un cinco en Matemáticas? ¿Y en Termodinámica? c) ¿Son independientes las calificaciones en Termodinámica y en Matemáticas? d) Representa gráficamente, comenta el resultado. e) Hallar el coeficiente de correlación. 2) Para realizar un estudio sobre la utilización de una impresora en un determinado departamento se midió en un día los minutos transcurridos entre las sucesivas utilizaciones (X) y el número de páginas impresas (Y), obteniéndose los siguientes resultados: X Y X Y 9 3 9 12 9 8 9 20 4 3 10 8 6 8 9 20 8 3 15 8 9 8 10 8 7 8 12 20 6 8 12 8 9 3 10 8 9 8 10 12 9 12 12 8 8 12 10 20 8 8 10 20 9 8 12 3 8 8 12 3 9 12 10 20 a) Escribir la distribución de frecuencias conjunta. ¿Cuál es el porcentaje de veces que transcurre más de nueve minutos desde la anterior utilización y se imprimen menos de doce páginas? ¿Cuántas veces se imprimen menos de doce páginas y transcurren nueve minutos desde la anterior utilización? b) Frecuencias marginales. ¿Cuántas veces se imprimen como mucho doce páginas? ¿Cuántas páginas como máximo se imprimen en el 80% de las ocasiones? c) Hallar la distribución de frecuencias del número de páginas impresas condicionada a que han transcurrido nueve minutos entre sucesivas utilizaciones. d) Dibujar el diagrama de dispersión. 3) De la distribución bidimensional (xi,yi,nij) se sabe que para 100 observaciones:  x i n i .  50  y j n. j  1000  x i y j n ij  6000 ij a) ¿Cuánto vale la covarianza entre X e Y? b) ¿Y la covarianza de (U,Z), si se tiene que X= 3U  4 2 y Y 2Z  3 2 92 4) Las estaturas y pesos de los 50 niños nacidos en una maternidad durante una semana fueron los siguientes: E P 50 3.1 51 4.2 50 3.2 51 4.3 52 4 51 4.1 50 3.3 51 4.4 53 4.5 51 3.9 50 3.9 50 3 52 3.7 51 3.7 51 3.6 53 4.1 49 3.4 48 2.9 52 4.2 51 3.3 50 3.8 52 3.5 48 2.7 49 3.8 51 3.8 50 3.4 52 3.6 50 3.6 52 3.6 52 3.9 51 3.4 53 4.4 49 3 54 4.6 52 4.3 50 3.8 50 3.5 50 3.3 52 4.1 51 3.6 52 4.2 51 3.5 51 3.1 51 4.2 52 4.0 51 4 51 3.3 49 3.1 52 3.8 51 3.7 a) b) Constrúyase una tabla de doble entrada, agrupando los pesos en intervalos de 0.5 kg. ¿Es la estatura independiente del peso? 5) En el examen de una asignatura que consta de parte teórica y parte práctica, las calificaciones de nueve alumnos fueron: Teoría 5 7 6 9 3 1 2 4 6 Prácti 6 5 8 6 4 2 1 3 7 ca Calcular la covarianza y el coeficiente de correlación lineal. Dibujar la nube de puntos. Comentar los resultados. 6) Se desea investigar el ganado caprino y el ganado ovino de un país. En la tabla de doble entrada adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del número de cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las explotaciones. X\ Y 0 1 2 3 4 0 1 2 3 4 4 5 7 5 2 6 10 8 5 3 9 7 5 3 2 4 4 3 2 1 1 2 1 1 0 a) Hallar las medias, varianzas y desviaciones típicas marginales. b) Hallar el número medio de ovejas condicionado a que en la explotación hay 2000 cabras. c) Hallar el número medio de cabras que tienen aquellas explotaciones que sabemos que no tienen ovejas. d) Hallar la covarianza y el coeficiente de correlación entre ambas variables. 93 7) Se realiza una prueba a 20 aspirantes a un puesto de grabador consistente en un dictado con cierto tiempo de duración (en minutos, que será variable para cada aspirante) y luego contar el número de errores cometidos al transcribirlo a un ordenador. Los resultados fueron: Tº 7 Er 8 r 6 7 5 6 4 6 5 7 8 7 10 9 8 9 9 6 10 8 5 6 8 6 10 8 8 9 7 8 8 8 7 7 6 8 6 6 9 8 a) Construir la tabla de correlación. b) Para la variable tiempo calcular: media, mediana, moda, recorrido, recorrido intercuartílico y coeficiente de variación. c) Covarianza. d) Número medio de errores de los aspirantes sometidos a un dictado de 6 minutos. e) Porcentaje de aspirantes que cometen menos de 8 errores de entre los que son sometidos a un dictado de más de 6 minutos. 8) La siguiente tabla muestra la talla de calzado y los pesos de 55 estudiantes: 39 40 40 40 41 41 41 41 42 42 42 42 43 43 44 Talla 55 60 65 70 60 65 70 85 65 70 75 80 65 75 85 Peso Nºestudi 1 3 3 4 3 4 6 1 8 8 7 2 2 1 2 a. a) Calcular la tabla de doble entrada de la distribución conjunta (tabla de correlación). b) Calcula la distribución del peso condicionado a una talla de 42. Para esta distribución condicionada calcula: mediana, tercer cuartil y nonagésimo percentil. c) ¿Son independientes el peso y la talla de calzado? d) Determina la covarianza. 9) Se trató a 5 enfermos de hepatitis con un mismo fármaco, variando el tratamiento en las cantidades diarias suministradas. Medido el número de días que cada enfermo tardó en sanar, se tiene: mg. de 10 20 30 40 50 fármaco Días en 200 180 150 120 100 sanar Calcular la covarianza entre estas dos variables. 94 CAPITULO 4 MODELOS PROBABILÍSTICOS INTRODUCCIÓN Probabilidad, rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad está basada en el estudio de la combinatoria y es fundamento necesario de la estadística. La definición de variable aleatoria permite el uso de un lenguaje común que ayuda a entender de una forma sistemática los experimentos aleatorios. En la medida en que se analizan distintos tipos de experimentos aleatorios se comienza a notar que el comportamiento de muchos de ellos es bastante similar entre sí. Comienzan a repetirse características de una variable aleatoria a otra lo que conlleva a continuar la sistematización del análisis al verificar esas características comunes. Este análisis lleva a definir modelos probabilísticos particulares que permiten explicar fenómenos aleatorios que tienen un comportamiento similar entre sí. Un modelo es una simplificación de la realidad. Un modelo probabilístico es un modelo matemático que describe el comportamiento de una variable aleatoria. Es una función que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una población en particular y que se denominan parámetros del modelo. OBJETIVO Y CRITERIOS DE APRENDIZAJE Página 1. Definir los conceptos de variable aleatoria, parámetros función y distribución de probabilidades. 1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades. 97 97 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1. Diferenciar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades. OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Definir las variables aleatorias continuas y discretas. 2.1. Ilustrar las variables aleatorias continuas y discretas. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 2.1.1. Diferenciar las variables aleatorias continuas y discretas. OBJETIVO Y CRITERIOS DE APRENDIZAJE 3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial, hipergeométrica y Poisson. 3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 3.1.1. Analizar los resultados obtenidos del cálculo mediante tablas de esas distribuciones discretas un conjunto de datos 97 97 102 102 95 OBJETIVO Y CRITERIOS DE APRENDIZAJE 4. Describir las consideraciones para elegir un modelo probabilístico discreto 4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un conjunto de datos. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 4.1.1. Analizar el modelo probabilístico discreto seleccionado para un conjunto de datos. OBJETIVO Y CRITERIOS DE APRENDIZAJE 5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de student y F. 5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 5.1.1. Analizar los resultados obtenidos del cálculo mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento. OBJETIVO Y CRITERIOS DE APRENDIZAJE 6. Describir las circunstancias en que se elige un modelo probabilístico continuo. 6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 6.1.1. Analizar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos. DEMOSTRACIÓN DE HABILIDADES FINALES Ta.6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto. Ta.7 Solución de ejercicio Pa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar contenga del ejercicio dado. 102 102 108 108 108 108 101 107 110 96 TEMA 1 Objetivo de aprendizaje. 1. Definir los conceptos de variable aleatoria, parámetros función y distribución de probabilidades. Criterio de Aprendizaje. 1.1. Ilustrar los conceptos de variable aleatoria, parámetros función y distribución de probabilidades. Didáctica de enseñanza. TEMA 2 Objetivo de aprendizaje. 2. Definir las variables aleatorias continuas y discretas. Criterio de Aprendizaje. 2.1. Ilustrar las variables aleatorias continuas y discretas. Didáctica de enseñanza. Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto. El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual probabilidad de ocurrencia. El modelo uniforme continuo es una variable aleatoria donde la probabilidad de que un evento ocurra en un intervalo de ancho t es proporcional a ese intervalo. La variable aleatoria se define al asignar a cada evento elemental un número entero. La numeración de los posibles valores de la variable se inicia en uno y termina en el número ‘n’ de eventos elementales asociados al experimento aleatorio. En la presente unidad se pretende que el alumno adquiera la habilidad del manejo de las anteriores herramientas estadísticas. Variable Aleatoria: Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio. Una variable aleatoria es el resultado numérico de un experimento aleatorio. Por ejemplo, podemos considerar X el número resultante de tirar un dado; o podemos tirar 6 dados y tomar X como la suma de los seis valores resultantes. La distribución de una variable aleatoria es la colección de posibles resultados con sus probabilidades asociadas. Esto puede ser descrito por una tabla, una formula, o un histograma de probabilidades Si repetimos un experimento muchas veces, podremos calcular el histograma de frecuencias, el cual es un grafico de barra que muestra el número de veces que cada valor de X fue observado. Esto debería darnos una aproximación del histograma de probabilidades. Ejemplo. 97 Probabilidades para n Dados. Supongamos que tiramos seis n dados regulares balanceados. Si X es la suma de los valores que aparecen en los n dados, Que son las probabilidades asociadas a cada valor de X dentro de los posibles valores de X = n , ... , 6n? En el caso de n=1, esas posibilidades son todas 1/6. Para dos dados, es más fácil considerar una tabla con los posibles resultados: (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Ahora, podemos considerar la suma asociada a esos resultados: 2345 6 7 3456 7 8 4567 8 9 5 6 7 8 9 10 6 7 8 9 10 11 7 8 9 10 11 12 Como hay 36 resultados posibles, todos igualmente probables, podemos ver que las probabilidades son: X frecuencia P(X) 2 1 1/36 3 2 2/36 4 3 3/36 5 4 4/36 6 5 5/36 7 6 6/36 8 5 5/36 9 4 4/36 10 3 3/36 11 2 2/36 12 1 1/36 Si hubiera más de dos dados, hacer tablas como las anteriores es difícil. El número de posibles resultados seria 6n, sin embargo basta contar el número de veces que cada suma se da entre los 6n 98 posibles resultados para calcular la probabilidad de cada suma. Esto es fácil de hacer si consideramos la función generadora para el número de veces que cada suma aparece: f(x) = (x + x2 + x3 + x4 + x 5+x6)n Por Ejemplo, para n=2 se tiene que: (x + x2 + x3 + x4 + x 5+x6)2= x 2+2x3+3x4+4x5+5x6+6x7+5x8+4x9+3x10+2x11+x12 El coeficiente de xn es el número de veces que la i-ésima suma se da. Ejercicio. Probabilidades para n mondas con dos caras águila o sol que son definidas por valor 1 y 2 respectivamente. Supongamos que tiramos cinco n monedas. Si X es la suma de los valores que aparecen en los n monedas, Que son las probabilidades asociadas a cada valor de X dentro de los posibles valores de X = n, ... , 5n? En el caso de n =2, esas posibilidades son todas 1/5. Considere una tabla con los posibles resultados. Determine la posibilidad de que se obtenga la suma asociada a esos resultados y determine las propiedades del cada evento. Variable Aleatoria: Es aquella que al tener una función se asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio. Existen Variables continuas y Variables discretas. Variables discretas: Son aquellas que toman determinado valor exacto como: El No. De hijos de una familia. Variable Continua: Es un rango que puede concebirse como un continuo de valores. Parámetros: cantidades que aparecen en la formulación de un modelo, relacionadas con las propiedades de la variable aleatoria en estudio. Modelo o distribución de probabilidades: función que distribuye probabilidades entre los valores de una variable aleatoria. Variables aleatorias continuas y discretas. 99 Una variable aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio. Las variables aleatorias se denotan con una letra mayúscula, tal como X , y con una letra minúscula, como x , el valor posible de X . El conjunto de los posibles valores de la variable aleatoria X recibe el nombre de rango de X . Una variable aleatoria discreta es una variable aleatoria con un rango finito. Ejemplo: Se evalúa un nuevo proceso para la fabricación de partes moldeadas en plástico en términos de la coloración y reducción de tamaño. Una de las primeras corridas del proceso proporciona la información para el espacio muestral y las probabilidades que aparecen en la siguiente tabla: Coloración aprobado aprobado inaceptable inaceptable Reducción de tamaño aprobado inaceptable aprobado inaceptable Probabilidad 0.64 0.16 0.16 0.04 Supóngase que el interés recae en resumir los resultados de este experimento aleatorio con el número de características (de coloración y reducción de tamaño) que son aprobadas. Por lo cual, se define una variable aleatoria, X , para ser igual al número de características aprobadas. La cuarta columna de la siguiente tabla, contiene los valores de X asignados a cada resultado del experimento. Por ejemplo al resultado (aprobado, aprobado) se le ha asignado x  2 . Coloración aprobado aprobado inaceptable inaceptable Reducción de tamaño aprobado inaceptable aprobado inaceptable Probabilidad 0.64 0.16 0.16 0.04 x 2 1 1 0 En todos los procesos productivos las características del producto deben ser medidas para asegura que el producto cuenta con las características especificadas en su diseño. En la práctica pueden presentarse pequeñas variaciones en las longitudes medidas, por muchas causas, tales como vibraciones, fluctuaciones de temperatura, diferencias entre quienes toman las mediciones, calibraciones, desgaste en la herramienta de corte, desgaste en los cojinetes y cambios en la materia prima. Incluso el procedimiento de medición puede producir variaciones en los resultados finales. En estos tipos de experimentos, las mediciones de interés la corriente en el alambre de cobre, la longitud de una parte maquinada puede representarse con una variable aleatoria. Es razonable modelar el rango de los avalores posibles de la variable aleatoria con un intervalo (finito o infinito) de números reales. Por ejemplo, para la longitud de una parte maquinada, este modelo permite que las mediciones del experimento produzcan cualquier valor dentro de un intervalo de números reales. Dado que el rango es cualquier valor en el intervalo, el modelo es adecuado para cualquier precisión utilizada al efectuar las mediciones. Sin embargo, como el número de valores posibles de la variable aleatoria X es infinito no contable, X tiene una distribución muy diferente de las de las variables aleatorias discretas estudiadas en el capítulo anterior. El rango de X incluye todos los valores contenidos en un intervalo 100 de números reales; esto es, el rango de X puede concebirse como un continuo de valores. En consecuencia, se tiene la siguiente definición. Evidencia parcial Ta. 6 Establezca cinco ejemplos relacionados con un experimento aleatorio discreto. Evaluación parcial Entrega de Ta.6 101 TEMA 3 Objetivo de aprendizaje. 3. Definir los conceptos y expresar las funciones de probabilidad: uniforme, binomial, hipergeométrica y Poisson. Criterio de Aprendizaje. 3.1. Calcular mediante tablas de esas distribuciones discretas un conjunto de datos. Didáctica de enseñanza. TEMA 4 Objetivo de aprendizaje. 4. Describir las consideraciones para elegir un modelo probabilístico discreto Criterio de Aprendizaje. 4.1. Seleccionar el modelo probabilístico discreto de acuerdo a la naturaleza de un conjunto de datos. Didáctica de enseñanza. Pa.6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el ejercicio dado. Modelo Uniforme. Al analizar un experimento aleatorio en el cual el espacio muestral es un conjunto discreto y finito y utilizar la definición clásica de probabilidades para el proceso de asignación de probabilidades a los eventos elementales, se concluye que todos ellos tienen igual probabilidad dada por el inverso del número de eventos elementales. Esta es la base de la definición de un modelo uniforme discreto. El modelo uniforme discreto es una variable aleatoria donde todos sus valores tienen igual probabilidad de ocurrencia. La numeración de los posibles valores de la variable se inicia en uno y termina en el número ‘n’ de eventos elementales asociados al experimento aleatorio. La regla de asignación se indica en la siguiente ecuación. …1 El modelo uniforme discreto se denotará como UD(n). La asignación de probabilidades de cada valor de la variable está dada por la ecuación. …2 Como consecuencia de la Ecuación 2, la función de distribución acumulativa de probabilidades, la función de densidad de probabilidades y la función de probabilidad vienen dadas por las ecuaciones 3, 4 y 5, respectivamente. 102 …3 …4 …5 La siguiente tabla muestra los valores esperados más importantes correspondientes al modelo uniforme discreto. Valores Esperados más Importantes para el Modelo Uniforme Discreto. Ejercicio: Considere el experimento aleatorio de lanzar una moneda honesta. Si al resultado ‘sello’ se le asigna el valor uno y al resultado ‘cara’ se le asigna el valor dos entonces la variable aleatoria definida se corresponde con el modelo uniforme discreto n = 2. Ejercicio: Considere la variable aleatoria definida para el experimento aleatorio de lanzar un dado honesto. Esta variable corresponde al modelo uniforme discreto con n = 6. Distribución binomial. Un proceso de manufacturas electrónicas produce miles de diodos diariamente. En promedio, el 1% de estos diodos no se apega a las especificaciones. Cada hora, un inspector selecciona una muestra aleatoria de 50 diodos y los clasifica como conformes o disconformes. Sea x la variable aleatoria que representa el número de piezas con disconformidad en la muestra; entonces la distribución de probabilidad de x es:  n n x p x     p x 1  p   x x  0,1,2...n 103  50 x 50  x px    0.01 0.99 x x  0,1,2...50  50 50! Donde    que es el número de combinaciones de 50 partes tomadas x cada vez. Esta  x  x!50  x ! es una distribución discreta, ya que el número observado de disconformidades es x  0,1,2...50 y se denomina distribución binómica o binomial. Podemos calcular la probabilidad de encontrar a lo más una pieza disconforme en la pieza: p x  1  p x  0  p x  1  p0  p1 1  50  x 50  x    0.01 0.99 x 0  x  50! 0.99 50 0.010  50! 0.011 0.99 49  0!50! 1!49!  0.6050  0.3056  0.9106  91.06% De encontrar 1 o no encontrar ninguna. Distribución Exponencial La variable aleatoria X que es igual a la distancia entre ocurrencias sucesivas de un proceso Poisson con media   0 , tiene una distribución exponencial con parámetro  . La función de densidad de probabilidad de X es: f x x;     x , Para 0  x   La distribución exponencial obtiene su nombre de la función exponencial que aparece en la función de densidad de probabilidad. Para cualquier valor de la distribución exponencial tiene mucho sesgo. Los resultados siguientes se obtienen con facilidad y la deducción de éstos se deja como ejercicio. Si la variable aleatoria X tiene una distribución exponencial con parámetro  , entonces 1 1 EX   Y V X   2   Ejemplo: La vida útil de un foco es una variable exponencial con un promedio de 500 hrs. Calcula la probabilidad de que la vida de un foco cualquiera: 104 a) Este entre 400 y 700 hrs. 1 1     F 700  1  e  1 700  500 F 400  1  e  1 400  500  1 500  0.7534  0.5506 p400  x  700  F 700  F 400  0.7534 0.5506 0.2028 La probabilidad de que el foco dure entre 400 y 700 hrs. Es de 20.28% b) Sea menor que el promedio.  1 500 p  x  500 )  500  e  x dx 0 1 1  500     0    500  1  e 500  1  e        =0.6321-0 =0.6321 Ejercicio La vida de anaquel de producto enlatado es exponencial en funciona al tratamiento térmico que se aplique en el proceso. La vida de anaquel es una variable exponencial con un promedio de 520 días. Calcula la probabilidad de que la vida de anaquel de cualquier producto enlatado: 1. Que se ubique entre 450 y 800 días. 2. Que sea menor que el promedio. La probabilidad de que un foco dure menos que el promedio (500 hrs. ) es de 63.21% Distribución de Poisson Una aplicación clásica de la distribución de Poisson en el control de calidad es como un modelo del número de defectos o disconformidades que ocurren en una unidad del producto por ejemplo, supóngase que el número de defectos por unidad en las conexiones de conductores en un dispositivo electrónico de semiconductores tiene distribución de Poisson, con parámetro  = 4 (o sea 4 defectos en promedio cada unidad). Entonces, la probabilidad de que uno de estos dispositivos seleccionados al azar contenga 2 defectos o menos (incluso ninguno) es: 105 px  2  p0  p1  p2 p x     p0  e  x x  0,1,2.... x! 2  e   4 0  0.0183156 0! x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 . . . P(x) 0.0183 0.0733 0.1465 0.1954 0.1954 0.1563 0.1042 0.0595 0.0298 0.0132 0.0053 0.0019 0.0006 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 Resultado .2381 Existe 23.81% de probabilidad de encontrar dos, uno o ninguno. 106 Práctica 6 Determine la probabilidad de que uno de estos dispositivos seleccionados al azar, contenga el ejercicio dado. Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. En una agroindustria seleccionadora de manzana se aplico el control de calidad es como un modelo del número de defectos o disconformidades que ocurren en una unidad del empaque, supóngase que el número de defectos por caja tiene distribución de Poisson, con parámetro  = 2 (o sea 2 defectos en promedio cada unidad). 1. Determine la probabilidad de que uno de estos dispositivos seleccionados al azar contenga 2. 107 TEMA 5 Objetivo de aprendizaje. 5. Definir y expresar la distribución de probabilidades: Normal, Ji cuadrada, t de student y F. Criterio de Aprendizaje. 5.1. Calcular mediante tablas de distribuciones continuas, la probabilidad de la ocurrencia de un evento. Didáctica de enseñanza. TEMA 6 Objetivo de aprendizaje. 6. Describir las circunstancias en que se elige un modelo probabilístico continuo. Criterio de Aprendizaje. 6.1. Seleccionar el modelo probabilístico continuo de acuerdo a la naturaleza de un conjunto de datos. Didáctica de enseñanza. Ta.7 Solución de ejercicio Distribución Normal Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución normal. Esta distribución puede obtenerse al considerar el modelo básico de una variable aleatoria binomial cuando el número de ensayos se vuelve cada vez más grande. Este fue el enfoque original seguido por De Moivre en 1733. Desafortunadamente, su trabajo se perdió por algún tiempo, y Karl Gauus Desarrolló, de manera independiente, la distribución normal casi cien años después. Aunque más tarde se dio crédito a De Moivre, la distribución normal también se conoce como distribución Gaussiana. Una variable aleatoria X con función de densidad de probabilidad normal: 1  x     2   1 f x   e 2  2   x   Ejemplo. La resistencia a la tensión del papel utilizado en la fabricación de bolsas para las compras es una característica de calidad importante, se sabe que la resistencia (x) tiene distribución normal, con media (psi, del inglés poud per square inch) y desviación estándar   2 lb , lo que se   40lb p lg 2 p lg 2 denota por x  N 40,2 2 . El comprador de las bolsas necesita una resistencia de por lo menos 35lbs p lg 2 . La probabilidad de que una bolsa producida con este papel satisfaga o exceda esta especificación es px  35. Nótese que   108 px  35  1  px  35 Para evaluar esta probabilidad a partir de las tablas de distribución estándar hay que estandarizar el punto 35 y se encuentra que: x   35  40  px  35  p  z     2    pz  2.5   25  0.0062 Por consiguiente la probabilidad buscada es px  35  1  px  35  1  .0062 0.9938 La probabilidad de que una bolsa exceda las 35lbs p lg 2 es de 99.38% Ejercicio. Un parámetro a evaluar como control de calidad en los empaque de manzana Red Deliciuos la textura. Mediante un penetrómetro se sabe que la resistencia (x) tiene distribución normal, con media (psi, del inglés poud per square inch) y desviación estándar   2 lb , lo que se   40lb p lg 2 p lg 2   denota por x  N 40,2 2 . El comprador de manzana necesita una resistencia de por lo menos 38 lb/plg2. Determine la probabilidad de que una manzana empacada satisfaga o exceda esta especificación. Distribución T-Student Supóngase que se toma una muestra de una población normal con media  y varianza  2 . Si X es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución de Z   X    /  / n es una distribución normal estándar. Supóngase que la varianza de la población  2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza  por S? La distribución t proporciona la respuesta a esta pregunta.   Sea <Z una variable aleatoria con distribución N(0,1) y V una variable aleatoria jicuadrada con k grados de libertad. Si Z y V son independientes, entonces la variable aleatoria T Z V /K Tiene la función de densidad de probabilidad 109 f x   T k  1 / 2 1  kk / 2 x 2 / k  1 k 1 / 2      x   y se dice que sigue la distribución t con k grados de libertad, lo que se abrevia como t k . La media y la varianza de la distribución t son  = 0 y  2  k /k  2 para que k>2, respectivamente. Ejemplo: Un químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación muestrea 25 lotes cada mes. Si el valor t calculado cae entre  t 0.05 y t 0.05 , queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media x  518 gramos por milímetro y una desviación estándar muestral s  40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal. De las tablas se extrae el valor t 0.05  1.711 para 24 grados de libertad. Por tanto, el fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711. Si   500, entonces, t 518  500  2.25 40 / 25 un valor muy por arriba de 1.771. La probabilidad de obtener un valor t , con v  24 , igual o mayor que 2.25 es aproximadamente 0.02. Si   500, el valor de t calculado de la muestra sería más razonable. De aquí que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa. Ta.7 Solución de ejercicio En una agroindustria de lácteos se realiza un análisis de acidez a leche caliente (recién ordeñada). El resultado arroja una acidez expresada en º Dornikc superior a 18. Lo que indica que la materia prima esta altamente contaminada y disminuirán en medida correctiva el precio a los productores. Para verificar esta afirmación los productores muestrea 25 lotes cada mes. Si el valor t calculado cae entre  t 0.05 y t 0.05 , queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media 19 º D y una desviación estándar muestra 3 2 º D. ¿ A que conclusión llegaría si la distribución de acidez es aproximadamente normal? 110 CAPITULO 5 PRUEBAS DE HIPÓTESIS INTRODUCCIÓN A menudo, el problema que enfrenta el científico o el ingeniero no es tanto la estimación de un parámetro poblacional, sino más bien la formación de un procedimiento de decisión que se base en los datos que pueda producir una conclusión acerca de algún sistema científico. Por ejemplo, un investigador médico puede decidir sobre la base de evidencia experimental si beber café aumenta el riego de cáncer en humanos; un ingeniero puede tener que decidir sobre la base de datos muestrales si hay una diferencia entre la precisión de dos tipos de medidores; o un sociólogo puede desear reunir los datos apropiados que le permitan decidir si el tipo sanguíneo de una persona y el color de los ojos son variables independientes. En cada uno de estos casos el científico o el ingeniero postula o conjetura algo acerca de un sistema. Además, cada uno debe incluir el uso de datos experimentales y la toma de decisiones basadas en éstos. De manera formal, en cada caso, la conjetura se puede poner en forma de hipótesis estadística. Los procedimientos que conducen a la aceptación o rechazo de hipótesis estadísticas como éstas comprenden un área principal de la inferencia estadística y son los que y trataremos en la presente unidad. OBJETIVO Y CRITERIOS DE APRENDIZAJE Página 1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y dos colas. 1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1. Diferenciar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad. 113 OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis. 2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 2.1.1. Diferenciar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis. OBJETIVO Y CRITERIOS DE APRENDIZAJE 3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una distribución normal y los casos en los que se emplea esta prueba. 3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los resultados. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 113 113 113 118 118 111 3.1.1. Aplicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los resultados. OBJETIVO Y CRITERIOS DE APRENDIZAJE 4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba. 4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 4.1.1. Aplicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba. OBJETIVO Y CRITERIOS DE APRENDIZAJE 5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba. 5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 5.1.1. Aplicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba. DEMOSTRACIÓN DE HABILIDADES FINALES Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en alguna agroindustria. Además considere las opciones de error tipo I y error tipo II. Ta.9 Realizar el ejercicio, probando la hipótesis. In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal Pa.7 Elaborar ejercicios sobre prueba de hipótesis p 123 123 126 126 117 122 125 129 112 TEMA 1 Objetivo de aprendizaje. 1. Describir la naturaleza de una prueba de hipótesis y los tipos de hipótesis: una y dos colas. Criterio de Aprendizaje. 1.1. Practicar las pruebas de hipótesis, clasificarlas y esbozar el procedimiento de contrastabilidad. Didáctica de enseñanza. TEMA 2 Objetivo de aprendizaje. 2. Ilustrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis. Criterio de Aprendizaje. 2.1. Demostrar los errores tipo I y II que se pueden presentar al aceptar o rechazar una hipótesis Didáctica de enseñanza. Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en alguna agroindustria. Además considere las opciones de error tipo I y error tipo II. Pruebas de hipótesis. Primero, definamos con precisión que entendemos por hipótesis estadística. Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones. La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certidumbre a menos que examinemos toda la población. Esto, por supuesto, sería poco práctico en la mayoría de las situaciones. En su lugar, tomamos una muestra aleatoria de la población de interés y utilizamos los datos contenidos en esta muestra para proporcionar evidencia que apoye o no a la hipótesis. La evidencia de la muestra que es inconsistente con la hipótesis que se establece conduce al rechazo de ésta, mientras que la evidencia que la apoya conduce a su aceptación. Debe quedar claro al estudioso de la materia que el diseño de un procedimiento de decisión se debe hacer con la idea en mente de la probabilidad de una conclusión errónea. Por ejemplo, suponga que la conjetura (hipótesis) que postula el técnico es que la fracción p de defectuosos en cierto proceso es 0.10. El experimento es la observación de una muestra aleatoria del producto en cuestión. Suponga que se prueban 100 artículos y se encuentra que 12 están defectuosos. Es razonable concluir que esta evidencia no rechaza la condición p  0.10 , y por ello puede conducir a la aceptación de la hipótesis. Sin embargo, tampoco rechaza p  12 o incluso p  15 . Como resultado, el lector se debe acostumbrar a comprender que la aceptación de una hipótesis simplemente implica que los datos no dan suficiente evidencia para rechazarla. Por otro lado, el rechazo implica que la evidencia muestral la refuta. Puesto de otra forma, el rechazo significa que hay una pequeña probabilidad de obtener la información muestral observada cuando, de hecho, la hipótesis es verdadera. Por ejemplo, en nuestra hipótesis de proporción de defectuosos, una muestra de100 que revela 20 artículos defectuosos es ciertamente evidencia de rechazo. ¿Por qué? Si, en realidad, p  0.10 , la probabilidad de obtener 20 o más defectuosos es aproximadamente 0.0035. Con el pequeño riesgo resultante de una conclusión 113 errónea, parecería seguro rechazar la hipótesis de que p  0.10 . En otras palabras, el rechazo de una hipótesis tiende a casi “excluir” la hipótesis. Por otro lado, es muy importante enfatizar que la aceptación o, más bien, la falla al rechazo no excluyen otras posibilidades. Como resultado, el analista de los datos establece una conclusión firme cuando se rechaza una hipótesis. El planteamiento formal de una hipótesis a menudo está influido por la estructura de la probabilidad de una conclusión errónea. Si el científico se interesa en apoyar con fuerza una opinión, desea llegar a la opinión en la forma de rechazo de una hipótesis. Si el investigador médico desea mostrar fuerte evidencia a favor de la opinión de que beber café aumenta el riesgo de contraer cáncer , la hipótesis a aprobar debe ser de la forma “ no hay aumento en el riesgo de contraer cáncer como producto de beber café”. Como resultado, la opinión se alcanza por medio de un rechazo. De manera similar, para apoyar la afirmación de que un tipo de medidores es más preciso que otro, el ingeniero prueba la hipótesis de que no hay diferencia en la precisión de los dos tipos de medidor. Hipótesis nula y alternativa La estructura de la prueba de hipótesis se formulará con el uso del término hipótesis nula. Éste se refiere a cualquier hipótesis que deseamos probar y se denota con H 0 conduce a la aceptación de una hipótesis alternativa, que se denota con H 1 . Una hipótesis nula con respecto a un parámetro poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro, mientras que la hipótesis alternativa permite la posibilidad de varios valores. De aquí, si H 0 es la hipótesis nula p  0.5 para una población binominal, la hipótesis alternativa H 1 sería una de las siguientes: p  0.5, p  0.5, O, p  0.5. Pruebas de Hipótesis Hipótesis Afirmación acerca de los parámetros de la población. Hipótesis nula Es una afirmación acerca de los valores de uno o más parámetros de la población. Se pone a prueba usando la evidencia muestral. Establece que la diferencia entre el parámetro poblacional y el estadístico muestral se debe a la variación aleatoria del muestreo. Se denota por H0. Hipótesis Alterna o alternativa Es la afirmación sobre los parámetros de la población que es cierta si la hipótesis nula es falsa (rechazada). Se denota por H1. Región de rechazo 114 También llamada región crítica. Es el rango de valores de un estadístico muestral que conducirá al rechazo de la hipótesis nula, bajo el nivel de significancia dado. Error de tipo I Se incurre en este error cuando incorrectamente se rechaza la hipótesis nula. Denotamos por  la probabilidad de que se cometa un error de tipo I. Error de tipo II Se incurre en este error cuando incorrectamente no se rechaza la hipótesis nula. Denotamos por  la probabilidad de que se cometa un error de tipo II. Colas Una prueba de una cola es una en la que la hipótesis alternativa indica una dirección. Una prueba de dos colas es aquella en la que la hipótesis alternativa no especifica dirección. Prueba de Hipótesis: 1. Se Especifica H0 y H1, y un nivel aceptable de  (Nivel de significancia de una prueba de Hipótesis). 2. Se define un estadístico muestral (estadístico de prueba) y la región de rechazo para la hipótesis nula (regla de decisión). 3. Se recogen los datos de la muestra y se calcula el estadístico de prueba. 4. Se decide rechazar o no rechazar la hipótesis nula. 5. Interpretar los resultados en el marco del problema. Estadístico de prueba Es un estadístico de la muestra cuya distribución muestral puede ser especificada para la hipótesis nula o para la hipótesis alternativa, aunque para la hipótesis alternativa esto pueda ser bastante complejo. Después de especificar el nivel de significancia , la distribución muestral de este estadístico de prueba puede usarse para definir la región de rechazo. 115 Ejemplo: Según la FEDEFUT, el peso promedio de un jugador nuevo de la Liga Nacional de Fútbol es de 168. Ahora, la nutricionista del equipo XYZ piensa que el peso promedio del equipo XYZ es diferente que 168. Como se están haciendo reclutamientos, escoge una muestra aleatoria del peso de 40 candidatos. Asuma que  = 23 H0:  = 168 H1:   168 Nivel de significancia (probabilidad de rechazar la hipótesis nula cuando esta es cierta): 0.05. La media y la desviación estándar de la muestra El estadístico de prueba es la media muestral. Entonces rechazaríamos la hipótesis nula, si el promedio muestral es mayor que un valor C1 o menor que un valor C2, para un nivel de significancia del 5%. Si H0 es verdadera, entonces la media muestral tiene una distribución normal con media  igual a 168 y una desviación estándar , donde  es la desviación estándar de la población. Siendo simétrica la curva normal, Se tiene que Z1 = 1.96 y Z2 =  1.96, entonces C1 = 175.13 y C2 = 160.87 116 Si no conociéramos , utilizamos la distribución t de 40 - 1 grados de libertad. TINV(0.025, 39) = 2.3315 C1 = 177.2161 C2 = 158.78 Conclusión: no se rechaza la hipótesis nula. En general, la hipótesis nula se construye para ser la hipótesis que siendo cierta, ninguna decisión concerniente a un cambio se hará (cambio nulo). Rechazar la hipótesis nula significa tomar decisiones que conllevan un cambio, y por lo tanto, representaran un costo. En este sentido, incurrir en un error de tipo I conlleva una mayor preocupación. La hipótesis alternativa describe condiciones para las cuales algo debe hacerse. Es la hipótesis de investigación o acción. En un ambiente de investigación o experimental, la hipótesis alternativa es la que queremos establecer, al rechazar la hipótesis nula, con un nivel suficientemente bajo de significancia tal que es improbable que la nueva hipótesis sea erróneamente aceptada. Es importante entonces el especificar un nivel adecuado de significancia. Cometer un error del tipo I tiene mayores consecuencias, entonces se escoge un valor pequeño de . 0.1, 0.05, 0.01, más comúnmente 0.05. Hay una relación inversa entre  y . A menos de que se aumente el tamaño de la muestra, se puede reducir  solamente aumentando. Ahora bien, conviene determinar en cada experimento cuales son las consecuencias de cometer un error de tipo II. Ta.8 Defina hipótesis nulas y hipótesis alternas en función de cinco ejemplos de control estadístico en alguna agroindustria. Además considere las opciones de error tipo I y error tipo II. 117 TEMA 3 Objetivo de aprendizaje. 3. Describir el procedimiento para realizar prueba de hipótesis sobre la media de una distribución normal y los casos en los que se emplea esta prueba. Criterio de Aprendizaje. 3.1. Practicar pruebas de hipótesis sobre la media de una muestra de datos, así como el procedimiento de prueba para aceptar o rechazar la hipótesis e interpretar los resultados. Didáctica de enseñanza. Ta.9 Realizar el ejercicio, probando la hipótesis. Pruebas de Hipótesis sobre la Media, Varianza Conocida En este tema se consideran pruebas de hipótesis sobre la media de una población (o la media de una distribución de probabilidad), donde la varianza de la población es conocida. Las suposiciones para esta prueba son mínimas. La población o distribución de interés tiene media  y varianza  2 , con  2 conocida. El estadístico de prueba se basa en la media muestral X , por lo que también se supondrá que la población está distribuida de manera normal o que se aplican las condiciones del teorema del límite central. Esto significa que la distribución de X es aproximadamente normal con media  y varianza  2 /n. Desarrollo del procedimiento de prueba Supóngase que se desea probar la hipótesis H 0 :   0 H1 :    0 Donde  0 es una constante específica. Se tiene una muestra aleatoria X 1 , X 2 ,.........X n De la población. Puesto que X tiene una distribución aproximadamente normal con media  0 y desviación estándar  si la hipótesis nula es verdadera, entonces puede construirse una región n crítica con base en el valor calculado de la media muestral x . Habitualmente, es más conveniente estandarizar la media muestral y utilizar una estadística de prueba basada en la distribución normal estándar. Esto es, el procedimiento de prueba para H 0 :    0 utiliza el estadístico de prueba Z0  X  0  n Si la hipótesis nula H 0 :    0 es verdadera, E X  0  , de donde se desprende que la distribución de Z 0 es la distribución normal estándar  denotada por N 0,1  . En consecuencia, si H 0 :    0 es 118 cierta, la probabilidad de que la estadística de prueba Z 0 caiga entre  Z  (Recuérdese que Z  2 y Z es 1   . 2 es el punto que corresponde al porcentaje 100 / 2 de la distribución normal 2 estándar). Nótese que la probabilidad de que la estadística de prueba Z 0 caiga en la región Z 0  Z / 2 o Z 0  Z / 2 cuando H 0 :    0 es verdadera, es  . Es evidente que una muestra que produce un valor del estadístico de prueba que cae en las colas de la distribución de Z 0 será inusual si H 0 :    0 es cierta; por tanto, esto es un indicador de que H 0 es falso. En consecuencia, H 0 debe rechazarse si Z 0  Z Z 0  Z 2 (3) 2 (4) Por otra parte, H 0 no puede rechazarse si  Z / 2  Z 0  Z / 2 (5) La ecuación 5 define la región de aceptación de H 0 , y las ecuaciones 3 y 4 definen la región crítica o región de rechazo. La probabilidad del error tipo I para este procedimiento de prueba es  . En general, es más fácil comprender la región crítica y el procedimiento de prueba cuando la estadística de prueba es Z 0 más que X . Sin embargo, la misma región crítica siempre puede escribirse en términos del valor calculado de la media muestral x . Un procedimiento idéntico al anterior es el siguiente: Rechazar H 0 :    0 si x  a o x  b Donde a  0  Z / 2 / n b  0  Z / 2 / n Ejemplo: Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un combustible sólido. Una de las características importantes de este producto es la rapidez de combustión. Las especificaciones requieren que la rapidez promedio de combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidez es   2 cm./s. El experimentador decide especificar una probabilidad para el error tipo I, o nivel de significancia, de   0.05 selecciona una muestra aleatoria de n = 25 y obtiene una rapidez promedio muestral de combustión de x  51.3cm / s. ¿ A qué conclusiones debe llegar? La solución de este problema puede hallarse siguiendo el procedimiento de ocho pasos: 1. El parámetro de interés es  , la rapidez promedio de combustión. 119 2. H 0 :   50cm / s. 3. H1 :   50cm / s. 4.   0.05 5. La estadística de prueba es Z0  x  0 / n 6. Rechazar H 0 si Z 0  1.96 o Z 0  1.96 . Nótese que esto es consecuencia del paso 4, donde se especifica   0.05 , de modo que las fronteras de la región crítica son Z 0.025  1.96 y  Z 0.025  1.96 7. Cálculos: Puesto que x  51 .3 y   2 , Z0  51.3  50  3.25 2 / 25 8. Conclusión: Dado que Z 0  3.25  1.96 , se rechaza H 0 :   50 con nivel de significancia de 0.05. Planteado de manera más completa, se concluye que, con base en una muestra de 25 mediciones, la rapidez promedio de combustión es diferente de 50 cm/s. De hecho, existe una evidencia fuerte que la rapidez promedio de combustión es mayor que 50 cm/s. Ejercicio 1. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo gaussiano. Deseamos contrastar con un nivel de significación de si la altura media es diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra de n=25 personas se obtuvo: 2. Consideramos el mismo ejercicio anterior. Comprobado que se rechaza el hecho de que la altura media de la población sea igual a 174 cm. Realizar el contraste sobre si la altura media es menor de 174 cm. Pruebas de Hipótesis sobre las Medias de dos Distribuciones Normales, Varianzas Desconocidas. Ahora se considerarán pruebas de hipótesis sobre la igualdad de las medias 1 , y  2 de dos distribuciones normales donde las varianzas  12 y  22 son desconocidas. Para probar esta hipótesis se usará una estadística t . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de prueba, pero los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento. 120 Ejemplo Índices de Octano en Carretera Formula 1 Formula 2 ( con tetraetil-plomo) (Sin plomo) 89.5 89.5 90.0 91.5 91.0 91.0 91.5 89.0 92.5 91.5 91.0 92.0 89.0 92.0 89.5 90.5 91.0 90.0 92.0 91.0 Se desea probar la hipótesis de que el índice octánico medio de la formulación 1 (con plomo) es igual al índice de octano medio para la formulación 2; o sea, H 0 : 1   2 H 1 : 1   2 Rechazar H 0 si t 0  t / 2,v n1  10 n 2  10 x1  90.7 x 2  90.8 S1  1.16 S 2  1.03 S  1.34 S 22  1.07 2 1 Sp  Sp  n1  1S12  n2  1S 22 n1  n 2  2 10  11.34  10  11.03 10  10  2 V  n1  n2  2 V  10  10  2  18 S p  1.09 t0  x1  x2 1 1 Sp  n1 n2 121 t0  90.7  90.8  0.21 1 1 1.09  10 10 Usando   0.01 tenemos t 0.01 / 2,18 t0.005,18  2.878 0.21  2.878 La decisión es aceptar H 0 Ejercicio Establecer las pruebas de hipótesis sobre la igualdad de las medias 1 , y  2 de dos distribuciones normales donde las varianzas  12 y  22 son desconocidas. Para probar esta hipótesis se usará una estadística t . Se requiere la hipótesis de normalidad para desarrollar el procedimiento de prueba, pero los alejamientos moderados de la normalidad no tendrán efectos adversos sobre el procedimiento. Ta.9 Realizar el ejercicio, probando la hipótesis. Presencia de Plomo en la leche Leche de la laguna Leche del Valle del (ppm) Mezquital (ppm) 0.0895 0.0895 0.090 0.0915 0.091 0.0910 0.095 0.0890 0.0925 0.0915 0.0910 0.092 0.0890 0.092 0.0895 0.0905 0.0910 0.090 0.0920 0.091 Se desea probar la hipótesis de que el contenido de plomo entre los productos originados de la laguna y del Valle del Mezquital es diferente. H 0 : 1   2 H 1 : 1   2 122 TEMA 4 Objetivo de aprendizaje. 4. Describir el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba. Criterio de Aprendizaje. 4.1. Practicar el procedimiento para realizar prueba de hipótesis sobre la varianza de una distribución normal y los casos en que se emplea esta prueba. Didáctica de enseñanza. In 1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal Pruebas de Hipótesis sobre la Varianza Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. En esta sección se presentan dos procedimientos; uno se basa en la hipótesis de que la población es normal, mientras que el otro es una prueba para una muestra grande que no requiere la suposición de normalidad. Procedimientos de Prueba para una Población Normal Supóngase que se desea probar la hipótesis de que la varianza de una población normal  2 es igual a un valor específico, por ejemplo,  02 . Sea X 1 , X 2 ,....X n una muestra aleatoria de n observaciones tomadas de esta población. Para probar. H 0 :  2   02 H1 :  2   02 (1) Se utiliza el estadístico de prueba X 02  n  1S 2  02 (2 ) Donde S 2 es la varianza muestral. Ahora, si H 0 :  2   02 es verdadera, entonces el estadístico de prueba X 02 sigue una distribución ji-cuadrada con n  1 grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba X 02 , y la hipótesis H 0 :  2   02 debe rechazarse si X 02  X 2 / 2,n1 (3) O si X 02  X 12 / 2,n1 (4) 123 Donde X 2 / 2,n1 y X 12 / 2,n1 son los puntos que corresponden a los porcentajes 100 / 2 inferior y superior de la distribución ji-cuadrada con n  1 grados de libertad, respectivamente. El mismo estadístico de prueba se utiliza para hipótesis alternativas unilaterales. Para la hipótesis unilateral. H 0 :  2   02 H1 :    2 2 0 (5 ) Se rechaza H 0 si X 02  X 2,n1 (6) Para la hipótesis unilateral H 0 :  2   02 H1 :  2   02 (7 ) Se rechaza H 0 si X 02  X 12 ,n1 (8 ) Ejemplo: Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para llenar las botellas. De manera específica, es deseable que la desviación estándar  del proceso de llenado sea menor que 0.5 onzas de líquido; de otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral s 2  0.0153 (Onzas de fluido) 2 . Si la varianza del volumen de llenado es mayor que 0.01 (onzas de fluido) 2 , entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene un problema con el llenado de las botellas? Utilícese   0.05 . Al utilizar el procedimiento de ocho pasos se tiene lo siguiente: 1. El parámetro de interés es la varianza de la población s 2 . 2. H 0 :  2  0.01 3. H 0 :  2  0.01 4.   0.05 5. El estadístico de prueba es X 2 0  n  1s 2   02 124 6. Se rechaza H 0 si X 02  X 02.05,19  30.14 7. Cálculos: 190.0153   29.07 0.01 8. Conclusiones: Puesto que X 02  29.07  X 02.05,19  30.14 , se concluye que no hay ninguna evidencia X 02  fuerte de que la varianza del volumen de llenado sea mayor que 0.01 (onzas de fluido) 2 In.1 y Ta.10 Investigar y desarrollar, tres ejercicios relacionados con el control de calidad aplicado a la agroindustria, donde se aplique prueba de hipótesis sobre la varianza de una distribución normal 125 TEMA 5 Objetivo de aprendizaje. 5. Describir el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba. Criterio de Aprendizaje. 5.1 Practicar el procedimiento de la prueba de hipótesis sobre p de una muestra de datos de una distribución binomial y los casos en que se emplea esta prueba. Didáctica de enseñanza. Pa.7 Elaborar ejercicios sobre prueba de hipótesis p Prueba de hipótesis sobre una distribución binomial. Existen muchas formas de ejemplificar la probabilidad de que ocurra un evento y su aplicación en un modelo binomial. Por ejemplo, cuando un grupo de productos se elabora en forma independiente y se evalúa de acuerdo a su conformación como articulo defectuoso y no defectuoso; o cuando se hace una prueba de preferencia entre el producto para ver si agrada o no al consumidor. La comparación entre la conformación probable entre estas dos clases hace posible seleccionar o inferir cual es la tendencia proporcional.. La distribución binomial. Esta distribución describe una variedad de procesos y describe datos discretos, no continuos, que son resultado de un experimento conocido como proceso de Bernoulli. Prueba de hipótesis sobre p de una muestra de datos de una distribución binomial. Supongamos que tenemos dos muestras independientes tomadas sobre dos poblaciones, en la que estudiamos una variable de tipo dicotómico (Bernoulli): Si X1 y X2 contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada una de ellas se distribuye como una variable aleatoria binomial: De modo que los estimadores de las proporciones en cada población tienen distribuciones que de un modo aproximado son normales (cuando n1 y n2 son bastante grandes) 126 El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en cada población es una cantidad conocida Si H0 fuese cierta se tendría que Desafortunadamente ni p1 ni p2 son conocidos de antemano y utilizamos sus estimadores, lo que da lugar a un error que es pequeño cuando los tamaños muestrales son importantes: Contraste bilateral El contraste bilateral sobre la diferencia de proporciones es Entonces se define Y se rechaza la hipótesis nula si o si Contrastes unilaterales En el contraste 127 Se rechazará H0 si Se rechaza H0 si . Para el test contrario . Ejemplo El gerente de ventas de una empresa agroindustrial asegura que la venta del producto depende del color que se use en el empaque. Con el propósito de evaluar a la anterior consideración se estableció un experimento donde 25 amas de casa elegidas aleatoriamente en forma independiente seleccionaron a su agrado una muestra del producto en comparación: empaque color rojo y empaque color azul. Solución: Los resultados indicaron que las amas de casa prefirieron el producto con empaque azul. Al esperar que el color del empaque no influye en la selección del producto se espera una conformación de proporcionalidad igual al 50 % ( P = (0.5 y q =0.5 ). a un nivel de significancia =0.05. Ho: P = 0.5 Ha: P  0.5 Ahora bien, si se tiene que n = 25 y T = 18 y el nivel de significancia es =0.05., al región crítica se considera /2=0.025 P1= 18/25= 0.72 P2=7/25 = 0.28  = 0.72-0.28= 0.44 Z calculada = 0.0432 por lo tanto se concluye que la 128 Práctica 7 Elaborar ejercicios sobre prueba de hipótesis p Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. En todos los problemas que siguen a continuación, se supone que las muestras han sido elegidas de modo independiente, y que las cantidades cuantitativas que se miden, se distribuyen de modo gaussiano. En temas posteriores se verá cómo contrastar si estas premisas pueden ser aceptadas o no al examinar las muestras. Ejercicio 1. El calcio se presenta normalmente en la sangre de los mamíferos en concentraciones de alrededor de 6 mg por cada 100 ml del total de sangre. La desviación típica normal de ésta variable es 1 mg de calcio por cada 100 ml del volumen total de sangre. Una variabilidad mayor a ésta puede ocasionar graves trastornos en la coagulación de la sangre. Una serie de nueve pruebas sobre un paciente revelaron una media muestral de 6,2 mg de calcio por 100 ml del volumen total de sangre, y una desviación típica muestral de 2 mg de calcio por cada 100 ml de sangre. ¿Hay alguna evidencia, para un nivel α=0.05, de que el nivel medio de calcio para este paciente sea más alto del normal? Ejercicio 2. El número de accidentes mortales en una ciudad es, en promedio, de 12 mensuales. Tras una campaña de señalización y adecentamiento de las vías urbanas se contabilizaron en 6 meses sucesivos 8, 11, 9, 7, 10, 9 accidentes mortales. ¿Fue efectiva la campaña? Ejercicio 3. El promedio de las puntuaciones de un número elevado de alumnos de Bioestadística es de 6,50. Un determinado año se examinaron 50 alumnos con resultados promedio de 7,25 y desviación típica de 1. ¿Variaron las calificaciones? Ejercicio 4. El peso medio de mujeres de 30 a 40 años es de 53 kg. Un estudio realizado en 16 mujeres de tales edades que siguen una dieta vegetariana da y . ¿Modifica la dieta el peso medio? Ejercicio 5. Una población infantil se dice que es susceptible de recibir una campaña de educación e higiene si su porcentaje de niños con dientes cariados es superior al 15%. Una población con 12.637 niños, ¿debe hacerse la campaña si de 387 de ellos 70 tenían algún diente cariado? 129 CAPITULO 6 ANÁLISIS DE LA VARIANZA INTRODUCCIÓN El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del análisis multivariante. OBJETIVO Y CRITERIOS DE APRENDIZAJE Página 1. Analizar las causas del error experimental durante las mediciones. 1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos de texto. 132 132 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1. Utilizar un modelo lineal a partir de mediciones experimentales o datos de texto OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Reconocer las fuentes de variación, describir el procedimiento del análisis de varianza y explicar el concepto de grado de libertad. 2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de varianza y el concepto de grado de libertad. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 2.1.1. Utilizar las fuentes de variación, el procedimiento del análisis de varianza y el concepto de grado de libertad. OBJETIVO Y CRITERIOS DE APRENDIZAJE 3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones. 3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad experimental y número de repeticiones. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 3.1.1. Emplear en un conjunto de datos el tamaño de muestra, la unidad experimental y número de repeticiones.. OBJETIVO Y CRITERIOS DE APRENDIZAJE 4. Identificar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial. 4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 4.1.1. Emplear de acuerdo a la estructura de los datos, el experimento completamente 134 134 136 136 136 136 130 al azar, el experimento en bloques al azar y el experimento factorial. OBJETIVO Y CRITERIOS DE APRENDIZAJE 5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos. 5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de experimentos. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 5.1.1. Determinar el procedimiento del análisis de varianza para ese tipo de experimentos. DEMOSTRACIÓN DE HABILIDADES FINALES Pa.8 Análisis de varianza (ANOVA) 136 136 146 131 TEMA 1 Objetivo de aprendizaje. 1. Analizar las causas del error experimental durante las mediciones. Criterio de Aprendizaje. 1.1. Ilustrar y formular modelo lineal a partir de mediciones experimentales o datos de texto. Didáctica de enseñanza. Modelo Matemático Lineal Causas del error experimental Al conducir un experimento una persona encuentra uno o más de tres tipos generales de errores: error humano, error sistemático, y error al azar. Error humano (un error) ocurre cuando el experimentador, incurre en una equivocación. Los ejemplos serían cuando se instala un experimento incorrectamente, cuando se lee mal un instrumento, o cuando se incurre en una equivocación en un cálculo. Error sistemático, es un error inherente en el experimento instalado que hace sesgar a los resultados en la misma dirección, es decir, siempre demasiado grande o siempre demasiado pequeño. Algunos errores sistemáticos pueden ser corregidos fácilmente. Por ejemplo, si un equilibrio lee 0,25 g cuando no hay masa en ella, esto introduciría un error sistemático a cada medida, todo sería demasiado grande por 0,25 g. Esto puede ser corregido poniendo a cero el equilibrio. Todos los experimentos tienen error al azar, que ocurre porque ninguna medición no se puede hacer con precisión infinita. Los errores al azar harán una serie de medidas demasiado grande y a veces demasiado pequeña. Un ejemplo del error al azar podía ser al hacer sincronizaciones con un cronómetro. Usted puede parar a veces el reloj demasiado pronto, o a veces demasiado tarde. Cualquier caso introduce error al azar en sus medidas. (nota que cuando un ser humano está implicado en el proceso real de la medida, el/ella puede introducir el error experimental válido que no está dentro de la definición del error humano. Su tiempo de reacción finito no es un error; es una limitación de una porción del proceso experimental, del ser humano haciendo la medida.) El error al azar puede ser reducido haciendo un promedio de varias mediciones. Análisis del error Una forma para analizar error experimental con un % del cálculo del error. El % del error es útil cuando se tiene un solo resultado experimental que se desee comparar con un valor estándar, o cuando se tienen dos valores experimentales obtenidos por diversos medios que se deseen comparar. El % del error se calcula según la fórmula siguiente. expt. # - std. # % error = x 100 % std. # "expt. #" es su valor experimental, y el "std. #" es el valor del standard o del referente. Usando esta fórmula, un resultado positivo indica que su resultado fuera más grande que el estándar, mientras que un resultado negativo implica un resultado experimental más pequeño que el estándar. Mientras que % 132 del error le dice el tamaño relativo de su error, no le da ninguna pista en cuanto al tipo de ese error (error al azar o error sistemático)). En ciertos casos uno puede utilizar una cantidad estadística llamada la desviación de estándar , denotada generalmente por la sigma griega minúscula de la letra, σ , o la abreviatura std., Podemos resumir: - % pequeños del error, dentro de uno o de dos σ estándar:, principalmente al azar. - % pequeños del error, no dentro de dos o de tres σ estándar: principalmente sistemático. - % grandes del error, dentro de uno o de dos σ estándar: grande, principalmente errores del random. - % grandes del error, no dentro de dos o de tres σ estándar: principalmente sistemático. 133 TEMA 2 Objetivo de aprendizaje. 2. Reconocer las fuentes de variación, describir el procedimiento del análisis de varianza y explicar el concepto de grado de libertad. Criterio de Aprendizaje. 2.1. Ilustrar y diferenciar las fuentes de variación, el procedimiento del análisis de varianza y el concepto de grado de libertad. Didáctica de enseñanza. Análisis de varianza del modelo lineal De acuerdo con la hipótesis nula, según la cual se supone que las medidas poblacionales de los tres grupos son iguales, se puede obtener una medición de la variación total o suma de los cuadrados, sumando las diferencias elevadas al cuadrado entre cada observación y una medida global X sobre la base de todas las observaciones. La variación total se calcularía como: __ Supóngase que el gerente de producción de una planta en la cual se fabrica y envasa cereal en cajas de 368 gramos, considera sustituir una máquina antigua que afecta directamente la producción. Es más supóngase que tres productores le han permitido usar sus equipos para efectuar pruebas , y cuyos precios de compra y contratos de mantenimientos son totalmente iguales . Para tomar la decisión de compra , el gerente de producción decide llevar a cabo un experimento para determinar las diferentas más importantes entre las tres macas de equipo en el tiempo promedio (en segundos) que necesitan los obreros para su producción. Se asignan en forma aleatoria 15 operarios con experiencia, capacidad y edades similares, para recibir adiestramiento en una de las tres máquinas de modo que cada máquina tenga cinco operadores. Después de una capacitación adecuada , suficiente y practica, el gerente de producción mide el tiempo que necesitan los operadores para trabajar con sus equipos respectivos. En la siguiente tabla se presentan los resultados de este experimento. MÁQUINA Media 1 25.40 26.31 24.10 23.74 25.10 24.93 2 23.40 21.80 23.50 22.75 21.60 22.61 3 20.00 22.20 19.75 20.60 20.40 20.59 Se expresa la hipótesis nula y alternativa en la forma siguiente: H0: 1 = 2 =3 = ...= c Todas las medias son iguales H1: No todas las medias son iguales Para el caso del ejemplo las hipótesis nula y alternativa serian: H0: 1 = 2 =3 = ...= c Todas las máquinas son iguales 134 H1: No todas las máquinas son iguales En la tabla se observa que existen diferencias en las medias maestrales para las tres máquinas. La pregunta es si estos datos son lo suficientemente diferentes para que el gerente de producción llegue a la conclusión de que los promedios poblacionales no son todos iguales. Grados de libertad Para calcular s2 se necesita conocer primero la media. Por consiguiente se puede decir que solo n-1 de los valores de muestra están “libres” para variar. Es decir , hay n-1 grados de libertad. 135 TEMA 3 Objetivo de aprendizaje. 3. Definir el tamaño de muestra, la unidad experimental y número de repeticiones. Criterio de Aprendizaje. 3.1. Practicar para definir en un conjunto de datos el tamaño de muestra, la unidad experimental y número de repeticiones. Didáctica de enseñanza. TEMA 4 Objetivo de aprendizaje. 4. Identificar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial. Criterio de Aprendizaje. 4.1. Diferenciar de acuerdo a la estructura de los datos, el experimento completamente al azar, el experimento en bloques al azar y el experimento factorial. Didáctica de enseñanza. TEMA 5 Objetivo de aprendizaje. 5. Describir el procedimiento del análisis de varianza para ese tipo de experimentos. Criterio de Aprendizaje. 5.1 Diferenciar el procedimiento del análisis de varianza para ese tipo de experimentos. Didáctica de enseñanza. Pa.8 Análisis de varianza (ANOVA) Diseño de experimentos Los experimentos son usados por los investigadores en todas las áreas de la ciencia ya se para describir algo acerca de un proceso en particular o para comparar el efecto de varias condiciones sobre algún fenómeno. Para el diseño y análisis de experimentos se requiere que toda persona involucrada en el experimento tenga una idea clara de lo que exactamente se será estudiado , como serán colectados los datos y al menos una idea cualitativa de cómo serán analizados los datos. A continuación se describe una generalización del procedimiento recomendado para el diseño de experimentos: 1. Establecimiento del problema y objetivos. Un claro establecimiento del problema frecuentemente contribuye a un buen entendimiento del fenómeno y a la solución final del problema. Es necesario desarrollar todas las ideas acerca de los objetivos del experimento. 136 2. Selección de factores y niveles el experimento debe seleccionar el factor o los factores (variable o variables independientes) que serán investigados en el experimento. También se deberá seleccionar los valores o niveles del factor o factores que se usaran en el experimento y que definen los tratamientos. Al definir los tratamientos se esta definiendo al denominado especio de exploración o región de exploración. 3. Definir a la unidad experimental. La unidad experimental es aquella subdivisión menor del material experimental y que puede definir un tratamiento diferente. Para la selección de las unidades experimentales debe tomarse en cuenta el especto práctico, no puede considerarse representativo el uso de una planta para comparar dosis de fertilizante. En el aspecto estadístico debe tomarse en cuenta el tamaño de la unidad experimental y el número de repeticiones para la precisión del experimento. Se entiende por número de repeticiones al número de unidades experimentales que se repiten con el mismo tratamiento. 4. Definir las observaciones o mediciones. En general selección de variables respuesta. 5. Elección del diseño experimental. El diseño experimental es la forma de asignar los tratamientos o las unidades experimentales, esto determina un modelo o un análisis a seguir. El experimentador debe determinar la diferencia en la respuesta verdadera que desea detectar, así como la magnitud de riesgo que esta dispuesto a tolerar , con lo cual un tamaño de muestra apropiado puede ser seleccionado. También debe determinar el orden en el cual los datos deberán ser recolectados y el método de aleatorización que será empleado. Generalmente en diseños experimentales las ideas centrales guían a la elección de aleatorización y bloqueo. El bloqueo es la inclusión en el diseño de algunos factores que aunque no son de interés, si pueden ser causa de una fuerte variación en las unidades experimentales y que no pueden mantenerse constantes para todas las unidades experimentales del experimento. Un bloque es un grupo de unidades experimentales que son más o menos homogéneas, de modo que la asignación de tratamientos diferentes a dichas unidades produzca en las observaciones un efecto más fácil de distinguir de otros factores aleatorios. Se llama bloque completo a un grupo de unidades experimentales que contienen todos los tratamientos del experimento y bloque incompleto si contiene solo una parte de todos los tratamientos. Para el caso de dos tratamientos , los bloques completos son parejas de unidades experimentales semejantes y se les denomina observaciones apareadas. La aleatorización es un medio de impartir insesgamiento a los estimadores, a pesar de tener unidades experimentales heterogéneas, es decir que todos los factores no estudiados, ni controlados explícitamente en el modelo y que causan variación las unidades experimentales, son “controlados” por la aleatorización. 6. Determinar el número de repeticiones. Las repeticiones son las veces que se reproduce cada tratamiento en la unidad experimental. Las repeticiones permiten obtener una estimación de la varianza del error experimental e incrementan la precisión del experimento ya que de hecho son el tamaño de muestra de cada una de las poblaciones estudiadas. 137 7. Proyecto de resultados y análisis. Estos aspectos deben determinarse antes de efectuar el experimento , para que puedan señalarse cuales son las suposiciones básicas del modelo y determinar si el experimento cumple satisfactoriamente tales suposiciones. 8. Efectuar el experimento y colección de datos. Debe tenerse cuidado en a especificación de los pasos prácticos a seguir y tener formas especialmente diseñadas para capta las observaciones. 9. Efectuar el análisis estadístico. Para este análisis existen programas de computadora , pero deben complementase con graficas, cuadros o lagunas rutinas de calculo extra que sean fácilmente explicables. Obtención de conclusiones. Si el experimentador o investigador tiene poco conocimiento de la estadística, entonces debe ser auxiliado por un estadístico para la interpretación de los análisis El modelo. Las observaciones pueden expresarse en general mediante el siguiente modelo estadístico lineal: Yij = +i + εij i = 1,2,...t j= 1,2,...n Que es el diseño estadístico completamente aleatorizado y donde: Yij : es la i-ésima observación tomada bajo el tratamiento i-ésimo. μ: Es el parámetro común a todos los tratamientos (media general) I : Es el parámetro del i-ésimo tratamiento denominado “ efecto del i-ésimo tratamiento”. εij = Es el componente de error aleatorio ocasionado por todos los factores no constantes en cada una de las poblaciones estudiadas. t: es el número de tratamientos (poblaciones) n: Es el número de observaciones o tamaño de muestra de la i-ésima población. El interés por desarrollar el análisis de varianza radica en que se desea probar la hipótesis sobre la igualdad de los efectos de los tratamientos, es decir: Ho: 1 =2=3 ...=t Ha: 1≠ j para al menos i ≠ j vs Si Ho es cierta entonces cada observación puede ser representada como: Yij =  + εij El procedimiento del análisis de varianza se resume en el cuadro siguiente: F.V G.L SC CM F0 138 TRATAMIENTOS t-1 SCTr CMTr=SCTr/(t-¡) ERROR nt-t SCE CME= SCE/(nt-t) TOTAL nt-1 SCT CMTr/CME La suma de cuadrados puede obtenerse como sigue: t n t SCT =  (Yij  Y ..)2   i 1 j 1 i 1 n Yij  2 j 1 2 Y.. nt Yi .2 Y..2 SCTr = n (Yi  Y ..)   .  nt i 1 i 1 n t t 2 SCE = SCT – SCTr Diseño experimental completamente aleatorizado Es el diseño experimental más sencillo, y se origina por la asignación aleatoria de los tratamientos a un conjunto de unidades experimentales previamente establecidas. En este diseño pueden probarse cualquier número de tratamientos resultando deseable, aunque no esencial, asignar al mismo número de unidades experimentales a cada tratamiento. Es un diseño experimental de mucha utilidad en todos los campos de la ciencia, siempre y cuando se consiga homogeneidad del material experimental y del sitio donde se vaya a desarrollar el experimento. Se podrían enumerar una serie de ventajas y desventajas del diseño: Ventajas: 1.- Tanto la planificación como el análisis son los más simples si se les compara con los otros diseños conocidos. 2.- Produce el máximo número de grados de libertad para el error, lo que es muy útil en pequeños ensayos. 3.- Cuando existe un número desigual de replicaciones por tratamientos, no es causa de complicaciones en el análisis estadístico. 4.- Es de fácil manejo tanto en el campo como en el laboratorio. Desventajas: 1.- Solo puede usarse con material experimental muy homogéneo. 2.- Su utilidad es restringida en los experimentos de campo, debido a la heterogeneidad del suelo, que puede ser muy grande. Para evitar que la misma enmascare los resultados del experimento, debe recurrirse a diseños muy eficientes. 139 3.- Presenta desventajas cuando el material no es homogéneo, ya que no se puede aumentar mucho el tamaño del experimento, debido a que esto motiva variaciones muy altas, que enmascaran el efecto del tratamiento. En cuanto al número de observaciones para cada tratamiento o factor, se determina en base a los costos y a la potencia de la prueba. Seguidamente se presenta con un ejemplo, los pasos a seguir para la realización del análisis en este tipo de diseño, donde se incluyen: modelo lineal aditivo, supuestos, hipótesis a probar. En el presente cuadro se muestran los resultados (área intestinal en dmª), en un ensayo donde se prueba el efecto de 4 desparasitantes en cerdos estabulados. Desparasitantes OBS(n) 1 2 3 4 5 6 7 8 total 1 4.87 4.60 1.33 5.58 5.88 2.81 4.10 5.63 34.84 2 3.30 2.25 5.85 6.16 8.35 5.93 1.50 5.85 38.19 3 6.80 5.70 4.62 3.80 2.75 4.93 4.93 3.80 37.33 4 1.28 3.88 5.00 3.25 1.56 4.25 4.46 5.53 29.21 139.53 n= número de observaciones por desparasitantes = 8 N= número total de observaciones = 32 Modelo lineal: Yij    i  ij Yij: observación j-ésima del i-ésimo tratamiento. μ: media general i: efecto del i-ésimo tratamiento εij: error experimental de la j-ésima observación en el i-ésimo tratamiento. i=1,2,...,t j=1,2,...,n 140 MODELO I MODELO II t  i  0 i 1 2 i ~ NID(0, 2) ij ~ NID(0, 2) ij ~ NID(0, 2) Hipótesis: MODELO I i  0 Ha : i  0 Ho : MODELO II 2  i  0 2 Ha:  i  0 Ho: El modelo I se utiliza para tratamientos fijos como el caso del ejemplo, el modelo II, se aplica para aquellos tratamientos elegidos al azar. Esquema del análisis de varianza: F. V. G .L TRATAMIENTOS t  1 t SC CMI 2 t Yi .   FC i 1 n 2   n ERROR t ( n  1) diferencia TOTAL nt  1 CMII  i 2 2   n i t 1  2  2 t n 2   Yij  FC i 1 j 1 n (   Yij ) 2 FC  i 1 j 1 n. t 2 2 2 2 2  38.19  37.33  29.21 34 . 80 139 . 53 SCtrat   6.139 8 32 Suma de cuadrados totales: 2 2 2 2 2 139.53 SCtot  4 .87  4 .60  .......  4 .46  5.53   92. 596 32 141 Suma de cuadrados del error experimental SCEE  SCtot  SCtrat 86. 457 Cuadrados medio del tratamiento CMtrat  SCtrat t 1  2. 0463 Cuadrado medio del error experimental: CMEE  SCEE t ( n  1)  3. 0877 Análisis de Varianza: F DE V Tratamientos Error Total G DE L 3 28 31 SC 6.139 86.457 CM 2.0463 3.0877 F0 0.662 Prueba de hipótesis: FC  CMtrat  0. 662 CMEE Fteorico 2  2  n   ( t 1)  2 Para probar la hipótesis compare el F calculado (0,662) con el F tabulado , este se encuentra en la tabla de "F", con los grados de libertad del numerador (tratamiento) y los grados de libertad del denominador (error experimental), y con un nivel de significación o probabilidad de cometer error tipo I (). Ftab ,5% = 2.95 Ftab , 1% = 4,57 Fcal = 0.662 De acuerdo a la no significación de F, se acepta la Ho: i=0, es decir, no hay diferencia entre los tratamientos (desparasitantes) estudiados; las áreas intestinales promedios correspondientes a los cerdos criados estabulados tratados con 4 desparasitantes, fueron estadísticamente iguales. Experimento en bloques al azar En muchos problemas experimentales es necesario diseñar el experimento de tal manera que la variabilidad debida a fuentes extrañas pueda ser controlada sistemáticamente. El remover la 142 variabilidad de factores extraños nos permite reducir el error experimental. Un diseño que nos permite tal situación es el denominada “diseño en bloques al azar”. Es una técnica de bloqueo de variación en el material experimental, bloqueo que puede ser en el tiempo o en el espacio. El diseño consiste en incluir en el modelo, algunos factores que aunque no son de interés, se reconoce que pueden causar una fuente de variación en las unidades experimentales del experimento. Así un bloque es un grupo de unidades experimentales que son más o menos homogéneas, de modo que la asignación de tratamientos diferentes a dichas unidades produzca en las observaciones un efecto más fácil de distinguir de otros factores aleatorios. La estructura de los datos de este diseño es como sigue: BLOQUE 1 BLOQUE 2 BLOQUE b Y11 Y21 Y31 Y12 Y22 Y32 Y1b Y2b Y3b . . . . . . . . . Yt1 Yt2 Ytb El modelo estadístico para este diseño es: Yij = +I +βj + εij i= 1,2,...,t; j= 1,2,...,b; El procedimiento para un análisis de varianza para este modelo es el siguiente: F.V G.L SC CM F0 TRATAMIENTOS t-1 SCTr CMTr=SCTr/(t-1) CMTr/CME BLOQUES b-1 SCBlo CMBlo = SCBLo/b-1 ERROR (t-1)(b-1) SCE TOTAL tb-1 CME= SCE/(t-1)(b-1) SCT La suma de cuadrados puede obtenerse como sigue: t SCT =  i 1 b Yij  2 j 1 2 Y.. tb Yi .2 Y..2 SCTr =   tb i 1 b t Yi .2 Y..2 SCBlo=   tb i 1 t b 143 SCE = SCT – SCTr – SCBlo Experimento factorial Muchos experimentos requieren del estudio de los efectos de dos o más factores, los experimentos factoriales son los diseños más eficientes para este tipo de análisis. Se entiende por experimento factorial aquel donde en cada ensayo o repetición completa del experimento se investigan todas las posibles combinaciones de los niveles de los factores considerados. Por ejemplo, si se tienen 2 niveles del factor 1 y 3del factor 2, entonces cada repetición o ensayo contiene todas las 2x3 =6 combinaciones. En algunos tratamientos puede encontrarse que las diferencias en respuesta entre los niveles de un factor no es la misma en todos los niveles de otros. Cuando esto ocurre entonces existe una interacción entre los factores. Por ejemplo, considérese un factor a y un factor b como se muestra en el siguiente cuadro: b0 b1 a0 a0b0 = 20 a0b1 = 40 a1 a1b0 = 50 a1b1 = 12 Al primer nivel del factor b, el efecto simple del factor a es A= (a1b0)-(a0b0) = 50-20 = 30 y el efecto simple del factor a al segundo nivel del factor b es A = (a1b1)-(a0b1) = 12-40= -28. Entonces el efecto de a depende del nivel seleccionado para el factor b , entonces se dice que existe interacción entre los factores a y b. Lo anterior se ilustra gráficamente como sigue: 60 A b0 b1 50 b1 b1 40 Respuesta B b1 b1 30 b0 20 b0 b1 10 0 a0 a0 a1 a1 Figura. Experimento factorial sin interacción (A) y experimento factorial con interacción (B) Graficas de este tipo son útiles en la interpretación de las interacciones significativas y en los informes de resultados para personas con poco o ningún entrenamiento estadístico, pero no pueden usarse como única técnica de análisis. El procedimiento para el análisis de varianza de este experimento se resume en el siguiente cuadro. F.V G.L SC CM F0 144 TRATAMIENTO (A) a-1 SCA CMA=SCA/(a-1) CMA/CME TRATAMIENTO (B) b-1 SCB CMB = SCB/(b-1) CMB/CME INTERACCIÓN (AB) (a-1)(b-1) SCAB CMAB = SCAB/(a-1)(b-1) CMAB/CME ERROR ab.(n-1) SCE TOTAL abn-1 SCT CME= SCE/(t-1)(abn-1) La suma de cuadrados puede obtenerse como sigue: 2 a b n Y... 2 SCT = Yijk  abn i j k a SCA=  i 2 Yi.. Y2  ... bn abn b Y. 2j. j an SCB=   Y...2 abn SCAB = SC (Subtotales) – SCA- SCB SC = a b i j  2 Y...2  n abn Yij. SCE = SCT – SCA – SCB - SCAB 145 Práctica 8 Análisis de varianza (ANOVA) 1. Determinar si el color del envase de un producto influye en las ventas del artículo. Se estableció un diseño experimental donde se evalúo el envase en tres colores: Rojo, Azul y Amarillo, y observaron las ventas en cada presentación. Obteniéndose los siguientes resultados. Color Ventas $ Azul 400 Azul 250 Azul 550 Azul 600 Azul 550 Rojo 300 Rojo 200 Rojo 450 Rojo 500 Rojo 500 Amarillo 480 Amarillo 220 Amarillo 360 Amarillo 400 Amarillo 650 2. En un sistema Regional de Control de Calidad, con 15 laboratorios afiliados se quiere investigar las fluctuaciones entre 3 diferentes maneras de medir RGR (Recuento de Glóbulos Rojos). La primera forma es usando equipos automatizados de recuento, o contadores hematológicos, tales como el Technicon H301 y similares. De entre todos los afiliados que usen ese método se eligen cinco de ellos al azar para conformar el Grupo 1. La segunda manera es usando el método microhematocrito y para ello, se eligen al azar, otros cinco afiliados que usan tal método para conformar el Grupo 2. Finalmente, el Grupo 3 se conforma con otros cinco laboratorios seleccionados al azar, de entre los que usan otros métodos, como por ejemplo el macrohematocrito, recuento en cámara, etc. Los 15 laboratorios siguen un programa de Control de Calidad interno y se suponen calibrados. Se envía a cada laboratorio una muestra ciega, con una sangre calibrada en el laboratorio de referencia de: gl/ml. Valores de RGR expresados en 106 gl/ml 146 3. Para controlar la influencia del factor humano en las mediciones clínicas se debe hacer medir lo mismo a varios operadores diferentes. Así, se pueden comparar los valores medidos por cada uno, entre sí, con un modelo de Anova. En el ejercicio siguiente se usa un modelo de un factor para ilustrar el método, sin embargo, cuanto más factores se tomen en cuenta, mejor será la sensibilidad del modelo estadístico para detectar las diferencias. Registro 1. Registro 2. Registro 3. 147 CAPITULO 7 REGRESIÓN LINEAL INTRODUCCIÓN Una respuesta a la pregunta típica que hace cualquier estudiante que se enfrenta a las dificultades del razonamiento matemático, ¿ para que me sirven las matemáticas?, se plantea aquí como una muestra de la matemática aplicada en aspectos tangibles y cotidianos como la estadística y la matemática financiera. Pero también en aspectos no tan tangibles como lo son los temas de potenciación, radiación, fracciones y ecuaciones trigonométricas que sirven de apoyo para otros temas como el cálculo diferencial e integral, el cual tiene una aplicación más directa., con estos elementos el estudiante de la Carrera de Procesos Agroindustriales se beneficia porque complementa su formación básica en matemáticas. OBJETIVO Y CRITERIOS DE APRENDIZAJE Página 1. Analizar la importancia de los usos de la regresión lineal simple. 1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal simple en el ámbito profesional. 149 149 DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 1.1.1. Practicar y utilizar la regresión lineal simple en el ámbito profesional. OBJETIVO Y CRITERIOS DE APRENDIZAJE 2. Expresar las ecuaciones para estimar los parámetros de regresión lineal, definiendo el coeficiente de correlación R2 y relacionarlo con la precisión de la recta estimada. 2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2. DEMOSTRACIÓN DE HABILIDADES PARCIALES (RESULTADO DE APRENDIZAJE) 2.1.1. Emplear las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2. DEMOSTRACIÓN DE HABILIDADES FINALES Pa.9 Regresión lineal 161 161 175 148 TEMA 1 Objetivo de aprendizaje. 1. Analizar la importancia de los usos de la regresión lineal simple. Criterio de Aprendizaje. 1.1. Describir e ilustrar con ejemplos las aplicaciones practicas de la regresión lineal simple en el ámbito profesional. Didáctica de enseñanza. Modelo regresión lineal Con este tipo de regresiones nos conformamos con encontrar relaciones funcionales de tipo lineal, es decir, buscamos cantidades a y b tales que se pueda escribir Con el menor error posible entre De forma que e Y, o bien sea una variable que toma valores próximos a cero. Obsérvese que la relación explica cosas como que si X varía en 1 unidad, varía la cantidad b. Por tanto:  Si b>0, las dos variables aumentan o disminuyen a la vez;  Si b<0, cuando una variable aumenta, la otra disminuye. Por tanto, en el caso de las variables peso y altura lo lógico será encontrar que b>0. El problema que se plantea es entonces el de cómo calcular las cantidades a y b a partir de un conjunto de n observaciones De forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son de forma esquemática, las que siguen: 1. Dadas dos variables X, Y, sobre las que definimos Medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias entre los valores reales y los aproximados al cuadrado (para que sean positivas y no se compensen los errores): 149 2. Una aproximación de Y, se define a partir de dos cantidades a y b. Vamos a calcular aquellas que minimizan la función 3. Posteriormente encontraremos fórmulas para el cálculo directo de a y b que sirvan para cualquier problema. Regresión de Y sobre X Para calcular la recta de regresión de Y sobre X nos basamos en la figura. Figura: Los errores a minimizar son las cantidades Una vez que tenemos definido el error de aproximación mediante la relación las cantidades que lo minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los mínimos cuadrados): 150 La relación no es más que otra manera de escribir la relación, que se denomina ecuaciones normales. La primera de se escribe como Sustituyendo se tiene que Lo que nos da las relaciones buscadas: La cantidad b se denomina coeficiente de regresión de Y sobre X. Regresión de X sobre Y Las mismas conclusiones se sacan cuando intentamos hacer la regresión de X sobre Y. Para calcular la recta de regresión de X sobre Y es totalmente incorrecto despejar de 151 Pues esto nos da la regresión de X sobre hace aproximando X por , del modo , que no es lo que buscamos. La regresión de X sobre Y se Donde Pues de este modo se minimiza, en el sentido de los mínimos cuadrados, los errores entre las cantidades xi y las Figura: Los errores a minimizar son las cantidades Ejemplo En una muestra de 1.500 individuos se recogen datos sobre dos medidas antropométricas X y Y. Los resultados se muestran resumidos en los siguientes estadísticos: Obtener el modelo de regresión lineal que mejor aproxima Y en función de X. Utilizando este modelo, calcular de modo aproximado la cantidad Y esperada cuando X=15. Solución: 152 Lo que se busca es la recta, que mejor aproxima los valores de Y (según el criterio de los mínimos cuadrados) en la nube de puntos que resulta de representar en un plano (X,Y) las 1.500 observaciones. Los coeficientes de esta recta son: Así, el modelo lineal consiste en: Por tanto, si x=15, el modelo lineal predice un valor de Y de: En este punto hay que preguntarse si realmente esta predicción puede considerarse fiable. Para dar una respuesta, es necesario estudiar propiedades de la regresión lineal que están a continuación. Propiedades de la regresión lineal Una vez que ya tenemos perfectamente definida , (o bien ) nos preguntamos las relaciones que hay entre la media y la varianza de esta y la de Y (o la de X). La respuesta nos la ofrece la siguiente proposición: En los ajustes lineales se conservan las medias, es decir En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores de las variables X y Y, y sus aproximaciones y , pues sólo se mantienen en un factor de r2, es decir, Basta probar nuestra afirmación para la variable Y, ya que para X es totalmente análogo: 153 Donde se ha utilizado la magnitud que denominamos coeficiente de correlación, r, y que ya definimos anteriormente como Como consecuencia de este resultado, puede decirse que la proporción de varianza explicada por la regresión lineal es del . Nos gustaría tener que r=1, pues en ese caso ambas variables tendrían la misma varianza, pero esto no es cierto en general. Todo lo que se puede afirmar, como sabemos, es que Y por tanto La cantidad que le falta a la varianza de regresión, , para llegar hasta la varianza total de Y, es lo que se denomina varianza residual, que no es más que la varianza de , , ya que El tercer sumando se anula según las ecuaciones normales expresadas en la relación: 154 Por ello Obsérvese que entonces la bondad del ajuste es Para el ajuste contrario se define el error como proporcional a 1-r2: , y su varianza residual es también Y el coeficiente de determinación (que sirve para determinar la bondad del ajuste de X en función de Y) vale: Para los ajustes de tipo lineal se tiene que los dos coeficientes de determinación son iguales a r2, y por tanto representan además la proporción de varianza explicada por la regresión lineal: Por ello:  Si viceversa). el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir de X y  Si las variables X e Y no están relacionadas (linealmente al menos), por tanto no tiene sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no posean ninguna relación en el caso r=0, ya que si bien el ajuste lineal puede no ser procendente, tal vez otro tipo de ajuste sí lo sea. Ejemplo 1 155 De una muestra de ocho observaciones conjuntas de valores de dos variables X e Y, se obtiene la siguiente información: Calcule: 1. La recta de regresión de Y sobre X. Explique el significado de los parámetros. 2. El coeficiente de determinación. Comente el resultado e indique el tanto por ciento de la variación de Y que no está explicada por el modelo lineal de regresión. 3. Si el modelo es adecuado, ¿cuál es la predicción para x=4. Solución: 1. En primer lugar calculamos las medias y las covarianza entre ambas variables: Con estas cantidades podemos determinar los parámetros a y b de la recta. La pendiente de la misma es b, y mide la variación de Y cuando X aumenta en una unidad: Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a medida que X aumenta, la tendencia es a la disminución de Y. En cuanto al valor de la ordenada en el origen, a, tenemos: Así, la recta de regresión de Y como función de X es: 2. El grado de bondad del ajuste lo obtenemos a partir del coeficiente de determinación: 156 Es decir, el modelo de regresión lineal explica el tanto queda un de la variabilidad de Y en función de la de X. Por de variabilidad no explicada. 3. La predicción que realiza el modelo lineal de regresión para x=4 es: Lo cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado anterior, hay una razonable cantidad de variabilidad que no es explicada por el modelo. Ejemplo 2 Se realizan 8 mediciones de textura y grado de madurez a 10 manzanas golden, obteniéndose los siguientes resultados: Resultado de las mediciones textura 12 8 10 11 7 7 10 14 grado de madurez 58 42 51 54 40 39 49 56 ¿Existe una relación lineal importante entre ambas variables? Calcular la recta de regresión de la textura en función del grado de madurez y la del grado de madurez en función de la textura. Calcular la bondad del ajuste ¿En qué medida, por término medio, varía el grado de madurez? Solución: Para saber si existe una relación lineal entre ambas variables se calcula el coeficiente de correlación lineal, que vale: Ya que 157 Por tanto el ajuste lineal es muy bueno. Se puede decir que el ángulo entre el vector formado por las desviaciones del grado de madurez con respecto a su valor medio y el de la textura con respecto a su valor medio, , es: Es decir, entre esos vectores hay un buen grado de paralelismo (sólo unos 19 grados de desviación). La recta de regresión del grado de madurez en función de la textura es: La recta de regresión de la edad como función del peso es Que como se puede comprobar, no resulta de despejar en la recta de regresión de Y sobre X. La bondad del ajuste es Por tanto podemos decir que el de la variabilidad del grado de madurez en función de la textura es explicada mediante la recta de regresión correspondiente. Lo mismo podemos decir en 158 cuanto a la variabilidad de la textura en función del grado de madurez. Del mismo modo puede decirse que hay un de varianza que no es explicada por las rectas de regresión. Por tanto la varianza residual de la regresión del grado de madurez en función de la textura es: Y la de la textura en función del peso: Análisis de varianza del modelo lineal Regresión Lineal Un problema clásico en estadística es tratar de determinar la relación entre dos variables aleatorias X y Y. Por ejemplo, podríamos considerar el alto y ancho de una muestra de adultos. La regresión lineal trata de explicar esta relación con una línea recta que trata de acercarse lo mas posible a todos los puntos de la muestra. La regresión lineal postula que Y= a+bX+e Donde el "residual" e es una variable aleatoria de media cero. El coeficiente a y b son escogidos de forma tal que la suma de los cuadrados de los residuales sea lo mas cercano a cero posible. En multitud de ocasiones, son varias las variables que se observan en la realización de un muestreo, existiendo entre ellas dependencias estadísticas. En tales situaciones puede plantearse el problema de hasta qué punto el conocimiento de unas variables, llamadas explicativas, aportan información suficiente para predecir los valores de otras denominadas de respuesta. Dependiendo de los contextos, de las hipótesis que se consideren válidas, de la naturaleza de las variables y del número de éstas, se utilizarían los diferentes métodos de regresión. Regresión Simple (Recta de Regresión) Los datos y el modelo El problema de la regresión lineal simple entre dos variables X y Y se reduce a calcular la recta de regresión que mejor represente su distribución conjunta. Los datos se presentan como una matriz de dos columnas: 159 Siendo (xi, yi), con i= 1, 2, ..., n, el i-ésimo par observado. Se pretende ajustar un modelo de la forma yi=a xi+b+ei Bajo las siguientes hipótesis: 1. La variable respuesta yi depende de la variable explicativa xi de forma lineal (con pendiente a y ordenada en origen b), más un factor residual aleatorio ei. 2. Los residuos tienen distribución normal de media 0 y varianza desconocida. 3. Estos factores aleatorios son independientes entre sí. Nota: en el Anexo se pueden encontrar más ejercicios, además de las tablas de: Z, Ji2, 160 TEMA 2 Objetivo de aprendizaje. 2. Expresar las ecuaciones para estimar los parámetros de regresión lineal, definiendo el coeficiente de correlación R2 y relacionarlo con la precisión de la recta estimada. Criterio de Aprendizaje. 2.1. Practicar e ilustrar las ecuaciones de mínimos cuadrados en la estimación de la recta e interpretar los parámetros de la regresión y el coeficiente de correlación R2. Didáctica de enseñanza. Pa.9 Regresión Lineal Estimación de parámetros Los parámetros de la recta de regresión, a y b, se calculan siguiendo el criterio de los mínimos cuadrados, lo que lleva a los siguientes resultados: Siendo Y Las medias de ambas variables estadísticas. La varianza residual es desconocida, siendo su estimador insesgado El coeficiente de correlación Definiendo el coeficiente de correlación como , Que sólo toma valores en el intervalo [-1, 1], nos da una idea de hasta qué punto el ajuste lineal es razonable: 161  Si r es próximo a -1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi) alrededor de una recta de pendiente negativa.  Si r es próximo a 0: el ajuste no es aceptable, indicando que no existe relación lineal entre las variables.  Si r es próximo a +1: el ajuste es aceptablemente bueno, distribuyéndose las observaciones (xi, yi) alrededor de una recta de pendiente positiva. Contraste de independencia El contraste de independencia entre las variables es más objetivo que la simple observación del coeficiente de correlación r. Así se plantea comprobar si los datos observados corroboran o no la hipótesis nula: H0: "la variable explicativa X no influye en la respuesta Y". Frente a la alternativa: H1: "la variable explicativa X influye linealmente en la respuesta Y". Mediante el estadístico de contraste Que se distribuye como una tn-2 de Student, se puede contrastar la hipótesis nula H0 al nivel de significación del 5%. Caso Se dispone de los datos de ocho anestesias de diferente duración, efectuadas con un anestésico volátil y del tiempo en que se restablece la conciencia suficiente como para contar hacia atrás desde un número determinado sin error: Duración Duración despertar anestesia (min) (min) 150 13 127 16 160 21 210 20 250 16 130 13 60 12 55 14 Se intenta probar la hipótesis de que la duración del despertar no está influida por la de la anestesia. El coeficiente de correlación para esta muestra es de 0.562231, a medio camino entre el 0 y el 1, no permitiendo dar una respuesta segura sobre el contraste; en cambio, el estadístico A toma un valor de 162 1.66531, del que se puede deducir que la hipótesis no puede rechazarse al nivel del 5%; en conclusión, no hay indicios de que la duración del despertar esté linealmente relacionada con el tiempo de duración de la anestesia. Si se hubiese rechazado la hipótesis de independencia, se podrían ajustar los datos a la recta de ecuación y = 0.03 x + 11.62, siendo x la duración de la anestesia e y la del despertar. Regresión Lineal Múltiple Los datos y el modelo Se trata de predecir el valor de una variable respuesta (y) como función lineal de una familia de m variables explicativas (x1, x2, ..., xm), a partir de una muestra de tamaño n cuyas observaciones se ordenan matricialmente: Siendo yi la i-ésima variable respuesta y xi,j la j-ésima variable explicativa asociada a la observación i. Así las cosas, se trata de ajustar los datos a un modelo de la forma Bajo las siguientes hipótesis: 1. Los residuos ei son normales de media 0 y varianza común desconocida ; además, estos residuos son independientes. 2. El número de variables explicativas (m) es menor que el de observaciones (n); esta hipótesis se conoce con el nombre de rango completo. 3. No existen relaciones lineales exactas entre las variables explicativas. Estimación de los parámetros de regresión El estimador del vector paramétrico es Siendo 163 Habiéndose indicado la transposición matricial mediante el superíndice T. Estimación de la varianza El estimador insesgado de la varianza expresión , conocido con el nombre de varianza residual, tiene por Coeficiente de determinación corregido El coeficiente de determinación corregido, definido como Siendo Mide el ajuste del modelo, se interpreta como el porcentaje de variación de la variable respuesta explicada por el modelo; así, cuanto más se acerque R2 a 100, con más confianza se podrá considerar el modelo lineal como válido. Contraste de regresión El contraste de regresión es imperativo a la hora de diagnosticar y validar el modelo que se está ajustando; consiste en decidir si realmente la variable respuesta y es función lineal de las explicativas x1, x2, ..., xm. Formalmente, el contraste se plantea en los siguientes términos: H0: "no existe dependencia lineal: Frente a la alternativa: H1: "sí existe alguna dependencia lineal: El estadístico de contraste es " ". Que se distribuye como una Fm,n-m-1 de Snedecor. El contraste se realiza con un nivel de significación del 5%. 164 Caso En una muestra de 25 hospitales, el analista ha recogido los siguientes datos sobre el costo anual en 1988 (variable respuesta), así como sobre el personal sanitario y el número de camas durante el mismo año. Coste hospitalario 1000 750 500 350 400 750 850 450 450 350 800 950 900 500 1000 365 400 525 400 400 350 500 600 550 750 800 Personal sanitario 100 50 25 15 20 30 70 30 35 25 39 70 60 25 65 20 45 50 46 46 20 36 50 50 65 70 Número de camas 300 150 100 70 80 100 200 90 100 75 125 260 215 95 300 75 94 108 93 93 76 129 183 145 250 275 Se quiere ajustar un modelo lineal que devuelva el coste de mantenimiento hospitalario en función del personal sanitario y del número de camas. En primer lugar observamos que el número de variables explicativas es 2, por lo que se necesitan estimar tres parámetros de regresión: 222.28 para el término independiente, 1.28 para la variable personal sanitario y 2.24 para el número de camas. La desviación típica residual y el coeficiente de determinación corregido toman los valores 107.80 y 76.49%, respectivamente. Finalmente, el contraste 165 de regresión rechaza la hipótesis de independencia al nivel del 5%, dando a entender que no hay indicios de que el modelo lineal y = 222.28 + 1.28 x1 + 2.24 x2 Deba ser rechazado. Sin embargo, un análisis más detallado muestra que la inclusión de la variable personal sanitario no aporta información relevante, de modo que al eliminarla se obtiene el modelo y = 232.34 + 2.55 x2, Con una desviación típica residual de 106.08 y un coeficiente de determinación de 77.23%, parámetros de diagnóstico ligeramente mejores que los anteriores. Para comprobar estos resultados, eliminar en el panel superior de entrada los datos centrales (100, 50, 25, 15, etc.) y volver a pulsar la barra central. Método de mínimos cuadrados La formula de regresión de la muestra que represéntale modelo de regresión en línea recta sería: Ŷі =bo + b1Xі Donde Ŷі es el valor del predicho de Y para la observación і y Xі Estimación por mínimos cuadrados generalizados. En un modelo de regresión lineal se supone que la matriz de varianzas-covarianzas de los errores es de la forma Siendo In la matriz identidad de orden n. Si no se verifica la hipótesis de homocedasticidad, o la de independencia, o ambas, entonces la matriz de varianzas-covarianzas tiene la forma general Siendo una matriz simétrica, definida positiva de orden n × n. En este caso, se puede calcular el estimador de por el método de mínimos cuadrados generalizados. Este método se desarrolla en dos etapas: en una primera etapa se transforma el modelo de regresión original Para ello y por ser una matriz simétrica, definida positiva, existe una matriz cuadrada P tal que Esta matriz no tiene porque ser única, pero si existe. Multiplicando por P la ecuación de regresión se obtiene (10.3) Denominando * = P , X* = PX y * = P , se obtiene la ecuación de regresión 166 Y los errores del modelo verifican Por tanto los errores son incorrelados y homocedásticos. Ahora se puede aplicar el método de mínimos cuadrados ordinarios a estos datos transformados Por el Teorema de Gauss-Markov, este estimador para obtener el estimador G es el mejor estimador lineal insesgado. En la práctica, la matriz P, aunque existe, es desconocida y es necesario estimarla observaciones, obteniendo el estimador a partir de las A continuación se exponen dos situaciones comunes en las que se puede aplicar este método de estimación. Heterocedasticidad. Si las observaciones son independientes pero heterocedásticas entonces la matriz de varianzascovarianzas viene dada por Y la matriz P En este caso los datos transformados son 167 Esto equivale a trabajar con el modelo transformado Sobre este modelo se aplica ahora el método de mínimos cuadrados ordinarios. En particular, si se trabaja con el modelo de regresión lineal se obtiene el siguiente estimador del coeficiente de regresión Este estimador se denomina estimador por mínimos cuadrados ponderados y es un caso particular del estimador por mínimos cuadrados generalizados. En la práctica, para utilizar este estimador hay que calcular estimadores de los parámetros 12,..., n2 , lo que puede hacerse por uno de los siguientes métodos: * Suponer que la varianza se ajusta a una función Y estimar la función g. * Hacer grupos en las observaciones (en el orden en que se han recogido) normalmente del mismo tamaño k y suponer que en cada grupo la varianza es constante. Entonces se estima la varianza en cada grupo a partir de las observaciones del grupo. Una forma de conseguir esto es ajustar el modelo de regresión por mínimos cuadrados ordinarios a las observaciones originales y a partir de los residuos de este modelo obtener los estimadores de la varianza en cada grupo. Observaciones dependientes. 168 Si las observaciones son homocedásticas pero dependientes entonces la matriz de varianzascovarianzas es de la forma general En la mayoría de las situaciones la estructura de dependencia de los errores puede ajustarse a un modelo paramétrico. Un modelo sencillo y muy utilizado es el modelo AR , (modelo autorregresivo de orden uno). En este caso se verifica que los errores siguen la ecuación siendo la autocorrelación de orden 1 del proceso t, por tanto, aleatorias independientes e igualmente distribuídas. < 1, y at es una sucesión de variables En este caso, la matriz de varianzas-covarianzas es La matriz P de transformación es Y la matriz -1 es 169 Utilizando esta matriz se obtiene el estimador por mínimos cuadrados generalizados Nuevamente, en la práctica, -1 es desconocido y se tiene que estimar. Por la forma de la matriz -1, es suficiente con estimar el parámetro y sustituir en la matriz. Para estimar , puede utilizarse el siguiente procedimiento: ajustar a los datos el modelo de regresión lineal por mínimos cuadrados ordinarios y calcular los residuos mínimo cuadráticos A partir de estos residuos se obtiene el siguiente estimador de , sustituyendo por en la matriz estimador -1 se obtiene la matriz estimada -1 , a partir de la cual se obtiene el Siguiendo este procedimiento se puede obtener el siguiente estimador iterativo: Paso 1. Se utiliza el estimador F para obtener nuevos residuos ei'. Paso 2. De estos residuos se obtiene un nuevo estimador '. Paso 3. Utilizando ' se calcula un nuevo estimador F'. Se continúa el proceso de forma iterativa (volver al Paso 1) hasta obtener la convergencia del estimador F (estimador iterativo de Cochran y Orcutt (1949)). En este problema también se pueden considerar otros estimadores del parámetro dependencia más complejos que dependen de un número mayor de parámetros. o modelos de Ejemplo “Se desea ajustar un modelo de regresión lineal simple de diseño fijo a cien observaciones, donde los valores de la variable explicativa son xi = i/n, i = 1,...,100 (diseño fijo equiespaciado) y los valores de la variable respuesta vienen dados en la tabla adjunta (leídos por columnas). Analizar la hipótesis de independencia de los residuos”. 2'4 1'4 2'3 2'1 2'9 4'5 3'5 3'6 2'3 2'5 1 3 4 1 1 2 5 3 2 9 3'1 1'4 2'5 2'1 2'6 4'1 3'0 3'6 2'4 3'1 0 9 6 3 4 4 4 4 6 5 2'6 1'8 2'5 1'8 2'5 4'1 3'3 3'4 2'3 3'2 170 1 5 5 5 3 7 4 0 1 9 1'8 1'6 2'9 2'2 2'7 3'6 3'2 3'1 2'4 3'2 7 9 5 5 5 6 1 7 1 3 1'4 7 1'0 1 2'2 8 2'4 2 2'7 2 2'8 4 2'1 5 2'8 0 2'2 9 2'8 1 2'7 0 2'5 6 3'3 1 2'7 6 3'1 6 3'4 7 2'6 9 3'2 4 2'7 0 2'0 8 1'4 1'9 2'0 3'1 3'1 2'3 3'3 3'5 2'8 2'5 8 1 8 4 9 0 9 2 0 7 1'4 2'7 2'1 3'0 3'4 3'1 3'8 3'5 3'2 3'1 7 3 0 3 3 0 4 3 9 7 1'8 1'9 2'0 3'0 3'2 3'8 4'0 3'2 3'1 2'8 5 3 3 5 2 9 7 2 4 0 1'9 1'9 1'7 3'3 4'2 3'6 3'4 2'5 2'7 2'3 1 3 0 1 4 0 5 2 8 8 Ajustando la recta de regresión por mínimos cuadrados se obtiene Las observaciones muestrales y la recta ajustada se representan en la Figura. Figura. Datos y recta ajustada por MCO. 171 Los residuos de este modelo presentan una clara dependencia positiva. Esto se observa en el gráfico de residuos frente al índice Figura Residuos MCO según índice. En la Figura 10.3. Se representa el correlograma (f.a.s.) de los residuos del modelo y se observa que las primeras autocorrelaciones de los residuos son muy altas. En particular, r1 = 0'758, con desviación típica = 0'099. Utilizando el contraste de independencia de Ljung-Box (Sección 4.7.2.) se obtiene para m = 5 (número de retardos) que 172 Figura. F.a.s. de los residuos MCO. En la Figura se representa el gráfico de autocorrelaciones parciales (f.a.p.) de los residuos y se observa que la fap de orden uno es muy grande. De todo se concluye que no se acepta la hipótesis de independencia. Figura. F.a.p. de los residuos MCO. De los gráficos representados en las Figuras 10.3 y 10.4 se deduce que la sucesión de errores del modelo de regresión sigue una estructura de dependencia del tipo AR (1) con = 0'758. En base a ello se estima la recta de regresión por mínimos cuadrados generalizados utilizando la matriz de transformación dada anteriormente. Se obtiene el siguiente modelo de regresión Las dos rectas de regresión obtenidas por mínimos cuadrados y por mínimos cuadrados generalizados se representan en la Figura siguiente. En este ejemplo la diferencia entre las dos rectas estimadas es pequeña. 173 Figura. Las dos rectas ajustadas. 174 Práctica 9 Regresión lineal Instrucciones: resuelve correctamente los ejercicios que se enlistan. Nota: Debido al perfil de la materia lo que se recomienda es la resolución de ejercicios. 1. Sea la matriz de covarianzas entre X y Y: > var(datos) X Y X 1.866667 1.100 Y 1.100000 1.175 Halla la correlación lineal entre ambas (rXY). 2. Sea la variable dependiente Z predicha a través de la expresión lineal aY+b, donde Y es una variable regresora. Deduce la expresión de los estimadores de a y b por mínimos cuadrados. 3. Sean las variables X = "número de hijos" y Y = "gastos navideños". La siguiente tabla recoge las frecuencias observadas en cierta encuesta: Y \X 0 1 2 5 3 3 2 10 8 9 3 15 5 9 7 20 0 1 2 Da las medias y desviaciones típicas de cada variable, así como el coeficiente de correlación lineal entre las dos. 4. Considera una regresión Y=a+bX. Se pretende predecir el comportamiento de Y para X=X0. Explica las diferencias entre un intervalo de confianza para el valor esperado de Y y un intervalo de predicción para Y. 5. Se quiere predecir la variable Z a partir de alguna (y sólo una) de las variables X, Y y V. ¿Cómo decidirías cuál de las tres escoger? 6. ¿Cómo se expresa la calidad de un análisis de regresión? 7. En un proceso agroindustrial, se han considerado el factor A = "intensidad media" y B = "cantidad de proyección". Se han observado treinta valores (ai,bi) (i=1..30). Representados gráficamente, parece que adoptan una forma hiperbólica. Por ello, se pretende ajustar la curva AB=x+yA, siendo x y y parámetros de la curva. ¿Cómo llevarías a cabo el análisis? 8. La siguiente tabla presenta una muestra experimental relacionada con un estudio sobre la influencia del tiempo trascurrido desde el despertar (T) en el rendimiento en una prueba sicotécnica (R): 9. T 2'5 2'8 3'1 3'3 3'9 4'0 4'5 R 9'6 9'9 9'8 9'9 9'2 9'1 7'8 175 Los puntos adoptan una disposición claramente parabólica. Describe un modelo matemático y un método de análisis adecuados. 10. Un fabricante de motos pretende determinar qué factores influyen en la velocidad máxima que pueden alcanzar sus modelos. Efectúa mediciones de la velocidad máxima que alcanzan ochenta motos, para las cuales registra los valores de cuarenta variables continuas que piensa pueden tener relación con aquélla: potencia, cilindrada, dimensiones, aerodinámica, etc. Propón un método para llevar a cabo el estudio, detallando los pasos principales. 11. Da una interpretación del coeficiente de determinación. 12. En un estudio llevado a cabo en ocho ciudades de México, se obtuvo el número de autos y celulares por cada mil habitantes: Provincia Xicotepec Zacatlán Huahuchinango Teziutlán Acatlán Tehuacán Amozoc Zaragoza Autos 58 84 78 81 82 102 85 102 Móviles 64 78 83 88 89 99 101 102 Discute qué proporción de la variación de la tasa de celulares por mil habitantes puede explicarse a partir de la tasa de autos. Dato: la recta de mínimos cuadrados de "móviles" sobre "autos" es 19'83+0'81×autos, con r=0'87. 13. Relaciona el coeficiente de determinación con el contraste de regresión 176 V REFERENCIAS  Rendón, S. Gilberto. 1997. “Muestreo, aplicación en la estimación simultánea de varios parámetros”. Universidad Autónoma Chapingo, México.  Rendón, S. Gilberto. 1998. “Métodos estadísticos, muestreo, diseños experimentales, estadística no paramétrica”. Universidad Autónoma Chapingo, México.  Tamayo, T. Mario. 1998. “El proceso de la investigación científica”  Levin, I. Richard; Rubin S. David. 1996. “Estadística para Administradores”, Ed. Prentice Hall, Sexta Edición  Menderihall, William; Wackerly, Demis; . “Estadística Matemáticas”  León T., Aurelio et al. “Antología de Matemáticas IV”, Colegio de Bachilleres del Estado de Puebla. Sitios de internet visitados:  www.//ftp.metprev.uma.es  http://ftp.medprev.uma.es/libro/html.htm  http://www.hrc.es/bioest/Anova_1.html  http://www.itson.mx/un/posgrado/Estadistica/Descriptiva%20,%20teoria,%20ejercicios.doc  http://highered.mcgrawhill.com/sites/9701033612/information_center_view0/tabla_de_contenido.html  http://www.seh-lelha.org/ancova.htm  http://www.sportsci.org/resource/stats/ancova.html  http://trochim.human.cornell.edu/kb/expcov.htm  http://www.angelfire.com/emo/tomaustin/Met/guiaseismuestra.htm  http://www.uv.es/~meliajl/Research/LibroBMDP/BMBPinde.html  http://www3.uji.es/~mateu/ejer-tema5-d37.doc  http://www.hrc.es/bioest/Ejemplos_histo.html  http://www.gesell.com.ar/geselinos/egb/problema.htm VI GLOSARIO 177 VII ANEXOS Ejercicios y ejemplos Concepto de variable aleatoria. Se llama variable aleatoria a toda aplicación que asocia a cada elemento del espacio muestral de un experimento, un número real. Ejemplo: Sea el experimento que consiste en lanzar tres monedas al aire. El espacio muestral será: E  ccc, ccx, cxc, xcc, cxx, xcx, xxc, xxx Si a cada elemento de E le hacemos corresponder, por ejemplo, el número de caras, hemos definido una variable aleatoria. ccc  3; xcc 2; xxc 1; ccx  2 cxx  1; xxx  0; cxc  2; xcx  1 Se utilizan letras mayúsculas para designar las v.a. y sus respectivas letras minúsculas para los valores concretos de las mismas. Variable aleatoria discreta. Es la que solo puede tomar determinados valores. La variable aleatoria número de caras en el lanzamiento de tres monedas sólo puede tomar los valores 0, 1, 2 y 3. (Es discreta). La variable aleatoria suma de las caras superiores en el lanzamiento de dos dados puede tomar solamente los valores 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 y 12. (Es también discreta) Función de probabilidad de una v.a. discreta. Es la aplicación que asocia a cada valor x de la v.a. X su probabilidad p. Los valores que toma una v.a. discreta X y sus correspondientes probabilidades suelen disponerse en una tabla con dos filas o dos columnas llamada tabla de distribución de probabilidad: X P( X  x i ) En toda función de probabilidad se verifica que x1 x2 x3 xn p1 p2 p3 pn p1  p2  p3   pn  1 Ejemplo: La v.a. “número de caras en el lanzamiento de tres monedas” tiene la siguiente función de probabilidad: Nº de caras f(x)= P( X 0  xi ) 1 1 3 8 8 2 3 3 8 1 8 Función de distribución de una v.a. discreta. Sea X una v.a. cuyos valores suponemos ordenados de menor a mayor. Se llama función de distribución de la variable X a la función que asocia a cada valor de la v.a. la probabilidad acumulada hasta ese valor, es decir, F ( x)  p( X  x) Media, varianza y desviación típica de una variable aleatoria discreta. Se llama de una v.a. discreta X, que toma los valores x1 , x 2 , x3 ........x n con probabilidades valor de la siguiente expresión:    xi . p i p1 , p2 , p3 ............ pn al La varianza viene dada por la siguiente fórmula:  2   xi2 . pi   2 , bien  2   ( xi  ) 2 . pi 178 La desviación típica es la raiz cuadrada de la varianza. Ejercicio. La distribución de probabilidad de una v.a. X viene dada por la siguiente tabla: xi pi 1 2 0,1 0,3 3 4 0,2 5 0,3 ¿Cuánto vale p(X=3) Calcula la media y la varianza. Solución: La suma de todas las probabilidades es 1, por tanto, 0,1  0,3  p( X  3)  0,2  0,3  1 luego p(X=3)=0,1 Formamos la siguiente tabla: xi pi xi . p i xi2 . p i 1 2 3 4 5 0,1 0,3 0,1 0,2 0,3 0,1 0,6 0,3 0,8 1,5 0,1 1,2 0,9 3,2 7,5  2   xi2 . pi   2  12,9  (3,3) 2  2,01 Experimento de Bernoulli Es un experimento que tiene las siguientes características: 1. En cada prueba del experimento sólo son posibles dos resultados: el suceso ha llamado A llamado éxito y el suceso A llamado fracaso. 2. El resultado obtenido en cada prueba es independiente de los resultados anteriores. 3. La probabilidad del suceso A es constante y no varía de unas pruebas a otras. La distribución de probabilidad de este experimento recibe el nombre de distribución binomial de parámetros n y p n es el número de pruebas del experimento y p es la probabilidad del éxito. Si representamos por X la variable aleatoria binomial que representa el número de éxitos obtenidos en las n del experimento, podemos escribir:  n r  p .(1  p) n r r   p(obtener r éxitos )=p(X=r)=  Esta expresión recibe el nombre de función de probabilidad de una distribución binomial o de Bernoulli. Dado que en este tipo de experiencias los cálculos pueden ser laboriosos, se han construido unas tablas que nos proporcionan la probabilidad de que la variable X tome distintos valores, según los distintos valores de n y r. Media y varianza de una distribución binomial. Media:   n. p Varianza:  2  n. p.q; q  1  p 179 Desviación típica:   n. p.q Ejercicios resueltos. 1.- Calcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean varones. Solución: Se trata de un experimento de Bernoulli donde n=4 y p=1/2  4 3 1 1 .0.5 .0,5  3 4   p(obtener 3 varones)=P(X=3)=  Recuerda:  4   es un número combinatorio cuyo valor se obtiene así: 3 En general  4  4.3.2     3  3.2.1  m  m.(m  1).(m  2)......hasta tener n factoresen el numerador m!     n.(n - 1).(n - 2).....3.2.1 n!.(m  n)! n  2.- Se tiene una moneda trucada de modo que la probabilidad de sacar cara es cuatro veces la de sacar cruz. Se lanza 6 veces la moneda. Calcula las siguientes probabilidades:  Obtener dos veces cruz.  Obtener a lo sumo dos veces cruz. Solución: Calculamos en primer lugar la probabilidad de cara y de cruz: p(cara)+p(cruz)=1. Si llamamos x a la probabilidad de sacar cruz, podemos escribir: 4x+x=1; 5x=1; x=0,2 Así resulta: p(cruz)=0,2 y p(cara)=0,8 Es una distribución binomial de parámetros n=6 y p=0,2 Probabilidad de obtener dos veces cruz: 6 p( X  2)   .(0,2) 2 .(0,8) 4  15.(0,04).(0,4096)  0,24  2 Probabilidad de obtener a lo sumo dos veces cruz: p( X  2)  p( X  0)  p( X  1)  p( X  2)   6  6 6 .(0,2) 0 .(0,8) 6   .(0,2)1 .(0,8) 5   .(0.2) 2 .(0.8) 4  0,90  0 1   2 =  3.- La probabilidad de que un alumno de 1º de Bachillerato repita curso es de 0,3. Elegimos 20 alumnos al azar. ¿Cuál es la probabilidad de que haya exactamente 4 alumnos repetidores? Solución: Se trata de una binomial de parámetros 20 y 0,3, es decir, B(20; 0,3) Si X es el número de alumnos que repiten, 180  20 20! p( X  4)   .0,3 4.0,716  .0,3 4.0,716  0,13 4!.16! 4  4.- Calcula la esperanza matemática, la varianza y la desviación típica de la variable aleatoria X, cuya función de probabilidad viene dada por la siguiente tabla: xi -4 0,1 p( X  x i ) -1 0,5 2 0,3 5 0,1 Solución: La esperanza matemática es la media:   (4).0,1  (1).0,5  2.0,3  5.0,1  0,2    x . pi    (4) .0,1  (1) 2 .0,5  2 2.0,3  52.0,1  0,2 2  5,76 2 2 i 2 2   5,76  2,4 5.- Sea la siguiente función de probabilidad: xi pi 1 3 5 7 9 0,2 0,2 0,4 0,1 0,1 Escribe la función de distribución y calcula: p( X  5) y p(3  X  7) Solución: xi F(x)=P(X ≤ xi) p( X  5)  0,8 ; 1 3 5 7 9 0,2 0,4 0,8 0,9 1 p( X  7)  p( X  3)  p( X  5)  p( X  7)   0,2  0,4  0,1  0,7 181 Ejercicios propuestos. 1.- La probabilidad de que un reloj salga de fábrica defectuoso es del 4 %. Halla: a) El número de relojes defectuosos esperados en un lote de 1000 b) La varianza y la desviación típica. ( Solución: 40 y 6,19) 2.- Una determinada raza de perros tiene 4 cachorros en cada camada. Si la probabilidad de que un cachorro sea macho es de 0,55, se pide: a) La probabilidad de que en una camada dos exactamente sean hembras b) Probabilidad de que en una camada al menos dos sean hembras. (Solución: 0,3675; 0,609 ) 3.- Considera una variable aleatoria discreta X cuya distribución de probabilidad es la siguiente: xi 1 2 3 P(X = xi) k 0,45 k a) Calcula el valor de k b) Halla la función de probabilidad c) Halla la función de distribución F. Solución k = 0,275. Función de probabilidad: xi f(x)=P(X = xi) 1 0,275 2 0,45 3 0,275 1 0,275 2 0,725 3 1 Función de distribución: xi F(x)=P(X ≤ xi) 4.- Considera una variable aleatoria X cuya función de probabilidad viene dada por la siguiente tabla: x -25 -10 0 5 f(x) a 2a 3a 4a a) Deduce el valor de a. b) Halla la función de distribución F c) Calcula la esperanza, la varianza y la desviación típica. Solución: a) 0,1; c) –2,5; 86,25; 9,29 5.- La probabilidad de que un estudiante obtenga el título de arquitecto es 0,3. Calcula la probabilidad de que un grupo de 7 estudiantes matriculados en primer curso: a) Ninguno de los 7 finalice la carrera. b) Finalicen los 7. c) Al menos 2 acaben la carrera. d) Sólo finalice uno la carrera. Solución: 0,082; 0,00021; 0,671; 0,2471 6.- El 20 % de los tornillos de un gran lote so defectuosos. Se cogen tres tornillos al azar y se pide calcular razonadamente: a) La probabilidad de que los tres sean defectuosos. b) La probabilidad de que ninguno sea defectuoso. 182 c) La probabilidad de que solamente uno sea defectuoso. (Propuesto en Selectividad, Alicante, septiembre de 2001) Variable aleatoria continua. Distribución normal. Conocimientos previos CONCEPTO DE INTEGRAL DEFINIDA. Para hallar el área del recinto limitado por la curva f(x), el eje de abscisas y las rectas x=a y x=b, se utiliza la siguiente fórmula: b Area   f ( x)dx a que recibe el nombre de integral definida de f entre los límites a y b y se lee “integral entre a y b de f(x)”. La integración es la operación inversa de la derivación. Por ejemplo, si f ( x)  x n , la fórmula anterior se resuelve de la siguiente forma: b  b a  x n 1  x dx     n  1 a n Primero se sustituye la x por b y al resultado obtenido le llamaremos F(b). Después se sustituye la x por a y al resultado obtenido le llamaremos F(a) Finalmente restamos los resultados, es decir,  b a x n dx  F (b)  F (a) Ejercicio: 3 Resuelve la siguiente integral definida:  (x 1 2  2 x  3)dx Solución: 3  3 1  x3  ( x  2 x  3)dx    x 2  3x   F (3)  F (1) 3 1 2 F (3)  9  9  9  9 F (1)  1 5 1 3   3 3 183 luego  3 1 5 5 32 ( x 2  2 x  3)dx  9  ( )  9   3 3 3 Cuando se calculan áreas los resultados se toman en valor absoluto. Variable aleatoria continua. Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real. Por ejemplo, la duración de las bombillas de una determinada marca y modelo. En el caso de variables aleatorias continuas no tiene sentido plantearse probabilidades de resultados aislados, por ejemplo, probabilidad de que una bombilla dure 100 horas, 22 minutos y 16 segundos. La probabilidad sería 0. El interés de estas probabilidades está en conocer la probabilidad correspondiente a un intervalo. Dicha probabilidad se conoce mediante una curva llamada función de densidad y suponiendo que bajo dicha curva hay un área de una unidad. Conociendo esta curva, basta calcular el área correspondiente para conocer la probabilidad de un intervalo cualquiera. La función de densidad de una v.a. continua cumple las siguientes condiciones:  Sólo puede tomar valores comprendidos entre 0 y 1: 0  f ( x)  1  El área encerrada bajo la curva es igual a la unidad:    f ( x).dx  1 . Ejercicio: Sea f ( x)  x con x  0,6. Comprueba que es una función de densidad y calcula p(2  x  5) 18 Solución: Para que sea función de densidad x dx tiene que valer 1. Veamos: 0 18  6 6 x 1  x2  1  36  dx  0 18 18  2   18  2  0   1 0 6 5 x 1  x2  1  25 p(2  x  5)   dx       2 18 18  2  2 18  2 5 4  21 7   2  36 12 Función de distribución. Como en el caso de la v.a. discreta, la función de distribución proporciona la probabilidad acumulada hasta un determinado valor de la variable, es decir, F ( x)  p( X  x) . Cumple las siguientes condiciones:  Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable.  Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable. Media y varianza de una v.a. continua. Existe cierta correspondencia entre la variable aleatoria discreta y la continua: Variable aleatoria discreta    xi . p i    x pi   2 2 i Variable aleatoria continua b    x. f ( x).dx a 2 b  2   x 2 f ( x)dx   2 a 184 Lo que es  pasa a ser  pi pasa a ser f (x) y lo que es Ejercicio 1. La función de densidad de una v.a. continua viene definida por : 2 x si 0  x  1 f ( x)   0 en el resto a) Halla la función de distribución. b) Calcula la media y la varianza. Solución: a) La función de distribución se obtiene integrando la función de densidad, es decir, A la izquierda de 0, su valor 0. A la derecha de 1, su valor es 1 x Entre 0 y 1: F ( x)  p( X  x)   2 xdx  x 2 0  x 0  x2 0 si x  0  2 es decir, F ( x)  x si 0  x  1 1 para x  1  b) Cálculo de la media: b 1 a 0    x. f ( x).dx   x.2 x.dx  Cálculo de la varianza: b 1 a 0 2 3  2   x 2 f ( x)dx   2   x 2 .2 x.dx  4 1  9 18 Ejercicio 2. Calcula la media, la varianza y la desviación típica de una v.a. que tiene como función de densidad: f ( x)  x3 con x  1,5 24 Solución: 5 b Media:    x. f ( x).dx   Varianza: a b x3 1 5 2 1  x 3 3x 2  29 x. dx  ( x  3 x ) dx       24 24 1 24  3 2 1 9    x f ( x)dx     2 2 2 a 5 5 1 x3 1 5  29   29  x dx      ( x 3  3x 2 )dx     24 24 1  9  9 2 2 2 1  x4 104  29  3   1,28 .   x     24  4 81 1  9  Desviación típica: 2   1,28  1,13 Ejercicio 3. 185 Sea f ( x)  x2 1 con x  2,5 , una función de densidad. 36 a) Calcula su función de distribución. b) Calcula p(3  x  4) . Solución: a) F ( x)  p ( X  x)   x 2   x2 1 1 x 1 3 x 3  3x  2  dx   ( x 2  1)dx  ( x  x)  3 36 36 2 36 108 2 x Su valor es cero para todos los puntos situados a la izquierda de 2 Su valor es 1 para todos los puntos situados a la derecha de 5 4 b) p(3  x  4)   4 3  x2 1 1 4 2 1  x3 1 x 3  3x  17   dx  ( x  1 ) dx   x        3 36 36 36  3  3 36 3  3 54 4 Distribución normal. Hay muchas v.a. continuas cuya función de densidad tiene forma de campana. Ejemplos: - La variable peso en una población de personas de la misma edad y sexo. - La variable altura de la población citada. - etc. Se dice que estas variables tienen una distribución normal y la función de densidad recibe el nombre de curva normal o campana de Gauss. Para expresar que una v.a. continua X, tiene una distribución normal de media  y desviación típica  , escribimos N ( ,  ) . Representación gráfica de la función de densidad de una distribución normal. Distribución normal estándar. De las infinitas distribuciones N (  ,  ) , tiene especial interés la de media 0 y desviación típica 1, es decir, N (0,1) . Esta distribución recibe el nombre de estandar o reducida Existen unas tablas que permiten calcular probabilidades en distribuciones normales reducidas. Por ello es aconsejable transformar cualquier v.a. X que sigue que sigue una distribución N (  ,  ) en otra variable Z que siga una distribución N(0,1). El cambio de variable que es necesario hacer es el siguiente: Z X   Cálculo de probabilidades en distribuciones normales reducidas. Sea Z una variable que sigue una distribución normal N(0,1). Vamos algunos ejemplos que nos permiten calcular determinadas probabilidades en las tablas: a) p( Z  1,23) La probabilidad pedida se encuentra directamente en las tablas. Basta buscar 1,2 en la columna y 0,03 en la fila. Su intersección nos da la probabilidad. 186 b) p( Z  1,24) En este caso la probabilidad pedida no está en las tablas. Sin embargo, si tenemos en cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la figura que: p(Z  1,24)  1  p(Z  1,24)  1  0,8925 0,1075. c) p(Z  0,72) Como la gráfica es simétrica respecto al eje de ordenadas, p( Z  0,72)  p( Z  0,72) y ya estamos en el caso anterior. Comprueba que el resultado final es 0,2358. d) p(0,5  Z  1,76) Observando la figura se deduce que p(0,5  Z  1,76)  p(Z  1,76)  p(Z  0,5)  0,9608 0,6915 0,2693 Ejercicio 4 El peso de los individuos de una población se distribuye normalmente con media de 70 Kg. y desviación típica 6 Kg. De una población de 2000 personas, calcula cuántas tendrán un peso comprendido entre 64 y 76 Kg. Solución: Se trata de una distribución N(70,6) 187 76  70   64  70 p(64  X  76)  p Z    p(1  Z  1)  p( Z  1)  p( Z  1) 6   6 p( Z  1)  0,8413 (directamente en las tablas) p(Z  1)  p(Z  1)  1  p(Z  1)  1  0,8413. Por tanto, p(64  X  76)  0,8413 (1  0,8413)  0,8413 1  0,8413 0,6825 Esto significa que el 68,25 % de las personas pesan entre 64 y 76 Kg.. Como hay 2000 personas, calculamos el 68,25% de 2000 y obtenemos 1365 personas. Ejercicio 5. La duración media de un lavavajillas es de 15 años y su desviación típica 0,5. Sabiendo que su vida útil se distribuye normalmente, halla la probabilidad de que al adquirir un lavavajillas dure más de 15 años. Solución: Es una distribución normal de media 15 y desviación típica 0,5, es decir, N(15; 0,5). p( X  15)  p( Z  15  15 )  p( Z  0)  p( Z  0)  0,5 0,5 Ejercicio 6. La nota media de las pruebas de acceso correspondientes a los estudiantes que querían ingresar en una facultad era 5,8 y la desviación típica 1,75. Fueron admitidos los de nota superior a 6. a) ¿Cuál fue el porcentaje de admitidos si la distribución es normal? b) ¿Con qué probabilidad exactamente cuatro de diez estudiantes son admitidos? Solución: Apartado a): p( X  6)  p( Z  6  5,8 )  p( Z  0,11)  1  p( Z  0,11)  1  5438 0,4562 45,62% 1,75 Apartado b): Es una distribución binomial de parámetros n=10 y p=0,4562 p(obtener r éxitos )=p(X = r)=  n r 10  p .(1  p) n r = p(X  4)   (0,4562) 4 (1  0,4562) 6  r   4 10.9.8.7  (0,4562 ) 4 (0,5438 ) 6  0,235 4.3.2.1 =  Aproximación de la distribución binomial mediante la normal. (Corrección de Yates) Cuando n es grande y p está próximo a 0,5 el comportamiento de una distribución binomial B(n, p) es aproximadamente igual a una distribución normal, N (np, npq) Esto permite sustituir el estudio de una B(n, p) por el de una N (np, npq) . Suele considerarse que la aproximación es buena cuando np>5 y nq>5 Dado que por mucho que se parezca nunca es igual una binomial que una normal, es necesario aplicar en el cálculo de probabilidades un ajuste que recibe el nombre de corrección de Yates. Si X es la binomial y X’ la normal, la corrección consiste en lo siguiente: 188 1  p ( X  r )  p r   X   r  2  1  2 (Se asocia un intervalo unidad centrado en el punto) 1 1  p(a  X  b)  p a   X   b   2 2  (se alarga el intervalo ½ por la izquierda y ½ por la derecha.) Para valores de n mayores de 1.000 se puede suprimir la corrección. Ejercicio 7. Se lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de obtener un número de caras comprendido entre 180 y 210, ambos inclusive. Solución: Calculamos la media y la desviación típica de la distribución binomial: 1 2 1 1  10 . Por tanto, 2 2 210,5  200  179,5  200 p(180  X  210)  p(179,5  X   210,5)  p Z   10 10    p(2,05  Z  1,05)  p(Z  1,05)  p(Z  2,05) pero p( Z  1,05)  0,8531 y p( Z  2,05)  p(Z  2,05)  1  p( Z  2,05)  1  0,9798 0,0202   np  400 .  200 ;   npq  400. . luego p(180  X  210)  0,8531 0,0202 0,8329 Ejercicio 8. Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una competición y tira 25 veces, ¿cuál es la probabilidad de que acierte más de 10 tiros? Solución: Es una distribución B(25; 0,7) que podemos aproximar a través de la normal:   n. p  25.0,7  17,5  5 n.q  25.0,3  7,5  5 La aproximación será buena.   npq  25.0,7.0,3  2,29 10,5  17,5   p( X  10)  p( X  11)  p( X   10,5)  p Z    p(Z  3,06)  2,29    p(Z  3,06)  0,9998 189 Ejercicios propuestos. 1.- Un profesor de matemáticas ha observado que las notas obtenidas por sus alumnos en los exámenes de Estadística siguen una distribución N(6; 2,5). Se han presentado al último examen 32 alumnos, ¿cuántos sacaron al menos un 7?. ( Sol. 11 ) 2.- Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de pruebas anteriores, se sabe que las puntuaciones siguen una distribución normal de media 80 y desviación típica 25. ¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos? (Sol. 36,74% ) 3- Calcula el valor de k para que la función f ( x )  1  kx si x  0, 10 sea función de densidad. 5 Obtenido el valor de k, calcula la media y la desviación típica de la distribución. ( Sol. k = 1/50 ; media = 3,33; desviación típica = 2,36 ) 4.- El peso de los toros de una determinada ganadería se distribuye normalmente con una media de 500 Kg. y 45 Kg. de desviación típica. Si la ganadería tiene 2000 toros, a) Cuántos pesarán más de 540 Kg.? b) Cuántos pesarán menos de 480 Kg.? c) Cuántos pesarán entre 490 y 510 Kg.? ( Sol. 373; 660; 348 ) 5.- Una de las pruebas de acceso a la Universidad para mayores de 25 años consiste en un test con 100 preguntas, cada una de las cuales tiene 4 posibles respuestas y sólo una correcta. Para superar esta prueba deben obtenerse, al menos, 30 respuestas correctas. Si una persona contesta al azar, ¿cuál es el número esperado de respuestas correctas?. ¿Qué probabilidad tendrá de superar la prueba? (Sol. 25; Utilizando la aproximación a través de la normal: p= 0,1492) 6.- Después de realizar varios sondeos sobre una población con escasa cultura, se ha conseguido averiguar que únicamente el 15 % de la misma es favorable a los tratamientos de psicoterapia. Elegida al azar una muestra de 50 personas de dicha población, se desea saber: a) La probabilidad de que haya más de 5 personas favorables a dichos tratamientos. b) La probabilidad de que a lo sumo haya 6 personas favorables. (Sol. 0,7852; 0,3446 ) 190

MATEMATICAS PARA ING - Universidad Tecnológica de la Selva

Productos

Apoyo

MATEMATICAS PARA ING - Universidad Tecnológica de la Selva

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib