Reforma del Bachillerato Tecnológico 2004 SUBSECRETARIA DE EDUCACIÓN MEDIA SUPERIOR DIRECCIÓN GENERAL DE EDUCACIÓN TECNOLÓGICA AGROPECUARIA PARA EL QUINTO SEMESTRE Enero de 2011 PROPÓSITO. Los estudiantes desarrollaran capacidades y habilidades a través del análisis de problemas relacionados con su entorno, para aplicar la Probabilidad y la Estadística en los campos de la Investigación, el desarrollo tecnológico y el medio ambiente, y poder así resolver los problemas que se le presenten CBTa. No. 153 1 PROBABILIDAD Y ESTADÍSTICA PROBABILIDAD Y ESTADÍSTICA UNIDAD VARIABLES Y REPRESENTACIONES SUBTEMA Introducción Población y muestras Variable discreta y continua Redondeo de datos Notación sistematizada Cifras significativas Cálculos DISTRIBUCIONES DE FRECUENCIAS Tabla de Distribución de frecuencias TEMA PÁGINA 4 7 7 1er. Eval. 9 10 11 11 ESTADÍSTICA DESCRIPTIVA MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE DISPERSIÓN PROBABILIDAD INTRODUCCIÓN ANALISIS DE FUNCIONES Y RAPIDEZ DE CAMBIO PROBABILIDAD AXIOMÁTICA PROBABILIDAD PARA EVENTOS SUCESIVOS 14 Promedios 24 Media 28 Mediana Moda Cuartiles, deciles, percentiles Regresión líneal Dispersión Rango Desviación media Varianza Desviación típica Rango semi cuartílico Rango entre percentiles Conceptos básicos Modelos matemáticos Permutaciones y combinaciones Diagrama de árbol Proceso de contar Combinaciones Teorema del Binomio Simbología básica Probabilidad para eventos Probabilidad condicional Eventos independientes Eventos dependientes 28 29 34 Recopilación: ING. CESAR NAVARRO ESPINOSA 2do. Eval. 36 38 45 45 45 42 42 47 48 49 49 50 55 60 62 64 75 72 77 3er. Eval. CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA Desarrollo Cronológico de la estadística Época Contribuidor Contribución Grecia antigua Filósofos Ideas sobre el análisis no cualitativo Estudio de la estadística vital Graunt, Petty Siglo XVII Siglo XVII Estudio probabilístico acerca del cambio del juego Pascal, Berno D´Moire, Laplace, Gauss Quetelet Siglo XIX Galton Pearsons Curva normal, regresión aplicada sobre estudios de astronomía Astrónomo que primero aplicó el análisis estadístico a biología humana. Estudia la variación genética en humanos (usando regresión y correlación lineal) Estudio de la selección natural usando correlación, formando primero departamentos académicos de estadística, Journal de Biométrica, ayudados de el análisis de Chi Cuadrada Gossett (Student) Estudio de procesos, alerta la comunidad estadística acerca de problemas con pequeñas muestras, presentando la prueba t´student Fisher Evolución biologica presentada- presentación de ANOVA , resalta la importancia del diseño experimental. Siglo XX Wilcoxon Bioquímico estudió pesticidas, equivalente no parámetrico de dos pruebas. Recopilación: ING. CESAR NAVARRO ESPINOSA 2 CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA Kruskal Wallis Economista que presentó el equivalente no parámetrico de ANOVA Siglo XX Spearman Kendall Psicólogo que presenta el equivalente no parámetrico del coeficiente de correlación Estadista que presenta otro equivalente no parámetrico del coeficiente de correlación. Tukey Estadista que presenta el procedimiento de la comparación múltiple. Dunnett Bioquímico que estudia los pesticidas, presenta un procedimiento de comparación múltiple para grupos control. Keuls Agrónomo que presenta una procedimiento de comparación múltiple Prueba muchas ventajas sobre cálculos a mano y en calculadora, estimula el fondo de la investigación mediante nuevas técnicas. Recopilación: ING. CESAR NAVARRO ESPINOSA 3 CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 4 UNIDAD I: ESTADÍSTICA VARIABLES Y REPRESENTACIONES INTRODUCCIÓN Estadística: Es un método científico que recopila, organiza, analiza e interpreta los datos obtenidos para tener conocimiento de los hechos pasados, para prever situaciones futuras y tomar decisiones en base a la experiencia. En el estudio de la estadística, se diferencian dos tipos de estadísticas: Estadística descriptiva o deductiva y Estadística inferencial o inductiva. Estadística Descriptiva: Es aquella cuyo objetivo es describir cuantitativamente una serie de personas, animales o cosas, su estudio incluye las técnicas de colectar, presentar, analizar e interpretar datos. Esta parte de la estadística es la que estudiaremos en el presente curso de probabilidad y estadística 1, será la que nos auxilie a resolver preguntas de investigaciones como las siguientes: ¿Cómo ordenar los datos y analizarlos adecuadamente? ¿Qué tipo de representación gráfica es más conveniente utilizar para presentar los datos? ¿Cuál es la media aritmética o promedio de los datos obtenidos? ¿Qué tan dispersos están los datos con respecto a otra muestra? Estadística Inferencial: Es aquella cuyo objetivo es obtener información sobre una población o grupo grande de personas o cosas, mediante un metódico procedimiento de los datos de una muestra tomada de él. Este último tipo de estadística no la utilizaremos en éste curso, pero hagamos un ejercicio para analizar cuál es la diferencia entre estos dos tipos de estadística: A un grupo de 50 alumnos del CBTA 153 extensión Jungapeo le preguntamos ¿Cuál es la materia que les gusta más? Los datos arrojados por ésta encuesta, en éste grupo en particular, es incumbencia de la Estadística Descriptiva, ya que ordenamos los datos, los analizamos obteniendo sus parámetros como la media, la desviación, los graficamos y hasta los interpretamos Pero… Si queremos hacer conclusiones a nivel estatal de todos los alumnos de los CBTAs del estado de Michoacán, éste grupo de 50 encuestados sería una parte de las diferentes muestras que nos servirían para saber la tendencia de toda la población estudiantil respecto a la materia que les gusta más, y debemos tomar más muestras de estudiantes de otros CBTAs, por lo cual ya entraríamos en el campo de la Estadística Inferencial y sus datos deberán de analizarse de otra manera más profunda, haciendo pruebas de hipótesis para obtener las inferencias o conclusiones a futuro. Con tus propias palabras escribe Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 5 POBLACIÓN Y MUESTRAS Población: Es el conjunto de todos los elementos, medidas, individuos y objetos que tienen una característica en común, pero en muchas ocasiones debido a limitaciones de tiempo o de recursos no se puede trabajar con la totalidad de la población. Muestra: Es la parte de una población que podemos utilizar para obtener conclusiones de toda una población sin tener que analizar su totalidad. La muestra elegida debe cumplir con ciertos requisitos indispensables: a) Validez. Debe representar a la población, esto es, ha de pertenecer a ésta y ser elegida al azar o 67en forma aleatoria, para que todos los elementos de la población tengan la misma probabilidad de ser considerados. b) Confiable. Los resultados que se obtengan deben poder generalizarse a toda la población con cierto grado de precisión. c) Práctica. Debe ser sencilla de llevar acabo. d) Eficiente. Debe proporcionar la mayor información con el menor costo. DATOS: Son las medidas, valores o características susceptibles de ser observadas y contadas. VARIABLE DISCRETA Y CONTINUA VARIABLES: Es una propiedad o característica de algún evento, objeto o persona, que puede tener diversos valores en diferentes instantes, según las condiciones. La altura, el peso, el tiempo de reacción y la dosis de un medicamento, son ejemplos de variables. Las variables son las herramientas fundamentales de la estadística y se clasifican de la siguiente manera: En las VARIABLES CATEGÓRICAS los valores pueden ser EXPRESIONES y también estas expresiones pueden ser sustituidas por SÍMBOLOS que nos permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada por el valor de la variable. Hagamos unos ejemplos: Si queremos saber la forma en que se trasladan los estudiantes del CBTA-JUAREZ para recibir sus clases grupales; preguntaremos a cada estudiante del grupo, si usualmente se trasladan de su casa a la escuela CAMINANDO o EN ALGÚN VEHÍCULO, por lo tanto los valores de la variable serán (C) "caminando" o (V) " Vehículo" y se clasifican a los alumnos en éstas dos categorías. Otro ejemplo: Si quisiéramos conocer la materia que prefieren los estudiantes de una lista de 4 materias en donde se incluyen Ciencias Sociales, Matemáticas, Ciencias Naturales y Español; En este caso la materia de preferencia puede tomar cuatro valores: (CS) que es Ciencias Sociales; (M) que es Matemáticas, (CN) Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 6 Ciencias Naturales y (E) será Español. Es claro pues que la variable, materia de preferencia clasifica a los estudiantes en cuatro categorías. Observa que los valores que pueden tomar las variables en los ejemplos anteriores son EXPRESIONES y que estas expresiones han sido sustituidas por SÍMBOLOS que nos permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada por el valor de la variable. Los ejemplos anteriores son VARIABLES CATEGÓRICAS NOMINALES. Veamos ahora otros ejemplos de VARIABLES CATEGÓRICAS: Si deseamos saber si el contenido de la materia de Procesos de Producción Pecuaria tiene relación con las prácticas de campo que se realizaron el semestre pasado y le pedimos la opinión a cada estudiante, los valores que puede tomar la variable pueden ser: "Nunca" (A), "Raras veces" (B), "Algunas veces" (C), Casi siempre" (D) y "Siempre" (E). Observe que esta variable clasifica a cada uno de los estudiantes que contestaron la pregunta, según la opinión que haya elegido. Otro ejemplo: Si queremos saber cómo se alimentan los estudiantes del CBTA-JUAREZ, para relacionarlo con el aprovechamiento escolar, preguntaremos cada semana a todos los estudiante del grupo, cuáles alimentos ingirieron durante la semana y clasificamos la variable calidad de la alimentación de la siguiente manera: “MD” al alumno que se alimentó muy deficientemente, “D” el de alimentación deficiente, “R” el de alimentación regular, “B” el de alimentación buena y “MB” el de alimentación muy buena. Con esto todos los estudiantes del grupo, quedarán distribuidos en cinco posibles categorías. Observa que los valores de las variables también son EXPRESIONES, sin embargo, entre los valores de estos dos ejemplos últimos hay UN ORDEN. Los ejemplos anteriores SON VARIABLES CATEGÓRICAS ORDINALES. Si comprendiste, escribe con tus propias palabras: ¿Cuándo es variable Categórica nominal? SON LAS VARIABLES CUALITATIVAS EN LAS QUE PARA “CUANTIFICARLAS”, SE LES ASIGNAN NÚMEROS A LAS CATEGORÍAS EJEMPLO: 1 MUJER SEXO 0 HOMBRE 1 AZUL 2 VERDE COLOR DE OJOS 3 MARRÓN 4NEGRO ¿Cuándo es una variable Categórica Ordinal? CUANDO RECOGEN LA IDEA DE ORDEN. NO TIENE SENTIDO REALIZAR OPERACIONES ARITMÉTICAS CON ELLAS. EJEMPLO: PREFERENCIAS SOBRE TRES OBJETOS: 3 AL PREFERIDO, 2 AL SIGUIENTE Y 1 AL MENOS DESEADO Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 7 Ahora con las VARIABLES NUMÉRICAS. En las variables numéricas, sus valores no son expresiones sino NÚMEROS y es en donde además tiene sentido efectuar operaciones aritméticas con ellos y compararlos. Si los valores de la variable son NÚMEROS ENTEROS, se llamará NUMÉRICA DISCRETA, pero si los valores de la variable pueden tomar CUALQUIER VALOR NUMÉRICO en algún intervalo de números reales (con decimales o fracciones), la variable será NUMÉRICA CONTINUA. Hagamos unos ejemplos: Si queremos saber el número de hermanos de los alumnos del CBTA-JUAREZ. Serán desde cero en adelante y como es lógico no puede haber medio hermano o tres cuartos de hermano, por lo tanto la variable número de hermanos es una variable numérica discreta. Otro ejemplo será el número de preguntas acertadas en un examen de conocimientos; los años cumplidos de los estudiantes, el número de materias que cursan en el quinto semestre, etc.... Ya que son variables numéricas que pueden tomar sólo valores enteros. Veamos por último los ejemplos de las variables numéricas continuas: Si queremos saber la estatura de los alumnos del quinto semestre con una aproximación a milímetros, tendríamos que utilizar una regla de dos metros y dividida en centímetros y milímetros. Los valores posibles de la variable serán todos los números pertenecientes a algún intervalo. Otro ejemplo es El peso que tienen las personas que asisten a un evento será también una variable numérica continua, pues podrán pesar kilos, con gramos y hasta miligramos, dependiendo de la precisión que queramos los resultados. Si observas estas variables numéricas pueden tomar cualquier valor en algún intervalo. EJERCICIO Describe los valores que pueden tomar las siguientes variables y escribe si ésta es, una variable categórica nominal, categórica ordinal, numérica discreta o numérica continua: a) El Género (sexo) de cada alumno del grupo de quinto semestre. Variable: NOMINAL b) La cantidad de estudiantes en cada grupo de una escuela: Variable: NUMÉRICA c) El Peso de los niños mexicanos de 6 años. Variable: ORDINAL d) El daño causado a los pulmones de los jóvenes que fuman. Variable: ACTIVIDADES DE APRENDIZAJE I e) Tipo de material con el que se construyen los techos de las viviendas de una localidad. Variable: ________________________________ f) El número de naranjas producidas por cada naranjo en una huerta. Variable: _______________________________________ g) La cantidad de afecto o amor que siente un niño por su mamá. Variable: ______________________________________ h) El tiempo de reacción de una sustancia química en el laboratorio. Variable: ______________________________________ REDONDEO DE DATOS Dado que estaremos dando nuestras respuestas finales con dos decimales y en ciertas ocasiones hasta con cuatro cifras decimales, necesitamos decidir cómo determinar el valor de los últimos dígitos. Si nuestro resultado final tiene ENTEROS redondearemos a DOS DECIMALES Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 8 Primer ejemplo cuando el residuo es menor que 0.5: 34.01350 = 34.01 es la respuesta potencial y .350 el residuo; como .350 es menor que 0.5, el último dígito de la respuesta potencial permanece sin cambio y la respuesta final es 34.01 Segundo ejemplo cuando el residuo es mayor que 0.5: 34.01761 34.01 es la respuesta potencial y .761 el residuo; como .761 es mayor que 0.5, al último dígito de la respuesta potencial debemos sumar 1 al último dígito, por lo que la respuesta correcta es 34.02 Tercer ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es impar: 43.07500; 43.07 es la respuesta potencial y .500 el residuo; como es impar el último dígito de la respuesta potencial se AUMENTA 1, por lo que la respuesta correcta es 43.08 Cuarto ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es par: 17.06500; 17.06 es la respuesta potencial y .500 el residuo; como es par el último dígito de la respuesta potencial NO se aumenta 1, por lo que la respuesta correcta es 17.06 Si nuestro resultado final tiene puros DECIMALES redondeamos a CUATRO DECIMALES Siguiendo los mismos principios anteriores, si tenemos una cifra de 0.7544762 su respuesta correcta es 0.7545; en cambio si es 0.1136211 la respuesta correcta es 0.1136; si tenemos que 0.3463500 lo correcto será 0.3464; finalmente si tenemos 0.7728500 lo correcto será 0.7728. EJERCICIO Redondea las siguientes cifras: 35.666666 = __________________ 0.2678198 = ___________________ 72.87754 = ____________________ 0.5489657= ___________________ 5985.3578 = ___________________ 0.4569866 = ___________________ 99.7156 = _____________________ 0.005329 = _____________________ ACTIVIDADES DE APRENDIZAJE DE II Redondea las siguientes cifras: 22.666666 = __________________ 0.7654598= ___________________ 57.87754 = ____________________ 0.0663597= ___________________ 3876.2255 = ___________________ 0.3877865 = __________________ 99.7156 = _____________________ 0.005329 = ____________________ NOTACIÓN SISTEMATIZADA En estadística, por lo general, trabajamos con datos agrupados resultantes de medir una o más variables. Con gran frecuencia, los datos se obtienen de las muestras y en ocasiones de las poblaciones. Para fines matemáticos, generalmente se utiliza la letra mayúscula X y a veces la Y, para representar la(s) variable(s). Así, si estuviéramos midiendo la edad de los sujetos, haríamos que X represente la variable “edad”. Si existen muchos valores de la variable agregamos un subíndice al símbolo X. Ilustramos este proceso en la siguiente tabla, la cual contiene las edades de seis sujetos: Número Símbolo Valor del dato, de sujeto del dato edades 1 2 X1 X2 8 10 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 9 3 X3 7 4 X4 6 5 X5 10 6 X6 12 En este ejemplo representamos la variable “edad” mediante el símbolo X, además, N representa el número total de datos que hay en la distribución. En este ejemplo, N = 6, Cada uno de los seis datos representa un valor específico de X. Distinguimos los seis datos diferentes, al agregar un subíndice a X, correspondiente al número de sujeto que tiene el valor dado. Así, el símbolo X 1 corresponde al valor del dato 8, X2 al valor del dato 10 hasta el X6 al 12. En general, podemos referirnos a un único dato de la distribución X como Xi, donde i puede asumir cualquier valor de 1 a N, según el dato que queramos designar. En resumen: X o Y representa la variable medida. N representa el número total de sujetos o datos. Xi es el i-ésimo dato, donde i puede variar de 1 a N CIFRAS SIGNIFICATIVAS: En la estadística analizamos datos; este análisis implica muchos cálculos matemáticos. Con mucha frecuencia tenemos un residuo decimal, por ejemplo, después de realizar una división. Cuando esto ocurre, necesitamos decidir la cantidad de cifras decimales que utilizaremos para el residuo. En las ciencias físicas, por lo general, se utiliza el mismo número de cifras significativas que tienen los datos en bruto, Por ejemplo, si medimos el peso de cinco sujetos hasta tres cifras significativas (173, 156, 162, 165, y 175 libras) y queremos calcular el promedio de estos pesos, nuestra respuesta debe contener sólo tres cifras significativas. Así X 173 156 162 165 175 831 X 166.2 166 N 5 5 La respuesta de 166.2 se redondea a tres cifras significativas, dando un resultado final de 166 libras. Por varias razones y mas por continuar una tradición, en el presente curso de estadística utilizaremos DOS cifras decimales redondeadas cuando el resultado tenga ENTEROS y CUATRO cifras decimales cuando NO EXISTAN ENTEROS, sin importar las cifras significativas de los datos en bruto. Así cuando se pida que el resultado tenga dos cifras decimales, debemos realizar los cálculos intermedios con al menos CUATRO cifras decimales y redondear la respuesta final a dos cifras. CÁLCULOS Una de las operaciones que se realizan con más frecuencia en estadística consiste en sumar todos o una parte de los datos que pertenecen a una distribución. Como no es práctico escribir “suma de todos los datos” cada vez que se necesite emplear esta operación, particularmente en las ecuaciones, se utiliza una abreviatura simbólica. La letra griega mayúscula sigma ( ∑ ) indica la operación de sumatoria. La frase algebraica utilizada para la sumatoria es: N X i 1 i Esta expresión se lee como “la suma de la variable X de i = 1 a N”. Las notaciones que aparecen arriba y debajo del signo de la sumatoria indican los datos que deben incluirse en la operación. El término que aparece debajo del signo de la sumatoria nos indica el primer dato en esta operación, y el término que se encuentra arriba de dicho signo indica el último dato. Así, esta frase señala que debemos sumar los datos X, comenzando con el primero y concluyendo con el N-ésimo dato. Así. N Ecuación de una sumatoria X X X X ... X i 1 i 1 2 3 N Al “aplicar la sumatoria” a los datos de las edades de la tabla anterior, tenemos que: Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 N X i 1 i 10 PROBABILIDAD Y ESTADÍSTICA X 1 X 2 X 3 X 4 X 5 X 6 =8 + 10 + 7 + 6 + 10 + 12 = 53 Cuando la sumatoria se realiza con todos los datos (de 1 a N), es frecuente que la propia frase de esta operación se abrevie, omitiendo las notaciones arriba y abajo del signo de la suma, al igual que el subíndice i. Así. N X i 1 En el ejemplo anterior, X i Se abrevia con frecuencia como i X i i =53, esta expresión indica que la suma de todos los datos X es 53. i Observa que no es necesario que la sumatoria se realice de 1 a N, Por ejemplo, podríamos querer sumar sólo el segundo, tercer, cuarto y quinto dato. Recuerda que la notación debajo del signo de la sumatoria nos dice dónde comenzar la suma, y el término arriba de dicho signo nos dice dónde terminarla. N Utilizaríamos el símbolo X i 2 Para los datos anteriores, tenemos que: i N X i 2 X 2 X 3 X 4 X 5 10 7 6 10 33 i 3 Resolvamos algunos ejemplos: X i 1 i Para los siguientes datos, determine X1= 10, X2 = 12, X3 = 13, X4= 18 3 X Por lo tanto: i 1 i 10 12 13 35 4 Para los siguientes datos, determine X i 3 ; X1=20, X2=24, X3=25, X4=28, X5=30, X6=31 2 4 Por lo tanto: X 3 (24 25 28) 3 =77 i 2 4 Para los siguientes datos, determine X i 3 ; X1=20, X2=24, X3=25, X4=28, X5=30, X6=31 2 4 Por lo tanto: X i 3 = 24 3 25 3 28 3 86 2 N Existen otros dos tipos de sumatorias que veremos con frecuencia en estadística y son: X 2 y i 1 N ( X ) 2 . Aunque se parecen, son distintos y, en general, proporcionan diferentes respuestas. i 1 N El símbolo X 2 (suma de los cuadrados de los datos X) indica que primero debemos elevar el i 1 cuadrado de los datos X y luego sumarlos. Así:, X 2 2 X 12 X 22 X 32 ..... X N Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 11 N El símbolo ( X) 2 , o (el cuadrado de la suma de los datos X), indica que primero debemos sumar los i 1 datos X y luego elevar al cuadrado la suma resultante. Así, ( X ) 2 X 1 X 2 X 3 ..... X N La confusión es muy común cometerlo, sobre todo cuando se calculan las desviaciones estándar, eso lo analizaremos un poco mas adelante. EJERCICIO Primer ejercicio si 7 X i 3 5 X1=5; X2=8; X3=6; X4=4; X5=3; X6=7; X7=5 i ( X 12) X 205 i 4 i 1 i i 2 Segundo ejercicio si X1=12; X2=17; X3=13; X4=16; X5=15; X6=20; 6 ( X i ) 8 2 i 2 5 ( X i ) 2 510 i 1 ACTIVIDADES DE APRENDIZAJE III Primer ejercicio si 7 X i 3 X1=3; X2=6; X3=8; X4=2; X5=9; X6=1; X7=5 i 5 ( X 12) X 205 i i 41 i 2 i Segundo ejercicio si X1=10; X2=7; X3=3; X4=16; X5=2; X6=22; 6 ( X i ) 8 2 i 2 5 ( X i ) 2 510 i 1 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 12 DISTRIBUCIONES DE FRECUENCIAS TABLA DE DISTRIBUCIÓN DE FRECUENCIAS La Tabla de Distribución de Datos o Tabla de Distribución de Frecuencias, además de ser un instrumento útil para resumir un conjunto de datos obtenidos en una investigación, es una herramienta muy importante con que cuenta la estadística para realizar las observaciones de manera rápida y sencilla. Para construir dicha Tabla realizaremos siete pasos y para tu mejor aprendizaje, desarrollaremos un ejemplo con una variable numérica discreta, ya que deseamos conocer el “tiempo en minutos que emplearon para estudiar” 50 estudiantes del CBTA 153 en la materia de Estadística Descriptiva. PASO UNO: TOMA Y ORDENACIÓN DE DATOS: La recopilación de los datos consiste en asistir al grupo de estudiantes y obtener los valores mediante una pregunta abierta sobre el tiempo en minutos que emplearon para estudiar el tema de estadística o si desconfiamos, podemos medir directamente el tiempo durante las asesorías que emplearon cada uno de los alumnos al estudiar estadística. En resumen para recopilar los datos debemos "asistir" al lugar donde vamos a 'tomar" o "levantar" los datos. Esto puede ser mediante entrevistas, cuestionarios, observaciones o mediciones directas a los individuos o cosas que corresponda nuestra variable. Supongamos que los 50 datos obtenidos en nuestra variable: tiempo de estudio de la materia de estadística en minutos fueron los siguientes: 75 60 80 67 81 71 74 63 72 70 76 62 82 63 81 66 78 68 80 74 67 74 84 70 63 77 68 82 74 72 76 64 75 80 69 85 71 79 60 74 83 75 67 72 78 64 77 81 76 70 La Ordenación de los datos consiste en colocar los datos tomados en orden creciente (de menor a mayor) o decreciente (de menor a mayor). Nosotros los vamos a ordenar en forma creciente y sobre todo "contando" y "anotando" los que se repitan, que será la frecuencia. Ordenación de datos: Tiempo empleado en minutos Conteo Frecuencia 60 62 63 64 66 67 68 69 70 71 72 // / /// // / /// // / /// // /// 2 1 3 2 1 3 2 1 3 2 3 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 13 74 ///// 5 75 /// 3 76 /// 3 77 // 2 78 // 2 79 / 1 80 /// 3 81 /// 3 82 // 2 83 / 1 84 / 1 85 / 1 Total 50 Es importante que la suma total sea igual al número de datos que tomamos en la investigación. PASO DOS: RANGO. El rango o recorrido es la diferencia que hay entre el dato mayor y el menor. Una vez que se ordenaron los datos en forma creciente obtenemos el rango 85 que es el dato mayor 60 que es el dato menor 25 será el rango o recorrido PASO TRES: INTERVALOS DE CLASE. Cuando se tiene un gran número de datos, se recomienda distribuirlos en clases o categorías llamadas intervalos de clase o celdas. Para decidir la cantidad de intervalos de clase que se van a utilizar (o número de clases) y la amplitud de los intervalos (o ancho del intervalo) se siguen las siguientes operaciones: Primero el NÚMERO DE CLASES o INTERVALOS se obtienen con la fórmula: Q = 1 + 3.322 (log. n) donde n es el número de datos y log. Es el logaritmo de dicho número. Siguiendo el ejemplo tenemos: Q = 1+ 3.322 (log. 50) observa que obtendremos el logaritmo de 50. En una calculadora el logaritmo de 50 es 1.69897... Redondeando su valor será 1.70 Este valor lo multiplicamos por 3.322 y nos da en la calculadora 5.64... Que redondeado será 5.64 y finalmente le sumamos 1 a dicha cantidad arrojándonos = 6.64 Si el número que nos arroje la formula tiene su primera decimal igual o mayor que .5 se aumenta el entero. Así en nuestro ejemplo tenemos que 6.6 seria igual a 7. En resumen y de acuerdo a la fórmula el número de intervalos será de 7 PASO CUATRO: ANCHO DEL INTERVALO: Se divide el rango entre el número de intervalos para obtener la anchura de cada intervalo o celda. Rango / numero de intervalos de clase = 25 = 3.57 redondeando será igual a 4 7 Por lo tanto el ancho del intervalo será de 4 Resulta claro que si lo ancho del intervalo es de 4 y el número de intervalos son 7; (4) (7) = 28 se cubrirá todo el rango que es de 25. Debemos hacer uso de los Límites reales Inferiores (L.R.I.), quitando 0.5 al dato más chico que en nuestro caso es de 60 minutos. Por lo tanto será de 59.5 el L.R.I. Luego a este se le suma lo ancho del intervalo que es de 4 resultando 63.5 que es el Límite Real Superior (L.R.S.) por lo que ahora si podemos decir que los dos datos 64 se deberán anotarse en el 2do. Intervalo que iniciaría en 63.5 hasta 67.5 como límite real superior. PASO CINCO: TAMAÑO DEL INTERVALO DE CLASE. Ahora si podemos construir cada uno de los intervalos con sus límites reales inferiores y limites reales superiores. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 14 Recuerda que el ancho de cada intervalo es de 4 y que en total son siete (7) intervalos de acuerdo a las operaciones realizadas anteriormente: INTERVALOS DE CLASE L. R. I. L. R. S. 59.5 63.5 63.5 71.5 71.5 79.5 87.5 Observación Importante: Si te fijas detenidamente en los intervalos y los datos ordenados del cuadro anterior; los dos datos de 63.5 quedarían comprendidos en el 1er. y 2do. Intervalo, es decir, pueden anotarse en el primero o en el segundo intervalo, también los 71.5 en el 3er o 4to intervalo; pero se sabe que una observación dada (los 63.5 y 71.5) deben colocarse en uno y solamente uno de los intervalos de clase. PASO SEIS: MARCA DE CLASE. La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites reales inferiores más los límites reales superiores, dividiendo el resultado entre dos. Hagámoslo practicando. Llena los espacios que faltan. Se suma 59.5 63.5 123 = = 61.5 2 2 Intervalos de Clase MARCA DE CLASE L.R.I. L.R.S. (59.5, 63.5] 61.5 (63.5, 67.5] (67.5, 71.5] (71.5, 75.5] (75.5, 79.5] (79.5, 83.5] (83.5, 87.5] 85.5 PASO SIETE: FRECUENCIA ABSOLUTA Y RELATIVA. La Frecuencia absoluta de clase: es el total de observaciones o datos que pertenecen a cada clase. La Frecuencia Relativa, es la frecuencia que se representa con un Tanto por Ciento (%) y se obtiene al dividir la frecuencia absoluta de un intervalo de clase entre el total de frecuencias de todas las celdas por cien. La frecuencia Relativa se emplea para mostrar la proporción o porcentajes de los valores incluidos en los intervalos de clase, por lo que también se le llama Distribución Porcentual. Del 1er. y 2do Intervalos; Frecuencia Relativa de clase = Del 6to intervalo; La Frecuencia Relativa = 6 = 0.12 x 100 = 12 % 50 9 = 0.18 x 100 = 18 % 50 Con todos los datos anteriores, finalmente construyamos nuestra… Tabla de distribución de frecuencias de una variable numérica “Tiempo dedicado a estudiar la materia de estadística” Intervalos de Clase Marca de Frecuencia L.R.I. L.R.S. Clase Absoluta (59.5 , 63.5] 61.5 6 (63.5 , 67.5] 65.5 6 (67.5 , 71.5] 69.5 8 Frecuencia Relativa (%) 12 12 16 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 (71.5 (75.5 (79.5 (83.5 TOTAL = PROBABILIDAD Y ESTADÍSTICA , , , , 75.5] 79.5] 83.5] 87.5] 73.5 77.5 81.5 85.5 11 8 9 2 50 15 22 16 18 4 100% PASO OCHO: DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS Así se llama al número de observaciones que pertenecen aun determinado intervalo. Para obtener las frecuencias de cada clase es necesario contabilizar las observaciones, valores o casos pertenecientes a cada intervalo, utilizando el cuadro donde ordenamos los datos que está en la página 13. . Sigamos Practicando Intervalos de clase Marca Frecuencia Frecuencia Frecuencia Frecuencia de Absoluta Relativa (%) acumulada acumulada clase absoluta relativa L.R. L.R. fi pi Inferior Superior vi 6 (59.5 63.5] 61.5 6 12 6 𝑥100% (63.5 67.5] 65.5 6 12 6+6=12 (67.5 71.5] 69.5 8 16 12+8=20 50 12 𝑥100% 50 20 𝑥100% 50 (71.5 75.5] 73.5 11 22 (75.5 79.5] 77.5 8 16 (79.5 83.5] 81.5 9 18 (83.5 87.5] 85.5 2 4 TOTAL = 50 100% 50 100% Con los datos anteriores terminamos los componentes principales del cuadro que también recibe el nombre de... "TABLA DE DISTRIBUCIÓN DE FRECUENCIAS" por lo que... Ya podemos obtener algunas CONCLUSIONES de nuestra investigación. Cuando las variables son cuantitativas o numéricas sean discretas o continuas la representación gráfica más común es el HISTOGRAMA DE FRECUENCIAS y el POLÍGONO DE FRECUENCIAS. HISTOGRAMA DE FRECUENCIAS: Este tipo de gráfica consiste en una serie de rectángulos trazados en un sistema de coordenadas cartesianas o rectangulares. Para realizar el histograma es necesario agrupar los datos en intervalos de clase, con sus límites reales inferiores y superiores, además de su frecuencia absoluta. Los rectángulos tienen sus bases sobre el eje horizontal con centros en las marcas de clase y su longitud es igual a la anchura de los intervalos de clase. La altura de cada rectángulo corresponde al valor de la frecuencia que tenga el intervalo que representa. En éstos histogramas los rectángulos se trazan adyacentes entre si. De acuerdo a los datos de la "Tabla de distribución de frecuencias" del ejemplo (pag.16), donde analizamos el tiempo que dedican a estudiar la materia de estadística 50 estudiantes, vamos a construir su Histograma de Frecuencias. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 16 Histograma: Tiempo en minutos dedicados a estudiar Estadística por 50 estudiantes 14 F R E C U E N C I A S 12 10 8 6 4 2 0 59.5 63.5 67.5 71.5 75.5 79.5 83.5 87.5 61.5 INTERVALOS DE CLASE (con sus L.R.I. y L.R.S.) Si observas en el eje vertical de las "Y", se ubican las frecuencias absolutas, mientras que en el eje horizontal de las "X" se ubican los intervalos de clase en donde cada límite real superior corresponde al límite real inferior del siguiente intervalo. Las marcas de clase (61.5) aunque es permitido no escribirse en el histograma, se pueden ubicar ya que corresponde al punto medio de cada intervalo. Como habrás observado, el histograma nos ayuda a mostrar la frecuencia absoluta con que se presentan algunos datos; otra forma de gráfica son los… 14 F R E C U E N C I A S 12 10 8 6 4 2 0 61.5 65.5 69.5 73.5 77.5 81.5 85.5 MARCAS DE CLASE (puntos medios) POLÍGONOS DE FRECUENCIA. Los polígonos de frecuencia también se construyen a partir de datos con variables cuantitativas o numéricas y se puede realizar a partir de un histograma si se desea. Una vez trazado el histograma, se localizan los puntos medios o marcas de clase en la parte superior de cada uno de los rectángulos o intervalos de clase. Se trazan segmentos de recta que unen cada punto medio de cada uno de los intervalos. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 17 Este polígono se encierra uniendo con el eje horizontal en el punto que corresponde al punto medio de un rectángulo imaginario y adyacente al histograma, esto se hace en los extremos izquierdos y derechos del polígono. En el histograma se localizan los puntos medios en la parte superior de cada intervalo de clase y en el eje horizontal, se indican las marcas de clase o puntos medios de cada intervalo. Construyamos un polígono.... 14 F R E C U E N C I A S Polígono de Frecuencia: Tiempo en minutos dedicados a estudiar Estadística por 50 estudiantes 12 10 8 6 4 2 0 61.5 65.5 69.5 73.5 77.5 81.5 85.5 MARCAS DE CLASE (Puntos medios) Para trazar el polígono de frecuencia unimos con rectas los puntos medios o marcas de clase con su frecuencia absoluta respectiva, en donde estaban la parte alta de los rectángulos del histograma. CONCLUSIONES… Te recordamos que los 50 datos son del tiempo en minutos dedicado a estudiar estadística por los estudiantes. Si analizamos detenidamente sus datos, podemos ver que el mayor número de casos (frecuencia absoluta) es 11 y dedican de 71.5 a 75.5 minutos en estudiar (su intervalo) pero además representan el mayor porcentaje con un 22% del total. Caso contrario, son lo que dedican de 83.5 a 87.5 minutos en estudiar pues únicamente son 2 y representan un 4 % del total. Si observamos en global el cuadro, podemos decir que la mayoría de los estudiantes (Los intervalos 3,4 y 5) dedican de 67.5 a 79.5 minutos en estudiar y representan el 54 % del total. Analizando otros datos podremos obtener más conclusiones de nuestro trabajo e ir descubriendo lo importante de nuestra investigación. Mas adelante aprenderás a realizar GRÁFICAS con los datos obtenidos de la tabla de frecuencias. Quedamos pendientes. .. , EJERCICIO 1) siguiendo los ocho pasos para una variable numérica, ordena los datos de la siguiente variable y realiza las operaciones correspondientes hasta obtener completa la "tabla de distribución de frecuencias" de las “Estaturas de 55 estudiantes” con aproximación de un centímetro. Datos: 144 145 176 167 159 172 161 143 165 156 153 150 163 180 164 156 164 173 153 154 150 175 149 164 146 166 179 158 152 169 167 165 173 151 171 164 165 148 154 149 175 153 176 146 162 170 160 169 158 159 175 159 160 180 180 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 18 Aquí realiza los siete pasos y tus cálculos correctamente hasta llenar tu Tabla de distribución de frecuencias Paso 1 Ordenación de datos. Paso 2 Rango... etc Tabla de distribución de frecuencias de una variable numérica Intervalos de Clase Marca de Frecuencia Frecuencia Frec. Acum. Frec. Acum. L.R.I. L.R.S. Clase vi Absoluta fi Relativa (%) pi absoluta relativa TOTAL = Dibuja en ésta hoja el HISTOGRAMA, el POLIGONO DE FRECUENCIAS y la OJIVA. HISTOGRÁMA: “Estatura de 55 estudiantes” POLÍGONO DE FRECUENCIAS. “Estatura de 55 estudiantes” LA OJIVA: “Estatura de 55 estudiantes” PRINCIPALES CONCLUSIONES: 1.____________________________________________________________________ 2.____________________________________________________________________ 3_____________________________________________________________________ ACTIVIDADES DE APRENDIZAJE IV 1) siguiendo los ocho pasos para una variable numérica, ordena los datos de la siguiente variable y realiza las operaciones correspondientes hasta obtener completa la "tabla de distribución de frecuencias" de las “Aciertos en un Examen de admisión a la Universidad de 55 estudiantes”. Datos: 154 165 156 160 159 170 151 163 166 166 153 160 173 160 161 166 162 153 163 156 170 165 159 168 149 163 169 157 162 159 168 155 163 161 161 174 160 168 152 169 165 156 166 166 162 160 170 163 168 157 165 159 163 160 160 Aquí realiza los siete pasos y tus cálculos correctamente hasta llenar tu Tabla de distribución de frecuencias Paso 1 Ordenación de datos. Paso 2 Rango... etc Tabla de distribución de frecuencias de una variable numérica Intervalos de Clase L.R.I. L.R.S. Marca de Frecuencia Frecuencia Clase vi Absoluta fi Relativa (%) pi Frec. Acum. absoluta TOTAL = Recopilación: ING. CESAR NAVARRO ESPINOSA Frec. Acum. relativa CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 19 Dibuja el HISTOGRAMA, el POLIGONO DE FRECUENCIAS y la OJIVA. HISTOGRÁMA: “Estatura de 55 estudiantes” POLÍGONO DE FRECUENCIAS. “Estatura de 55 estudiantes” OJIVA: “Estatura de 55 estudiantes” PRINCIPALES CONCLUSIONES: 1.______________________________________________________________ 2.______________________________________________________________ 3______________________________________________________________ DISTRIBUCIÓN DE FRECUENCIA RELATIVA ACUMULADA Ahora estudiemos como se construye la DISTRIBUCIÓN DE FRECUENCIA ACUMULADA y su gráfica LA OJIVA además de la FRECUENCIA RELATIVA ACUMULADA. La frecuencia total de todos los valores menores que el límite real superior de un determinado intervalo de clase, es conocida como frecuencia acumulada incluyendo hasta este intervalo. Lo anterior lo comprenderás mejor si nos ayudas a resolver el ejemplo que sigue: Si tomamos los datos obtenidos al medir el “tiempo en minutos que emplearon los estudiantes en ir de su casa a la escuela”. Se construye la siguiente tabla de distribución de frecuencias y una columna que corresponde a la distribución de frecuencia acumulada y otra a la frecuencia relativa acumulada. Concluyen los datos que faltan en la frecuencia acumulada de clase, de tal forma que sumen un total de 243. En la columna de frecuencia acumulada relativa, también calcula los espacios que faltan hasta que obtengas el 100% INTERVALO DE CLASE 9.5 – 12.5 12.5 –15.5 15.5 – 18.5 18.5 – 21.5 21.5 – 24.5 24.5 – 27.5 27.5 – 30.5 30.5 – 33.5 33.5 – 36.5 T O T A L: MARCA DE CLASE 11 14 17 20 23 26 29 32 35 Frecuencia Absoluta fi 3 4 6 7 9 8 5 3 2 47 Frecuencia relativa % pi 6.38% 8.51% 12.77% 14.89% 19.15% 17.02% 10.64% 6.38% 4.26% 100% Frecuencia acumulada Frecuencia relativa acumulada 3 3/47X 100= 6.38% 7/47X100=14.89% 7 13 20 (3+4 ) (7+6) ( ) 100% 243 LA OJIVA O POLÍGONO DE FRECUENCIA ACUMULADA. Se le llama ojiva o polígono de frecuencia acumulada, a la gráfica que muestra la distribución de frecuencia acumulada. Al construirla, los intervalos de clase se disponen en el eje horizontal, y las frecuencias acumuladas se representan en el eje vertical. Luego se unen los puntos localizados mediante segmentos. Para entender la forma en que se traza una ojiva, considere el ejemplo de los datos obtenidos al registrar el tiempo empleado por los estudiantes para ir de su casa a la escuela. Primero se coloca un punto sobre el eje horizontal donde está el 9.5, puesto que no hay observaciones de ésta o de inferior magnitud. Luego se traza el siguiente punto en el 12.5 a la altura del 3, esto se puede hacer porque hay 3 registros iguales o menores de 12.5 de esta manera se continúan representando el resto de los puntos. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 20 FRECUENCIA ACUMULADA Ejemplo: Tomando como base la distribución de frecuencia acumulada del ejemplo anterior, y el tiempo en minutos que emplean los integrantes de un grupo de estudiantes de ir de su casa a la escuela, construyamos la ojiva correspondiente: 50 45 40 35 30 25 20 15 10 5 0 INTERVALO DE CLASE En esta página transfiere los datos de la tabla de distribución de frecuencias del ejercicio de la página 16 y en las dos columnas últimas obtén la FRECUENCIA ACUMULADA y la FRECUENCIA RELATIVA ACUMULADA, además construye su gráfica llamada OJIVA. 1° SIMULACRO DE EXAMEN Describe los valores que pueden tomar las siguientes variables y escribe si ésta es, una variable categórica nominal, categórica ordinal, numérica discreta o numérica continua: a) El Género (sexo) de cada alumno del grupo de quinto semestre. Variable: __________________________________________ b) La cantidad de estudiantes en cada grupo de una escuela: Variable: _________________________________________ c) El Peso de los niños mexicanos de 6 años. Variable: ________________________________________ d) El daño causado a los pulmones de los jóvenes que fuman. Variable: _______________________________________ e) Tipo de material con el que se construyen los techos de las viviendas de una localidad. Variable: ________________________________ f) El número de naranjas producidas por cada naranjo en una huerta. Variable: _______________________________________ g) La cantidad de afecto o amor que siente un niño por su mamá. Variable: ______________________________________ h) El tiempo de reacción de una sustancia química en el laboratorio. Variable: ______________________________________ Redondea las siguientes cifras: 22.666666 = __________________ 0.7654598= ___________________ 57.87754 = ____________________ Primer ejercicio si 7 x i 3 5 0.0663597= __________________ X1=3; X2=6; X3=8; X4=2; X5=9; X6=1; X7=5 i (x i 12) ______________________________________________ i 1 1) siguiendo los ocho pasos para una variable numérica, ordena los datos de la siguiente variable y realiza las operaciones correspondientes hasta obtener completa la "tabla de distribución de frecuencias" de las “Estaturas de 55 estudiantes” con aproximación de un centímetro. Datos: 154 165 156 160 159 170 151 163 166 166 153 160 173 160 161 166 162 153 163 156 170 165 159 168 149 163 169 157 162 159 168 155 163 161 161 174 160 168 152 169 165 156 166 166 162 160 170 163 168 157 165 159 163 160 160 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 21 Aquí realiza los siete pasos y tus cálculos correctamente hasta llenar tu Tabla de distribución de frecuencias Paso 1 Ordenación de datos. Paso 2 Rango... etc Tabla de distribución de frecuencias de una variable numérica Intervalos de Clase L.R.I. Marca de Clase Frecuencia Frecuencia L.R.S. Absoluta Relativa (%) TOTAL = Dibuja el HISTOGRAMA, el POLIGONO DE FRECUENCIAS y la OJIVA. HISTOGRÁMA: “Estatura de 55 estudiantes” POLÍGONO DE FRECUENCIAS. “Estatura de 55 estudiantes” OJIVA: “Estatura de 55 estudiantes” MEDIDAS DE TENDENCIA CENTRAL PROMEDIOS O MEDIAS En estadística al promedio se le conoce como medida de tendencia central, ya que está localizado hacia el medio o centro de una distribución, en la que la mayoría de los valores tenderán a concentrarse. Entre los más comunes se pueden mencionar: la media aritmética, la mediana y la moda Media Aritmética MEDIDAS DE TENDENCIA CENTRAL Mediana Moda LA MEDIA, MEDIANA Y MODA CON “DATOS AGRUPADOS” o también se llaman de distribución de frecuencias agrupadas. MEDIA ARITMÉTICA PARA DATOS AGRUPADOS Si los datos o valores han sido agrupados en intervalos de clase, entonces se considera que todos los valores incluidos dentro de un determinado intervalo son iguales o están representados por el punto medio del intervalo o la marca de clase. En este caso se procede a multiplicar cada punto medio por su respectiva frecuencia. Luego se suman estos productos, para finalmente dividir este resultado entre el total de datos. Es importante señalar que el valor de la media de la frecuencia agrupada es suficientemente aproximado para trabajos de estadística y que el valor de la media no será suficientemente aproximado si la distribución de frecuencias agrupadas es muy irregular o demasiado asimétrica. La fórmula para la media aritmética en datos agrupados es la siguiente: ∑(𝑓)(𝑥) ∑(𝑓)(𝑣𝑖 ) 𝑋̅ = o 𝑋̅ = 𝑛 𝑛 Donde f = Frecuencias absolutas de los intervalos. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 22 𝑥 = Marca de clase o Valor medio de clase. n = La suma de las frecuencias. MEDIANA PARA DATOS AGRUPADOS Cuando Los datos simples son agrupados en una distribución de frecuencias, cada uno de los valores pierde su identidad en la tabla, significando que la mediana de los datos simples puede no ser igual a la mediana obtenida de una distribución de frecuencias del mismo conjunto de datos. Es importante mencionar, que la mediana de los datos agrupados es una aproximación de la verdadera mediana. La aproximación puede ser obtenida mediante el uso de la siguiente fórmula: n 2 c Me Li (i ) fm e Donde: Me = Mediana Li = Límite real inferior de la clase que contiene la mediana. n = El número de datos o frecuencia total. c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o la suma de las frecuencias de los intervalos por debajo de la mediana. fme = La frecuencia de la clase mediana. i = Tamaño del intervalo o amplitud de la clase mediana. MODA PARA DATOS AGRUPADOS. Cuando la moda se calcula a través de la fórmula para datos agrupados, los valores y frecuencia en la clase modal y las frecuencias en las clases inmediatamente antes y después de la clase modal, son también empleadas. Por lo tanto se aplica la siguiente fórmula. d1 Mo Li (i ) d d 2 1 Donde: Mo = Moda L1 = Límite real inferior de la clase que contiene la moda d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua inferior. d2 = diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua superior. i = Tamaño del intervalo o amplitud del intervalo de la clase modal. A continuación resolveremos un ejercicio para utilizar las fórmulas de la media, la mediana y la moda de datos agrupados. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 23 Ejemplo: En la siguiente tabla se resumen los datos de los pesos en kilogramos de 50 estudiantes. Con base a la siguiente tabla de distribución de frecuencias, calculemos los valores de la media, la mediana y la moda, recordando cómo se conforman las columnas de Intervalos de clase ( I ), Marca de clase o punto medio ( X ), Frecuencia absoluta( f ), Frecuencia relativa % ( f’ ) y la Frecuencia acumulada ( F ). Marca de Frecuencia Frecuencia Absoluta relativa Intervalos de clase clase (vi) ( fi ) ( pi ) (I) 30.5 – 33.5 32 1 .02 33.5 – 36.5 35 2 .04 36.5 – 39.5 38 6 .12 39.5 – 42.5 41 11 .22 42.5 – 45.5 44 16 .32 45.5 – 48.5 47 9 .18 48.5 – 51.5 50 4 .08 51.5 – 54.5 53 1 .02 50 1.0 o 100% TOTAL = CALCULO DE LA MEDIA ARITMÉTICA para datos agrupados Frecuencia acumulada (F) 1 3 9 20 36 45 49 50 ∑(𝐟𝐢 )(𝐯𝐢) Su fórmula es…𝑥̅ = 𝑛 Esta expresión no se puede aplicar directamente, ya que únicamente se cuenta con el dato del denominador, esto es n = 50, pero no se tiene el dato del numerador. Para ello se agrega una columna a la tabla, donde se proporcionan los datos agrupados en intervalos. Esta columna se construye multiplicando el punto medio de cada intervalo por su respectiva frecuencia y cuando se tengan todos los productos, se procede a obtener la suma de ellos. La tabla original ya con la columna Fx y la suma de ésta queda de la siguiente manera. I X(Marca de f f’ F fx clase) 30.5 – 33.5 32 1 .02 1 32 33.5 – 36.5 35 2 .04 3 70 36.5 – 39.5 38 6 .12 9 228 39.5 – 42.5 41 11 .22 20 451 42.5 – 45.5 44 16 .32 36 704 45.5 – 48.5 47 9 .18 45 423 48.5 – 51.5 50 4 .08 49 200 51.5 – 54.5 53 1 .02 50 53 50 2161 TOTAL = 1 o 100 Entonces: ∑(𝐟𝐢 )(𝐯𝐢) 2161 𝑥̅ = = 50 = 43.22 será el resultado de la media aritmética 𝑛 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 24 CALCULO DE LA MEDIANA para datos agrupados. 𝒇𝒊 𝒗𝒊 I (30.5 , 33.5] (33.5 , 36.5] (36.5 , 39.5] (39.5 , 42.5] (42.5 , 45.5] (45.5 , 48.5] (48.5 , 51.5] (51.5 , 54.5] TOTAL = 32 35 38 41 44 47 50 53 1 2 6 11 16 9 4 1 50 𝒑𝒊 .02 .04 .12 .22 .32 .18 .08 .02 1 F 1 3 9 20 36 45 49 50 Si partimos de la definición, la mediana es el dato central, como hay OCHO INTERVALOS estará entre el cuarto y quinto intervalo; entonces, debe estar comprendida en el intervalo 42.5 – 45.5, ya que observando la columna “F”, a este intervalo le corresponde una frecuencia acumulada de 36. Note Usted que si se toma el intervalo inmediato inferior, 39.5 – 42.5 se observa en la columna “F”, que hasta esta celda hay 20 VEINTE casos y como se tiene un total de 50 datos, el caso central es el número 25. Así pues el intervalo donde está la mediana es: 42.5 – 45.5 44 16 32 36 Algunos autores efectúan el siguiente razonamiento, sin utilizar la fórmula, pero si interpolando una relación proporcional: ANALIZA DETENIDAMENTE n = 50 por lo tanto la media está en 50/2 = 25 El L.R.I.(Limite real inferior) de la mediana = 42.5 Como 20 casos (1+2+6+11) caen por debajo del L.R.I. de la mediana, necesitamos 5 datos más, para llegar a 25. Dado que existen 16 casos (frecuencia) en el intervalo y éste tiene 3 de amplitud o ancho, hacemos una regla de tres. 16 es a 3 como 5 es a x 16 : 3 :: 5 : x x= (3)(5) = 15 = 0.9375 16 16 Al L.R.I. le sumamos el resultado Me = 42.5 + 0.9735 = 43.4375 Finalmente mediana = 43.44 Kg. Ahora utilicemos la fórmula para determinar la mediana en datos agrupados: n c Me Li 2 (i ) Fm e Li = Límite real inferior de la clase que contiene la mediana. n = El número de datos o frecuencia total. c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o la suma de las frecuencias de los intervalos por debajo de la mediana. fme = La frecuencia de la clase mediana. i = Tamaño del intervalo o amplitud de la clase mediana. 39.5 -- 42.5 41 11 .22 20 .40 451 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 25 42.5 – 45.5 44 16 .32 36 .72 704 Analizando estos dos intervalos se pueden obtener los siguientes valores: L1 = 42.5 límite real inferior que contiene la mediana n = 50 es el número total de frecuencias de donde: n 25 2 c = 20 es la frecuencia acumulada hasta la clase anterior a la clase mediana fme = 16 es la frecuencia de la clase mediana i = 3 es el tamaño del intervalo o amplitud de la clase mediana. Sustituyendo estos datos en la fórmula se tiene: 25 20 5 ( 3 ) = 42.5 + ( 3 ) = 42.5 + 16 16 Me = 42.5+ 15 = 42.5 + 16 15 16 Me = 42.5 + 0.9375+ = 43.4375 Finalmente mediana = 43.44 Kg CALCULO DE LA MODA para datos agrupados. Para determinar el valor de la moda, habrá que observar las columnas “ f ” y seleccionar el intervalo que presenta la mayor frecuencia. En este caso, el intervalo que donde está incluida la moda es: 42.5 – 45.5 44 16 .32 36 .72 704 La fórmula que se utiliza para encontrar el valor de la moda es: d1 Mo Li (i ) d d 2 1 L1 = Límite real inferior de la clase que contiene la moda d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua inferior. d2 = diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua superior. i = Tamaño del intervalo o amplitud del intervalo de la clase modal. Para determinar los valores de cada término en esta expresión, se requiere además del intervalo donde está localizada la moda, de las celdas inmediata inferior y superior que queda como sigue: 39.5 - 42.5 41 11 .22 20 .40 451 42.5 - 45.5 44 16 .32 36 .72 704 45.5 - 48.5 47 9 .18 45 .90 423 A partir de estos intervalos se adquieren los valores requeridos y que son: Li = 42.5 d1 = 16 - 11 = 5 d2 = 16 – 9 = 7 i =3 Sustituyendo estos datos en la formula se obtiene: Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 5 Mo = 42.5 + (3) 5 7 Mo = 42.5 + 26 5 ( 3 ) 12 Mo = 42.5 + 15 = 42.5 + 1.25 = 43.75 12 Finalmente la Moda = 43.75 EJERCICIO Calcula la media aritmética, Media y Moda de los tres ejercicios siguientes. EJERCICIO Calcula la Media Aritmética, Mediana y Moda de ejercicio que se te presenta. Intervalo de clase L.R.I. L.R.S. Marca De clase (vi) Frecuencia de clase (fi) (9.5 , 12.5] (12.5 ,15.5] (15.5 , 18.5] (18.5 , 21.5] (21.5 , 24.5] (24.5 , 27.5] (27.5 , 30.5] (30.5 , 33.5] (33.5 , 36.5] T O T A L: 11 14 17 20 23 26 29 32 35 3 4 6 7 9 8 5 3 2 47 ACTIVIDADES DE APRENDIZAJE VI Calcula la Media aritmética, Mediana y Moda del ejercicio siguiente. Intervalos de Clase Marca de Frecuencia (f)( vi) L.R.I. L.R.S. Absoluta (fi ) Clase (vi ) (59.5 , (63.5 , (67.5 , (71.5 , (75.5 , (79.5 , (83.5 , TOTAL = 63.5] 67.5] 71.5] 75.5] 79.5] 83.5] 87.5] 61.5 65.5 69.5 73.5 77.5 81.5 85.5 6 6 8 11 8 9 2 50 De las edades de 40 maestros de los C.B.T.a s, calcula las MEDIDAS DE TENDENCIA CENTRAL (MEDIA, MEDIANA Y MODA) Tanto de los siguientes datos. Edades: 36, 53, 35, 28, 30, 36, 45, 29, 43, 28, 30, 46, 39, 54, 47, 44, 34, 40, 50, 38, 47, 56, 48, 42, 39, 47, 53, 51, 38, 29, 48, 52, 47, 46, 41, 40, 45, 39, 47, 38. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 27 MEDIDAS DE DISPERSIÓN A menudo escuchamos que en los países latinoamericanos existe mucha DIFERENCIA entre los ingresos que perciben por ejemplo los políticos y los trabajadores de otra clase social de la población. Esas diferencias tienen sus raíces en distintos fenómenos sociales, políticos y económicos; sin embargo, un economista diría “el ingreso per cápita en los países latinoamericanos está más DISPERSO que el ingreso per cápita de los países desarrollados”. El concepto de DISPERSIÓN resulta importante en casi todos los estudios, ya que puede darse el caso de poblaciones con igual valor central (Media aritmética, Mediana o Moda), pero una puede estar más DISPERSA que la otra, es decir, los promedios nos sirven para describir los datos representados por la tendencia central del conjunto. Por lo tanto, el promedio no logra por si mismo describir completamente a una colección de datos; se necesitan otros valores que nos indiquen el grado en que las observaciones estudiadas se apartan o VARÍAN con respecto al valor central, es decir, el GRADO DE VARIACIÓN O DISPERSIÓN. EJEMPLO Con los siguientes datos de dos poblaciones, analicemos primeramente sus medias aritméticas: Población A) : 1 (7) , 2 (11), 3 (13), 4 (9), 5 (5), 6( 3), 7( 2), 8(1) = 169 = 3.31 51 n = 51 Frecuencia 15 -13 -11 -9 -7 -5 -3 -1 -- 1 Histograma de los datos de la población A Media aritmética (promedio) = 3.31 2 3 4 5 6 7 8 Población B) : 1 ( 3 ), 2 ( 9 ), 3 ( 15 ), 4 ( 12 ), 5 ( 9 ) = 159 = 3.31 igual que la población A 48 n = 48 Frecuencia 15-13-11-9-7-5-3-1-- Histograma de los datos de la población B Media aritmética (promedio) = 3.31 1 2 3 4 1 2 3 4 5 5 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 28 No obstante que en las dos poblaciones se obtuvo una media aritmética igual de 3.31; al observar los dos histogramas nos damos cuenta que no son iguales PERO... ¿EN CUÁL HISTOGRAMA ESTÁN MÁS DISPERSOS LOS DATOS? En la población “A”____________ o en la población “B”_____________ Explica porque? ________________________________________________________ Por tal motivo las medidas de tendencia central, no dicen nada por sí mismas, por lo que se deben calcular las MEDIDAS DE DISPERSIÓN o LAS VARIACIONES de los datos. Por su cálculo las MEDIDAS DE DISPERSIÓN se dividen en absolutas y relativas, aún que existen mas, estudiaremos las siguientes: DISPERSIÓN ABSOLUTA: Rango o recorrido Rango intercuartilico o desviación cuartil Desviación Media Varianza Desviación Estándar DISPERSIÓN RELATIVA: Coeficiente de variación RANGO O RECORRIDO Como se ha indicado con anterioridad, el rango o recorrido es la diferencia entre el valor mayor y el valor menor de un grupo de datos o sea: RANGO = Dato mayor – Dato menor El rango es una medida de dispersión que no se utiliza mucho, aunque su cálculo es muy rápido. Si analizamos el rango de los histogramas anteriores tenemos que; En la primera población A su rango es: R=8–1=7 (su rango o recorrido es 7) En la segunda población B se rango es: R=5–1=4 (su rango o recorrido es 4) Por lo tanto y como 7 > 4, podemos señalar con seguridad que los datos de la primera población A), está más dispersa o desviados que los datos de la segunda población B). MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE DE VARIACIÓN, que son medidas de dispersión que tienen relación con la media aritmética, y por sus propiedades algebraicas son las de más frecuente aplicación y de mayor importancia. ¿QUE ES EL DESVÍO O DESVIACIÓN? El desvío de cada observación (o dato) es la DIFERENCIA ENTRE LA OBSERVACIÓN (o el dato) Y LA MEDIA ARITMÉTICA. El desvío es un concepto fundamental que nos permitirá comprender posteriormente otras medidas de dispersión. Por lo tanto. Desvío ( d ) = xi – x Pero hagamos un ejemplo… Si el conjunto de datos son: 4, 2, 5, 8, 2, 1, 7, 8, 5, y 7 su media aritmética es = 4.9 ¿Cuál es la dispersión de cada dato? ¿Cuál es el dato que está mas disperso? ¿Cuál es el dato menos disperso? Ordenamos los datos de menor a mayor 1, 2, 2, 4, 5, 5, 7, 7, 8, 8 y grafiquemos Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 29 1 2 4 7 8 9 x =4.9 Según la fórmula anterior, desvío es igual al dato menos la media aritmética por lo tanto tenemos: La desviación de cada dato será: Calculo del desvío Datos d = xi - 𝑥̅ desvío = - 3.9 1 1 – 4.9 = 2 2 – 4.9 = -2.9 Suman – 10.6 2 2 – 4.9 = -2.9 4 4 – 4.9 = -0.9 0.1 5 5 – 4.9 = 0.1 5 5 – 4.9 = 7 7 – 4.9 = 2.1 Suman 7 7 – 4.9 = 2.1 + 10.6 8 8 – 4.9 = 3.1 9 8 – 4.9 = 3.1 49/10= -10.6 4.9 +10.6= 0.0 De acuerdo a los resultados de la tabla ¿Cuál es el dato que está más disperso? Es el número 1, porque independientemente de su signo, su valor absoluto es el mas alto y es de – 3.9 de desvío. Ahora ¿Cuál es el dato menos disperso?. Es el número 5 porque está más cerca de la media aritmética y tiene un desvío de 0.1. Si observas la tabla anterior en muy importante obtener primero el valor de la media aritmética que en 49 nuestro caso fue de = 4.9 para después restarle al valor de cada dato, dicha media. 10 Por otro lado, al sumar los resultados NEGATIVOS de los desvíos nos arroja un valor de – 10.6 y al sumar los resultados POSITIVOS de los desvíos también nos da un valor de + 10.6 por lo tanto, se comprueba que la diferencia de los desvíos negativos y los positivos, nos da cero o en su defecto tiende a ser cero. Ahora resolvamos un problema para utilizar las medidas de dispersión DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE DE VARIACIÓN CON D A T O S N O A G R U P A D O S Número muestra 1 2 3 4 5 6 de DATOS de la resistencia del concreto kg/cm2 358 369 363 358 336 341 Un constructor, para asegurarse de la calidad de su obra, tomó seis muestras de concreto y obtuvo los resultados del cuadro. Al preguntarle uno de sus colaboradores ¿Cuál de todas las muestras del grupo era la más dispersa? Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 30 El constructor elaboró la siguiente tabla: Finalmente el constructor en base a la tabla y a los cálculos realizados le indicó a su colaborador: LA MUESTRA NÚMERO 5 ES LA MÁS DISPERSA, DEBIDO A QUE OBTUVO EL MAYOR VALOR ABSOLUTO DE DESVÍO CON -18.17. En este caso particular, el mayor valor tuvo el signo negativo lo que significa que la observación es menor que el valor de la media. Calculemos ahora la… Número de muestra 1 2 3 4 5 6 DESVIACIÓN MEDIA: Resistencia desvíos Kg/cm2 d = x1 – 𝑥̅ 358 369 363 358 336 341 Suma =2125 2125/6= Media =354.17 358 – 354.17 = 3.83 369 – 354.17 = 14.83 363 – 354.17 = 8.83 358 – 354.17 = 3.83 336 – 354.17 = -18.17 341 – 354.17 = - 13.17 Diferencia = 0.02 La desviación media es la media aritmética de los valores absolutos (ignorando el signo) de las desviaciones de cada elemento del conjunto de datos, es decir, hay que restar a la media aritmética cada valor del conjunto de datos, ignorando el signo, y sumamos todas las diferencias para dividirlo entre el número total de datos. N Su formula es Dm | x i i 1 x| N Sumatoria de los valores absolutos Número de datos Sigamos el mismo ejemplo y AUMENTEMOS UNA COLUMNA para los valores absolutos al cuadro anterior: Número de muestra 1 2 3 4 5 6 Datos resistencia de Desvío x - 𝑥̅ Valor absoluto | x - 𝑥̅ | 3.83 14.83 8.83 3.83 -18.17 -13.17 0.02 3.83 14.83 8.83 3.83 18.17 13.17 Suma = 62.66 358 369 363 358 336 341 2125 6 x= 354.17 Desviación media es igual a... La suma de los valores absolutos entre el número de muestras Desviación Media ( dm ) = 62 .66 = 10.44 6 Como se ve en el ejemplo anterior, La Desviación Media MIDE LA DISPERSIÓN ALREDEDOR DEL PROMEDIO, mas que la dispersión de ciertos valores, ya que el concepto de desviación media se origina cuando los desvíos se toman en valor absolutos, eliminando así el efecto de que la suma de los desvíos (x1 – x = 0 ) que es igual a cero (o tiende a cero). Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 31 Otra forma de hacerlo, es elevar al cuadrado los desvíos, por lo que surge la... VARIANZA (S2) : Que es la media aritmética (promedio) de los cuadrados de los desvíos y su fórmula es la siguiente: Suma de desvíos al cuadrado N S2 (x 1 i i x) Número de datos N Sigamos el mismo ejemplo para calcular la varianza ( S2 ): AUMENTAMOS OTRA COLUMNA a la tabla, ahora para los desvíos al cuadrado Número Datos de Desvío Valor Desvíos al de resistencia absoluto cuadrado x -𝑥̅ muestra | x - 𝑥̅ | (x - 𝑥̅ ) 2 1 358 3.83 3.83 144.67 2 369 14.83 14.83 219.93 3 363 8.83 8.83 77.97 4 358 3.83 3.83 14.67 5 336 -18.17 18.17 330.15 6 341 -13.17 13.17 173.45 Se tiende a Suma= 62.66 Suma = 830.83 2125/6 0.02 𝑥̅ = 354.17 Calculamos la varianza según la fórmula anterior y tenemos: Varianza (S2) = Suma de desvíos al cuadrado = 830.83 = 138.47 Número de datos 6 DESVIACIÓN ESTÁNDAR o TÍPICA ( S ): Es la raíz cuadrada de la varianza (S2 ) También se puede definir como la raíz cuadrada de la media aritmética de los cuadrados de los desvíos. 𝑆 2 = ∑(𝑥𝑖 −𝑥̅ )2 𝑁 En el mismo ejemplo tendríamos lo siguiente: Desviación Estándar 𝑆 = √𝑠 2 Varianza (S2) fue igual a = 138.47 por lo tanto… S = 138.47 = 11.77 Finalmente analicemos la medida de dispersión relativa llamada COEFICIENTE DE VARIACIÓN ( C.V ): Es el resultado de la división de la desviación estándar entre la media aritmética. Este tipo de coeficiente es muy útil para medir la DISPERSIÓN RELATIVA en base a la desviación estándar y la media y sirve básicamente para comparar muestras distintas en términos numéricos adimensionales, es decir, que mientras las demás medidas de dispersión tienen unidades, el coeficiente de variación carece de ellas. Su formula es... C. V. = S ( Desviación Estándar) . X ( Media Aritmética) En el mismo ejemplo que estamos analizando, el coeficiente de variación será: C. V = 11.77 . = 0.033 354.17 También se puede expresar en porcentaje al multiplicar por 100 esto es, (0.033) (100) = 3.30% C.V. = 3.30 % Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 32 UN RESUMEN DE LAS MEDIDAS DE DISPERSIÓN RANGO ( R )= Es la diferencia del valor mayor menos el valor menor en un conjunto de datos y se emplea de manera muy limitada, ya que es sólo una apreciación de la amplitud de los datos, y presenta poca estabilidad; se usa, casi siempre que se requiera rapidez. RANGO INTERCUARTIL ( Q ): es el resultado de la diferencia entre el tercer cuartil Q3 y el primero Q1. Su utilidad es baja y su valoración respecto a la cantidad de datos que incluye en su aplicación en una distribución normal es del 50 % DESVIACIÓN MEDIA ( dm )= Es el promedio de los valores absolutos (ignorando signos) de las desviaciones de cada dato; En ésta prueba se pueden calcular los desvíos tanto con la media aritmética como la mediana, según convenga. Actualmente ésta prueba casi no se usa. En una distribución normal, la cantidad de datos que incluye en su aplicación es de aproximadamente el 58%. VARIANZA ( S2 ) = Es el promedio de los cuadrados de los desvíos y se utiliza en análisis estadístico avanzado, pero tiene el inconveniente de que sus unidades son las mismas de la variable al cuadrado. DESVIACIÓN ESTÁNDAR ( S ) = Es la raíz cuadrada de la varianza o del promedio de los cuadrados de los desvíos. Es la más importante de todas las medidas de dispersión ya que incluye más o menos el 68% de los términos de una distribución normal, además por sus propiedades algebraicas se utiliza con facilidad en el análisis estadístico COEFICIENTE DE VARIACIÓN ( CV ) = Es el cociente entre la desviación estándar y la media aritmética. Generalmente se utiliza para comparar muestras distintas y saber cuál tiene mayor o menor dispersión en sus datos. EJERCICIO Los siguientes datos son las edades de dos grupos de estudiantes del SAETA-JUAREZ, de la generación Agosto -2005. A cada uno de los grupos le obtendrás las medidas de dispersión siguientes: DESVIOS de cada edad, DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN GRUPO “D” 20 ESTUDIANTES 16 19 22 27 Edad 16 16 18 19 19 19 19 20 21 16 19 22 29 18 20 22 29 19 21 22 30 Desvíos GRUPO “F” 25 ESTUDIANTES 15 17 18 19 21 19 21 23 32 Valor absoluto Desvíos al cuadrado Edad 15 15 15 16 16 17 17 17 18 Desvíos 15 17 18 20 22 15 17 19 20 22 Valor absoluto Recopilación: ING. CESAR NAVARRO ESPINOSA 16 16 18 18 19 19 21 21 29 30 Desvíos al cuadrado CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 21 22 22 22 22 23 27 29 29 30 32 33 18 18 18 19 19 19 19 20 20 21 21 21 22 22 29 30 REALIZA TUS CÁLCULOS DE ACUERDO A LAS FÓRMULAS CORRESPONDIENTES, HASTA OBTENER SUS RESULTADOS PARA CADA GRUPO. AHORA CONTESTA ¿CUÁL DE LOS DOS GRUPOS TIENE SUS DATOS MÁS DISPERSOS? Respuesta:_______________ ¿Porque?___________________________________________________ LAS MEDIADAS DE DISPERSIÓN P A R A DATOS AGRUPAD OS OBTENER LA DESVIACIÓN MEDIA (dm), VARIANZA (S2), DESVIACIÓN ESTANDAR (S) Y COEFICIENTE DE VARIACIÓN (C.V.) Completa las siguientes filas de las columnas para que calcules la Desviación media (dm), la Varianza (S2) la Desviación estándar o típica ( S ). Intervalo clase (estaturas ) 121.5 – 126.5 126.5—13.1.5 131.5—136.5 136.5—141.5 141.5—146.5 146.5—151.5 151.5—156.5 156.5—161.5 161.5—166.5 Totales Marca de clase (𝑣𝑖 ) Frecuencia (alumnos) (𝑓𝑖 ) Frecuenci a por marca de clase 𝑣𝑖 𝑓𝑖 Marca de clase al cuad por frec abs Marca de clase por frec al cuad 2 (𝑣𝑖 𝑓𝑖 ) Frec. media 𝑓𝑖 𝑥̅ 𝑣𝑖2 𝑓𝑖 124 134 144 149 159 2 3 8 23 27 20 16 3 2 n = 104 Recopilación: ING. CESAR NAVARRO ESPINOSA por CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 34 Media aritmética = 15041/ 104 = 144.625 = 144.62 Aquí o aun lado de la página, realiza tus cálculos con orden y limpieza; y utilizando las formulas correspondientes hasta que obtengas la Desviación media, Varianza y Desviación estándar. ∑𝑣 𝑓 Media aritmética 𝑥̅ = 𝑛𝑖 𝑖 Formula para obtener la desviación media Formula para obtener la varianza 𝑆 2 = 1 𝐷𝑚 = 𝑛 ∑|𝑣𝑖 𝑓𝑖 − 𝑓𝑖 𝑥̅ | 1 [∑ 𝑣𝑖2 𝑓𝑖 𝑛−1 − (∑ 𝑣𝑖 𝑓𝑖 )2 ] 𝑛 Formula para obtener la desviación estándar 𝑆 = √𝑠 2 𝑆 Formula para obtener el coeficiente de variación en porcentaje 𝐶. 𝑣. = 𝑥̅ RESULTADOS Desviación media =_______________ Varianza = ____________________ Desviación estándar = ______________ Coeficiente de variación = _____________ Calcula las medidas de dispersión (desviación media, varianza, desviación estándar y coeficiente de variación) de los siguientes dos ejercicios. Intervalos de Marca de Frecuencia Clase Clase (x) Absoluta (f) 148.5 152.5 150.5 3 152.5 156.5 154.5 7 156.5 160.5 158.5 13 160.5 164.5 162.5 12 164.5 168.5 166.5 13 168.5 172.5 170.5 5 172.5 176.5 174.5 2 TOTAL = 55 RESULTADOS Desviación media =_______________ RESULTADOS Desviación media =_______________ Varianza = ____________________ Varianza = ____________________ Desviación estándar =____________ Desviación estándar =____________ Coeficiente de variación = ___________ Coeficiente de variación = ___________ Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 35 ACTIVIDADES DE APRENDIZAJE X Calcula las medidas de dispersión (desviación media, varianza, desviación estándar y coeficiente de variación) de los siguientes dos ejercicios. Intervalos de Marca de Frecuencia Clase Clase (x) Absoluta (f) 148.5 152.5 150.5 3 152.5 156.5 154.5 7 156.5 160.5 158.5 13 160.5 164.5 162.5 12 164.5 168.5 166.5 13 168.5 172.5 170.5 5 172.5 176.5 174.5 2 TOTAL = 55 UNIDAD II:P R O B A B I L I D A D I N T R O D U C C I Ó N: PRIMERA PARTE TEORÍA DE CONJUNTOS Conjunto es una colección de conceptos o de objetos perfectamente especificados, en tal forma que se puede afirmar con certeza si cualquier objeto dado pertenece o no a la colección Ejemplos: Los ríos del Estado de Sinaloa. Las 6 primeras letras del alfabeto. Los números 1, 2, 3, y 4. Para identificar un conjunto se usaran letras mayúsculas del alfabeto por ejemplo a los conjuntos antes mencionados les llamaremos conjuntos A, B, y C respectivamente. Hay dos maneras de describir un conjunto: Por el método de la lista, si los conjuntos tienen pocos elementos, los cuales se listan dentro de unas llaves. Por el método de la regla, si los conjuntos tienen muchos elementos se escribe dentro de unas llaves una regla que describa los elementos del conjunto. Ejemplificando los tres primeros ejemplos tendremos, para los ríos de Sinaloa por el método de la lista será: A={Choix, Fuerte, Sinaloa, Mocorito, Culiacán, San Lorenzo, Elota, Piaxtla, Presidio, Baluarte, Cañas} Por el método de la regla será: A={x/x es uno de los ríos de Sinaloa}, y se lee el conjunto de las xs, tal que xs es un rio de Sinaloa. Para el conjunto de las 6 primeras letras del alfabeto a través del método de la lista será: B={a,b,c,d,e,f} Por el método de la regla será: B={x/x son las primeras 6 letras del alfabeto}, y se lee el conjunto de las x s, tal que xs son las primeras 6 letras del alfabeto. Finalmente para el conjunto de los números 1,2,3,y 4, por el método de la lista será: C={1,2,3 y 4} Por el método de la regla será: C={x/x son los primeros 4 números positivos}, y se lee el conjunto de las x s, tal que xs son los primeros 4 números positivos. Cuando los conjuntos tienen pocos elementos es fácil listarlos, pero cuando los conjuntos tienen muchísimos elementos es imposible, por eso es muy recomendable el método de la regla. Por ejemplo el conjunto de los números en el intervalo [0,1], es un conjunto infinito, entonces por el método de la regla tenemos: A={x/ 0 ≤ 𝑥 ≤ 1} Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 36 SIMBOLOGÍA. ∈ significa “es un elemento de” ∉ significa “no es un elemento de” Por ejemplo 2 es elemento del conjunto A, y 3 no lo es: 2∈A y 3∉A Ejemplos. Sean A={x/ 0 < 𝑥 < 1}, B={x/ 0 ≤ 𝑥 < 1} C={x/ 0 < 𝑥 ≤ 1} D={x/ 0 ≤ 𝑥 ≤ 1} Por lo tanto: 0∈B, 0∉A, 0∈D y 0∉C 1∈D, 1∉B, 1∈C y 1∉A, ETC. EJERCICIO completar el ejemplo anterior. Igualdad de conjuntos: Dos conjuntos son iguales cuando tienen los mismos elementos A=B, y el caso contrario será A≠B, A es diferente de B, y donde el orden de los elementos no es relevante. Subconjunto ⊂: si en dos conjuntos A y B todo elemento de A es elemento de B, entonces A es subconjunto de B y simbólicamente será A⊂B, y el caso contrario cuando A no es subconjunto de B, se simboliza así: A⊄B Subconjunto propio: si A⊂B, pero A≠B, diremos que A es subconjunto propio de B Conjunto Vacio: es un conjunto que no tiene elementos y se denota con el símbolo ∅ (fi minúscula) Conjunto universal: es el conjunto al cual pertenecen todos los demas conjuntos a los cuales se les llama subconjuntos, y se representa con la letra mayúscula U Diagrama de Venn: es un esquema donde se representan el conjunto universal y los subconjuntos del conjunto universal, así el conjunto universal se representa con un rectángulo y los subconjuntos con curvas cerradas dentro del rectángulo. Estos Diagramas también son conocidos como diagramas de Venn – Euler. U A B C Ejemplo: sea U={1,2,3,4,5,6,7,8,9,0} y A={1,2,3,4} B={4,5,6} C={7,8,9,0} D={9,0} La representación de estos conjuntos será U A 1 3 C 7 D 8 9 0 0 2 4 8 5 6 B EJERCICIO con el mismo conjunto universal y con los subconjuntos: A={1, 3,5} Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 37 B={4,5,6} C={6,8,9,0} D={8,9} Construir un diagrama de Venn ACTIVIDADES DE APRENDIZAJE XI A={x/−1 < 𝑥 < 1}, B={x/−1 ≤ 𝑥 < 1} C={x/−1 < 𝑥 ≤ 1} D={x/−1 ≤ 𝑥 ≤ 1} Determinar cuando el -1 pertenece o no a los conjuntos A,B,C,D y de igual manera con el 1 Del conjunto U={1,2,3,4,5,6,7,8,9,0}, y los subconjuntos: A={,5,7,8,0} B={8,4,3,0} C={2,3,4,6,8,9} D={4,6} Construir un diagrama de Venn ÁLGEBRA DE CONJUNTOS En el álgebra de conjuntos se cuenta con tres operaciones: La unión La intersección Y el Complemento de un conjunto con respecto al conjunto universal. El resultado de cada una de estas operaciones es también un conjunto, el cual es Subconjunto del conjunto universal. UNION DE CONJUNTOS (∪) Sean A y B dos conjuntos y U su conjunto universal. Así la unión de A y B (A∪B) es el conjunto cuyos elementos pertenecen por lo menos a uno de los conjuntos A o B. Simbólicamente escribimos A∪B= {x/x es elemento de A o x es elemento de B o x es elemento de ambos} En el diagrama de Venn se representa por el área sombreada, ejemplo: U U A B A∪B B Ejemplos : a) Si A = { 2, 7, 8 }, B = { 3, 5, 9}, entonces : = { 2, 3, 5, 7, 8, 9} Son los elementos que esten en A o que esten en B. En Diagramas de Venn : AUB Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 38 b) Si A = { María, Jorge, Luga, Tere }, B = { Tere, Kelvin, Guillermo}, entonces : = { Guillermo, Jorge, Kelvin, Luga, María, Tere } En Diagramas de Venn : AUB c) si U={1,2,3,4,5,6,7,8,9,0} y A={1,2,3,4} B={4,5,6} La representación de estos conjuntos será U A 1 3 2 4 5 6 B A∪B INTERSECCIÓN DE CONJUNTOS Sean A y B dos conjuntos y U su conjunto universal, entonces la intersección de los dos conjuntos es el conjunto integrado por los elementos que pertenecen a los dos conjuntos al A al B, la notación es A∩B es decir A∩B = {x/x es elemento del conjunto A y x es elemento del conjunto B}, al construir el diagrama únicamente se sombrea el lugar donde están los elementos que pertenecen a ambos conjuntos. EJEMPLO enDiagramas de Venn : Ejemplos : a) Si A = { 2, 7, 8 }, B = { 3, 5, 9}, entonces : = ∅ En Diagramas de Venn : A este tipo de intersección de conjuntos donde la intersección es el conjunto vacio se llama conjuntos ajenos o disjuntos Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 39 b) Si A = { María, Jorge, Luga, Tere }, B = { Tere, Kelvin, Guillermo}, entonces : = { Tere } En Diagramas de Venn : COMPLEMENTO El complemento de A con relación al conjunto Universal (U), que se representa como A', es el conjunto de los elementos de U que no son de A. Notación : La forma simbólica de representar A' es : A' = { X U | X A } A' en Diagramas de Venn : Ejemplos : a) Si U = { 2, 3, 5 , 7, 8, 9}, y A = { 2, 7, 8 } entonces : A' = { 3,. 5, 9 } En Diagramas de Venn : a) Si U = { Guillermo, Jorge, Kelvin, Luga, María, Tere } y A = { María, Jorge, Luga, Tere }, entonces : A' = { Guillermo, Kelvin } En Diagramas de Venn : Ejemplo : Si A = { c, f, i }; B = { c, d, e, f, g }, y C = { d, e, g}, entonces : a) = { c, d, e, f, g, i } y en Diagrama de Venn : b) = { c, f } y en Diagrama de Venn : Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 c) = 40 PROBABILIDAD Y ESTADÍSTICA porque A y C son ajenos y en Diagrama de Venn : d) C' con relación a B es C' = { c, f } y en Diagrama de Venn : e) f) C g) A h) ( = { d, e, g } y en Diagramas de Venn : Puede notarse en la figura anterior que B y en Diagramas de Venn : Puede notarse en la figura anterior que (C B) = B ) B y en Diagramas de Venn : =C =C De todo lo visto podemos obtener: (Ac)c = A Uc =∅ ∅c =U 𝐴 ∪ 𝐴𝑐 = 𝑈 𝐴 ∩ 𝐴𝑐 = ∅ EJERCICIO Del siguiente conjunto universal: U = {0,1,2,3,4,5,6,7,8,9} y de los conjuntos: A = {1,3,6,7,9} ; B = {0,1,2,3,4} ; C = {4,5,7,8,9} ; D = {2,4,6,8}, realice y represente en Diagramas de Venn c AUB; B∩C; y D ACTIVIDADES DE APRENDIZAJE XII Del siguiente conjunto universal: U = {0,1,2,3,4,5,6,7,8,9} y de los conjuntos: A = {0,3,7,9} ; B = {0,1,2,3} ; C = {4,5,7,8} ; D = {4,6,8}, realice y represente en Diagramas de Venn c AUC; B∩D; y D 2° SIMULACRO DE EXAMEN 1) Calcula la media aritmética, la mediana y la moda de las series de valores siguientes: Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 41 a) 2, 3, 7, 4, 5, 4, 8. Media Aritmética =___________________________________________= ________ Mediana = _________________________________________________ = ________ Moda = ___________________________________________________ = ________ De las edades de 40 maestros de los C.B.T.a 153, calcula las MEDIDAS DE TENDENCIA CENTRAL (MEDIA, MEDIANA Y MODA) Y LAS MEDIDAS DE DISPERSIÓN (DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN) Tanto de los datos sin agrupar como agrupados. Edades: 36, 53, 35, 28, 30, 36, 45, 29, 43, 28, 30, 46, 39, 54, 47, 44, 34, 40, 50, 38, 47, 56, 48, 42, 39, 47, 53, 51, 38, 29, 48, 52, 47, 46, 41, 40, 45, 39, 47, 38. Calcula las medidas de dispersión (desviación media, varianza, desviación estándar y coeficiente de variación) de los siguiente ejercicio. Intervalos de Marca de Frecuencia Clase Clase Absoluta (x) (f ) (59.5 , 63.5] 61.5 6 (63.5 , 67.5] 65.5 6 (67.5 , 71.5] 69.5 8 (71.5 , 75.5] 73.5 11 (75.5 , 79.5] 77.5 8 (79.5 , 83.5] 81.5 9 (83.5 , 87.5] 85.5 2 TOTAL = 50 Del siguiente conjunto universal: U = {0,1,2,3,4,5,6,7,8,9} y de los conjuntos: A = {1,3,6,7,0} ; B = {0,1,2,4,5} ; C = {4,5,7,8,9} ; D = {2,4,6,8}, realice y represente en Diagramas de Venn c AUB; B∩C; y D Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 42 I N T R O D U C C I Ó N: SEGUNDA PARTE El problema central de la estadística es el manejo del azar y la incertidumbre. Los eventos aleatorios siempre se han considerado como misteriosos. El libro de Job ponderó hace mucho tiempo la función del intento divino en los acontecimientos al azar y fue, varios siglos más tarde, que se usó el poder de las matemáticas para explicar la aleatoriedad. Los orígenes de las matemáticas de la probabilidad se remontan al siglo XV, las primeras aplicaciones se relacionan básicamente a los juegos de azar. Los jugadores ganadores utilizaron el conocimiento probabilístico para desarrollar estrategias de apuestas en loterías, casinos, carreras de caballos etc. Los avances científicos de los siglos que siguieron al Renacimiento, enfatizando la observación y la experimentación cuidadosa, dieron lugar a la teoría de la probabilidad para estudiar las leyes de la naturaleza y los problemas de la vida cotidiana. CONCEPTOS BÁSICOS Con el objeto de familiarizarse con el concepto de la probabilidad comenzaremos por dar una definición de probabilidad que sólo es válida cuando todos los resultados son igualmente probables. Si hay n posibilidades igualmente probables y una de ellas debe ocurrir, entonces la probabilidad de que ocurra algún evento o suceso de k de estas n posibilidades (espacio muestral) es k / n. Las palabras SUCESO O EVENTO aquí los utilizaremos como sinónimos. Si un experimento se repite muchas veces, digamos n y si el suceso o evento E1 se observa k veces, entonces la probabilidad S del suceso E1 es el cociente de la razón k / n. Probabilidad A= P(A) = núm. de veces que el suceso E1 ocurrió Total de sucesos realizados n = k La experiencia justifica esta igualdad, pues a medida que n se hace mayor, la frecuencia relativa se aproxima más a la probabilidad matemática. Este concepto se utiliza para definir la razón citada como probabilidad empírica, algunos autores la citan como FORMULA BÁSICA de la probabilidad. Otro concepto importante es que la probabilidad de que suceda un evento es un número real entre cero y uno. Entre más pequeño sea este número, el evento es menos probable, y entre más cercano a uno sea este número, el evento es más probable. Cuando la probabilidad es igual a ½ el evento tiene la misma probabilidad de ocurrir que de no ocurrir. Coloquialmente también hablamos de probabilidades empleando porcentajes. Así la posibilidad de que al tirar el dado el resultado sea 2 o 5 es dividió 1/3 por 100. 1 6 1 2 1 6 6 3 + = = , que sería igual al 33.33 % ya que se ¿Cuál es la probabilidad de obtener un número impar al lanzar un dado?. S = ( 1, 2, 3, 4, 5, 6 ) E = ( 1, 3, 5, ) p(E)= 3 = 1 6 2 La probabilidad es de ½ o 0.5 en porcentaje será el 50% ¿Cuál es la probabilidad de extraer una ficha de dominó con 7 puntos de una caja, sin ver?. S = (6,6), (6,5), (6,4), (6,3), (6,2), (6,1), (6,0), (5,5), (5,4), (5,3), (5,2), (5,1), (5,0), (4,4), (4,3), (4,2), (4,1), (4,0), (3,3), (3,2), (3,1), (3,0), (2,2), (2,1), (2,0), (1,1), (1,0), (0,0) E = { (6,1), (5,2), (4,3) } p(E) = 1 28 + 1 28 + 1 28 = 3 28 = 0.en porcentaje será el 10.71% MODELOS MATEMÁTICOS En la teoría de probabilidad matemática se define la probabilidad con los tres axiomas de Kolmogorov. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 43 Axiomas de Kolmogorov Primer axioma La probabilidad de un suceso A es un número real entre 0 y 1. 0 ≤ 𝑃(𝐴) ≤ 1 Segundo axioma Ocurre un suceso de la muestra de todos los sucesos del espacio muestral con probabilidad 1. 𝑃(𝐴) = 1 la probabilidad del espacio muestral es igual a 1: Tercer axioma Si A1, A2 ... son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de intersección vacía dos a dos), entonces: . ANALÍSIS DE FUNCIONES PERMUTACIONES Y COMBINACIONES Para pronosticar el triunfador de una elección municipal necesitamos al menos conocer quiénes son los candidatos de los distintos partidos políticos, así como para pronosticar si la selección mexicana de fútbol ganará un partido, es necesario saber si en caso de empate el partido se decidirá en tiempos extras o por medio de penales. En general, NO ES POSIBLE HACER PREDICCIONES RAZONABLES A MENOS DE QUE CONOZCAMOS LO QUE ES POSIBLE, es decir, es necesario conocer LO QUE ES POSIBLE antes de juzgar LO QUE ES PROBABLE. Por lo tanto estudiaremos someramente cómo determinar en algunos casos lo que es posible. En el estudio de “lo que es posible” hay esencialmente dos tipos de problemas. Existe el problema de hacer una lista de todo lo que puede suceder en una situación determinada y se tiene el problema de determinar cuántas cosas diferentes pueden suceder. El segundo tipo de problema es de especial importancia porque hay muchas situaciones en que no necesitamos una lista completa y por tanto, podemos ahorrarnos una gran cantidad de trabajo. DIAGRAMA DE ÁRBOL Presión sanguínea Tipo sanguíneo BAJA NORMAL Aunque el primer tipo de problema puede parecer directo y sencillo, existen problemas que ALTA A ilustran que esto no siempre es el caso; BAJA hagamos unos ejercicios para reflexionar. En un estudio médico se clasifica a los B NORMAL pacientes de acuerdo con el tipo de sangre que tengan, ya sea, tipo A; B, AB u O y también de AB ALTA BAJA acuerdo con su tipo de presión sanguínea, ya sea baja, normal o alta. ¿De cuántas maneras distintas se puede O NORMAL clasificar a un paciente? ALTA Este tipo de problemas se puede manejar BAJA sistemáticamente trazando un DIAGRAMA DE ÁRBOL como el siguiente, donde se puede apreciar que la respuesta es 12. NORMAL Comenzando por la parte superior, el primer ALTA camino a lo largo de las “ramas” corresponde a un paciente con tipo de sangre A y presión sanguínea baja, el segundo camino a un paciente con tipo de sangre A y presión sanguínea normal … y el duodécimo camino corresponde a un paciente que tiene sangre tipo O y una presión sanguínea alta. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 44 La respuesta que obtuvimos es de 4 por 3 = 12, específicamente es el producto del número de tipos de sangre por el número de niveles de presión sanguínea. Otro ejemplo: ¿Cuántas palabras de tres letras se pueden formar si se dispone de un alfabeto con dos letras; a y b.? (Nota: Son permisibles palabras como bba) Solución: Si tenemos 2 letras (a, b) y formamos la palabra con tres letras tendremos 23 = 2 x 2 x 2 = 8 esto quiere decir que formaremos ocho palabras con tres letras. Para comprender mejor hagamos otro “DIAGRAMA DE ÁRBOL” Letra Inical Letra central final letra palabra formada a ………………….. aaa a b …………………… a a b a a …………………… a b a b b ………………….. abb a ………………….. baa b …………………. bab a …………………. bba b …………………. bbb a b b PROCESO DE CONTAR Si un primer suceso o evento puede efectuarse de p1 maneras diferentes, y si después de que este suceso ha sido efectuado, un segundo suceso puede efectuarse de p2 maneras diferentes, entonces los dos sucesos pueden verificarse siguiendo el orden indicado de p1. p2 maneras diferentes. Analiza con cuidado: De cuantas maneras diferentes se pueden seleccionar parejas de diferentes sexo de un grupo de 4 hombres y 6 mujeres? Solución: Como cada hombre puede ser seleccionado de cuatro maneras diferentes y cada mujer puede ser seleccionada de 6 maneras diferentes; entonces, cada pareja puede ser escogida de: 4 ( 6 ) = 24 maneras diferentes. Si el suceso o evento incluye más de dos sucesos diferentes podemos ampliar el principio multiplicativo, de manera que si después de haber ocurrido los dos primeros sucesos, puede ocurrir un tercero de p3 maneras diferentes, un cuarto de p4 maneras diferentes, y por último un n-ésimo de pn maneras diferentes, entonces los sucesos pueden ocurrir en el orden siguiente: p1 p2 p3 p4 …, pn maneras diferente. Reflexiona y piensa: Una cafetería ofrece una comida especial que consiste en un emparedado (usando una de ocho carnes distintas y uno de cuatro tipos diferentes de pan), una de cuatro clases distintas de sopa y una de tres bebidas diferentes. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 45 ¿De cuántas maneras distintas una persona puede seleccionar una de estas comidas especiales? Solución: Dado que p1 = 8, p2 = 4, p3 = 4, p4 = 3, hay (8)(4)(4)(3) = 384 maneras diferentes en que se puede seleccionar una comida especial. Sigue pensando y analizando: Un examen de estadística, consta de quince preguntas de opción múltiple, de las cuales cada una tiene cuatro posibles respuestas. ¿De cuántas maneras distintas un estudiante puede marcar una respuesta para cada pregunta? Solución: puesto que p1=p2=p3=…= p15 = 4, en total hay 4.4.4.4.4.4.4.4.4.4.4.4.4.4.4 = 1,073,741,824 diferentes maneras en que un estudiante puede marcar una respuesta para cada pregunta. Nótese que sólo en una de las 1,073,741,824 posibilidades todas las respuestas son correctas. Y si queremos saber todas las respuestas incorrectas? será: 3.3.3.3.3.3.3.3.3.3.3.3.3.3 = 14,348,907 todas las respuestas incorrectas. En una calculadora científica este tipo de problema se resuelve de la siguiente forma: p15 (o quince preguntas) tiene 4 posibles respuestas = cuatro respuestas por las 15 preguntas tenemos = 415 ponemos 4 y tecleamos X y , ponemos 15 y la tecla = y nos arroja el resultado 1,073,741,824 El principio multiplicativo nos permite en muchos casos calcular el número de posibilidades sin necesidad de listar todas ellas o de desarrollar un diagrama de árbol excesivamente grande. ES IMPORTANTE TENER EN CUENTA QUE PARA APLICAR ESTA REGLA, NO DEBE HABER RESTRICCIONES EN LAS COMBINACIONES POSIBLES. FACTORIAL ¿QUE ES EL FACTORIAL DE UN NÚMERO? Uno de los principales conocimientos que nos servirán como base para el cálculo de las técnicas de conteo (permutaciones y combinaciones), es el factorial de un número. Su definición y algunos ejemplos se comentan enseguida. El producto de cualquier número entero positivo n por todos los enteros menores que n se llama FACTORIAL de n y se expresa con el símbolo n!, por lo tanto: 0! = 1 por definición 1! = 1 (1) = 1 2! = 2 (1) = 2 3! = 3 (2) (1) = 6 4! = 4 (3)(2)(1) = 24 5! = 5 (4)(3)(2)(1) = 120 . . . n! = (n) (n-1) (n-2) ,…(1) El factorial de los primeros números enteros positivos se pueden obtener directamente utilizando una calculadora, para números mayores se obtienen con la formula aproximada de Stirling o consultando tablas elaboradas con resultados. En tu calculadora científica pon 6 y oprime la tecla n! y te arrojará 720, que es el factorial de 6. Cuanto es el factorial de 7! = _____________________ 8! = _____________________ 9! =______________________ 10! = ______________________ P E R M U T A C I O N (P). Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 46 Frecuentemente nos interesamos en un espacio muestral que contenga como elementos a todos los órdenes o arreglos posibles, de un grupo de objetos. Por ejemplo deseamos conocer cuantos arreglos son posibles para sentar a 6 personas alrededor de una mesa, o podemos preguntar cuantas órdenes diferentes posibles para sacar dos billetes de lotería de un total de 20. a estos diferentes arreglos se llaman permutaciones. Permutación: es un arreglo de todo un conjunto de objetos o parte del mismo. Ahora consideremos tre letras: a, b, y c, las posibles permutaciones son: abc,, acb, bac, bca, cab, cba, asi vemos que hay 6 posibles arreglos. Utilizando el teorema podemos contar los arreglos, sin tener que listar las diferentes órdenes u o arreglos. Así hay tres posiciones para la primera letra “a” entonces n1 = 3 Para la letra “b” hay dos posiciones n2 = 2 Para la letra “c” hay una posición n3 = 1 Entonces el resultado será: n1 n2 n3 = 3x2x1=6 formas En general n objetos pueden arreglarse en n(n-1)(n-2)(n-3)(n-4)…(n-k). este producto se representa por n!, que se lee “n Factorial”, por lo tanto 3 objetos se pueden arreglar: 3!= 3x2x1=6 formas Entonces el numero de permutaciones de n objetos distintos es n! o n Pn n! Ejemplo 1: el número de permutaciones de 4 letras a, b, c, d es 4!= 4x3x2x1=24 arreglos Ejemplo 2: Permutar los elementos de un conjunto de TRES tomando todos a la vez, es igual a 3! = 6 los arreglos resultantes son los siguientes 123,- 132, - 213, - 231, - 312, - 321. La fórmula que se utiliza para estos casos es o n! n Pn n! Ejemplo 3: ¿De cuantas maneras distintas se pueden asignar a diez profesores las diez secciones de un curso de economía? n = 10, obtenemos: 10 P10 10! 3,628,800 Aquí si aplicamos la ley de la multiplicación sería: 10 (9)(8)(7)(6)(5)(4)(3)(2)(1) = 3,628,800 Fíjate que aquí si se multiplican toda la serie de los números. Ejemplo 4: Obtener cuántos números pueden formarse con los dígitos 1,2,3,4,5 sin repetir ningún dígito, n=5 P 5! 120 5 5 Si aplicamos la ley factorial sería 5(4)(3)(2)(1) = 120. PERMUTACIONES DE n OBJETOS DISTINTOS TOMADOS DE R A LA VEZ ( n Pr ) Si estamos eligiendo de un conjunto de objetos, algunos de ellos en un orden o jerarquía determinada estamos haciendo una permutación, esto es, si al seleccionar o acomodar (r) objetos de un conjunto de (n) objetos distintos, cualquier arreglo (u orden) de estos objetos se conoce como, una permutación. En cada arreglo pueden participar parte o la totalidad de los elementos del conjunto. Permutaciones tomando sólo “parte de los elementos” del conjunto a la vez En esta técnica de conteo en la que EL ORDEN SI IMPORTA en que aparecen cada elemento del conjunto y en donde en cada arreglo participan una parte de los elementos del conjunto. También le llamaremos permutaciones de n elementos diferentes en grupos de r elementos. Es decir, en cada arreglo aparecerá parte de los elementos del conjunto y se utilizará la siguiente fórmula: n Pr = n! (n r )! Ejemplo: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los números 1,2,3 tomando DOS a la vez? n=3 n = 1 2 3 3! 3! 6 p 6 r=2 3 2 (3 2)! 1! 1 Serían: 12; 13; 21; 23; 31; 32. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 47 Lo que hace que un arreglo sea diferente a otro es el orden en que aparecen los elementos del conjunto en cada arreglo. Para una PERMUTACIÓN, el arreglo {1,2} es diferente al arreglo {2,1}. Entonces, esta técnica de conteo es idónea para problemas en los que es importante la jerarquía que tienen algunos elementos sobre otros. Algunos ejemplos de ello, es cuando se requiere conocer el orden de llegada de personas, formas posibles de arranque y llegada en una justa atlética, colocación de objetos, la jerarquía en algunos puestos administrativos, la jerarquía en equipos médicos, el orden en que deben tomarse o medirse algunos objetos en experimentos, etcétera. Ejemplo: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los números 1,2,3,4 tomando DOS a la vez? n=4 r=2 4 p2 4! 4! 24 12 (4 2)! 2! 2 n = 1 2 3 4 Serían: 12; 13; 14; 21; 23; 24; 31; 32; 34; 41; 42; 43; De nuevo te recordamos que es muy importante que te fijes que aquí si interesa el orden en que se seleccionaron los dos números (la pareja) de entre los cuatro números (1,2,3,4) y resulta que hay 12 permutaciones. Ejemplo: ¿Cuántas diferentes quintas ( r ) de baloncesto pueden formarse con 7 jugadores disponibles (n) para jugar cualquier posición? 7 p5 7! 5040 2520 (7 5)! 2 Se pueden formar 2520 quintas diferentes con 7 jugadores disponibles. Observa como utilizando la ley de la multiplicación utilizando un ORDEN nos arroja el mismo resultado: 7(6)(5)(4)(3)= o sea 7 opciones serían para la primer quinta, 6 la segunda quinta, 5 la tercer quinta, 4 la cuarta quinta y por último 3 la quinta, quinta. Si lo multiplicas nos dará igual = 2520. Ejemplo: el entrenador de la selección mexicana de fútbol debe decidir cómo se deben tirar los cinco primeros penales obligatorios en caso de un empate. ¿Cuántas elecciones posibles puede considerar? Partimos de que ya sabes que un equipo de fútbol tiene 11 jugadores. 11 p5 11! 39916800 39916800 55440 (11 5)! 6! 720 Otra vez, utilizando la ley de la multiplicación sería: 11(10)(9)(8)(7)== 55440 elecciones posibles para determinar cómo tirarán los cinco penales obligatorios. EJERCICIO UTILIZA LA HOJA DE AUN LADO O DE ATRAZ, PARA RESOLVER LOS SIGUIENTES PROBLEMAS DE CONTEO (Diagrama de árbol y principio multiplicativo,) 1) ¿De cuántas maneras diferentes se puede arreglar uno de los viajes especiales de fin de semana a 10 ciudades distintas, por avión, tren o autobús, que ofrece una agencia de viajes?: 2) En un restaurante ofrecen 5 tipos de comidas (a,b,c,d,f); 4 tipos de sopas (1,2,3,4); y 3 tipos de postres( x,y,z), ¿Cuáles son el número total de posibles formas de arreglos? ELABORA UN DIAGRAMA DE ÁRBOL PARA ESTE EJERCICIO EN LA PÁGINA DE AÚN LADO. 3) Un examen de 12 preguntas consiste en 5 preguntas de elección múltiple, cada una con 4 posibles respuestas, y la otra parte del examen con 7 preguntas de falso y verdadero. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 48 a) ¿De cuántas maneras (diferentes) se puede contestar el examen? b) ¿En cuantas maneras es posible responder el examen y obtener todas las respuestas mal? 4) Una persona piensa comprar cierto automóvil. El fabricante ofrece cualquier combinación de las siguientes alternativas: SEIS colores diferentes; DOS tipos de motor; TRES tipos de rines; Transmisión manual o automática; sin radio, con radio AM-FM, con radio AM-FM-Tocacintas o con radio AM-FM-CD; y sin aire acondicionado o con aire acondicionado. Cada comprador debe hacer UNA elección con respecto al color, motor, rines, transmisión, radio y aire acondicionado. ACTIVIDADES DE APRENDIZAJE XIII 1) De una ciudad A a otra B hay 4 caminos; a su vez de, la ciudad B a la C hay 6 caminos, si todos los caminos son diferentes, de cuantas formas es posible: a) Viajar de A hasta C pasando por B b) Hacer el viaje “redondo” saliendo de A hasta C pasando por B y de C hasta A pasando por B c) Hacer el viaje “redondo” desde A hasta C pasando por B pero sin utilizar el mismo camino más de una vez. Ciudad Ciudad 2) Sea S = { a,b,c,}, Ciudado sea un conjunto con tres elementos genéricos, calcular las posibles formas en que C B se pueden permutar A tomando todos los objetos a la vez 3) Sea W = { A,B,C,D} un conjunto con cuatro elementos, calcular las posibles formas en que se pueden permutar tomando tres a la vez. 4) Sea X = { a,b,c,d,e,f} un conjunto con seis elementos, calcular las posibles formas en que se pueden permutar tomando dos a la vez. COMBINACIONES Una combinación es un subconjunto o un arreglo de todos o parte de los objetos de un conjunto sin considerar el orden de los objetos, donde el número total de combinaciones posibles de un conjunto de objetos tomados todos a la vez es 1. Por ejemplo, los arreglos posibles del conjunto de letras {a,b} son ab y ba. Puesto que el orden del arreglo NO es considerado, el arreglo ab es el mismo que ba. Por tanto, hay solamente una combinación posible para el conjunto. Combinaciones “tomando parte del conjunto” de elementos Esta técnica de conteo consiste en obtener en cualquier orden grupos de r elementos de un total disponible de n elementos diferentes y en cada arreglo participan una parte de los elementos del conjunto. Se utilizará la siguiente fórmula: n Cr n! r!(n r )! HAGAMOS LOS MISMOS EJEMPLOS QUE HICIMOS EN PERMUTACIONES ÚNICAMENTE QUE AHORA CON COMBINACIONES PARA QUE ANALICES SUS DIFERENCIAS. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 49 Para iniciar: Cuantas diferentes combinaciones o grupos se pueden realizar con los números 1,2,3 tomando DOS a la vez? n=3 r=2 3 3! 3! 6 3 2!(3 2)! 2!1! 2 C2 n = 1 2 3 Serían: 12; 13; 23 21; 31; 32; Estos se eliminan, porque no nos interesa el orden en que se seleccionan los dos números ( r ) de entre los tres números ( n ). Aquí es mas chico el resultado que en la permutación, porque el orden no tiene importancia. Ejemplo: Cuantas diferentes combinaciones o agrupaciones se pueden realizar con los números 1,2,3,4 tomando DOS a la vez? n=4 r=2 4 C2 4! 4! 24 6 2!(4 2)! 2!2! 4 n = 1 2 3 4 Serían: 12; 13; 14; 23; 24; 34; 21; 31; 32; 41; 42; 43; Estos se eliminan por la misma razón anterior. Es muy importante que te fijes que aquí NO interesa el orden en que seleccionan los dos números (la pareja) de entre los cuatro números (1,2,3,4) y resulta que hay 6 combinaciones. Ejemplo: Con una parte de su primer salario, un alumno de quinto semestre decide comprar TRES de los SIETE discos compactos que ha sacado a la venta el grupo MANA. ¿Cuántas posibilidades tiene? Ya que hay que elegir 3 discos (sin importar el orden) de un conjunto de siete. n=7 r=3 7 C3 7! 7! 5040 5040 35 3!(7 3)! 3!4! (6)(24) 144 Tiene 35 combinaciones al comprar tres discos de los siete. Ejemplo; ¿De cuantas maneras una persona puede seleccionar TRES libros de una lista de OCHO bestsellers? Aquí tampoco es importante el orden en que se seleccionen los tres libros. n=8 8! 8! 40320 40320 r=3 8 C3 3!(8 3)! 3!5! (6)(120) 720 56 Tiene 56 maneras para seleccionar los tres libros. Ejemplo: Un alumno del CBTa No. 153 Ext. Jungapeo, tiene 7 libros de física y 5 de matemáticas. Calcular de cuántas maneras se pueden ordenar 3 libros de física y 2 de matemáticas en un librero. Primeramente hacemos las combinaciones posibles de libros de física. n=7 7! 7! 5040 5040 35 combinaciones de libros de física r=3 7 C3 3!(7 3)! 3!4! (6)(24) 144 Ahora hacemos las combinaciones posibles de libros de matemáticas Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 5! 5! 120 50 120 10 combinaciones de libros de matemáticas n=5 5 C2 2!(5 2)! 2!3! (2)(6) 12 r=2 Multiplicamos 35 por 10 nos resulta 350 combinaciones posibles. AHORA… ¿Cómo se elaboran espacios muestrales para combinaciones “tomando sólo parte del conjunto” de elementos? De una manera general, la propuesta para elaborar espacios muestrales para este tipo de técnica de conteo está basada en un sistema numérico a la n, el cual denominamos “Método de la cifra”. (Tomado de: Técnicas de muestreo y espacios maestrales sin maestro. Héctor Francisco Reynoso Titrado) Sea S = { 1,2,3,4,5 }, un conjunto con cinco elementos genéricos. Calcule… a) El número de posibles arreglos tomando cuatro de ellos a la vez, b) Elabore el espacio muestral de esos arreglos o combinaciones. 5 C4 5! 5! 120 120 5...com binacio nes 4!(5 4)! 4!1! (24)(1) 24 La respuesta a la primera pregunta es 5 posibles combinaciones. En el caso de la segunda pregunta, empezaremos por preparar el espacio para arreglar esas cinco combinaciones Primer paso Colocamos los primeros cuatro elementos del conjunto en el primer arreglo. N.A. 1 2 3 4 5 Combinaciones a b c 1 2 3 d 4 En el segundo paso, colocaremos el segundo arreglo que representaría el tope de los arreglos que inician con los elementos 1,2 y 3. También cubrimos el tercer arreglo con la columna k-1 con el elemento n-1, o sea el elemento 4 N.A. 1 2 3 4 5 Combinaciones a b c 1 2 3 1 2 3 4 1 2 d 4 5 5 Observa cómo nuestra atención está siendo demandada en las últimas columnas, arreglando, de los elementos menores a los mayores, similar a un sistema numérico. Finalmente… Tercer paso, será cambiar el elemento 2 de la columna k-2, por el siguiente elemento, el 3 (arreglo número cuatro). Lo demás ya es sabido, no habrá elementos mayores a la izquierda. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 N.A. 1 2 3 4 5 PROBABILIDAD Y ESTADÍSTICA Combinaciones a b c 1 2 3 1 2 3 1 2 4 3 4 1 2 3 4 d 4 5 5 5 5 51 Este método permite ir agotando los elementos a usar de derecha a izquierda. Observa que en el cuarto arreglo ya están agotadas la k-ésima columna con el n-ésimo elemento, la columna k-1 con el elemento n-1 y la columna k-2 con el elemento n-2. Así, lo único que nos resta es colocar el elemento 2 en la primera columna y combinarlo con el resto de los elementos del conjunto que están a la derecha (arreglo número cinco). Algunas características de las combinaciones a) Las combinaciones son arreglos de elementos en los que no nos interesa el orden de los mismos. b) El primer arreglo tiene combinados los primeros elementos del conjunto. c) El último arreglo tiene combinados los últimos elementos del conjunto. d) Los elementos del conjunto aparecen arreglados del menor al mayor de los elementos, al menos en las escalas nominales y de razón. Justamente, en esta característica está basado el método de la cifra que usamos para elaborar espacios maestrales para combinaciones. e) El número que aparece cada elemento del conjunto es el espacio muestral está dado por la siguiente fórmula: Repeticiones de cada elemento en el espacio muestral (RCE) = (c) (r) . n donde: c = Número de combinaciones o arreglos posibles r = Elementos tomados a la vez en cada arreglo n = Número total de elementos en el conjunto. Para comprobar ésta formula con el ejemplo anterior tenemos: RCE = ( 5 ) ( 4 ) = 20 = 4 5 5 N.A. 1 2 3 4 5 Combinaciones a b c 1 2 3 1 2 3 1 2 4 1 3 4 2 3 4 d 4 5 5 5 5 Observamos que cada elemento (1,2,3,4,5) en el espacio muestral se repite cuatro veces; esto es, hay cuatro 1, cuatro 2, cuatro 3, cuatro 4 y cuatro 5. En resumen: Es muy importante que recuerdes que en una permutación SI importa el orden y se relaciona a sucesiones ordenadas; parejas ordenadas, tríadas ordenadas, etc. En las combinaciones NO importa el orden y se relacionan con la selección de un subconjunto de un conjunto dado. ACTIVIDADES DE APRENDIZAJE XIV CALCULA LAS POSIBLES FORMAS DE COMBINACIÓN POSIBLES Y ELABORA LOS ESPACIOS MUESTRALES 1) Sea X = { a,b,c,d,e f}, un conjunto con cinco elementos genéricos. Calcule a) el número de posibles arreglos tomando dos de ellos a la vez, b) elabore el espacio muestral de esos arreglos Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 52 2) Sea W = { 1,2,3,4,5,6}, un conjunto con cuatro elementos genéricos. Calcule a) el número de posibles arreglos tomando cuatro de ellos a la vez, b) elabore el espacio muestral de esos arreglos 3) Sea Z = { a,b,c,d,e,f }, un conjunto con cinco elementos genéricos. Calcule a) el número de posibles arreglos tomando cuatro de ellos a la vez, b) elabore el espacio muestral de esos arreglos ACTIVIDADES DE APRENDIZAJE XV En cada uno de los siguientes problemas, decide si se trata de una permutación o de una combinación y obtén su resultado correcto. 1) Calcular el número de palabras de 4 letras, que se pueden formar con 12 letras diferentes, aunque no necesariamente tengan algún significado. Permutación _____ o combinación________ Resolver: 2) Calcular el número de palabras, que pueden formarse seleccionando 5 consonantes y 3 vocales entre 10 consonantes y 4 vocales, no necesariamente con significado. Permutación _____ o combinación________ Resolver: 3) Calcular de cuántas maneras diferentes pueden colocarse 6 libros en un librero Permutación _____ o combinación________ Resolver: 4) Un parque de diversiones tiene 24 recorridos distintos. ¿De cuántas maneras diferentes una persona puede tomar cuatro de estos recorridos, suponiendo que el orden es importante y que no quiera tomar un recorrido más de una vez? Permutación _____ o combinación________ Resolver: 5) Una bolsa contiene 5 bolas rojas numeradas del 1 al 5 y 7 bolas azules numeradas del 1 al 7. ¿De cuántos modos se pueden seleccionar 6 bolas de manera que 2 sean rojas y 4 azules? Permutación _____ o combinación________ Resolver: 6) La carta de una fonda indica que hay 5 sopas, 6 carnes, 7 ensaladas y 3 postres. ¿De cuántos modos se puede ordenar una comida consistente en una sopa, una carne, 3 ensaladas y un postre? Permutación _____ o combinación________ Resolver: TEOREMA DEL BINOMIO Y TRIÁNGULO DE PASCAL En aritmética y álgebra ya se definió que a0 = 1 “Toda cantidad elevada a la cero potencia es igual a uno “ OBSERVA DETENIDAMENTE “EL TEOREMA DEL BINOMIO” ( x + y )1 = x + y ( x + y )2 = x2 + 2xy + y2 ( x + y )3 = x3 + 3x2y + 3xy2 + y3 ( x + y )4 = x4 + 4x3y + 6x2y2 + 4xy3 + y4 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 53 Resuelve los dos binomios que faltan ( x + y )5 = __________________________________ ( x + y )6 = _______________________________________________ Entonces analiza las siguientes conclusiones: A la mejor se te ocurre algo 1. El número de términos es igual al grado del binomio más uno. 2. El grado del primer término es igual al grado del binomio y disminuye sucesivamente en uno, en cada uno de los siguientes términos y es factor en todos los términos, menos en el último. 3. El segundo término, “y” en los ejemplos, aparece en el segundo término del desarrollo con exponente uno, y aumenta sucesivamente en uno en cada uno de los términos siguientes hasta llegar al exponente del binomio, el cual es el último del resultado. 4. El coeficiente del primer término del resultado es uno y el del segundo es el exponte del binomio; el último término también es uno. 5. El coeficiente de un término cualquiera es igual al coeficiente del término inmediato anterior, por el exponente de “x” en éste término y dividido entre el número de términos desarrollados. 6. El grado de cada término es igual al grado del binomio. 7. Los términos que equidistan de los extremos tienen coeficientes iguales 8. Cada término del binomio se considera con coeficiente y signo. AHORA SI PUEDES? ANIMO RESUELVELO Matemáticamente el binomio de Newton es el siguiente: ( x y) n x n nxn1 y n(n 1) x n2 y 2 n(n 1)(n 2) x n3 y 3 ... y n 1(2) 1(2)(3) El triángulo de TARTAGLIA junto con el triángulo de PASCAL, facilitan el cálculo de los coeficientes de la potencia de un binomio (o coeficientes binomiales) observa: TRIANGULO DE PASCAL ( x + y )0 = primera fila 1 ( x + y )1 = ( x + y )2 = ( x + y )3 = ( x + y )4 = 1 1 1 + 1 1 + 2 + 1 + 3 + 3 + 4 6 1 4 ( x + y )5= Recopilación: ING. CESAR NAVARRO ESPINOSA 1 CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 54 (x + y )6 = Observa que si sumas dos coeficientes adyacentes, su suma es el coeficiente entre ellos una fila abajo; por ejemplo, para obtener el 2 de la tercer fila sumamos los dos UNOS(1+1=2) de la segunda fila; para obtener el 4 de la quinta fila sumamos el UNO y TRES (1 +3 = 4) Preparados ahora si con todo este conocimiento, podemos escribir fácilmente TODO EL DESARROLLO de los binomios (x+y)5 ; (x+y)6 y (x + y )7 (x + y )5 = _______________________________________________ Por supuesto que si deseamos desarrollar la sexta potencia del binomio, podemos hacerlo utilizando los coeficientes de la quinta potencia y así sucesivamente. Fácil o no? ( x + y )6 = ____________________________________________________________ (x + y)7 = _________________________________________________________________ PROBABILIDAD AXIOMÁTICA Los problemas de probabilidad en situaciones prácticas, son sucesos o eventos compuestos que requerirían para su solución la enumeración de muchos puntos muestrales, procedimiento lento y cansado; de ahí, que haya un segundo procedimiento que se llama composición de sucesos o probabilidad axiomática. Esta composición se forma con dos o más sucesos y se realiza con la UNIÓN o con la INTERSECCIÓN DE CONJUNTOS o con la combinación de ambos; se basa en: la clasificación de los sucesos, las relaciones entre ellos y tres leyes: LA ADITIVA (o regla de la suma), LA MULTIPLICATIVA (o regla del producto) Y LA DE SUSTRACCIÓN ( o regla de la diferencia). Como estamos refiriéndonos a la probabilidad axiomática, es conveniente recordar que un axioma es una proposición matemática evidente por sí misma que no requiere demostración. PROBABILIDAD DE UNIONES Y EVENTOS COMPLEMENTARIOS Una vez que ya nos hemos familiarizado con los eventos y sus relaciones vamos a describir algunas reglas sencillas que nos permitan determinar la probabilidad de que ocurra algún evento. Para expresar simbólicamente estas reglas denotaremos por P ( A ) a la probabilidad de que ocurra el evento A. Ya hemos comentado que la probabilidad de que suceda un evento es un número real entre cero y uno y que entre más pequeño sea este número, el evento es menos probable y entre más cercano a uno el número el evento es más probable. REGLAS BÁSICAS DE PROBABILIDAD 1. Las probabilidades son números reales entre 0 y 1 2. P ( U ) = 1 y P ( Ø ) = 0 como el espacio muestral ( u ) universo “otros libros utilizan P(S)” contiene a todos los posibles resultados que pueden ocurrir, se tienen que el evento u ocurre con certeza, de modo que P (u ) = 1 y cuando con certeza un evento no puede ocurrir, su probabilidad es cero P ( Ø ) = 0 3. Regla de la suma ( ley aditiva de la probabilidad) Esta ley se utiliza cuando se quiere obtener la probabilidad de que ocurra el suceso A o el suceso B, para lo cual es necesario revisar si los sucesos SON O NO MUTUAMENTE EXCLUYENTES. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 55 a) Cuando dos sucesos son mutuamente excluyentes se tiene que A ∩ B = Ø ; (es el conjunto vacío) se utiliza entonces P ( A U B ) = P ( A ) + P ( B ) es decir, que la probabilidad de que A o B ocurran indistintamente, es igual a la suma de sus probabilidades individuales. Hagamos un diagrama… U P (A ) P (B) + Eventos mutuamente excluyentes b) Regla para eventos complementarios ( ‘ ). En consecuencia de las reglas anteriores, surge P ( A’ ) = 1 – P (A) ya que los eventos A y A’ son mutuamente excluyentes por no tener elementos en común y su unión es todo el universo (u). Hagamos un diagrama… P (A’) = U 1 – P (A ) Eventos mutuamente excluyentes c) Cuando dos sucesos NO son mutuamente excluyentes, se tiene que A ∩ B ≠ Ø (no es el conjunto vacío) ; se utiliza entonces P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) es decir, que la probabilidad de que A o B ocurran indistintamente, es igual a la suma de sus probabilidades individuales y restar sus intersecciones para rectificar el doble conteo que se lleva a cabo cuando se suman las dos probabilidades. Hagamos un diagrama… U P (A) P (B) No son mutuamente excluyentes P (A U B) = P (A) + P (B) – P (A ∩ B) AHORA SI PONGAMONOS A PRACTICAR DICHAS REGLAS DE LA PROBABILIDAD. PRIMERO UTILIZANDO LA LEY ADITIVA Y CUANDO UN EVENTO ES MUTUAMENTE EXCLUYENTE. P(AUB)=P(A)+P(B) Ejemplo: ¿Cuál es la probabilidad de elegir al azar un 10 o un 4 al extraer una carta de una baraja ordinaria de 52 cartas? (la “ o “ se interpreta como unión) Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 56 Como queremos un 10 o un 4 y como estos eventos son mutuamente excluyentes, aplicamos la regla de la suma P ( A o B ) = P ( A ) + P ( B ). Así, P (10 U 4) ; donde A representa sacar un 10 y B obtener un 4. y como existen cuatro 10, cuatro 4 y 52 cartas en la baraja, P (10 ) = 4/ 52 y P ( 4 ) = 4/52 tenemos P ( 10 o 4 ) = 4/52 + 4/52 = 8/52 = 0.1538 Ejemplo: Supongamos que va a elegirse de manera aleatoria UN individuo entre una población de 130 personas. En esta población hay 40 NIÑOS menores de 12 años, 60 ADOLECENTES y 30 ADULTOS ¿Cuál es la probabilidad de que el individuo elegido sea un adolescente o un adulto? Los eventos son mutuamente excluyentes porque queremos obtener un adolescente o un adulto y no los dos al mismo tiempo, por lo tanto utilizamos la ley aditiva P ( A o B ) = P ( A ) + P ( B ). Donde P (A) será obtener un adolescente y P (B) será obtener un adulto. Como hay 60 adolescentes, 30 adultos y 130 personas en la población tenemos, EJERCICIO P ( A o B ) = P ( 60/130) + P ( 30/130 ). = 60/130 + 30/130 = 90/130 = 0.6923 Ahora con otro problema para que utilices mas reglas… ECHALE GANAS Supongamos que A es el evento: el martes a las 16:00 hrs, estará lloviendo B es el evento: el martes a las 16:00 hrs, estará despejado Y que de acuerdo al Observatorio Nacional la P (A) = 0.45 y P (B) = 0.3, ¿Cuáles son las probabilidades de P ( A’ ), P ( A U B ) y P ( A ∩ B )? Para que tu aprendizaje sea significativo contesta por favor las siguientes preguntas Son eventos mutuamente excluyentes SI____ NO___ Porque? ____________________________________________________________________ P ( A’ ) como se interpreta o que significa en éste problema?: __________________ ____________________________________________________________________ Que nos pide el problema con P ( A U B ): ___________________________________________________________________________ Como se interpreta P ( A ∩ B ) en el contexto del problema? ___________________________________________________________________________ Si P (A) es la probabilidad de que el martes esté lloviendo; P (A’) será la probabilidad de que NO LLUEVA el martes a las 16:00 hrs. Por lo tanto utilizamos P ( A’ ) = 1 – P (A) y sustituyendo los valores P (A’) = 1 – 0.45 = 0.55 Para poder calcular las probabilidades de P (A U B) y P ( A ∩ B) debemos primero observar que los eventos A y B son mutuamente excluyentes, ya que el tiempo no puede estar lloviendo y despejado simultáneamente, por lo que … Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 57 P (A∩ B) = P ( Ø ) = 0 la intersección de A y B es un evento nulo Ya que no puede suceder al mismo tiempo. Finalmente P (A U B) = P (A) + P(B) = P ( 0.45) + P (0.3) = 0.75 En resumen... P (A’) = La probabilidad de que NO LLUEVA el martes a las 16:00 hrs = 0.55 P (A∩ B) = La probabilidad de estar lloviendo y despejado simultáneamente = P ( Ø ) = 0 P (A U B) = La probabilidad de que esté lloviendo o esté despejado = 0.75 Antes de realizar algunas actividades de aprendizaje finalmente… Analicemos otro problema donde Si k eventos son mutuamente excluyentes, la probabilidad de que ocurra alguno de ellos es igual a la suma de sus respectivas probabilidades Si las probabilidades de que una agencia de automóviles venda 0, 1, 2, 3, 4, y 5 automóviles durante cierta semana son respectivamente 0.05, 0.1, 0.15, 0.18, 0.12 y 0.05 ¿Cuáles son las probabilidades de que vendan de 2 a 5 automóviles y de que vendan 5 o más automóviles. Como estos eventos son mutuamente excluyentes, usando la regla P (A1 U… Ak ) = P (A1 ) + P(A2)... + P (A k ) para saber si la agencia venderá de 2 a 5 automóviles, por lo tanto será: 0.15 + 0.18 + 0.12 + 0.05 = 0.5 Ahora para calcular la probabilidad de que vendan 5 o más automóviles, o sea P (vender 5 o más automóviles), COMO ES UN EVENTO COMPLEMENTARIO DE (A’) debemos primero calcular la probabilidad de vender a lo más cuatro automóviles…(AK ) P ( Ak vender a lo más 4 automóviles) = 0.05 + 0.1 + 0.15 + 0.18 + 0.12 = 0.6 Ahora P (A’ vender cinco o más automóviles) = 1 – P (Ak ) = 1 – 0.6 = 0.4 EJERCICIO 1) Al lanzar un dado una vez, ¿Cuál es la probabilidad de obtener un 1 o un número par? 2) Para participar en la rifa de un reloj, los alumnos del primer año compraron 18 boletos; los de segundo año 12 boletos. Si son 50 boletos. ¿Cuál es la probabilidad de que un alumno de primero o segundo gane la rifa? ACTIVIDADES DE APRENDIZAJE XVI 1) En un experimento tiramos un par de dados y contamos los puntos obtenidos. a) Describe el espacio muestral : ______________________________________ b) Si A = { 2, 3, 4, 5, y 6} y B = { 3, 5, 7, 9, 11} describe los eventos: P ( A’ ) = _____________________ P ( B’ ) =_________________________ P ( A U B ) : ____________________ P ( A ∩ B’ ) = ______________________ P ( A ∩ B ) = ____________________________________ Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 58 2) Las probabilidades de que un hospital reciba a,1, 2, 3, 4, 5, 6, 7 y hasta 8 enfermos durante un día son, respectivamente, 0.02, 0.04, 0.08, 0.13, 0.15, 0.17, 0.16 y 0.08. Determina las probabilidades de que el hospital reciba a) Cuatro o más pacientes; b) A lo más cinco pacientes; c) De 3 a 6 pacientes. Ahora analicemos dos problemas para aplicar la ley aditiva cuando dos sucesos NO son mutuamente excluyentes, donde ya se indicó que P ( A ∩ B ) ≠ Ø y se utiliza entonces… P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) o sea la probabilidad de que A o B ocurran indistintamente. Ejemplo: Un estudio de mercado estima que las probabilidades de que una familia en cierta zona vea el noticiero de TV Azteca es de 0.3, que vea el noticiero de Televisa es de 0.2 y de que vea a ambos es de 0.02. ¿Cuál es la probabilidad de que una familia vea al menos uno de los dos noticieros? Sea A el evento la familia ve el noticiero de TV Azteca Sea B el evento la familia ve el noticiero de Televisa Entonces P ( A ) = 0.3 Entonces P ( B ) = 0.2 y P ( A ∩ B ) = 0.02 Observemos primero que como la probabilidad de que vean ambos noticieros es positiva, los eventos A y B NO son mutuamente excluyentes, por lo tanto se deben transmitir a diferente horario. P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) = P ( 0.3 ) + P ( 0.2 ) – P ( 0.02 ) = 0.48 Ejemplo: Queremos determinar al utilizar una baraja de póker ¿Cuál es la probabilidad de sacar UN AS o UN TREBOL de dicha baraja? Sea A el evento sacar UN AS y como en la baraja hay 4 ases en 52 cartas P ( A ) = 4/52 Sea B el evento sacar UN TREBOL y en la baraja hay 13 tréboles en 52 cartas P (B) = 13/52 La probabilidad de obtener UN AS y UN TREBOL al mismo tiempo es de 1/ 52 Por lo tanto… P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) = P (4/52) + P ( 13/52) – P ( 1/52) = 16/52 = 0.3077 Pero ¿Por qué debemos restar la probabilidad de obtener un as y un trébol a la vez? Porque hemos contado el as de trébol dos veces. Sin restarlo, pensaríamos de manera errónea que existen 17 eventos favorables en vez de 16. ACTIVIDADES DE APRENDIZAJE XVII 1) Una alumna del CBTa.- 153 estima que durante una fiesta la probabilidad de que se le declare JOSE es de 0.7, la probabilidad de que se le declare ENRIQUE es de 0.4 y la probabilidad de que se le declaren ambos es de 0.2. ¿Cuál es la probabilidad de que se le declare alguno de los dos durante la fiesta? 2) Si extraes de una baraja de póker ordinaria, una sola carta ¿Cuál es la probabilidad de de que sea: Una reina o un corazón? Un 3 o una carta negra? Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 59 PROBABILIDAD PARA EVENTOS SUCESIVOS Regla del producto ( ley multiplicativa de la probabilidad) La probabilidad de que ocurran SIMULTÁNEAMENTE DOS SUCESOS A y B, se obtiene con el producto de sus probabilidades. Esto es, mientras que la regla de la suma proporciona la probabilidad de que ocurra CUALQUIERA DE varios sucesos, la regla del producto analiza la ocurrencia CONJUNTA O SUCESIVA de varios eventos. Observa que la regla del producto analiza con frecuencia lo que ocurre en más de un lanzamiento o extracción, mientras que la regla de la suma estudia sólo un lanzamiento o extracción. Al analizar la regla del producto, es útil distinguir tres condiciones: A) CUANDO LOS EVENTOS SON MUTUAMENTE EXCLUYENTES B) CUANDO LOS EVENTOS SON INDEPENDIENTES C) CUANDO LOS EVENTOS SON DEPENDIENTES. REGLA DEL PRODUCTO: EVENTOS MUTUAMENTE EXCLUYENTES Ya se ha indicado anteriormente (cuando estudiamos la regla de la suma) que cuando dos sucesos son mutuamente excluyentes la probabilidad de A y B es el conjunto vacío, P ( A ∩ B ) = Ø otros autores la señalan como P ( A y B ) = Ø , esto es, la ocurrencia de un evento impide la ocurrencia del otro y la probabilidad de su ocurrencia CONJUNTA es nula o cero. REGLA DEL PRODUCTO: EVENTOS INDEPENDIENTES Dos eventos son independientes si la ocurrencia de un evento NO TIENE EFECTO sobre la probabilidad de ocurrencia del otro. El muestreo con reemplazo ilustra bien esta situación. Por ejemplo, suponga que vamos a extraer dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. Denotamos por A a la carta extraída primero y B a la carta obtenida en segundo lugar. Cuando A se reemplaza antes de extraer a B, la aparición de A en la primera extracción no tiene efecto alguno sobre la probabilidad de ocurrencia de B. Por lo tanto son eventos A y B son independientes. Bajo esta condición, la regla del producto se convierte en… P ( A ∩ B ) = P ( A ) P ( B ) . . . regla del producto para eventos independientes. P(A y B)=P(A)P(B) Vamos a analizar dos problemas para emplear esta ecuación. Suponga que vamos a obtener al azar dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. ¿Cuál es la probabilidad de que ambas cartas seas Ases? Como el problema nos pide DOS cartas; la primera que sea As “y ” en la segunda extracción sea también otro As y además con reemplazo, podemos utilizar la regla del producto P (A ∩ B) = P ( A ) P ( B ) P ( A ) = (un as en la primera extracción) P ( B ) = (un as en la segunda extracción) 4 ases o eventos favorables de 52 barajas también 4 ases o eventos favorables de 52 barajas P (A y B) = P ( 4/52 ) P ( 4/52 ) P (A y B) = ( 16/ 2704 ) = 0.0059 Otro para reflexionar y pensar. Se lanza un dado y se saca una canica de una bolsa; en la bolsa hay 3 canicas, una roja, una azul y una verde. ¿Cuál es la probabilidad de que salga un número primo y una canica azul? Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 60 Lee detenidamente el problema y contesta ¿los eventos (lanzar un dado y sacar una canica) son independientes? _____ porque? __________________________________________________ Si el lanzar el dado es el evento A, ¿Cuales son los eventos muestrales para A ? A = { _____________} P ( A ) = ( 4/ 6 ) el evento B será B = { sale una canica azul } P (A y B) = P ( 4/6 ) P ( 1/3 ) P ( B ) = ( 1/3 ) P (A y B) = ( 4/ 18 ) = 0.2222 Esto lo podemos comprobar contando de los resultados posibles, los que son favorables al suceso A y B, así: (A, 1) (A, 2) ( A, 3) (A, 4) (A, 5) ( A, 6) (R, 1) (R, 2) ( R, 3) (R, 4) (R, 5) ( R, 6) (V, 1) (V, 2) ( V, 3) (V, 4) (V, 5) ( V, 6) P (A y B ) = 4 resultados favorables = 18 resultados posibles 4 = 0. 2222 18 La anterior regla del producto para eventos independientes, también se aplica en situaciones con más de dos eventos. En tales casos, la probabilidad de la ocurrencia conjunta de los eventos es igual al producto de las probabilidades individuales de cada evento. En forma de ecuación es… P ( A y B y C …Z ) = P ( A ) P ( B ) P ( C ) … P ( Z ) Queremos obtener al azar 4 individuos de una población de 110 habitantes, los cuales 50 son varones y 60 mujeres. El muestreo es un individuo a la vez, con reemplazo. ¿Cuáles la probabilidad de obtener 3 mujeres y 1 hombre, en ese mismo orden? Como el problema pide una mujer en la primera, segunda y tercera extracción y un hombre en la cuarta y como el muestreo es con reemplazo, aplicamos la ley del producto para más de dos eventos independientes. A = representa una mujer en la 1ra extracción C = una mujer en la tercera extracción B = una mujer en la 2da. Extracción D = un hombre en la cuarta extracción P ( A y B y C y D ) = P (60/ 110) P (60/110) P (60/110) P (50/110) = 1080/ 14,641 = 0.0738 REGLA DEL PRODUCTO: EVENTOS DEPENDIENTES Dos eventos son dependientes si la ocurrencia de un evento, AFECTA la probabilidad de ocurrencia del otro. Cuando A y B son dependientes, la probabilidad de que ocurra B se ve afectada por la ocurrencia de A. En este caso se utiliza la regla… P ( A ∩ B ) = P ( A ) P ( B | A ) . . . Regla del producto para eventos dependientes P(A y B)=P(A)P(B|A) En esta nueva regla nos dice que la probabilidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A por la probabilidad de que B ocurra, dado que A ha ocurrido. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 61 El muestreo sin reemplazo ilustra bien esta situación de los eventos dependientes. Primer Ejemplo: Suponemos que vamos a extraer DOS cartas, una a la vez, sin reemplazo (sin volver a meter la primera), de una baraja ordinaria ¿Cuál es la probabilidad de que ambas cartas sean ases? Como va a ser sin reemplazo la ocurrencia de A realmente afecta la probabilidad de B por lo tanto son eventos dependientes y usaremos la regla… P(Ay B)=P(A)P(B|A) P (A) = (un as en la primera extracción) = P ( 4/ 52) P (B | A) = ( un as en la segunda extracción) = P ( 3/51 ) observa que aquí se trata de obtener un as en la 2da. extracción dado un as en la 1ra extracción. P ( A y B ) = P ( 4/52 ) P ( 3/51 ) = 12/ 2652 = 0.0045 Segundo ejemplo: Queremos obtener DOS frutas, una a la vez, de una bolsa de frutas que contienen 4 manzanas, 6 naranjas y 5 duraznos, sin reemplazo ¿Cuál es la probabilidad de obtener una naranja y una manzana, en ese mismo orden? P ( A ) = Obtener una naranja en la 1ra extracción Eventos favorables a A = 6 naranjas de 15 posibles (frutas) P ( B | A ) = Obtener una manzana en la 2da extracción Si es sin reemplazo: Eventos favorables a B = 4 manzanas de 14 posibles (ya que afectó la 1ra) Por lo tanto… P ( A y B ) = P ( A ) P ( B | A ) = P ( 6/15) P ( 4/14 ) = 24/ 210 = 0.1143 Tercer ejemplo: y después realices tus actividades de aprendizaje: De un grupo del CBTa – Xalisco turno vespertino, se van a elegir por sorteo a 3 alumnos que se hagan cargo de una ceremonia escolar del “día del maestro”; en el grupo hay 24 hombres y 12 mujeres. ¿Cuál es la probabilidad de que el grupo de representantes esté conformado de las maneras siguientes; sean Tres hombres y sean dos hombres y una mujer P ( A ) = Sean Tres hombres P ( B ) = Sean dos hombres y una mujer PARA QUE SEAN TRES HOMBRES Para calcular P (A) es necesario que se den los sucesos siguientes: A1, el primer alumno seleccionado sea hombre - - - - - A2 ; el segundo seleccionado sea hombre - - - - - - P ( A1 ) = 24/ 36 - P ( A2 ) = 23/ 35 Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 62 Observa que la ocurrencia de A, AFECTA la probabilidad de que ocurra A2 puesto que tanto el número de hombres como el número de alumnos cambia ( han disminuido) para el evento A2. A3 ; el tercer alumno seleccionado sea hombre - - - - - P ( A3 ) = 22/34 Entonces P ( A ) = P ( A1 ) P ( A2 ) P ( A3 ) = (24/ 36) (23/ 35) (22/34 ) = 12144/ 42840 = 0.2834 = 28.34 % PARA QUE SEAN DOS HOMBRES Y UNA MUJER Para calcular P ( B ) se deben cumplir los sucesos siguientes: B1 = Sale el primer hombre -B2 = Sale el segundo hombreB3 = Sale la tercera mujer- - - - - - - - - - - - - P ( B1 ) = 24/36 P ( B2 ) = 23/35 P ( B3 ) = 12/34 Entonces P ( B ) = P (B1 ) P (B2 ) P (B3 ) = (24/ 36) (23/ 35) (12/34 ) = 6624/ 42840 = 0.1546 = 15.46 % Observa que el orden en que salgan los dos hombres y la mujer no cambia el valor de la probabilidad. EJERCICIO 1) Determina si los siguientes eventos son Independientes o dependientes. Explica tus respuestas a) Se toma una carta de una baraja de póker bien revuelta y sin regresar esta carta se toma una segunda carta: ____________________________________________________________________________ b) Si A es el evento que el automovilista maneja en estado de ebriedad y B es el evento el automovilista tuvo un accidente. ____________________________________________________________________________ c) Si A es el evento que una moneda caiga águila en un primer volado y B es el evento que la moneda caiga águila en el segundo volado. ___________________________________________________________________________ d) Se toma una carta de una baraja bien revuelta. Se regresa la carta y después de revolver la baraja se toma una segunda carta. ___________________________________________________________________________ e) El evento A es una luna llena y el evento B es comer una hamburguesa. ___________________________________________________________________________ 2) Si se realiza un muestreo aleatorio, tomando un elemento a la vez, con reemplazo, de una bolsa que contiene OCHO canicas azules, SIETE canicas rojas y CINCO canicas verdes. ¿Cuál es la probabilidad de obtener: a) Una canica azul en una extracción de la bolsa? b) Tres canicas azules en tres extracciones de la bolsa? c) Una canica roja, una verde y una azul, en ese orden en tres extracciones de la bolsa. 3) En cierto grupo de la universidad, hay 15 estudiantes de música, 24 de historia y 46 de psicología. Y se escoge a los alumnos al azar una persona a la vez, sin reemplazo ¿Cual es la probabilidad de … a) Dos estudiantes sean de historia? b) Cuatro estudiantes sean de historia? 4) Si se lanzan dos monedas una sola vez. ¿Cuál es la probabilidad de que ambas caigan con cara hacia arriba? ACTIVIDADES DE APRENDIZAJE XVII 5) Dada una población de 30 bats, 5 guantes de béisbol y 60 pelotas, si el muestreo es aleatorio, uno a la vez, sin reemplazo. ¿Cuál es la probabilidad de obtener: a) Un guante si se extrae un objeto de la población Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 63 b) Un bat y una pelota si se extraen dos objetos de la población c) Un bat, un guante y un bat, en ese orden, si se extraen tres objetos de la población? 6) Usted quiere llamar a una amiga por teléfono. Sólo recuerda los tres primeros dígitos de su número telefónico y ha olvidado los últimos cuatro. ¿Cuál es la probabilidad de que marque al azar el número correcto? 7) Durante una comida de fin de año se rifan dos televisores entre un grupo de empleados. Los participantes en la rifa son cuatro hombres y ocho mujeres. Encuentra la probabilidad de que los televisores los ganen… a) Dos hombres b) Dos mujeres c) Un hombre y una mujer. 8) Determina la probabilidad de obtener de una baraja de póker bien revuelta dos tréboles si.. a) Después de sacar la primer carta se regresa y se vuelve a revolver. b) Se saca la segunda carta sin regresar la primera. PROBABILIDAD CONDICIONAL Es la probabilidad de que ocurra un evento B, cuando se conoce que ha ocurrido el evento A y se indica por P(A/B) y se lee “La probabilidad de B a condición de que ocurra A” o simplemente “La probabilidad de B a condición de A”. Así la probabilidad condicional se define: P(B/A)= P( A B) si P(A)>0 P( A) Ejemplo: Considérese el evento B de obtener un número que sea cuadrado perfecto cuando se tira un dado. Solución. El dado esta construido de manera que un número par tiene el doble de ocurrencia que el número impar, el espacio muestral es M={1,2,3,4,5,6} con pesos asignados de la siguiente manera: Para el 1= 1 2 1 2 1 2 , 2= , 3= , 4= , 5= , 6= 9 9 9 9 9 9 Así la probabilidad de que ocurra B será: P(B)= 1 2 3 1 + = = 9 9 9 3 Supongamos que se tiró el dado y cayo un número mayor que tres ahora el espacio muestral seta reducido a A={4,5,6}. Ahora la probabilidad de que ocurra B cuando ha salido A, para ello será necesario darle el peso a los nuevos números y será: 5 y si vemos el espacio de A, encontramos que B solo contiene un solo elemento que es el 4, de 9 2 aquí encontramos que P(A B)= 9 P(A)= Entonces utilizando la fórmula: 2 P( A B) 9 18 2 P(B/A)= = = = 5 45 5 P( A) 9 Ejemplo: en el siguiente espacio muestra S que representa los adultos de un pequeño pueblo que ha terminado sus estudios superiores, los cuales se clasifican de acuerdo a su sexo y condición de empleo. Empleados Desempleados Total Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 64 Hombres 460 40 500 Mujeres 140 260 400 Total 600 300 Si se escoge al azar uno de ellos para que realice una gira por el país, exponiendo las ventajas de establecer nuevas industrias en el pueblo, y trabajando con los siguientes eventos: M: se escoge a un hombre E: el escogido tiene empleo Usando el espacio muestral al reducido E P(M/E)= 460 23 = 600 30 Usando la fórmula: 600 2 900 3 460 23 P(E M)= 900 45 P(E)= 23 P( E M ) 45 69 23 P(M/E)= 2 P( E ) 90 30 3 TEOREMA DE BAYES El teorema de Bayes, descubierto por Thomas Bayes, en la teoría de la probabilidad, es el resultado que da la distribución de probabilidad condicional de una variable aleatoria A dada B en términos de la distribución de probabilidad condicional de la variable B dada A y la distribución de probabilidad marginal de sólo A. Sea A1, A2, ...,An un conjunto de sucesos incompatibles cuya unión es el total y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B) viene dada por la expresión: donde: P(Ai) son las probabilidades a priori. P(B | Ai) es la probabilidad de B en la hipótesis Ai. P(Ai | B) son las probabilidades a posteriori. Esto se cumple El teorema de Bayes es válido en todas las aplicaciones de la teoría de la probabilidad. Sin embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los seguidores de la estadística tradicional sólo admiten probabilidadades basadas en experimentos repetibles y que tengan una confirmación empírica mientras que los llamados estadísticos bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces para indicar como debemos modificar nuestras probabilidades subjetivas cuando recibimos información adicional de un experimento. La estadística bayesiana está demostrando su utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y permitir revisar esas estimaciones en función de la evidencia es lo que está abriendo nuevas formas de hacer conocimiento. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 65 N Como observación, se tiene P( A / B) 1 y su demostración i 1 i resulta evidente. En términos generales la regla o teorema de Bayes es una generalización de la probabilidad condicional. Ejemplo: en una población total de 32 ratones donde 24 son negros,8 son cafés, existe: 2 ratones negros, que están enfermos 22 ratones negros que son sanos 5 ratones cafés que están enfermos 3 ratones cafés que son sanos Solución. Con estos datos se construimos una tabla de doble entrada: N 2 32 C 5 32 7 = 32 22 32 3 32 25 = 32 24 32 8 = 32 32 = 32 = Encontrar la probabilidad de: 2 P( N E ) 32 1 P(E/{N})= 24 12 P( N ) 32 5 P(C E ) 32 5 P(E/{C})= 8 P(C ) 8 32 2 P( E N ) 32 2 P({N}/E)= 7 P( E ) 7 32 22 P( S N ) 32 22 P({N}/S)= 25 25 P( S ) 32 P( E C ) 5 P({C}/E)= P( E ) 7 P( S C ) 3 P({C}/S)= P( S ) 25 ACTIVIDADES DE APRENDIZAJE XVII I. A través de la Probabilidad Condicional o Teorema de Bayes resuelve los siguientes ejercicios. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 66 1. En una Ciudad existen 58 niños de los cuales 23 son niños y 35 niñas; de los niños 15 tienen beca y 8 no, y de las niñas 25 tiene beca y 10 no; si se escoge uno entre todos ¿Cuál es la probabilidad de que sea niño y sin beca? 2. En un total de 63 conejos, 47 son blancos y 16 son grises, donde 25 conejos blancos son de ojos verdes 22 conejos blancos son de ojos cafés 9 conejos grises son de ojos verdes 7 conejos grises son de ojos cafés Encontrar las Probabilidades de: P( B V ) P( B) P(G V ) P(V/{G})= P(G ) P(V/{B})= P( B C ) P( B) P(G C ) P(C/{G})= P(G ) P( B V ) P(V/{B})= P( B) P(C/{B})= 3° SIMULACRO DE EXAMEN En cada uno de los siguientes problemas, decide si se trata de una permutación o de una combinación y obtén su resultado correcto. UTILIZA LA HOJA DE AUN LADO Y/O LA DE ATRAZ PARA TUS OPERACIONES. 1) Calcular el número de palabras de 5 letras, que se pueden formar con 12 letras diferentes, aunque no necesariamente tengan algún significado. Permutación _____ o combinación________ Resolver: 2) Calcular el número de palabras, que pueden formarse seleccionando 6 consonantes y 2 vocales entre 10 consonantes y 4 vocales, no necesariamente con significado. Permutación _____ o combinación________ Resolver: 3) Calcular de cuántas maneras diferentes pueden colocarse 7 libros en un librero Permutación _____ o combinación________ Resolver: 4) Un parque de diversiones tiene 28 recorridos distintos. ¿De cuántas maneras diferentes una persona puede tomar cuatro de estos recorridos, suponiendo que el orden es importante y que no quiera tomar un recorrido más de una vez? Permutación _____ o combinación________ Resolver: 5) Una bolsa contiene 6 bolas rojas numeradas del 1 al 6 y 8 bolas azules numeradas del 1 al 8. ¿De cuántos modos se pueden seleccionar 6 bolas de manera que 2 sean rojas y 4 azules? Permutación _____ o combinación________ Resolver: Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 67 6) La carta de una fonda indica que hay 4 sopas, 7 carnes, 8 ensaladas y 5 postres. ¿De cuántos modos se puede ordenar una comida consistente en una sopa, una carne, 3 ensaladas y un postre? Permutación _____ o combinación________ Resolver: 7) Una alumna del CBTa.- 153 estima que durante una fiesta la probabilidad de que se le declare JOSE es de 0.7, la probabilidad de que se le declare ENRIQUE es de 0.4 y la probabilidad de que se le declaren ambos es de 0.2. ¿Cuál es la probabilidad de que se le declare alguno de los dos durante la fiesta? 8) Si extraes de una baraja de póker ordinaria, una sola carta ¿Cuál es la probabilidad de de que sea: Una reina o un corazón? Un 3 o una carta negra? 9) Las probabilidades de que un hospital reciba a,1, 2, 3, 4, 5, 6, 7 y hasta 8 enfermos durante un día son, respectivamente, 0.02, 0.04, 0.08, 0.13, 0.15, 0.17, 0.16 y 0.08. Determina las probabilidades de que el hospital reciba a) Cuatro o más pacientes; b) A lo más cinco pacientes; c) De 3 a 6 pacientes. I. A través de la Probabilidad Condicional o Teorema de Bayes resuelve los siguientes ejercicios. 1. En una Ciudad existen 58 niños de los cuales 23 son niños y 35 niñas; de los niños 15 tienen beca y 8 no, y de las niñas 25 tiene beca y 10 no; si se escoge uno entre todos ¿Cuál es la probabilidad de que sea niño y sin beca? 2. En un total de 63 conejos, 47 son blancos y 16 son grises, donde 25 conejos blancos son de ojos verdes 22 conejos blancos son de ojos cafés 9 conejos grises son de ojos verdes 7 conejos grises son de ojos cafés Encontrar las Probabilidades de: P(V/{B})= P( B V ) P( B) P(C/{B})= P( B C ) P( B) P(V/{G})= P(G V ) P(G ) P(C/{G})= P(G C ) P( B V ) P(V/{B})= P(G ) P( B) 1. FREUND John E. y Gary A. Simón. Estadística Elemental. Octava edición. México. D.F. Editorial Prentice Hall. Traducción José Julián Díaz Díaz. 1994. pp. 566 2. FUENLABRADA De la Vega Trucíos Samuel. Probabilidad y Estadística. México. D.F. Editorial MvGraw-Hill Interamericana. 2002. pp.255. 3. PAGANO, Roberto R. Estadística para las ciencias del comportamiento. Quinta edición. Edit. Internacional Thomson Editores. México. 1999. pp. 548 4. PASTOR Guillermo. Estadística Básica. México D.F. Editorial Trillas. SEP-CONALEP. 1998. (reimp. 2003). Pp.198. Recopilación: ING. CESAR NAVARRO ESPINOSA CBTa. No. 153 PROBABILIDAD Y ESTADÍSTICA 68 5. PÉREZ SEGUÍ María Luisa. Combinatoria. Instituto de Matemáticas, UNAM. Cuadernos de olimpiadas. 2000. 6. REYNOSO Tirado Héctor Francisco. Lecturas seleccionadas de Estadística Básica. Universidad Autónoma de Nayarit. México. Facultad de Economía. Septiembre de 2001. pp129. 7. REYNOSO Tirado Héctor Francisco. Glosario de estadística. Universidad Autónoma de Nayarit. México. Facultad de Economía. Abril del 2002. pp.75. 8. REYNOSO Tirado Héctor Francisco. Técnicas de conteo y espacios maestrales sin maestro. Universidad Autónoma de Nayarit. México. Facultad de Economía. Verano de 2003. pp.89. 9. SEP-SEIT-DGETA. Antología para el módulo 4 “Formación Matemática Básica” Bachillerato Tecnológico Agropecuario. México. D.F. Sistema Abierto de Educación Tecnológica Agropecuaria. SAETA. 1997. pp. 426. 10. SEP, CINVESTAB del IPN, Sección de matemática educativa “probabilidad “ ( Programa Nacional de Formación y Actualización de Profesores), México 1990 11. VILENKIN. N. ¿De cuantas formas? Combinatoria. Libro de la editorial MIR, Moscú, 1972. Impreso en el taller de publicaciones de Matemáticas de la Facultad de Ciencias UNAM. Vínculos matemáticos No. 219. 1996. Recopilación: ING. CESAR NAVARRO ESPINOSA