ESTADISTICA Y PROBABILIDAD Texto universitario ING. ROLANDO W. RIVERA OLIVERA UNIVERSIDAD AUTONOMA SAN FRANCISCO AREQUIPA PERU i ESTADÍSTICA Y PROBABILIDAD ii ESTADÍSTICA Y PROBABILIDAD ING. ROLANDO WENCESLAO RIVERA OLIVERA 2017 UNIVERSIDAD AUTÓNOMA SAN FRANCISCO iii © ESTADÍSTICA BÁSICA Autor – Editor: Ing., Rolando Wenceslao Rivera Olivera Calle Piérola N°107, Mariano Melgar, Arequipa. © Primera Edición – Febrero del 2017. HECHO EL DEPÓSITO LEGAL EN LA BIBLIOTECA NACIONAL DEL PERÚ ISBN N° © Prohibida la reproducción total o parcial de esta obra sin previa autorización escrita del editor. © Impreso en Perú / Printed in Perú. iv RESUMEN Este texto Universitario a guisa de ensayo primigenio, podrá ser empleado básicamente por los estudiantes de Educación Superior, por que implícitamente aborda los temas tan complicados de manera sencilla a fin de satisfacer los diferentes ritmos de aprendizaje que cada persona tiene con el mundo abstracto de la ciencia, el arte y la tecnología. Los cálculos que en ella se incluyen son básicos para toda Carrera Profesional y sobre todo cuando iniciemos una investigación de enfoque cuantitativo necesitamos calcular o contar toda la información poseída y mucha veces lograda con mucho esfuerzo, para poder inferir a través de ella, obtener conclusiones y lo que es más delicado aún tomar decisiones. Cada capítulo contiene un dossier de ejercicios de afianzamiento así como su correspondiente autoevaluación, cuya diversidad son producto de la enseñanza que se ejerce en la docencia Universitaria. Esta obra se ha clasificado en 6 capítulos que a nuestro entender constituye el tema de Estadística y Probabilidades, en la primera parte se abarca los temas generales y una introducción al estudio y tratamiento de datos, una segunda parte con la organización y/o presentación de los datos para posteriormente cuantificarlos con las medidas correspondientes es decir, de tendencia central y la variabilidad, incluimos el tema de Números Índices a fin de que se tenga una correlación de datos con su obtención y las diferentes interpretaciones que podemos obtener con ellos, por ejemplo si son o no simétricos o el grado de apuntalamiento que pudieran presentar en tal o cual situación terminando con el estudio de las probabilidades, sus usos, enfoques y la trascendencia que implica manejar la ocurrencia o no de un siempre para la toma de decisiones. v determinando evento o suceso PRESENTACIÓN: Este trabajo tiene como objeto contribuir al enriquecimiento cognitivo del estudiante, sirviendo como guía por esa ruta de aprender a aprender esta rama tan importante de las matemáticas como es la estadística, la única asignatura que nos enseña el arte de la toma de decisiones. En la literatura es común encontrar numerosos textos de Estadística llenos de vocabulario abstracto y un lenguaje técnico bastante sofisticado que algunas veces se muestra árido para el estudiante, que en vez de acercarlo a su dominio, suele muchas veces alejarlo, dado que adolecen de un sentido práctico y funcional de la Estadística, es por eso que nos sentimos animados a llevar adelante este proyecto de ofrecer este texto universitario como herramienta complementaria hacia los logros de aprendizaje de esta signatura. Anteriormente el término estadística solo era aplicado para asuntos de gobierno, sin embargo hoy en día se hace extensivo su uso en todas las disciplinas del conocimiento y cómo no en las facetas cotidianas de la vida humana, porque nuestro actuar se basa en tomar decisiones permanentes. Así, utilizamos estadística para la biología, los negocios, la medicina, sociología, la enseñanza, pero fundamentalmente es una herramienta básica del proceso de investigación a todo nivel. Como conocimiento prerrequisito señalamos la aritmética y algunos conocimientos de álgebra. Se incluye en éste texto seis capítulos y cada uno de ellos ilustrados con ejemplos y al final se invita al estudiante a resolver los ejercicios de aplicación para cada ítem, así como también en cada capítulo se encuentran las pruebas de Autoevaluación que permitirá al estudiante comprobar el logro de su aprendizaje. Debemos dejar clara constancia que no somos autores de todo lo que se encuentra en el presente texto, dado que los conocimientos, definiciones y algunos ejemplos, se van recreando y contextualizando a las exigencias de uso de los diferentes ritmos de aprendizaje de cada estudiante, cada autor va imprimiendo en dicha recreación su sello personal y la dirección con que induce al estudiante para el logro de los objetivos trazados, el nuestro es que el joven se recree con los ejemplos que se consignan, buscando constituir una herramienta fácil y sencilla para la toma de decisiones. Valoramos el aporte de los diferentes autores de quienes se ha nutrido el presente texto, cuya referencia indicamos oportunamente en la Bibliografía y que son muchos y si existiera alguna omisión es totalmente involuntaria. Finalmente, deseo agradecer a la Universidad Autónoma San Francisco por impulsar y cooperar con el logro de este proyecto. Ing. Rolando W. Rivera Olivera vi INDICE ING. ROLANDO W. RIVERA OLIVERA ....................................................................................... i UNIVERSIDAD AUTONOMA SAN FRANCISCO ......................................................................... i PRESENTACIÓN: ..................................................................................................................... vi CAPITULO I ................................................................................................................................. 1 1. CONCEPTOS GENERALES................................................................................................ 1 1.1. ESTADISTICA .................................................................................................................... 1 1.2. CLASES DE ESTADISTICA ............................................................................................ 1 1.2.1. Descriptiva – subjetiva : ..................................................................................... 1 1.2.2. Inferencial – objetiva: .......................................................................................... 2 1.3. TERMINOLOGÍA ESTADÍSTICA .................................................................................... 2 1.4. VARIABLES Y ATRIBUTOS ............................................................................................ 5 1.5. FORMAS DE OBSERVAR LA POBLACIÓN: ............................................................... 6 1.5.1. ATENDIENDO A LA FUENTE.- se clasifican en directa o indirecta.............. 6 1.5.2. ATENDIENDO A LA PERIODICIDAD.- puede ser continua, periódica o circunstancial. ..................................................................................................................... 7 1.6. CENSO: ............................................................................................................................... 8 1.7. Encuesta: ............................................................................................................................ 9 1.8. MODALIDADES DE RECOLECCIÓN DE DATOS: ..................................................... 9 1.8.1. Fuentes de información: ..................................................................................... 9 1.8.2. Sistemas de recolección: ............................................................................... 10 1.8.3. Técnicas de recoleccion ................................................................................... 10 1.9. ESCALAS O NIVELES DE MEDICION ........................................................................ 11 1.9.1. Medición................................................................................................................ 11 1.9.2. Niveles o Escalas de mediciones................................................................... 11 1.10. LAS VARIABLES Y SU MEDICIÓN: .................................................................... 14 1.11. INTERVALO. ............................................................................................................. 16 1.12. RAZÓN. ..................................................................................................................... 16 1.13. FORMAS DE RECOLECTAR INFORMACIÓN .................................................. 17 1.14. MUESTREO. ............................................................................................................. 17 1.14.1. Aleatorio Simple: ................................................................................................ 18 1.14.2. Sistemático: ......................................................................................................... 19 1.14.3. Estratificado: ....................................................................................................... 19 vii 1.14.4. Por conglomerados; En este caso la muestra nos presenta gran dificultad para establecer sus diferencias, por lo que iniciamos seleccionando en forma aleatoria una muestra de conglomerados, ya que, cada uno de ellos podría representar una muestra, posteriormente se deberá elaborar un censo para poder establecer las proporciones de las diferentes categorías que se encuentren presentes en nuestra muestra. ....................................................................................... 19 CAPITULO II .............................................................................................................................. 27 2. PROCESO ESTADISTICO. ................................................................................................ 27 2.1. ORGANIZACIÓN Y RESUMEN DE DATOS.- Cuando se tiene ya los datos que han sido tomados, recolectados, se procede a prepararlos y ordenarlos con un criterio sistemático, de forma que, puedan determinarse las características que se pretendan analizar, del cual nos ocuparemos en esta parte, denominamos a esta etapa como tabulación de resultados, es decir, representarlo mediante unas tablas que describiremos más adelante. ...................................................................... 27 2.2. DISTRIBUCIÓN DE FRECUENCIAS. .............................................................. 27 2.3. CLASIFICACIÓN DE DISTRIBUCION DE RECUENCIAS:........................... 28 2.4. Pasos para la elaboración de un tabla de distribución de frecuencias: 29 2.5. OTRAS FORMAS DE ELABORAR LA TABLA DE DISTRIBUCION DE FRECUENCIAS. ............................................................................................................... 33 2.6. FUENTE DE DATOS. .......................................................................................... 40 2.7. REPRESENTACION GRAFICA ........................................................................ 43 CAPITULO III ................................................................................................................................ 63 3 MEDIDAS DE CENTRALIZACIÓN ................................................................................... 63 3.1. MEDIDAS DE TENDENCIA CENTRAL MÁS UTILIZADAS. ....................... 63 3.2. MEDIDAS DE TENDENCIA CENTRAL PARA CASOS ESPECIALES ..... 75 3.3. MEDIDAS DE POSICIÓN ................................................................................... 86 CAPITULO IV ............................................................................................................................. 103 4. MEDIDAS DE DISPERSIÓN. ........................................................................................... 103 Introducción: .................................................................................................................... 103 4.1. RANGO o alcance (o Intervalo: R ): ............................................................... 103 4.2. RANGO INTER CUARTIL (RI): ....................................................................... 104 4.3. RANGO SEMI-INTER CUARTIL (RSIQ): (o Desviación Cuartil) ............ 104 4.4. DESVIACIÓN MEDIA ABSOLUTa (DM): (o Desviación Absoluta Promedio) 104 4.5. VARIANZA: ......................................................................................................... 105 4.6. DESVIACIÓN ESTÁNDAR: ............................................................................. 107 4.8. MEDIDAS DE FORMA ...................................................................................... 109 viii 4.9 MEDIDAS DE CONCENTRACIÓN ................................................................. 113 CAPITULO V ............................................................................................................................... 127 5 NUMEROS INDICES. ........................................................................................................ 127 5.1 Concepto. ........................................................................................................... 127 5.2 Número índice simple de precio, cantidad y valor .................................. 127 5.3 Índices relativo de precios ............................................................................. 128 5.4 Índice de cantidad o volumen relativo ........................................................ 130 5.5 Índice de valor ................................................................................................... 130 5.6 Índices de Agregación Simple. ..................................................................... 132 5.7 Método de media de Relativos simples...................................................... 132 5.8 Método de cálculo de los índices por agregación ponderada. ............ 133 5.9 METODO DE MEDIA DE RELATIVOS PONDERADA ............................... 135 5.10 NÚMEROS INDICES DE CANTIDAD O VOLUMEN. .................................. 136 5.11 NUMEROS INDICES DE VALOR ................................................................... 136 CAPITULO VI .......................................................................................................................... 145 6. PROBABILIDAD. ............................................................................................................... 145 6.2. SUCESO ELEMENTAL: hace referencia a cada una de las posibles soluciones que se pueden presentar. ......................................................................... 147 6.3. SUCESO COMPUESTO: .................................................................................. 147 6.4. RELACIÓN ENTRE SUCESOS ....................................................................... 148 6.5. CÁLCULO DE PROBABILIDADES ................................................................ 149 6.6. PROBABILIDAD DE SUCESOS ..................................................................... 152 6.7. ANALISIS COMBONATORIO Y PROBABILIDAD. ..................................... 155 6.8. PROBABILIDAD CONDICIONADA ................................................................ 169 6.9. PROBABILIDAD COMPUESTA ...................................................................... 171 6.10. TEOREMA DE LA PROBABILIDAD TOTAL ................................................ 172 6.11. TEOREMA DE BAYES ..................................................................................... 174 6.12. SUCESOS INDEPENDIENTES ....................................................................... 176 6.13. DISTRIBUCIONES DISCRETAS: BERNOUILLI .......................................... 178 6.14. DISTRIBUCIONES DISCRETAS: BINOMIAL .............................................. 180 6.15. DISTRIBUCIONES DISCRETAS: POISSON ................................................ 181 ix CAPITULO I 1. CONCEPTOS GENERALES 1.1. ESTADISTICA La estadística es una Técnica, arte, ciencia que forma parte de una comunicación gráfica. Es el estudio de datos. “es la primera herramienta de la investigación que se ocupa de la recolección, estudio, organización y análisis e interpretación de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables.” 1.2. CLASES DE ESTADISTICA 1.2.1. Descriptiva – subjetiva : Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial). En relación a la estadística descriptiva, Ernesto Rivas González dice; “Para el estudio de estas muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendrá dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilará dentro de cierto límite de confianza, que casi siempre es de un 95 a 99% de los casos. 1 Podemos decir también que es subjetivo depende de los sentimientos, estados de ánimo. 1.2.2. Inferencial – objetiva: Se basa en hechos reales tal y como son, además se apoyan en el cálculo probabilístico y utiliza pruebas objetivas para obtener inferencias y predicciones; utiliza estimaciones que más adelante tendrán validez general. Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística. Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigación científica y tecnológica radica en identificar clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos. 1.3. TERMINOLOGÍA ESTADÍSTICA ❖ Población.- conjunto de unidades de análisis que conforman un todo que tienen propiedades comunes. “Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones”. Levin&Rubin (1996). “Una población es un conjunto de elementos que presentan una característica común”. Cadenas (1974). Ejemplo: Los miembros del Colegio de Ingenieros de la Región Arequipa. El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de 2 elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de estudiante del ISEP “Honorio Delgado E.”, o los Estudiantes de la Universidad UANCV. Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística. Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar al grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra. ❖ Muestra.- una parte del todo con propiedades diferentes. “Se llama muestra a una parte de la población a estudiar que sirve para representarla”. Murria R. Spiegel (1991). “Una muestra es una colección de algunos elementos de la población, pero no de todos”. Levin&Rubin (1996). “Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia”, Cadenas (1974). Ejemplo; El estudio realizado a 50 miembros del Colegio de Ingenieros de la Región Arequipa. El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población. Los expertos en estadística recogen datos de una muestra. Utilizan esta 3 información para hacer referencias sobre la población que está representada por la muestra. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo. ❖ Muestreo.-Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población. Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra. Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra. Ejemplo; Consideremos como una población a los estudiantes de Contabilidad del ISEP “Honorio Delgado E.” de la ciudad de Arequipa, determinando por lo menos dos caracteres a ser estudiados en dicha población: Religión y Expectativas profesionales; estas serán diferentes a los de los estudiantes de Administración, lo que corrobora que hay variación de muestra a muestra. ❖ Tipos de muestreo.- Existen dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante. Las muestras de juicio evitan el análisis estadístico necesario para hacer muestras de probabilidad. ❖ Dato.- es un atributo, una cualidad, una habilidad, todo atributo, toda variable, todo lo que existe en nuestro mundo real. 4 ❖ Parámetro.- son las medidas de la población. ❖ Estadígrafo o estadístico.- son las medidas de las muestras en relación al tamaño de la población pueden ser finitas e infinitas. ❖ Características, propiedades, rasgos, atributos de una unidad de análisis, de carácter cualitativa y cuantitativa. ❖ Modalidades.- son los diferentes estados o situaciones de un carácter estas deben ser a la vez muy exhaustivas y además mutuamente excluyentes. ❖ Clases.- es el conjunto de una o más modalidades en el que se verifica en que cada modalidad pertenece a uno solo y a una clase. 1.4. VARIABLES Y ATRIBUTOS Es todo dato o característica de una unidad de análisis que puede tomar cualquier valor cualitativo o cuantitativo. Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Según, Murray R. Spiegel, (1992) “una variable es un símbolo, tal como X, Y, 𝑓𝑋 , que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante.” Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son los “valores de la variable”. Todos ellos juntos constituyen una variable. Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número. Iutin (1997). “Reciben el nombre de variables cualitativas o atributos, 5 aquellas características que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de “modalidades”. Ejemplo; El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en la misma modalidad en todos. 1.5. FORMAS DE OBSERVAR LA POBLACIÓN: 1.5.1. ATENDIENDO A LA FUENTE.- se clasifican en directa o indirecta. • Observación directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos originales. Para Ernesto Rivas González (1997) “Investigación directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama también a esta investigación primaria”. Ejemplo: El seguimiento de la población agrícola por año, llevado en una determinada granja. • Observación Indirecta: es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación 6 anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos. Ejemplo; si un investigador pretende estudiar la producción por años de una granja avícola, en el Distrito de la Joya, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a tal fin recurriría a las observaciones que posee la oficina administrativa de la granja durante estos cinco años, o dirigirse a la oficina de estadística, llevada en la Gerencia del Ministerio de la Producción y Comercio de nuestra localidad donde está registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros. 1.5.2. ATENDIENDO A LA PERIODICIDAD.- puede ser continua, periódica o circunstancial. Una observación continua; Como su nombre lo indica es aquella que se lleva acabo de un modo permanente. Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van produciéndose. • Una observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc. Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben tomarse constantes en lo posible. Ejemplo; el registro llevado por la Oficinas de Secretaría Académica de la Universidad UANCV, en cuanto a la inscripción de los estudiantes por semestre. La observación circunstancial, es aquella que se efectúa en forma 7 ocasional o esporádica, esta observación hecha más por una necesidad momentánea, que de carácter regular o permanente. Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en el campus del ISEP “Honorio Delgado E.” en la ciudad de Arequipa. 1.5.3. ATENDIENDO A LA COBERTURA. pueden ser exhaustivas, parciales o mixtas • Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación exhaustiva. • Observación Parcial. Dados que las poblaciones en general son grandes, la observación de todos sus elementos se ve imposibilitada. La solución para superar este inconveniente es observar una parte de esta población. • Observación Mixta. En este tipo de observación se combinan adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la población es muy grande, parte de ella se observa parcialmente. 1.6. CENSO: Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Para Levin&Rubin (1996) “Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. A esto lo llamamos una numeración completa o censo. Utilizamos el muestreo cuando no es posible contar o medir todos los elementos de la población. Si es posible listar (o enumerar) y observar cada elemento de la población, los censos se utilizan rara vez porque a menudo su 8 compilación es bastante difícil, consume mucho tiempo por lo que resulta demasiado costoso. 1.7. Encuesta: Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974). Según Antonio Napolitano “La encuesta, es un método mediante el cual se quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas”. 1.8. MODALIDADES DE RECOLECCIÓN DE DATOS: 1.8.1. Fuentes de información: Es el lugar, la institución o persona donde están los datos que se necesitan para cada una de las variables o aspectos de la investigación. Las fuentes de información pueden ser: a) Fuentes primarias: Cuando los datos se obtienen directamente de la misma persona o entidad utilizando ciertas técnicas. Ejemplo: Llevar a cabo una encuesta para conocer el grado de satisfacción laboral en los trabajadores de una empresa “X”. b) Fuentes secundarias: Cuando los datos ya han sido elaborados y procesados por otras personas o instituciones. Ejemplo: La información estadística que diferentes ministerios del Perú. 9 publica el INEI de los 1.8.2. Sistemas de recolección: Son procedimientos que se utilizan para recoger información y pueden ser: a) Los registros: Son libros, padrones, etc. en donde se anotan en forma regular permanente y obligatoria los hechos ocurridos. Ejemplo Registros Civiles, RENIEC, Registros Públicos, Registros Electrónicos, etc. b) Las encuestas: Son procedimientos de obtención de información estructurada según criterios previos de sistematización que se efectúa con un propósito específico en toda la población o en un sector de ella y pueden ser: b.1) Encuesta censal: Cuando abarca toda la población en estudio. Ejemplo: Censos de población y vivienda de una localidad o país. b.2) Encuesta muestral: Cuando abarca una parte de la población en estudio. Ejemplo Llevar a cabo una Encuesta de preferencia electoral. 1.8.3. Técnicas de recoleccion Son procedimientos que se utilizan para recolectar información según la observación, naturaleza del trabajo de investigación. Pueden ser: La observación, el cuestionario, la entrevista, test, etc. a) La observación: Es la acción de mirar con rigor, en forma sistemática y profunda, con el interés de descubrir la importancia de aquello que se observa. b) El cuestionario: Es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas, que se formulan al encuestado o entrevistado, con el propósito de obtener datos de las 10 variables consideradas en estudio. c) La entrevista: Es un diálogo entre personas, es una técnica donde una persona llamada entrevistador, encuestador o empadronador solicita al entrevistado, le proporcione algunos datos e información. d) El test : Pruebas o exámenes con ayuda de un cuestionario o escala que mide determinadas funciones, generalmente cognitivas. 1.9. ESCALAS O NIVELES DE MEDICION 1.9.1. Medición Existen diversas definiciones del término “medición”, pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificación y el proceso mismo de la construcción de una escala o instrumento de medición. En general, se entiende por medición la asignación de números a elementos u objetos para representar o cuantificar una propiedad. El problema básico está dado por la asignación de un numeral que represente la magnitud de la característica que queremos medir y que dicho números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas “números”. Es evidente que el mundo resultaría caótico si no pudiéramos medir nada. En este caso cabría preguntarse de que le serviría al físico saber que el hierro tiene una alta temperatura de fusión. 1.9.2. Niveles o Escalas de mediciones 1.9.2.1. Escala Nominal: La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no 11 ser el de que cada elemento pueda pertenecer a una y solo una de estas categorías. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones por las cuales se le conoce como “medidas nominales”. Ejemplo, podemos estar interesados en clasificar los estudiantes de la UASF Distrito de Tiabaya de acuerdos a la carrera que cursan. Carrera Número asignada a la categoría Ing. Industrial 01 Ing. Comercial 02 Ing. Mecánica 03 Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente para identificar la categoría y no poseen propiedades cuantitativas. 1.9.2.2. Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de “orden” de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B. 12 La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre éstas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana. Ejemplo: Al asignar un número a los pacientes de una consulta médica, según el orden de llegada, estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número representará una categoría en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los números asignados guardan la misma relación que el orden de llegada a la consulta. 1.9.2.3. Escalas de intervalos iguales: La escala de intervalos iguales, está caracterizada por una unidad de medida común y constante que asigna un número igual al número de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta escala, además de poseer las características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación. 13 Ejemplo: El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001. 1.9.2.4. Escala de coeficientes o Razones: El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B. Ejemplo: En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos 1.10. LAS VARIABLES Y SU MEDICIÓN: Una variable es un símbolo, tal como X, Y, H, x ó b, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) “una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta”. Una Variable puede ser también clasificada de dos formas atendiendo su naturaleza: Cuantitativas y cualitativas, las primeras se pueden expresar por cantidades y la segunda sólo resalta las cualidades o atributos especiales y no se expresan con cantidades medibles sino en categorías o atributos. 14 Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas Las variables continuas se caracterizan por el hecho de que para todo par de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, temperatura, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos y expresarse con fracciones o decimales. Ejemplo: En el preescolar Niña María, ubicado en la urbanización San Martin, Mariano Melgar de esta ciudad se procedió a recoger las medidas de talla y peso de los niños que a este asisten. Niño Peso Talla José 18,300 1,15 Julio 20,500 1,20 Pedro 19,000 1,10 Luis 18,750 1,18 Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2, 3, 4... Nótese que no encontramos valor como 1,5 estudiantes Las escalas más frecuentes de medición son el nominal, ordinal del intervalo y de razón; estas mediciones se deben expresar como un número que informe lo más preciso posible sobre las características en la unidad observada. 15 RESUMEN DE VARIABLES: Cualitativas.- muestran atributos, cualidades, categorías, no cantidades. Cuantitativas.- resulta de medir y pesar o contar y si se expresa en cantidades. • Contar: discretas (carro, personas, edad) son aquellas que se cuenta y no éxpresan fracciones o decimales. • Medir, pesar: continuas.- (Talla, temperatura, presión, velocidad, etc.) Se pueden expresar en fracciones y aceptan cantidades decimales. Dependiente: Efecto (bajo rendimiento académico) Independiente: Causa Principal (no tiene apoyo logístico) Intervinientes: Cusas secundarias: (no estudia, no asiste, llega tarde, trabaja, etc.) 1.11. INTERVALO. Además de las características anteriores se tiene que analizar la diferencia entre los números asignados ya que representa propiamente, cantidades de la característica medida y estas se expresan en rangos, parámetros, que se pueden estimar dentro de un conjunto de datos, entonces podemos indicar que una cierta cantidad está entre dos valores uno máximo y otro mínimo al cual denominamos intervalo (k). a≤k≤b k a b 1.12. RAZÓN. Aquí, los propios números asignados en la medida ya representan cantidades de las características que se mide, estas escalas se caracterizan no solo por tener una unidad de medida sino también por poseer un cero absoluto u origen natural el cual significa ausencia de la característica por tanto más prima las razones convencionales en su uso. • Cuestionarios -------------------- • Entrevista --------------------- preguntas abiertas • Encuesta • Observador descriptivo --------- preguntas abiertas ------------------- preguntas cerradas 16 objetivo 1.13. FORMAS DE RECOLECTAR INFORMACIÓN 1.13.1 Directa: Cuando vamos a recoger información en forma personal con instrumentos diseñados para las circunstancias específicas. 1.13.2 Indirecta: Cuando los datos o información ya están registrados y almacenados. Ej. Ios datos que se obtienen de las instituciones como Municipalidades, Hospitales, Colegios, Comisarias, Centros de salud, Bibliotecas, Internet, Reniec etc. etc. 1.14. MUESTREO. Cuando ya se han identificado el problema que deseamos resolver, la población, el tipo de datos y las variables con las que nos acercaremos a la información entonces será necesario especificar si es necesario trabajar solo con la población o con una muestra así como la forma en la que obtendremos los datos. Por lo anterior se describirán las diferentes formas de obtener una muestra: Dentro de la estadística se pueden obtener muestras que resultan probabilísticas y las no probabilísticas, diferenciándose en el método de su consecución, es decir, cuando utilizamos un método que nos garantice que todos los elementos de una población tienen la misma probabilidad de ser elegidos estamos trabajando con un muestreo probabilístico y cuando la obtención de una muestra resulte de criterios, juicios, preferencias o cualquier elemento subjetivo (o en otras palabras, que no podamos garantizar que contemos con elementos equiprobables) entonces estaremos trabajando con un muestreo no probabilístico. De ahí que nos enfocáremos más a los primeros; subdividiéndolos en: 17 1.14.1. Aleatorio Simple: El muestreo aleatorio requiere del tamaño de la población “N”, el tamaño de la muestra “n”, de una tabla de números aleatorios, especificar si se realizará con reemplazo o sin él, así como, de una regla de uso (no debe ser la misma en todos los casos) y determinar el número de dígitos que se utilizarán. Por ejemplo; si me intereso en determinar el nivel socioeconómico de 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 1 0 5 3 5 0 9 6 8 3 4 5 6 3 2 5 8 0 3 9 5 5 9 3 9 4 2 3 4 3 9 5 5 0 6 0 9 0 5 2 7 4 5 9 4 9 2 3 2 2 1 9 9 7 5 2 5 8 5 5 3 3 9 2 4 8 8 0 5 4 5 6 6 3 6 2 5 3 1 4 5 9 8 9 1 9 1 7 4 7 9 7 5 1 9 1 8 1 4 9 3 0 3 0 8 4 4 9 6 2 3 9 0 6 5 9 9 0 0 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 0 9 4 5 6 4 9 4 9 0 5 7 7 6 9 4 4 6 8 2 3 4 9 9 3 7 7 6 8 4 9 3 8 3 5 5 9 0 8 5 6 7 1 6 0 2 7 7 7 8 4 3 3 1 6 4 4 1 9 6 8 9 6 8 4 4 0 3 4 1 4 3 2 7 2 0 3 9 4 9 9 0 1 1 6 2 0 9 7 0 1 0 8 1 6 0 7 9 4 0 7 3 8 0 5 1 8 5 6 1 5 9 1 8 2 3 9 4 4 8 3 5 9 9 3 7 6 3 7 3 5 1 8 6 4 3 2 6 8 0 8 2 4 1 2 1 7 2 2 2 8 3 8 7 6 0 4 7 8 5 6 1 4 8 5 6 9 7 7 5 1 0 7 5 6 4 2 0 5 7 0 2 5 7 1 9 7 2 0 2 7 8 8 9 7 1 6 8 0 4 4 7 3 7 7 6 0 6 9 9 7 2 0 8 9 1 9 8 8 4 2 1 3 7 3 0 0 4 8 7 7 9 0 7 4 3 6 1 las personas que se encuentran trabajando dentro de una empresa y deseo que todos sus integrantes tengan la misma probabilidad de ser elegidos entonces realizo lo siguiente: determino el número total de empleados (N=200), el número de personas que integrarán la muestra (n=10), selecciono una regla para utilizar mi tabla de números aleatorios (lanzaré mi lápiz y donde caiga leeré de 3 en 3 dígitos sobre la misma columna hacia abajo hasta terminarla y cuando esto suceda continuare leyendo en la siguiente columna hasta terminar de obtener los diez datos). Supongamos que la tabla es la siguiente y que al arrojar el lápiz cayó en el renglón 5 columna 7, entonces, las personas que debemos seleccionar serán: 097,766, 628,179, 047, 582, 478, 895, 664, 604, 772, 373, 685, 765, 553, 101, 780, 295, 191, 276, 321, 298, 797, 454, 544, 221, 458, 097,363, 158, 409, 517, 279, 458, 243, 755, 061, 212, 061, 641, 112, tomando en cuenta que es un muestreo con reemplazo. 18 1.14.2. Sistemático: Este muestreo permite obtener los elementos de cada k - ésima unidad de la población, y para ello se requiere conocer el tamaño de la población (N), el de la muestra (n) y obtener el valor de k, de tal forma que al tener estos datos escojamos al primer dato por medio del número aleatorio simple y de ahí de k en k. K N n Por ejemplo; si tenemos la necesidad de extraer una muestra de 20 artículos de 1000 unidades producidas entonces deberemos dividir 1000/20 obteniendo 50 por lo que el primer número lo seleccionamos de nuestra tabla de números aleatorios obteniendo el número 12, por lo que, los siguientes números deberán ser 12+k, 12+2k, etc., es decir, 12, 62,112, 162, 212, 262, 312, 362, 412, 462, 512, etc. 1.14.3. Estratificado: Este tipo de muestreo requiere tener una población bien clasificada en varios grupos llamados estratos, que a su interior se mantengan bastante homogéneos, para construir la muestra normalmente se toma una cantidad de elementos del mismo tamaño de cada uno de los estratos, este debe ser mediante el muestreo aleatorio simple (m.a.s.); aunque en algunos casos cuando las proporciones de los estratos son distintas se toman en cuenta. 1.14.4. Por conglomerados; En este caso la muestra nos presenta gran dificultad para establecer sus diferencias, por lo que iniciamos seleccionando en forma aleatoria una muestra de conglomerados, ya que, cada uno de ellos podría representar una muestra, posteriormente se deberá elaborar un censo para poder establecer las proporciones de las diferentes categorías que se encuentren presentes en nuestra muestra. 19 Ejercítate en: ¿Podrías escoger los números del juego “Tinka” mediante un muestreo probabilístico?, ¿De poder cuál utilizarías?, ¿Qué números seleccionarías?, ¿Te atreverías a pagar por esos números? 20 EJERCICIOS PROPUESTOS N° 1 1. Para cada caso señale qué tipo de variables son: a. Puntaje en un a examen de un curso en la Carrera de Contabilidad. b. Número de teléfono celular c. El ranking de un examen. d. Tiempo de reacción ante un estímulo visual. e. Número de DNI. f. Ingreso mensual familiar. g. Pérdida de peso en Kilogramos de las personas subidas en peso. h. Intensión de voto para las próximas elecciones. i. Dirección de una vivienda. j. Número de botes que da una pelota al ser lanzado de cierta altura. 2. Para cada uno de los siguientes casos: a. Identificar: Población, muestra unidad de análisis, variable y tipo de variable. b. Clasificar los datos en una tabla de distribución de frecuencias, usar criterio personal. c. Interpretar el significado de: 𝑓2 , ℎ3 , 𝐹4; 𝐻3 ; 𝑝4 (𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑠𝑖𝑚𝑝𝑙𝑒); 𝑃2 (𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑜). 2.1. Una empresa que vende microcomputadoras ha llevado a cabo un estudio para analizar el número de microcomputadoras que existe en pequeñas empresas del distrito A. Para el efecto toma una muestra aleatoria de 40 empresas, encontrando los siguientes resultados: 5; 7; 9; 7; 8; 5; 4; 4; 3; 7 8; 4; 9; 6; 8; 7; 6; 9; 8; 4 6; 4: 7; 4; 3; 5; 8; 5; 9; 6 7; 9; 4; 7; 5; 8; 7; 9; 6; 8 2.2. Un experto en computadoras, tratando de optimizar la operación de un sistema, reunió datos sobre el tiempo, en microsegundos, entre las solicitudes de servicio de un proceso especial. 21 2,81; 4, 20; 3, 85; 9,11; 2,08; 5, 91; 1, 62; 6, 72; 21, 66 3,07; 2,95; 8,77; 4,73; 9,21; 14,21; 1,58; 9,85; 78,81 2.3. 6,65; 1,80; 7,01; 1,89; 4,23; 6,58; 4,74; 8,53; 10,56 43,0; 16,72; 2,61; 26,46; 34,87; 4,19; 4,03; 2,78; 28,81 La confiabilidad de un sistema de cómputo se mide en términos de vida de un componente de hardware específico (por ejemplo, la unidad del disco). Se prueba un conjunto de componentes de computadora hasta que fallen, y se registra su vida (en meses). 12 18; 5; 2; 8; 24; 17; 5; 9; 15 27; 35; 18; 14; 3; 9; 15; 20; 24; 27 30; 22; 21; 17: 20; 36; 28; 23; 12; 11 22; 32; 37; 40; 28; 36; 35; 39; 12; 19 28; 20; 15; 6; 2.4. 4; 12; 16 El tiempo de respuesta de una computadora se define como el tiempo que un usuario debe esperar mientras la computadora accede a información en el disco. Se observaron aleatoriamente un grupo de 48 computadoras del Laboratorio de Contabilidad y se obtuvo los siguientes resultados (en milisegundos): 59 92 54 48 73 60 73 75 74 84 33 61 71 38 47 53 63 48 41 68 60 44 39 34 75 86 72 50 47 52 65 68 70 47 40 36 70 38 40 52 60 50 90 84 72 88 49 40 2.5. En las fechas recientes se recabaron datos correspondientes a la velocidad MHz de 50 computadoras elegidas al azar en las oficinas de la UASF. 33 25 20 33 25 16 16 16 16 20 12 20 33 33 20 33 20 12 25 20 33 25 16 25 33 25 20 20 20 20 12 25 16 16 20 16 25 20 25 16 22 AUTOEV ALUACIÓN I NOMBRE…………………………………………………… CARRERA…….. 1. Indica qué variables son Cualitativas(Cl) y cuáles Cuantitativas (Ct) a) Profesión que te gusta. ( ) b) Número de goles marcados por tu equipo favorito en la última temporada ( ) c) Comida Favorita. ( ) d) Número de alumnos de tu Instituto. ( ) e) El color de los ojos de tus compañeros de c lase. ( ) f) f) Coeficiente intelectual de tus compañeros de clase. ( ) 2. De las siguientes variables indica cuáles son discretas: (D) y cuales continuas:(C) a. Número de acciones vendidas cada día en la Bolsa. ( ) b. Temperaturas registradas cada hora en un observatorio. ( ) c. Período de duración de un automóvil. ( ) d. El diámetro de las ruedas de varios coches. ( ) e. Número de hijos de 50 familias. ( ) f. Censo anual de los españoles. ( ) 3. Clasificar las siguientes variables en cualitativas( C ) y cuantitativas discretas( CD) ó continuas ( CC). a. La nacionalidad de una persona. ( ) b. Número de litros de agua contenidos en un depósito. ( ) c. Número de libros en un estante de librería. ( ) d. Suma de puntos tenidos en el lanzamiento de un par de dados . ( ) e. La profesión de una persona. ( ) f. El área de las distintas baldosas de un edificio. ( ) 23 4. Responda con palabras concretas sobre los siguientes términos: a. Probabilidad………………………………………………………………………… ………………………………………………………………………………………… …… b. Estadístico………………………………………………………………………… … ………………………………………………………………………………………… …. c. Atributo.……………………………………………………………………………… ………………………………………………………………………………………… …. d. Población……………………………………………………………………………… …………………………………………………………………………………………. e. Unidad de análisis ………………………………………………………………………………………… ………………………………………………............................. f. Variable……………………………………………………………………………… ………………………………………………………………………………………… …. g. Gráfico estadístico………………………………………………………. ………………………………………………………………………… h. Intervalo de confianza .………..……………………………………………………………… ………………………………………………………………………… 24 5. Explique: a. La diferencia que existe entre Estadística Descriptiva y probabilística b. La diferencia entre Variable Cuantitativa contínua y discreta. c. La diferencia entre lo Objetivo y Subjetivo. d. La diferencia entre Población y muestra. 6. Diga específicamente qué razones existen para efectuar un muestreo? 7. Consigne en qué consisten, si fuera el caso y en qué casos se aplican las: a. Preguntas abiertas. b. Preguntas cerradas. c. Preguntas mixtas d. Fichas de observación. e. Fichas de entrevista. f. Manuales. 25 26 CAPITULO II 2. PROCESO ESTADISTICO. Una vez encontrados los datos de manera directa o indirecta el paso que sigue consiste en investigar el comportamiento de un fenómeno aleatorio para lo cual se utilizan técnicas propis de la estadística y tiene los siguientes pasos: • Toma de datos • Organización y resumen de datos • Análisis e interpretación 2.1. ORGANIZACIÓN Y RESUMEN DE DATOS.- Cuando se tiene ya los datos que han sido tomados, recolectados, se procede a prepararlos y ordenarlos con un criterio sistemático, de forma que, puedan determinarse las características que se pretendan analizar, del cual nos ocuparemos en esta parte, denominamos a esta etapa como tabulación de resultados, es decir, representarlo mediante unas tablas que describiremos más adelante. 2.2. DISTRIBUCIÓN DE FRECUENCIAS. Es una organización de datos, en la cual se distribuyen los resultados de la recopilación de información en tablas o cuadros al que denominamos; tabla de distribución de frecuencias o un agrupamiento de datos estadísticos que están ordenados y agrupados en clases o categorías que muestran la cantidad y los porcentajes de observaciones de cada una de ellas. 27 Los datos agrupados posteriormente se pueden representar en tablas, en cuadros y estos originan grafico de diferente tipo, las mismas que nos permiten observar el comportamiento de este fenómeno aleatorio. 2.3. CLASIFICACIÓN DE DISTRIBUCION DE RECUENCIAS: Las distribuciones de frecuencias se construyen de acuerdo a la variable y su clasificación está dada por: distribuciones de frecuencias en puntos aislados, distribuciones de frecuencias en intervalos de clase y distribuciones de frecuencias por atributos o categorías, tal como se muestra en el siguiente mapa conceptual. 28 Ing. Rolando W. Rivera Olivera 2.4. Pasos para la elaboración de un tabla de distribución de frecuencias: Para elaborar una tabla de distribución de frecuencias seguiremos los siguientes pasos: a. Determinar el rango o amplitud de variación ( R ): Es la diferencia entre el dato máximo y el dato mínimo. 𝑹 = 𝑿𝒎𝒊𝒏 − 𝑿𝒎á𝒙 R Dato min. Dato máx b. Número de intervalos: Para encontrar el número de intervalos peticionamos la amplitud de variación o rango en grupos llamados intervalos de clase. 5 ≤ K ≤ 20 Este número depende de la naturaleza de los datos y de los objetivos del analista o investigador; no pueden ser pocos porque no serían significativos para obtener buenas conclusiones, ni tampoco muchos ya que proporcionarían demasiados detalles y se perdería el propósito de la investigación por lo tanto este número de intervalos, de acuerdo a ciertas reglas de convencionalismos deben ser mayor o igual que 5 y menor o igual a 20. Para el número adecuado de intervalos se asumen la recomendación hecha por STURGES que recomienda que el número de intervalos sea igual a: 29 Ing. Rolando W. Rivera Olivera N° de intervalos → 𝐾 = 1 + 3.322 log 𝑛 n número de datos c. Cálculo del Tamaño o Amplitud del intervalo C: El tamaño del intervalo es el rango de cada intervalo y para el grupo de datos resulta de dividir el Rango entre el número de intervalos. 𝑐= Amplitud → 𝑅 𝐾 d. Construir los intervalos de clase: Empezamos con organizar la columna de intervalos con el dato mínimo (𝐿𝑖 ) y luego sucesivamente vamos sumando en cada intervalo al límite inferior y la amplitud ( C - 1 ) 𝐿𝑠 = 𝐿𝑖 + (C - 1) e. Computar la frecuencia de clases: Es decir el número de datos en cada clase o intervalo a la que comúnmente se denomina frecuencia absoluta: ( 𝑓𝑖 ) lo que confirmaremos mejor con el siguiente ejemplo. EJERCICIO No. 1: 1. Se tiene la estatura de 50 estudiantes de un salón en cm. 164 169 160 167 165 168 157 166 171 161 163 152 166 170 166 169 160 172 165 175 174 167 166 162 157 160 172 154 172 167 165 161 159 150 177 174 162 158 155 161 30 167 170 158 173 157 155 172 162 163 182 Ing. Rolando W. Rivera Olivera Efectuar la tabla de distribución de frecuencias y efectuar un análisis básico: a. 𝑹 = 𝑿𝒎𝒊𝒏 − 𝑿𝒎á𝒙 Calculo de rango(𝑹 ): 𝑅 = 182 – 150 b. entonces R= 32 Cálculo de K intervalos: 𝐾 = 1 + 3.322 log (50) = 6,64 ( Este 7 x exceso resultado aproximar a 2 números 6,64 enteros.) 6 X defecto 𝐾1 = 7 𝑦 𝐾 2 = 6 Entonces obtenemos dos valores de K : c. 𝑅 𝑐=𝐾 Cálculo de C Amplitud : C = 32 6 C = 5,83 C = 32 7 C = 4,57 5 6 5 4 Luego despejamos de la fórmula de c, los valores de K y de C, así: 𝐾 ∗ 𝐶= 𝑅 = 7 * 32 5 = 35 De estos valores se descartan los resultados de R que no 7 * 4 = incluyan 28 al valor de R o sea 32 y de los que quedan se 36 sea más próximo a éste, en este caso 35 entonces selecciona al que 6 * 6 = los valores son: 6 * 5 = 30 K =7; C = 5; 31 R = 32 Ing. Rolando W. Rivera Olivera Entonces nuestra Tabla de frecuencias tendrá 7 intervalos de tamaño 5 ↔ 𝐿𝑠 = 𝐿𝑖 + (𝐶 − 1) Luego: 𝑳𝒔 = 150 + (5 − 1) = 154 y así sucesivamente; 𝒀𝒊 : Marca de clase o promedio de cada intervalo: 𝑌𝑖 = 𝐿𝑖 +𝐿𝑠 2 𝒇𝒊 ∶ Frecuencia absoluta: Número de datos en cada intervalo 𝑭𝒊 ∶ Frecuencia Absoluta Acumulada, se inicia desde el primero y se va acumulando hasta el final. 𝒉𝒊 ∶ Frecuencia Relativa 3 50 𝒉𝒊 = 𝑓𝑖 𝑛 en este caso para el 1er intervalo 𝒉𝒊 = = 0,06 𝑯𝒊 : Frecuencia Relativa acumulada. TABLA 1: Estatura de estudiantes de la Universidad. Li - Ls Li - Ls 150 - 154 155 - 159 160 - 164 165 - 169 170 - 174 175 - 179 180 - 184 CONTEO FRECUENCIA FRECUENCIA ABSOLUTA RELATIVA 149,5 - 154,5 III 154,5 - 159,5 IIII III 159,5 - 164,5 IIII IIII II 164,5 - 169,5 IIII IIII IIII 169,9 - 174,5 IIII IIII 174,5 - 179,5 II 179,5 - 184,5 I fi hi 3 8 12 14 10 2 1 50 0,06 0,16 0,24 0,28 0,20 0,04 0,02 1,00 FRECUENCIA FRECUENCIA PORCENTAJE PORCENTAJE ABSOLUTA RELATIVA SIMPLE ACUMULADO ACUMULADA ACUMULADA Fi Hi 3 11 23 37 47 49 50 0,06 0,22 0,46 0,74 0,94 0,98 1,00 Fuente: propia 28% 24% 14 20% 12 16% 10 8 6% 6 4% 2% 4 2 149,50 154,50 1159,50 164,50 169,50 Histograma 32 174,50 179,50 184,50 %S %A 6 16 24 28 20 4 2 100 6 22 46 74 94 98 100 Ing. Rolando W. Rivera Olivera . 14 . 12 . 10 . 8 6 . 4 . . 2 147 152 157 162 167 172 177 182 187 Polígono de Frecuencias INTERPRETACION: Las características más relevantes es que el mayor porcentaje de los chicos es de 28% de los 50 estudiantes, tienen una estatura promedio de 1.67 cm (14 personas) a la talla está Comprendida entre y podemos concluir también que el 74% tiene una estatura comprendida entre 149.5 – 169 a 37 personas que equivale al 74%. 2.5. OTRAS FORMAS DE ELABORAR LA TABLA DE DISTRIBUCION DE FRECUENCIAS. Ahora bien, después de haber elaborado una tabla de distribución de frecuencias nombraremos otros mecanismos de elaboración, las mismas que se ciñen al buen juicio y pericia del investigador y entre ellos tenemos los siguientes casos: Una vez determinado qué tipo de variables utilizaremos, de que formas las vamos a medir y si será necesario obtener una muestra nuestra siguiente decisión a tomar dentro del método estadístico será el de especificar si usaremos los datos en forma agrupada o no agrupada. Para el caso de querer agrupar los datos, entonces deberemos crear una tabla de distribución de frecuencias y para ello los pasos que debemos seguir son los siguientes: Se debe conocer el número total de datos (N). 33 Ing. Rolando W. Rivera Olivera Se elaborará el Diagrama de Tallo y Hojas, buscando la cifra que haga más evidente el cambio para formar el tallo y los demás valores formarán las hojas. Ejemplo: Supongamos que tenemos los siguientes datos: 87 65 78 87 60 87 34 31 43 87 78 90 65 68 62 70 80 61 62 72 95 64 80 90 68 80 30 35 40 75 59 68 65 92 70 78 95 33 72 65 70 95 50 75 31 60 43 78 70 60 65 60 30 90 40 80 59 27 92 65 Un restaurante establece, sobre la base de sus registros, que el número de comensales que hicieron uso de su servicio día con día, durante los últimos dos meses a la hora de la comida, son los que se presentan a continuación: Nos podemos percatar que en este caso las cifras significativas son las que representan a las decenas por lo que el diagrama quedará compuesto de la siguiente forma: 2 3 4 5 6 7 8 9 7 0 0 0 0 0 0 0 0 0 9 0 0 0 0 1 3 9 0 0 0 0 1 3 4 5 3 0 0 0 2 1 2 7 2 2 2 7 5 2 5 7 5 4 5 5 5 5 5 5 8 8 8 5 8 8 8 7 8 5 Nótese que este diagrama nos sirve para encontrar los valores mínimos y máximos de forma más rápida, también nos permitió ordenar a los datos en forma más sencilla y por último nos muestra al menos el comportamiento de la forma en el conjunto de datos. 34 Ing. Rolando W. Rivera Olivera El siguiente paso es obtener el Rango mediante la siguiente relación, en la que nos debemos cuestionar su significado, ya que, no representa una diferencia simplemente sino que, más bien es nuestra primer medida estadística que representa la máxima dispersión que vamos a encontrar en nuestro conjunto de datos, así tendremos: 𝑹 = 𝑿𝒎𝒊𝒏 − 𝑿𝒎á𝒙 R = 95 - 27 = 68 Posteriormente debemos determinar la cantidad de intervalos o clases (K) deseamos utilizar para clasificar o agrupar nuestra información y para ello contamos con Cuatro procedimientos al menos: 1) Obtenemos la raíz de N y el resultado redondeado siempre a valor entero nos dará en número de renglones ( en nuestro ejemplo tendremos K = 60 7.7459666 8 ) 2) Seleccionar de una tabla, el número de renglones representados por K y el número que más se aproxime al número de datos en la columna denominada con la letra N por ejemplo en nuestro problema tenemos 60 datos, por lo que, la tabla nos sugiere utilizar 5 intervalos para poderlos agrupar adecuadamente. K N 4 8 5 16 6 32 7 64 8 128 etc. etc. 3) Número de Intervalos:No debe ser menor de 5 ni mayor de 20. ( 5 K 20 ) Se puede establecer: - al criterio óptimo del investigador n redondeado al siguiente entero utilizando la tabla 35 Ing. Rolando W. Rivera Olivera - mediante la expresión 2 n k 4) Escoger el número de renglones o intervalos a juicio del investigador, tomando en cuenta que si no se tiene experiencia en este tipo de problemas el diagrama de tallo y hojas puede proporcionarnos una buena cantidad de renglones para nuestro objetivo, en nuestro ejemplo el diagrama sugiere 8 renglones. C Tamaño de intervalo rango 1 K Número de renglones El paso siguiente para elaborar la tabla de distribución de frecuencias es calcular el tamaño de intervalo, en nuestro caso resultará de 9, por lo que procederemos a calcular los límites de los intervalos, comenzando con los límites inferiores sumándole al número más pequeño el tamaño del intervalo “K” veces, en nuestro ejemplo tendríamos 𝑙𝑖 27 36 45 54 63 72 81 90 Nótese que al dato menor se le ha sumado el tamaño de intervalo que es 9 resultándonos el siguiente y así sucesivamente hasta sumarle el tamaño del intervalo 8 veces (que es el número de renglones que hemos escogido). Posteriormente debemos calcular los límites superiores y para ello debemos considerar que los intervalos que nos encontramos construyendo son intervalos cerrados, es decir, intervalos que incluyen a sus extremos, de esta manera observamos que los números que deben 36 Ing. Rolando W. Rivera Olivera estar en el primer intervalo son 27, 28, 29, 30, 31, 32, 33, 34 y 35, o sea, nuestro límite superior es 35 en lugar de 36 que es el resultado de sumar 27+9, por lo que debemos disminuir el resultado una unidad. (Por lo anterior los límites superiores que nos quedan en nuestro ejemplo son tomados de los inferiores pero con una unidad menos). El siguiente paso será determinar la frecuencia ( f ) o número de datos que caen dentro de los intervalos que hemos generado por lo que debemos contestar a la pregunta de ¿cuántos datos se encuentran entre tal valor y tal otro?, es decir, en nuestro ejemplo vemos que debemos preguntarnos ¿cuántos datos hay entre los valores de 27 y 35?, pudiendo observar en el diagrama de tallo y hojas que contamos con 8 datos, y así sucesivamente hasta terminar de preguntarnos los demás intervalos teniendo: 𝑓𝑖 8 4 1 9 14 11 5 8 De esta manera ahora ya contamos con una tabla de distribución de frecuencias la cual nos permitiera crear nuevas columnas que nos facilitarán la tarea de describir una realidad y con ello resolver un problema mediante decisiones importantes. Fi 8 12 13 22 36 47 52 60 37 Ing. Rolando W. Rivera Olivera Una de las columnas que podemos generar puede ser la que representa n a la Frecuencia acumulada ( Fi f i ), es decir, la que nos responderá a i 1 la pregunta de ¿cuántos datos se fueron presentando desde el primer intervalo hasta el último?, Dé esta forma tendremos: Así, con esta columna podemos decir que 8 días tuvimos entre 25 y 37 comensales, 12 días entre 25 y 44, etc. Después debemos encontrar un número que representa a todo el intervalo, ya que, es más sencillo hablar de un solo dato a un intervalo. Este número se llama marca de clase o punto medio el cual quedará representado por una “ Yi ” y se calcula utilizando los límites o los límites reales o verdaderos, mediante la siguiente relación: Yi = Li + Ls 2 = L ri + L rs 2 En donde “ L i ” representa al límite inferior “ L s ” al límite superior y “ Lri ”, “ L rs ” a los límites reales. Nótese que la marca de clase puede obtenerse con los límites que habíamos obtenido o con los límites reales, los cuales resultan de las siguientes acciones. Es importante lograr establecer un intervalo continuo para poder hacer análisis estadístico de todo el conjunto de datos y que a la vez no nos limite este mismo conjunto. Para obtener un límite real debemos tomar los valores de los límites que presentan un “hito” de información (como es el caso de 44 y 45 en nuestro ejemplo) y encontrar un punto que represente ese intervalo con la fórmula que hemos utilizado con las marcas de clase. Ahora procederemos a calcular la frecuencia relativa ( h i ) la cual nos representa la proporción que le corresponde a cada intervalo con respecto al total de datos mediante la fórmula: Al tener la frecuencia hi = fi x 100 N relativa entonces también nos 38 Ing. Rolando W. Rivera Olivera n podemos preguntar cuál es la proporción acumulada ( H i hi ) por i 1 renglón de la misma forma que lo hicimos para la frecuencia. Hi hi (%) (%) 13 13 7 20 2 22 15 37 23 60 18 78 8 87 13 100 Como estas columnas representan la proporción que le corresponde a cada una de las frecuencias en cada renglón entonces también podríamos crear una columna que representara los grados dentro de una circunferencia con el objetivo de crear una gráfica de pastel o de pay también llamada gráfica de sectores, esto en resumen sería como sigue: TABLA No. 2 𝐿𝑖 𝐿𝑠 Yi fi hi Fi Hi % Simp 27 35 31 8 0,13 8 0,13 13 13 36 44 40 4 0,07 12 0,20 7 20 45 53 49 1 0,02 13 0,22 2 22 54 62 58 9 0,15 22 0,37 15 37 63 71 67 14 0,23 36 0,60 23 60 72 80 76 11 0,18 47 0,78 18 78 81 89 85 5 0,08 52 0,87 8 87 90 98 94 8 0,13 60 1,00 13 100 60 1,00 TOTAL 100 Fuente: Elaboración propia 39 % Acum. Ing. Rolando W. Rivera Olivera 2.6. FUENTE DE DATOS. Ahora nos interesa describir la forma en que la estadística se hace llegar la información para poder trabajarla. En principio podemos decir que hay dos tipos de estudios estadísticos; aquellos que involucran la toma de decisiones respecto a una población y/o sus características, es decir, el estudio enumerativo y el segundo llamado estudio analítico que involucra realizar actividad sobre un proceso para mejorar el desempeño en el futuro. Después de haber decidido qué tipo de estudio se debe realizar entonces podremos encontrar la información en tres tipos de fuentes: 1) La bibliográfica 2) La experimentación y 3) La entrevista. Dentro de la información bibliográfica podemos decir que está representada por la información impresa y quedan incluidas las nuevas fuentes tales como la información obtenida en Internet, discos compactos, y cualquier otro medio digital que permita obtener información almacenada. Las ventajas de este tipo de datos quedan manifiestas por la velocidad de obtención de la información, ya que, tal vez pueda estar clasificada y ordenada, además de evitarnos la pérdida de tiempo para recopilar esta información. La desventaja es que muchas veces la información no es actualizada o que la información no se apegue exactamente a nuestro problema. La experimentación en forma contraria a la bibliográfica tiene como ventaja que la información obtenida es exactamente de nuestro problema, pero esto implica que se requiera de un grupo de investigadores, de presupuesto, así como de todos los insumos para su funcionamiento. En cuanto a la entrevista podemos decir que contamos al menos con tres tipos diferentes: 40 Ing. Rolando W. Rivera Olivera a) Por correo b) Por teléfono c) Directa. Cada una de ellas tiene sus ventajas y sus desventajas pero también son utilizadas en la actualidad, así como, una serie de versiones que mezclan estos tres tipos, por ejemplo en los noticieros televisivos hacen una pregunta y dan dos diferentes teléfonos o tres para recibir las respuestas. EJERCICIO 2 Los datos siguientes corresponden a las notas obtenidas por los estudiantes de la carrera de contabilidad del II Semestre, 32 estudiantes cuyas notas fueron en la primera evaluación. Efectuar un análisis estadístico simple 13 07 10 06 05 10 13 03 18 16 10 13 03 06 05 15 02 16 06 06 10 06 19 13 04 02 06 06 08 09 12 10 a. Calculo de rango ( R ) : R= X máx. – X min R= 19 – 02 R= 17 b. Cálculo de K intervalos: K= 1 + 3.322 log 32 41 Ing. Rolando W. Rivera Olivera K = 1 + 3.322 (1.50) K = 5.98 K=6 7 x exceso 6 X defecto 6 Luego: K₁ = 6 y K₂ = 7 c. Cálculo de C Amplitud C = C = C = R K C = 17 7 2,40 3 C = 17 6 2,80 2 2 3X 7 2X 7 3X 6 2X 6 = = = = 3 Ls Ls Ls 21 14 18 12 = Li + (C - 1) = 2+2 = 4 R = 17 C=3 K=6 TABLA 3: Frecuencias de Notas de Estadística Li - Ls 2- 4 5- 7 8 - 10 11 - 13 14 - 16 17 - 19 Li - Ls 15 - 45 45 - 75 75 - 105 105 - 135 135 - 165 165 - 195 Yi 3 6 9 12 15 18 FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA fi hi 5 10 7 5 3 2 0,15625 0,3125 0,2188 0,1563 0,0938 0,0625 42 FRECUENCIA FRECUENCIA PORCENTAJE PORCENTAJE ABSOLUTA RELATIVA SIMPLE ACUMULADO ACUMULADA ACUMULADA Fi Hi 5 15 22 27 30 32 0,15625 0,46875 0,6875 0,84375 0,9375 1 %S %A 15,625 3125 31,875 15,625 9375 625 15,625 46,875 68,75 84,737 9375 100 Ing. Rolando W. Rivera Olivera 2.7. REPRESENTACION GRAFICA Una vez construida la tabla de distribución de frecuencia y que esta nos permite visualizar el comportamiento de los datos posteriormente se afectaran los gráficos correspondientes estas nos permite apreciar con mayor facilidad estos comportamientos dentro de ellos tenemos los siguientes: 2.7.1 HISTOGRAMA Es un gráfico plano formado por rectángulos cuya área es proporcional a la frecuencia (absoluta o relativa). Se siguen los siguientes pasos: Paso 1.- se constituye el cuadrante superior derecho de un sistema de coordenadas rectangulares. Paso 2.- la longitud de los semejantes tanto el eje de las abscisas como las ordenadas es convencional por lo tanto es criterio de cada persona asignar las medidas teniendo en cuenta lo siguiente: Paso 3.- elegimos los segmentos de las abscisas y ordenadas y posteriormente en las divisiones de los ejes de menos a mayor y en las abscisas van los intervalos de clase y en las ordenadas la frecuencias absolutas relativas. HISTOGRAMA 28% 14 13 24% 12 11 10 20% 9 16% 8 7 6 5 6% 4% 4 3 2% 2 1 149,50 154,50 159,50 164,50 169,50 43 174,50 179,50 184,50 Ing. Rolando W. Rivera Olivera Paso 4.- Por ultimo sobre cada segmento de las abscisas se constituye un rectángulo cuya altura será indicada por la frecuencia de clase absoluta o relativa. Ejemplo de aplicación No. 3 Hallar el análisis estadístico y construir el histograma para los siguientes datos. Las calificaciones de un test de inteligencia de 32 estudiantes han sido las siguientes. 60 67 67 55 15 15 25 50 50 50 30 45 75 67 60 60 55 50 50 30 20 20 30 30 50 50 50 45 55 55 55 55 El test era de 100 puntos 1. Cálculo de rango (R): R= X máx. – X min R= 75 – 15 R= 60 2. Cálculo de K intervalos: K= 1 + 3.322 log 32 K = 1 + 3.322 (1.50) 7 x exceso 6 X defecto C = 60 6 10 6 K = 6,0001 K=6 3. Cálculo de C Amplitud C = C = C = R K 60 7 8,57 9 C = 11 10 8 44 Ing. Rolando W. Rivera Olivera 4. selección de K y C CxK 9X 7 8X 7 11 X 6 10 X 6 = = = = = R = 60 63 56 66 60 Nota: recordemos que debemos desechar a los resultados que no incluyan al Rango, en este caso 60 y de los que quedan es decir 63 y 66, se toma al más próximo al rango, en este caso 63, por tanto nos quedamos con: 9 x 7 = 63; es decir: K = 7 ; C = 9 y R = 60 TABLA 4 Li - Ls 15 - 23 24 - 32 33 - 41 42 - 50 50 - 59 60 - 68 69 - 77 Li - Ls 14,5 - 23,5 23,5 - 32,5 32,5 - 41,5 41,5 - 505 50,5 - 59,5 59,5 - 68,5 68,5 - 77,5 Yi 19 28 37 46 55 64 73 FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA fi hi 04 05 00 10 06 06 01 32 0,125 0,15625 0 0,3125 0,1875 0,1875 0,03125 45 FRECUENCIA FRECUENCIA PORCENTAJE PORCENTAJE ABSOLUTA RELATIVA SIMPLE ACUMULADO ACUMULADA ACUMULADA Fi Hi 04 09 09 19 25 31 32 0,125 0,28125 0,28125 0,59375 0,7813 0,96875 1 %S %A 12,5 15,625 0 31,25 18,75 18,75 3,215 12,5 28,125 28,125 59,375 78,125 96,875 100 Ing. Rolando W. Rivera Olivera HISTOGRAMA 12 11 10 9 8 7 6 5 4 3 2 1 14,5 23,5 32,5 41,5 50,5 59,5 68,5 77,5 Poligono de Frecuencia 12 11 10 9 8 7 6 5 4 3 2 1 10 19 28 27 46 55 64 73 82 2.7.2 POLIGONO DE FRECUENCIAS Para construir el polígono de frecuencias se empieza uniendo mediante una línea poligonal, los puntos medios de los techos de los rectángulos obteniendo en el histograma este polígono de frecuencias, se acostumbra cerrar este polígono en el eje de la abscisa. 46 Ing. Rolando W. Rivera Olivera Poligono de Frecuencia 14 13 12 11 10 9 8 7 6 5 4 3 2 1 147 152 157 162 167 172 182 187 2.7.3 GRAFICO DE FRECUENCIAS ACUMULADAS Para representar las frecuencias acumuladas absolutas o relativas, ubicamos en el eje horizontal los intervalos ( K ) y en el eje vertical las frecuencias acumuladas absolutas (𝐹𝑖 ) o relativas (𝐻𝑖 ), luego en el extremo superior de cada intervalo se levanta un segmento cuya altura es igual a la respectiva frecuencia acumulada por ultimo partiendo del extremo inferior del primer intervalo se unen con segmentos de recta, los extremos de los segmentos verticales obteniéndose una línea poligonal que a partir de la última frecuencia se extiende paralelo al eje horizontal. 47 Ing. Rolando W. Rivera Olivera 50 45 ˚ ˚ ˚ ˚ PERSONAS 40 35 30 ˚ 25 OJIVA DE 20 GALTON ˚ 15 10 5 ˚ 149,5 154,5 159,5 164,5 169,5 174,5 179,5 184,5 ESTATURA - INTERVALOS 2.7.4 REPRESENTACIÓN TABULAR DE LOS DATOS CUANTITATIVOS DISCRETOS: Cuando la variable es discreta o discontinua la distribución de la tabla de frecuencias tiene la siguiente estructura. Ejemplo No. 4 .- Los siguientes datos corresponden al número de hijos por familia en una muestra de 40 familias de un barrio del distrito de Bustamante y son los siguientes: 5 3 2 5 3 3 2 1 2 3 1 3 2 3 2 3 2 4 48 2 3 2 3 5 3 3 4 4 3 4 2 4 4 3 2 4 2 Ing. Rolando W. Rivera Olivera Tabla No. 5 xi fi hi Fi Hi %S %A 1 2 0,05 2 0,05 5 5 2 11 0,275 13 0,325 28 33 3 15 0,375 28 0,7 38 71 4 8 0,20 36 0,9 20 91 5 3 0,075 39 0,975 7 98 6 1 0,025 40 1 2 100 40 1,00 100 x i = valor de variable hi = frecuencia relativa f i = frecuencia absoluta Fi = frecuencia absoluta acumulada Hi = frecuencia relativa acumulada %S, %A = porcentaje simple y Acumulado HISTOGRAMA 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 49 7 Ing. Rolando W. Rivera Olivera 2.7.5 GRÁFICOS PARA DATOS CUANTITATIVOS DISCRETOS: Representación: Si los datos pertenecen a una variable cuantitativa discreta los diagramas más utilizados son el diagrama de puntos y el diagrama de barras. 2.7.5.1 DIAGRAMA DE PUNTOS: Para su construcción en el eje de abscisas se consignan los distintos valores de la variable en este caso el número de hijos en el eje vertical u ordenada las frecuencias correspondientes. 40 35 30 25 20 15 ˚ 10 5 ˚ ˚ ˚ ˚ 1 2 ˚ ˚ ˚ ˚ ˚ ˚ ˚ 3 4 5 6 ˚ ˚ 7 8 ˚ 2.7.5.2 DIAGRAMA DE BARRAS: Son muy similares a los diagramas de puntos solo que en su lugar se construye las barras que son espacios rectangulares y permiten colocar el puntaje en el techo de las mismas. HISTOGRAMA 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 50 7 Ing. Rolando W. Rivera Olivera 2.7.5.3 GRAFICAS PARA LAS FRECUENCIAS ACUMULADAS: Para los datos cuantitativos discretos se utilizan la variable o los datos del intervalo en la abscisa y el valor de la frecuencia acumulada, absoluta o relativa en la ordenada la cual se llama diagrama en escalera, bastante similar a la ojiva. 40 ˚ ˚ ˚ 30 ˚ 20 10 ˚ ˚ 1 2 3 4 5 6 7 8 OBSERVACIONES: 1. Cuando la variable discreta adquiere muchos valores distintos, para abreviar, con justa arbitrariedad y con una pérdida de precisión puede tratarse estos datos como variables cuantitativas continuas teniendo cuidado en la interpretación de los mismos. 2. En un estudio descriptivo los datos muéstrales son siempre discretos, aun si la variable es continua, porque si los valores están expresados en fracciones bastara trabajar en función del último orden decimal, es decir que los datos de una variable continua, pueden tratarse también como datos discretos por cierto grado de imprecisión (por ejemplo marcas de clase siempre enteros, no fracciones). 51 Ing. Rolando W. Rivera Olivera 3. En términos generales se prefiere la distribución de frecuencia que no presenta perdidas de información cuando: a. Los datos son números enteros b. El rango es pequeño menor de 15 c. Cuando se desea estimar algún parámetro desconocido de una población. 4. Por otro lado es útil una distribución de frecuencias en las que al agruparse produce una pérdida de información cuando: a. Intervienen tanto números enteros como no enteros o únicamente no enteros. b. Intervienen solamente enteros pero existe demasiados números diferentes. c. La pérdida de información es menos importante por lo contrario se gana en visión de conjuntos que es el propósito de la estadística 2.7.6 ELABORACIÓN DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CUALITATIVOS O ATRIBUTOS: Los datos cualitativos son los más fáciles de representar ya que las clases se ponen de manifiesto con facilidad y los cálculos también son mínimos ej.: consideremos la tabla nro. 5 en la que se consignan los resultados de un proceso de evaluación de 72 estudiantes. CATEGORIA fi hi % Aprobados 45 0,625 63 Desaprobados 18 0,25 25 Retirados 9 0,125 12 TOTAL 72 1,00 100 2.7.7 REPRESENTACIÓN GRAFICA DE LAS VARIABLES CUALITATIVAS: 52 Ing. Rolando W. Rivera Olivera a. Gráfico de barras b. Diagrama circulares y en algunos aspectos suelen representarse con cartogramas. LEYENDA APROBADO DESAPROBADO RETIRADO 63% 225° 90° 90° 45°45° 12% 25% 360 72 X 45 𝑥= 360 . 45 72 fi ∝ % 45 225° 63 18 90° 25 9 45° 12 72 360° 100 = 225° 53 Ing. Rolando W. Rivera Olivera 𝑥= 360 . 18 72 = 90° x = 54 360 . 9 72 = 45° Ing. Rolando W. Rivera Olivera EJERCICIOS PROPUESTOS N° 2 1. Los siguientes datos obtenidos mediante una encuesta realizada por la Empresa AMC en el mes de Febrero del 2015 corresponden a una muestra aleatoria de 40 empresas de la ciudad de Arequipa según motivo del uso de Internet: P O P RP O P P P Donde; P: “Publicidad” F F P F F F RP RP F F O P F: “Facturación” P O P P F P P P RP RP F F RP: “Recepciones” O: Otros Se pide : a. Identificar la unidad de observación y la variable en estudio. b. Construir una distribución de frecuencias (absolutas y porcentuales). c. Graficar el diagrama circular correspondiente. d. Dibujar la ojiva de Gálton. e. Interpretar 𝑓2 ; ℎ2 y % s 2. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Diamante SAC en el año 2013 fueron los siguientes: 440 560 335 587 613 400 424 466 565 393 453 650 407 376 470 560 321 500 528 526 570 430 618 537 409 600 550 432 591 428 440 340 558 460 607 382 667 512 492 560 450 530 501 471 660 470 364 634 580 450 574 500 462 380 518 480 625 507 645 382 a. Construya la tabla de frecuencias. b. Identifique la población, muestra y la variable con su tipo de escala 3. Se distribuye el número de empresas según sus inversiones en millones de soles: 55 Ing. Rolando W. Rivera Olivera 𝑳𝒊 − 𝑳𝒔 𝒇𝒊 4 - 10 1 10 - 16 3 16 - 22 6 22 - 28 12 28 - 34 11 34 - 40 5 40 - 46 2 ¿Cuántas empresas intervienen en menos de 25 millones de soles? 4. Se tiene las temperaturas observadas en el hemisferio norte durante 24 días en °C. 𝑳𝒊 − 𝑳𝒔 -19 - -17 -17 - -15 2 -15 - -13 8 -13 -11 - -11 - -9 𝒇𝒊 0,125 -9 - 𝐡𝐢 4 -7 0,2083 a. ¿Durante cuántos días se obtuvo una temperatura de -16 a -10 en promedio? b. Cómo es la tabla de frecuencias completa? 5. Completar la tabla de distribución para una muestra de 4308 elementos, si se sabe que a partir de la segunda frecuencia absoluta se cumple que cada frecuencia es la quinta parte de la anterior más dos. Además se conoce que: k= 5 𝑌1 = 60 𝑌4 = 105 6. Dada la siguiente distribución de frecuencias: 56 Ing. Rolando W. Rivera Olivera (𝐿𝑖 - 𝐿𝑠 ) 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 30 m n 0,15 z 70 p q w a - 90 r s 0,25 b 10 u x 0,7 30 v y 50 - 70 90 110 - 50 110 130 Hallar: a. m + n b. r – p + a 7. La compañía ABC, muestreó sus registros de embarque durante cierto día, obteniendo los siguientes resultados con respecto al tiempo transcurrido desde la recepción de la orden hasta la entrega (en días). 20 12 5 8 19 14 10 11 15 6 24 7 7 13 29 13 6 4 11 11 a. ¿Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a partir de la distribución de frecuencias? b. Si la compañía quiere asegurarse de que la mitad de sus entregas se realicen en diez o menos días, ¿puede usted determinar mediante la distribución de frecuencias si la compañía ha alcanzado su meta? 8. En una fábrica se sabe que el jornal mínimo es S/. 115, si se conoce además que: 20 obreros ganan por lo menos S/. 155, pero menos de S/165, 68 obreros ganan por lo menos S/. 145 ; 106 obreros ganan por lo menos S/. 135; 135 obreros ganan por lo menos S/.125 y el restante 10% de los obreros ganan menos de S/. 125. Además se sabe que el rango es 50. Completar la tabla de distribución de frecuencias. 9. Una compañía tiene 60 trabajadores. El sueldo mínimo de un trabajador es $100 y el máximo $590 mensuales. El 80% de los trabajadores ganan 57 Ing. Rolando W. Rivera Olivera por lo menos $210; 18 perciben haberes inferiores a $390 mensuales; 20% son profesionales y reciben un haber de por lo menos $490 mensuales. Construir la tabla de distribución de frecuencias relativas. 10. La tabla muestra la distribución del ingreso familiar correspondiente a 80 familias. - 𝐿𝑠 ) 160 - 170 170 - 180 180 - 190 (𝐿𝑖 190 200 - 𝑓𝑖 𝐹𝑖 48 60 ℎ𝑖 0,125 200 0,075 210 Determinar el número de familias que ganan menos de 200 nuevos soles. 11. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente número de artículos defectuosos por lote: 3 2 5 0 1 3 2 1 0 1 3 4 2 4 4 4 3 3 2 3 Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de lotes tienen 2 o más pero menos de 4 artículos defectuosos? 12. En una prueba de estadística se evaluaron a “n” estudiantes y se obtuvo el siguiente cuadro estadístico. 𝑌𝑖 45 ℎ𝑖 2𝑛 25 55 65 75 3𝑛 100 𝑛 50 3𝑛 50 85 𝑛 100 ¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor o igual a 80 puntos? 13. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 familias (𝑳𝒊 - 𝑳𝒔 ) 𝒇𝒊 58 𝑭𝒊 Ing. Rolando W. Rivera Olivera 12 - 270 - 300 90 30 330 126 - - 50 ¿Cuántas familias tienen un ingreso comprendido entre 260 y 320? 14. Se tiene la siguiente distribución simétrica: (𝑳𝒊 - 𝑳𝒔 ) [12 𝒇𝒊 𝑭𝒊 𝒉𝒊 8 - 0,2 - 24[ 17 - Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo [ 12 – 20 ]? 15. Los tiempos de vida útil (en días) de un tipo de bacteria, se tabuló en una distribución de frecuencias de 5 intervalos de igual amplitud con frecuencias relativas acumuladas: 0.10; 0.25; 0.55; 0.80; 1.00. Determine la distribución de frecuencias absolutas, si la tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el límite inferior del cuarto intervalo es 12. 16. En una fábrica se sabe que el jornal mínimo es S/.115, si se conoce además que: 20 obreros ganan por lo menos S/.155, pero menos de S/. 165, 68 obreros ganan por lo menos S/. 145; 106 obreros ganan por lo menos S/. 135; 135 obreros ganan por lo menos S/. 125 y el restante 10% de los obreros ganan menos de S/.125. además se sabe que el rango es 50. Completar la tabla de distribución de frecuencias. 59 Ing. Rolando W. Rivera Olivera 17. La compañía ABC, muestreó sus registros de embarque durante cierto día, obteniendo los siguientes resultados con respecto al tiempo transcurrido desde la recepción de la orden hasta la entrega (en días). 20 12 5 8 19 14 10 11 15 24 7 7 13 29 13 6 4 6 11 11 a. Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a partir de la distribución de frecuencias? b. Si la compañía quiere asegurarse de que la mitad de sus entregas se realicen en diez o menos días, ¿puede usted determinar mediante la distribución de frecuencias si la compañía ha alcanzado sus metas? 18. El consumo mensual de agua de 150 hogares, se tabularon en una distribución de frecuencias simétrica de 6 intervalos, siendo las frecuencias 𝑓2 = 25; 𝐹3 = 75; 𝐹5 = 130. Si el límite inferior del sexto intervalo es igual a 60, y si el 75% de los consumos son mayores de 42,5 𝑚3 , completar la distribución de frecuencias. 19. Los siguientes datos corresponden a los sueldos de los trabajadores de una compañía Número de Sueldos trabajadores 950 - 1000 5 1000 - 1050 12 1050 - 1100 9 1100 - 1150 8 1150 - 1200 4 1200 - 1250 10 1250 - 1300 6 a. Grafique un histograma. b. Grafique un Polígono de frecuencias. c. Grafique una Ojiva de Galton. d. Grafique un diagrama circular. 60 Ing. Rolando W. Rivera Olivera AUTOEV ALUACIÓN II NOMBRE………………………………………………………CARRERA………… 1. Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18, 20, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribución de frecuencias y dibuja el polígono de frecuencias. 2. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras. 3. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras y circular. 4. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla: Peso:Kgs [5 0, 6 0[ Nro. mp Construir [6 0, 7 0[ [7 0, 8 0[ [8 0, 9 0[ [9 0, 10 0[ [1 0 0, 1 1 0[ 8 10 16 14 10 5 la tabla de frecuencias. Y Representar [1 1 0, 12 0 [ 2 el histograma, el polígono de frecuencias y la ojiva de Galton. 5. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Estadística General. 61 Ing. Rolando W. Rivera Olivera 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. Construir la tabla de frecuencias, dibujar el histograma y el polígono de frecuencias y la ojiva de Galton. 6. Los ingresos quincenales en dólares de 45 personas son: 63, 89, 36, 49, 56, 64, 59, 35, 78, 43, 53, 70, 57, 62, 43, 68, 62, 26, 64, 72, 52, 51, 62, 60, 71, 61, 55, 59, 60, 67, 57, 67, 61, 67, 51, 81, 53, 64, 76, 44, 73, 56, 62, 63, 60 . Indique: a. El número de intervalos y La Población. b. La Unidad de análisis. c. La frecuencia más alta. d. Tipo de variable en estudio. e. El porcentaje de los que ganan más de 70 dólares quincenales. f. El tamaño de cada intervalo. g. Qué indica la Marca de clase y Qué, la frecuencia relativa? 7. La compañía Luxos SAC, muestreó sus registros de embarque durante cierto día, obteniendo los siguientes resultados con respecto al tiempo transcurrido desde la recepción de la orden hasta la entrega (en días). 20 12 24 7 5 7 8 19 14 13 29 13 10 11 6 4 15 11 6 11 a. Qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos a partir de la distribución de frecuencias? b. Si la compañía quiere asegurarse de que la mitad de sus entregas se realicen en diez o menos días, ¿puede usted determinar mediante la distribución de frecuencias si la compañía ha alcanzado sus metas? c. Efectúe los gráficos correspondientes para visualizar mejor sus respuestas. 62 Ing. Rolando W. Rivera Olivera CAPITULO III 3 MEDIDAS DE CENTRALIZACIÓN El objetivo principal de las medidas de tendencia central es poder representar por medio de un solo número al conjunto de datos, es decir, dan valores representativos de la distribución de frecuencias, situados en algún lugar intermedio, alrededor del cual, se encuentran los otros valores. Nos indican dónde tienden a concentrarse los valores. Existen tres medidas de tendencia central generales, que son, la Media aritmética, la Mediana y la Moda; así como otras que se utilizan en casos particulares como la Media ponderada, la Media Armónica, la Media Geométrica, la Media Cuadrática las medidas de posición tales como los Cuartiles, quintiles, deciles, percentiles y otros. 3.1. MEDIDAS DE TENDENCIA CENTRAL MÁS UTILIZADAS. 3.1.1. MEDIA ARITMÉTICA x : Es el promedio de los datos, y su objetivo principal es encontrar el valor que debería de estar en el centro. Su ventaja principal es que es la única medida en la que x x 0 , su inconveniente es que se ve influida por valores extremos. • MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS: Se dice Datos no agrupados a un conjunto pequeño de datos con los cuales se trabaja directamente y no necesitamos agruparlos ni construir tablas de frecuencias por ejemplo para obtener nuestro promedio de asignatura, 63 Ing. Rolando W. Rivera Olivera pocos exámenes y trabajos y fácilmente podemos sacar el promedio. X= cualquier dato n X i i 1 X= n Número total de datos Ejemplo: Calcular la media aritmética de los números 10; 12; 36; 25; 58 x • 10 12 36 25 58 121 5 5 24.2 PROMEDIO PARA DATOS AGRUPADOS: ❖ METODO DIRECTO: Producto de la frecuencia Absoluta por la marca de clase de cada intervalo k f i *Y i X= i 1 n Número total de datos Donde: k = última clase o intervalo Nota: La media muestral se denota X , la media poblacional se conoce como . Ejemplo 1: Calcular el empresas: salario promedio de 3 Salario No. De Emp. Xi fi $15,000 18 $20,000 35 $25,000 29 Total 82 64 Ing. Rolando W. Rivera Olivera Como x f i 82 n sustituimos en la formula y se obtiene: 15000 *18 20000 * 35 25000 * 29 1695000 $20,670.70 82 82 ❖ MÉTODO ABREVIADO Se siguen los siguientes pasos: 1. Se elige una media supuesta u origen de trabajo (generalmente es la marca de la clase central de la distribución o el intervalo de mayor frecuencia). 2. Se halla las desviaciones (di) a partir de la media supuesta u origen de trabajo. La división correspondiente a la clase en que esta la media supuesta es cero, la de las clases inferiores -1, -2, -3, … etc. Respectivamente, las clases superiores serán 1, 2, 3, …etc. 3. Se halla los productos de las frecuencias por las desviaciones (fi*di) respectivamente respetando la regla de signos al multiplicar. 4. Luego se aplica la siguiente formula: k X = Yi C f . d i 1 i i n Ejemplo 2: Hallar la Media Aritmética por los dos métodos de la estatura de los 50 estudiantes, ejemplo de la Unidad anterior (Tabla No. 1 Unidad 2): 65 Ing. Rolando W. Rivera Olivera Solución: a. Método directo: k f X= Li i i 1 *Y i n - X Ls 8250 X 165 50 Yi fi Yi . f i di f i .d i 149,5 – 154,9 152 3 456 -3 -9 154,5 – 159,5 157 8 1256 -2 -16 159,5 – 164,5 162 12 1944 -1 -12 164,5 – 169,5 167 14 2338 0 0 169,5 – 174,5 172 10 1720 1 10 174,5 – 179,5 177 02 354 2 4 179,5 – 184,5 182 01 182 3 3 50 8250 Total -20 b. Método Abreviado: Utilizamos las dos columnas de la tabla de arriba di y f i .d i k X = Yi f . d C X 167 i 1 i i n 5 20 50 X 165 Ejemplo 3: Hallar la media Aritmética por los dos métodos de las notas de la tabla de 32 estudiantes 66 Ing. Rolando W. Rivera Olivera Li - Ls Yi fi Yi . f i di f i .d i 1,5 – 4,5 3 5 15 -1 -5 4,5 – 7,5 6 10 60 0 0 7,5 – 10,5 9 7 63 1 7 10,5 – 13,5 12 5 60 2 10 13,5 – 16,5 15 3 45 3 9 16,5 – 19,5 18 2 36 4 8 32 279 Total 29 a. Método directo: k f X= i 1 i *Y i n X 279 32 X 8.72 b. Método Abreviado: k X = Yi C 3.1.2. f . d i 1 i n i X 6 3 29 X 8.72 32 MEDIANA (Me): Es el valor central, el que delimita al 50% de los datos, es decir, es el valor que se encuentra exactamente en la mitad de los datos, dividiendo a los datos en dos partes simétricas. 50% Xi 50% Me 67 Xn Ing. Rolando W. Rivera Olivera a. MEDIANA PARA DATOS NO AGRUPADOS: En los datos ordenados se aplica la siguiente relación, para encontrar la posición de los datos. posición n 1 ; en donde n = número total de datos. 2 Entonces podemos tener sólo dos alternativas, que sea par o impar • El valor de la posición puede ser entero y lo único que debemos hacer es contar el número de lugares que nos indica esta fórmula. • El valor de la posición nos da un valor decimal y entonces debemos: sumar los valores involucrados y dividirlos entre 2. Por ejemplo: Si los datos son Pares: si tenemos los valores 5, 7, 8, 13 entonces la posición nos da 2.5 por que tendremos que seleccionar a los números 7 y 8 para luego sumarlos (15) y dividirlos entre 2 = 7,5 entonces: Me = 7,5 Si los datos son Impares: Si tenemos los valores de 5, 6, 7, 8, 9 ; el valor de la posición es 3, por tanto la mediana corresponde al dato que ocupa el 3er lugar, así: Me = 7 b. Mediana para datos Agrupados: Se localiza la clase o renglón que contiene a la mediana, con la siguiente condición Fi n 2 , es decir debemos encontrar la primera frecuencia acumulada que sea mayor a la posición, para posteriormente aplicar la siguiente formula: n Fi -1 Me L i + C 2 fi 68 Ing. Rolando W. Rivera Olivera Donde: Li : es la frontera o Límite inferior del intervalo mediano Fi -1 : Frecuencia acumulada anterior al intervalo mediano fi : Frecuencia absoluta del intervalo mediano C : tamaño del intervalo en el intervalo mediano Nota: Si la posición, en los datos no agrupados, es decimal, se toma el promedio del dato anterior y el siguiente, respectivamente Ejemplo 1: Calcular el sueldo mediano de los datos de la siguiente tabla: Fronteras($) Salario No. De emp. Yi fi 𝐿𝑖 − 𝐿𝑠 Fi 12,500 - 17,500 $15,000 18 18 17,500 - 22,500 $20,000 35 53 22,500 - 27,500 $25,000 29 82 TOTAL 82 Primero se obtiene la posición: posición 82 41 2 Entonces buscamos el renglón de la mediana buscando la Fi más grande de 41, como 18+35 = 53, entonces decimos que es el segundo renglón o clase es donde se encuentra la mediana y aplicamos la fórmula: 69 Ing. Rolando W. Rivera Olivera n Fi -1 C Me = L i + 2 fi 41 - 18 Me 17500 * 5000 entonces Me $17828,571 35 Ejemplo 2: Hallar la Mediana de la Tabla 1 del ejemplo de la Unidad 2 Recordemos el resumen de la tabla 1 , Unidad 2, de acuerdo a lo que necesitamos: 𝐿𝑖 − 9,5 - 𝐿𝑠 154,5 𝑓𝑖 𝐹𝑖 3 3 154,5 - 159,5 8 11 159,5 - 164,5 12 23 164,5 - 169,5 14 37 169,5 - 174,5 10 47 174,5 - 179,5 2 49 179,5 - 184,5 1 50 TOTAL 50 Solución: Necesitamos, primero dividir: 𝑛 2 = 25 con este resultado ubicamos el intervalo mediano, buscando la frecuencia absoluta acumulada 70 Ing. Rolando W. Rivera Olivera (𝐹𝑖 ) que contenga a dicho número, después de esto aplicamos la fórmula de mediana. n Fi -1 C Me = L i + 2 fi 25 - 23 Me 164,5 5 entonces Me $165,21 14 3.1.3. MODA (Mo) : Es el valor más frecuente, el que se observa mayor número de veces en una distribución de datos. a. MODA PARA DATOS NO AGRUPADOS: Después de ordenar los datos buscamos el valor que más se repite. Ejemplo 1: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52. Podemos observar que el número que más se repite es el 49. ( Mo = 49 ) Ejemplo 2: Los siguientes datos representan la cantidad de pedidos diarios recibidos en un período de 20 días, ordenados en orden ascendente 0 6 0 6 1 7 1 7 2 8 2 4 4 5 5 12 15 15 15 1 Mo = 15 9 La cantidad de pedidos diarios que más se repite es 15 71 Ing. Rolando W. Rivera Olivera Ejemplo 3: La cantidad de errores de facturación por día en un periodo de 20 días, ordenados en orden ascendente es: 0 6 0 6 1 7 1 8 1 8 2 9 4 9 4 4 5 10 12 12 Esta distribución tiene 2 modas. Se la llama distribución bimodal. Mo = 1 y Mo = 4 Nota: Si ningún valor se repite, no existe moda, el agrupamiento sería amodal, si tuviera dos, bimodal; tres trimodal y varios polimodal. 72 Ing. Rolando W. Rivera Olivera b. MODA PARA DATOS AGRUPADOS: Se localiza la clase modal buscando la frecuencia más alta y después se aplica la siguiente fórmula: 1 Mo L i + C 2 1 donde : 1 f i f i anterior 2 f i - f i posterior Nota: La distribución puede ser: - amodal, - unimodal, - bimodal, - trimodal,...., - polimodal. Ejemplo 1: Calcular el salario que más se repite (Mo) en: Fronteras($) 𝐿𝑖 − 𝐿𝑠 Salario No. De Yi emp. fi 12,500 - 17,500 $15,000 18 17,500 - 22,500 $20,000 35 22,500 - 27,500 $25,000 29 Observamos las frecuencias (No. de empleados) y decimos que la clase modal es la segunda, porque 35 es la frecuencia más grande y aplicamos: 73 Ing. Rolando W. Rivera Olivera 1 17 C 17500 Mo = L i + 5000 $21,195.65 17 6 1 2 donde : 1 f f anterior 35 18 17 2 f f posterior 35 29 6 Ejemplo 2: Hallar la Moda de la Tabla 1 del ejemplo de la Unidad 2 Recordemos el resumen de la tabla 1, Unidad 2: 𝐿𝑖 − 𝐿𝑠 𝑓𝑖 149,5 - 154,5 3 154,5 - 159,5 8 159,5 - 164,5 12 164,5 - 169,5 14 169,5 - 174,5 10 174,5 - 179,5 2 179,5 - 184,5 1 TOTAL 50 Solución: Necesitamos recordar en la Tabla 1 de la Unidad 2 , el intervalo que tiene la mayor frecuencia y luego aplicar la fórmula: 1 Mo L i + C 1 2 14 12 2 164,5 5 Mo 164,5 + 5 166,16 2 4 (14 12) (14 10) 74 Ing. Rolando W. Rivera Olivera Luego la moda es: 3.1.4. Mo = 166,16 Relación entre Media Aritmética, Mediana y Moda: Para distribuciones unimodales que sean poco asimétricas: X Mo 3X Me HG X Sus posiciones relativas, según la simetría de la distribución de frecuencias es: Relación Simetría Mo Me X Simétrica Mo < Me < X Sesgo positivo Mo Me > X Sesgo negativo Nótese que en nuestros ejemplos tenemos: Mo > Me > X es decir : 166,16 165,21 165 Por tanto se da una asimetría negativa ó es una distribución sesgada negativamente. 3.2. MEDIDAS DE TENDENCIA CENTRAL PARA CASOS ESPECIALES 3.2.1. MEDIA ARITMÉTICA PONDERADA ( X w ): Es el promedio de los datos en donde se le da un peso o importancia específica a cada observación. Se calcula: Producto de cada uno de los datos por su ponderación o peso 75 Ing. Rolando W. Rivera Olivera n W *X Xw = i i 1 i Suma de las ponderaciones n W i 1 i Ejemplo: Se desea obtener el precio promedio en el siguiente cuadro Precio del Producto Cantidad en Kg. $ 17.80 75 $ 35.90 56 $ 79.45 19 : Aplicamos la fórmula: n W *X X w= i i 1 n W i 1 i (17.8 * 75) (35.9 * 56) (79.45 *19) 4854.95 75 56 19 150 $ 32.37 i 3.2.2. MEDIA GEOMÉTRICA (G): Con cierto tipo de datos, la media aritmética no da el valor promedio correcto. La media geométrica sirve para promediar los crecimientos geométricos de una variable. 76 Ing. Rolando W. Rivera Olivera Si suponemos que Y representa el factor de crecimiento geométrico de la variable X, es decir: Yi Xi , entonces el factor X i 1 de crecimiento geométrico promedio de la variable X se puede calcular como en el siguiente ejemplo. Ejemplo. Si los precios de la acción “Cemento Sur” en los últimos cuatro días fueron; 4,75; 5,23; 4,78 y 6,32 calcule el factor de crecimiento promedio y el crecimiento porcentual promedio. Existen dos formas de resolverlo: Primero calculamos el promedio Geométrico (G), con la siguiente fórmula: G n X1 * X 2 ** X n , luego, reemplazamos en ella nuestros datos : G 4 4,75 * 5.23 * 4.78 * 6,32 G 4 750,482 5,234 Entonces G = 5,234 a) También se calcula por logaritmos: log G log G = log X n log 4,75 log 5,23 log 4,78 log 6,32 4 log G 0,6767 0,7185 0,6794 0,8007 4 2,8753 0,7188 4 entonces log G 0,7188 log G por tanto: G = 5.2340 77 Anti log G 5,234 i Ing. Rolando W. Rivera Olivera b) Para calcular el factor de crecimiento con estos mismos datos y el crecimiento porcentual se sigue el procedimientos siguiente: La forma más ortodoxa o clásica, es: G n Y1 * Y2 * * Yn 3 G 3 1.330526316 5.23 4.78 6.32 * * 4.75 5.23 4.78 1.099869493 Lo que acabamos de obtener es factor de crecimiento promedio y para obtener el crecimiento se aplica la siguiente formula: crecimient o (1 G ) *100 (1 1.099869493) *100 9.9869% c) Otra forma es : G número de datos -1 último 6.32 3 3 1.330526316 1.099869493 primero 4.75 Lo demás se repite del mismo modo, entonces el crecimiento resulta = 9,9869 % 3.2.2.1. APLICACIÓN DE LA MEDIA GEOMETRICA: a. Media Geométrica ( G ) para datos No Agrupados: G n x1 * x 2 ** x n log G = log x i n 78 Ing. Rolando W. Rivera Olivera xi = corresponde a los datos no agrupados. Ejemplo: Hallar la media geométrica del siguiente conjunto de números: 6; 7; 5; 3; 9 y 11 Solución: ❖ Aplicamos el método directo: G n x 1 * x 2 * * x n G 6 6 * 7 *5 * 3* 9 * 11 6 62370 G 6,2974 Aplicando logaritmos: log G = log G = log G = log X i n log 6 log 7 log 5 log 3 log 9 log 11 6 4,79497574 6 = 0,7992 G = Antilog 0,7992 = 6,2975 , por tanto los resultados son idénticos b. Media Geométrica para datos Agrupados: 79 Ing. Rolando W. Rivera Olivera G n Y1f1 * Y2f2 * * Ykfk ó log G = f i log Yi n donde: k = última clase Nota: Se puede demostrar que: X G . También puede calcularse la media geométrica ponderada. Ejercicio: Supóngase que se cuenta con la información diaria de los incrementos porcentuales de una acción y que se representan en la siguiente tabla: Crecimiento porcentual (%) Frecuencias en días 10 14 20 15 30 48 77 a) Calcular los factores de crecimiento. crecimient o porcentual Yi 1 100 b) Calcular el factor de crecimiento promedio G n Y1f1 * Y2f2 * * Ykfk 77 1.1014 *1.2015 *1.30 48 1.2415965 crecimient o (1 G ) *100 (1 1,2415965) *100 24.15965% Ejemplo 2: 80 Ing. Rolando W. Rivera Olivera Hallar la media Geométrica de la Tabla 1 del ejemplo de la Unidad 2 Recordemos el resumen de la tabla 1 , Unidad 2: 𝑳𝒔 𝒀𝒊 𝒇𝒊 149,5 - 154,5 152 3 154,5 - 159,5 157 8 159,5 - 164,5 162 12 164,5 - 169,5 167 14 169,5 - 174,5 172 10 174,5 - 179,5 177 2 179,5 - 184,5 182 1 𝑳𝒊 − TOTAL 50 Solución, necesitamos recordar la Tabla 1 de la Unidad 2 y luego aplicar la fórmula: log G = f i log Yi n logG= 3 log 152 8 log 157 12 log 162 14 log 167 10 log 172 2 log 177 1log 182 50 log G = log G = 110,8562411 50 2,217124823 Posteriormente se extrae el antilogaritmo de dicha cantidad Antilog de 2,217124823 es el valor de G, por lo tanto: G = 164,86 81 Ing. Rolando W. Rivera Olivera 3.2.3. MEDIA ARMÓNICA (H): Cuando los datos a promediarse están medidos en unidades expresadas en forma de cocientes (km./hr., $/lt, etc.), lo más adecuado es utilizar la media armónica, ya que la media aritmética nos llevará a un promedio equivocado. a. Media Armónica para datos No Agrupados: H n n 1 X i 1 i Ejemplo 1 : Si un vehículo se mueve de la ciudad A a la B a 65 Km./hr y regresa de B a A a 98 Km./Hr a qué promedio se desplazó. H n n 1 i 1 X i 2 1 1 65 98 78.1595 b. Media Armónica para datos Agrupados: H n fi i 1 Yi k Nota: Se puede demostrar que: X G H ; entonces señor estudiante con este mismo ejemplo verifique lo planteado. También puede calcularse la media armónica ponderada. Ejemplo 1: Supóngase que una flotilla de vehículos muestra la siguiente información: Halle su media Armónica. 82 Ing. Rolando W. Rivera Olivera Velocidad promedio en km/hr Número de vehículos 50 15 60 28 75 31 La respuesta es: H n 74 62,711864 15 28 31 fi 50 60 75 Y i 1 i k Ejemplo 2: Hallar la media Armónica de la Tabla 1 del ejemplo del Capítulo 2 Recordemos el resumen de la tabla 1 , Capítulo 2: 𝐿𝑖 − 𝐿𝑠 𝑌𝑖 149,5 - 154,5 152 3 154,5 - 159,5 157 8 159,5 - 164,5 162 12 164,5 - 169,5 167 14 169,5 - 174,5 172 10 174,5 - 179,5 177 2 179,5 - 184,5 182 1 TOTAL 𝑓𝑖 50 83 Ing. Rolando W. Rivera Olivera Aplicamos la fórmula de H para datos agrupados: H n fi i 1 Yi H 50 3 8 12 14 10 2 1 152 157 162 167 172 177 182 H 50 0,3035 k H 164,74 3.2.4. MEDIA CUADRÁTICA (MC): La media cuadrática nació con el objetivo de poder obtener el promedio de valores positivos y negativos al mismo tiempo, además de ser una gran ayuda para poder calcular las dispersiones promedio de los datos (ver medidas de dispersión). a. Media Cuadrática para datos no agrupados: n MC x i 1 2 i n Ejemplo: Supóngase que se obtienen las ganancias y pérdidas del precio de una acción durante una semana; - 4.00, - 3.50, 2.35, 6.20, 3.25 Calcular el promedio cuadrático: 84 Ing. Rolando W. Rivera Olivera n MC MC x i 1 2 i (4.0) 2 (3.5) 2 2.35 2 6.2 2 3.25 2 5 n 50.775 3.186691 5 b. Media Cuadrática para datos agrupados n n MC i 1 f i xi2 MC n fY i 1 ó 2 i i n Ejemplo 1: Ahora deseamos obtener el promedio de una tabla de distribución de frecuencias pero con datos positivos y negativos; Así tenemos Ganancias y pérdidas del precio por acción y días. Ganancias y Nro.de pérdidas días: xi fi -7.25 25 2.75 14 12.75 2 n MC fx i 1 i n 2 i 25 * ( 7.25) 2 14 * 2.75 2 2 *12.75 2 41 MC 6.5239 85 Ing. Rolando W. Rivera Olivera Ejemplo 2: Hallar la Media Cuadrática del ejemplo Tabla 1 del Capítulo 2. 𝐿𝑖 − 𝐿𝑠 𝑌𝑖 149,5 - 154,5 152 3 154,5 - 159,5 157 8 159,5 - 164,5 162 12 164,5 - 169,5 167 14 169,5 - 174,5 172 10 174,5 - 179,5 177 2 179,5 - 184,5 182 1 TOTAL 𝑓𝑖 50 n MC f .Y i 1 i 2 i n MC 3 * (152) 2 8 * 157 2 12 * 162 2 14 * 167 2 10 * 172 2 2 * 177 2 1 * 182 2 50 MC 3 * (152) 2 8 *157 2 12 *1622 14 *167 2 10 *1722 2 *177 2 1 *1822 50 MC 1363500 50 MC 27270 MC 165,14 3.3. MEDIDAS DE POSICIÓN Ayudan a localizar el valor de la variable que acumula cierto porcentaje específico de datos. 86 Ing. Rolando W. Rivera Olivera 3.3.1. Cuartiles( Q x ): Encuentran el valor acumulado al 25%, 50% y 75% respectivamente. 3.3.2. Deciles ( D x ): Representan el 10%, 20%, ... , 90% de los datos acumulados respectivamente. 3.3.3. Percentiles ( Px ): Representan el 1%, 2%, ... , 99% de los datos acumulados respectivamente. Cada cuantil delimita dos regiones: el p% de datos de menor valor (acumulados a la izquierda del cuantil C) el (1 - p)% de datos de mayor valor (acumulados a la derecha del cuantil C). 3.4. MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS: En los datos ordenados: se debe calcular la posición mediante la fórmula: Posición x*n r donde : x Número de cuantil que se desea obtener r puede ser 4, 5, 10 ó 100 depende del cuantil que se desee obtener n número de datos Después de calcular la posición se utiliza la siguiente fórmula para encontrar el cuantil deseado: dato menor (dato mayor - dato menor) * fracción de la posición Ejemplo: Dados los números 3, 5, 7, 36, 45; obtener el número que represente al 75% de los datos ( P75 ) 87 Ing. Rolando W. Rivera Olivera Solución: 1. Primero obtienes la posición N=5 x = 75 r = 100 75 * 5 3,75 100 2. Identificamos que números están en la cuarta y quinta posición, es decir el 36 y el 45 3. Aplicamos la fórmula: 36 (45 36) * 0.5 40.5 Es decir, el número que representa al 75% de los datos es el 40.5 o sea el P75 40.5 3.5. MEDIDAS DE POSICIÓN PARA DATOS AGRUPADOS: Primero calculamos la posición como en los datos no agrupados, después buscamos en la tabla correspondiente la columna de Frecuencia acumulada y ubicamos el primer valor de Fi posición y aplicamos la siguiente formula: Posición del Cuantil Frecuencia acumulada anterior al intervalo seleccionado . xn Fi 1 r C Q x = Li + fi Tamaño de intervalo del renglón seleccionado Frecuencia del intervalo seleccionado Frontera inferior 88 Ing. Rolando W. Rivera Olivera Ejemplo 1: a. Encontrar el cuartil 3 de la siguiente tabla: 3 * 1099 824,25 4 • Encontramos la posición: Posición • Esta cantidad está incluida en la Tercera Fila, por tanto ésa es la clase que contiene al Q3 y aplicamos la fórmula del cuartil. Li _ Ls fi Fi 100 - 200 389 389 200- 300 258 647 300 - 400 452 1099 Total 1099 3 * (1099) xn 647 Fi 1( anterior) 4 4 * 100 339.2146 Q 300 Qx = Li + C 3 fi 452 Q3 = 339,2146 b. Encontrar el Decil 7 en la tabla anterior ( D 7 ) xn Fi 1( anterior) 10 D x = Li + C fi 89 Ing. Rolando W. Rivera Olivera 7 * (1099) 647 10 *100 327,058 D 7 300 452 c. Encontrar el Percentil 35 ( P35 ): Observa que para el Percentil 35, la posición: 351099 x n 384,65 = 100 100 Este valor indica la posición del Percentil 35: Con este valor vemos que en la columna de Fi éste se posiciona en el 1er. Intervalo de la tabla correspondiente, entonces: Fi 1( anterior) = 0 xn 35 * (1099) Fi 1( anterior) 0 100 100 P 100 *100 198,88 Px = L i + C 35 fi 389 Ejemplo 2: Hallar 𝑄3 ; 𝑄1 ; 𝐷4 ; 𝐷8 ; 𝑃35 𝑦𝑃40 de la Tabla 1 del ejemplo de la Unidad 2 El resumen de la tabla 1, Unidad 2, de acuerdo a lo que se necesita para su solución es: 90 Ing. Rolando W. Rivera Olivera 𝐿𝑖 − 9,5 - 𝐿𝑠 154,5 𝑓𝑖 𝐹𝑖 3 3 154,5 - 159,5 8 11 159,5 - 164,5 12 23 164,5 - 169,5 14 37 169,5 - 174,5 10 47 174,5 - 179,5 2 49 179,5 - 184,5 1 50 TOTAL 50 Solución, necesitamos, primero ubicar la posición correspondiente a los cuantiles y con este resultado ubicamos el intervalo del correspondiente cuantil y se busca en la frecuencia absoluta acumulada (𝐹𝑖 ) que contenga a dicho número, después de esto aplicamos la fórmula que corresponda, asi como vemos en la solución que se muestra. a. Cálculo de Cuartiles Q1 y Q3 Para calcular Cuartiles se usa la siguiente fórmula: xn Fi -1 4 C Qx = Li + fi 1(50) 11 5 entonces Q1 160,125 Q1 = 159,5 + 4 12 3(50) - 37 entonces Q3 169,75 Q3 169,5 5 4 10 91 Ing. Rolando W. Rivera Olivera b. Cálculo de Deciles: D4 y D8 xn Fi -1 C Dx = L i + 10 fi 4(50) 11 entonces D4 163,25 D4 = 159,5 + 5 10 12 8(50) - 37 entonces D8 171 D8 169,5 5 10 10 c. Cálculo de Percentiles: P35 y P40 xn Px = L i + 100 fi Fi -1 C 35(50) 11 entonces P35 162,21 P35 = 159,5 + 5 100 12 40(50) - 11 D40 159,5 5 100 12 entonces P40 163,25 92 Ing. Rolando W. Rivera Olivera EJERCICIOS PROPUESTOS N° 3 1. Una empresa grande de equipos deportivos está probando el efecto de dos planes publicitarios sobre las ventas de los últimos 4 meses. Dadas las ventas que se ven aquí, ¿cuál programa de publicidad parce producir el crecimiento promedio más alto en ventas mensuales? Mes Plan 1 Plan 2 Enero 1657,0 4735.0 Febrero 1998.0 5012.0 Marzo 2267.0 5479.0 Abril 3432.0 5589.0 2. Los estadísticos del programa de Meals on Wheels (comida sobre ruedas), el cual lleva comidas calientes a enfermos confinados en casa, desean evaluar sus servicios. El número de comidas diarias que suministran aparece en la siguiente tabla de frecuencia. Calcular la media, mediana y la moda e interprete sus resultados. Número de comidas por Número de días día [0 , 5[ 3 [5 , 10[ 6 [10 , 15[ 5 [15 , 20[ 8 [20 , 25[ 2 [25 , 30] 3 3. Bill Karl compró 20 acciones a &15 cada una, 50 acciones a &20 cada una, 100 acciones a $30 cada una y 75 acciones a &35 cada una. ¿Cuál es el precio promedio por acción? 93 Ing. Rolando W. Rivera Olivera 4. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadas aparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la mediana y la moda. Además, calcule e interprete: Q1, Q2, D10, D60, P15, P90, Edades Frecuencia [50 , 55[ 8 [55 , 60[ 13 [60 , 65[ 15 [65 , 70[ 10 [70 , 75[ 3 [75 , 80] 1 5. Dado el siguiente cuadro estadístico con ancho de clase constante igual a 20. Determine la media de los datos. Li - Ls fi Fi Yi.fi - 8 8 880 - 15 23 1950 - 12 35 1800 - 13 48 18 66 4 70 - 200[ Yi 6. En el curso de estadística y probabilidades; se tienen las notas de los alumnos distribuidas según el siguiente histograma de frecuencias, entonces la nota promedio del curso es: 94 Ing. Rolando W. Rivera Olivera 7. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la moda es 60 y pertenece al tercer intervalo. (Li - Ls) fi ( 16 - 32 ) 6 ( 32 - 48 ) n ( 48 - 64 ) 8 ( 64 - 80 ) 3n ( 80 - 96 ) 3 8. En un examen de estadística tomado el mismo día y hora a los tres grupos del segundo Semestre de la carrera de Mantenimiento de la institución: A B y C con un total de 150 alumnos se obtuvo una nota promedio de 13,2; las notas promedio de los grupos A y B fueron 12 Y 14 respectivamente ; los registros del grupo C se extraviaron , pero se sabe que el grupo A es el 36% del total y que el número de alumnos del grupo B es la tercera parte de las matriculadas en el grupo C a. Hallar nota promedio del grupo C b. Hallar la nota promedio del grupo C c. Calcular la nota promedio de los grupos A y C juntos 9. La siguiente tabla de distribución de frecuencias muestra la edad de un grupo de personas. Si además se sabe que la moda es 27,5 (Li fi Ls) (10 - 20) (20 - 30) a 30 (30 - 40) (40 - a+10 50) 20 a. Hallar el valor de a b. ¿Bajo qué edad se encuentra el 35% más joven c. Cuantas personas tienen como mínimo 20 años Justifique 10. De un grupo de pequeñas empresas se sabe que ninguna tiene más de 5 trabajadores ni menos de 2, la mayoría tiene 3 trabajadores, el 20% tiene 5 trabajadores, 2 de cada 20 empresas tiene 4 95 Ing. Rolando W. Rivera Olivera trabajadores; la proporción de empresas que tienen 2 trabajadores es 0.25% Calcular e interpretar la media aritmética. 11. Dada la siguiente distribución de frecuencias: (Li - Ls) fi (20 - 30) (30 3 - 40) (40 1 - 50) (50 - 2 6 60) (60 - 70) x Hallar el valor de x, si se sabe que la mediana es 61,6 12. Los siguientes datos corresponden a los sueldos de los trabajadores de una compañía Sueldos Número de trabajadores 950 - 1000 5 1000 - 1050 12 1050 - 1100 9 1100 - 1150 8 1150 - 1200 4 1200 - 1250 10 1250 - 1300 6 a) Calcular la media aritmética b) Si a cada trabajador se le duplica el sueldo pero a la vez se le hace un descuento de 150 soles ¿Cuál será el nuevo sueldo promedio? c) Si cada trabajador recibe un incremento del 30% de su sueldo ¿Cuál sería el nuevo sueldo promedio? d) Si cada trabajador recibe un aumento de 270 soles y al mismo tiempo se decreta un descuento del 3,5 % del nuevo haber ¿Cuál es el sueldo promedio? 13. En un examen tomado a 3 secciones de un curso de estadística de 91 alumnos el puntaje medio general fue de 69.3. los puntajes medios de las secciones 1 y 2 fueron 70.4 y 64.2 respectivamente. Se perdieron los archivos con la notas de la sección 3 pero los ayudantes recuerdan que las secciones 1 y 2 tenían exactamente el mismo número de alumnos , mientras que el ayudante de la sección 96 Ing. Rolando W. Rivera Olivera 3 menciona que su sección tenía 5 estudiantes menos que la sección 1 ¿Cuál es el promedio de la sección 3? 14. Una fábrica de aparatos electrónicos ha comenzado un estudio para mejorar su eficiencia. Efectuó para esto un relevamiento en la sección de armado de visores para computadora durante 10 días consecutivos. La cantidad de visores armados diariamente fueron: 30; 20; 50; 80; 40; 50; 60; 30; 70 y 50 Calcule todas las medidas de tendencias central proporcionando un significado a su valor de manera que sirva para los fines propuestos en el estudio. 15. La siguiente información es relativa a los sueldos de un grupo de trabajadores en una compañía donde el 12% de ellos ganan S/ 530, el 24% gana S/ 560, el 20% ganan S/ 600, el 15% ganan S/ 650, el 13 %ganan S/ 680 y el resto ganan S/ 700. ¿Cuál es el salario medio? 16. En un grupo hay 40 estudiantes varones con una edad promedio de 20 años, las mujeres son en promedio más jóvenes en un 10% . ¿Cuántas mujeres hay si la edad promedio de la clase es de 19 años? 17. El salario promedio mensual pagado a los trabajadores de una compañía es de $ 200. Los salarios promedios mensuales pagados a los hombres y mujeres de la compañía son$ 210 y $150 respectivamente. Determinar el porcentaje de hombres y mujeres que trabajan en la compañía. 18. Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de frecuencias con 6 intervalos de clase y se sabe que la mínima ganancia es de $ 6 , el rango es de 36 , el promedio de ganancias diarias es de $25,14, el 50% de los establecimientos ganan más de 25,58 dólares diarios H 2 = 0,15; F2 = 120; h3 = 0,25; H5 = 0,93; f4 = 304; f2 = 2f1. Reconstruir la distribución 97 Ing. Rolando W. Rivera Olivera de todas las frecuencias y hallar la ganancia más frecuente y la ganancia promedio. 19. Una compañía minera tiene 100 trabajadores. Para los nombrados el haber máximo es $450 y el mínimo $60. Hay un 5% de eventuales (en prueba) que trabajan ad honorem o perciben compensaciones inferiores a $60. Quince trabajadores nombrados perciben haberes inferiores a $250 y el 85% ganan haberes inferiores a $400. Con esta información, calcule las medidas de tendencia central posible. 20. Un grupo de 200 estudiantes con estatura media de 60,96pulg. se divide en 2 grupos, un grupo con una estatura media de 63,4 pulg. y el otro con 57,3 pulg. ¿Cuántos estudiantes hay en cada grupo? 21. El sueldo promedio de 200 empleados de una empresa es S/ 400. Se proponen 2 alternativas de aumento: a) S/ 75 a cada uno, b) 15% de su sueldo más 10 soles a cada uno. Si la empresa dispone a lo más de S/ 94,000 para pagar sueldos, ¿Cuál alternativa es la más conveniente? 22. De una central telefónica salieron 70 llamadas de menos de 3 minutos promediando 2,3 minutos, 40 llamadas de menos de 10 minutos pero no menos de 3 minutos, promediando 6,4 minutos y 10 llamadas de al menos 10 minutos promediando 15 minutos. Calcular la duración promedio de todas las llamadas. 23. El sueldo medio de los obreros de una fábrica es de $286 a) ¿Qué porcentaje de hombres y mujeres trabajan en la fábrica si sus sueldos medios respectivos son $300 y $260? b) Si el 60% de los obreros tienen menos de 30 años y perciben el 20% del total de sus sueldos, ¿Cuánto es el sueldo medio de los obreros de al menos 30 años? 98 Ing. Rolando W. Rivera Olivera 24. En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al 25% del ya existente con el sueldo medio igual al 60% de los antiguos. Si 3 meses más tarde se incrementan cada sueldo en 20%, más $30, ¿Cuánto es el nuevo salario medio? 25. Una empresa que vende microcomputadoras ha llevado a cabo un estudio para analizar el número de microcomputadoras que existe en pequeñas empresas del distrito A. Para el efecto toma una muestra aleatoria de 40 empresas, encontrando los siguientes resultados: 5; 7; 9; 7; 8; 5; 4; 4; 3; 7 8; 4; 9; 6; 8; 7; 6; 9; 8; 4 6; 4: 7; 4; 3; 5; 8; 5; 9; 6 7; 9; 4; 7; 5; 8; 7; 9; 6; 8 Hallar: Asimetría Me; y Mo; H;G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷8 ; 𝑃40; 𝑃70 , explique e encontrados. 99 interprete los tipo de resultados Ing. Rolando W. Rivera Olivera 100 Ing. Rolando W. Rivera Olivera AUTOEV ALUACIÓN III NOMBRE…………………………….……. CARRERA……………………………… 1. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla Peso Kgs Núm.de Emp. [50;60[ [60;70[ [70;80[ [80;90[ [90;100[ 8 10 16 14 10 [100;110[ 5 [110;120[ 2 a. Calcular la Media Aritmética por dos métodos. b. Calcular la Mediana. c. Calcular Moda d. Cuartil 3; Decil 7; Percentil 35. e. Calcular la media Cuadrática, Geométrica, Armónica. f. Efectuar un análisis estadístico de sus resultados 2. Una distribución que tiene los siguientes datos en la tabla: 𝑥𝑖 𝑓𝑖 61 5 64 18 67 42 70 27 73 8 Total 100 Hallar: Me; Mo; H; G;, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷8 ; 𝑃40; 𝑃70 y tipo de Asimetría 3. Calcular 𝑥̅ , Me, Mo, G, H, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷8 ; 𝑃40; 𝑃70 en la siguiente serie de números 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4 101 Ing. Rolando W. Rivera Olivera 4. La siguiente tabla de distribución de frecuencias muestra la edad de un grupo de personas. Si además se sabe que la moda es 27,5: [𝐿𝑖 𝐿𝑠 [ 𝑓𝑖 [10 - 20[ [20 - 30[ a [30 - 40[ 30 [40 - 50[ a + 10 20 Hallar: a. Me, 𝑥̅ , Mo, H, G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷4 ; 𝑃30; 𝑃60 b. ¿Bajo qué edad se encuentra el 35 % más joven? c. ¿Cuántas personas tienen como mínimo 20 años? Justifique 5. Se sabe que la media Aritmética de la siguiente distribución es 11,5: [𝐿𝑖 𝐿𝑠 [ 𝑓𝑖 [4 - 6 [ [6 - 10[ [10 - 16[ [16 - 20[ [20 - 30[ 5 x 3 1 4 Clacular: a. Me, Mo, H, G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷4 ; 𝑃30; 𝑃60 b. Media cuadrática c. Promedio ponderado 6. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la moda es 60 y pertenece al tercer intervalo, además calcule: Me, Mo, H, G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷4 ; 𝑃30; 𝑃60 . (Li - Ls) fi [ 16 - 32 [ 6 [ 32 - 48 [ n [ 48 - 64 [ 8 [ 64 - 80 [ 3n [ 80 - 96 ] 3 102 Ing. Rolando W. Rivera Olivera CAPITULO IV 4. MEDIDAS DE DISPERSIÓN. Introducción: Las Medidas de centralización ya estudiadas sólo nos revelan una parte de la información que necesitamos saber acerca de las características de los datos. Para aumentar nuestra confianza y entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad; por ello estas medidas nos permiten obtener información adicional para juzgar la confiabilidad de nuestras medidas de tendencia central. Si los datos se encuentran ampliamente dispersos como veremos más adelante, la posición central es menos representativa de los datos. Las principales medidas de dispersión son: 4.1. RANGO o alcance (o Intervalo: R ): Es la distancia que existe entre el menor y mayor valor de los datos, es fácil de entender y de encontrar, pero su utilidad como medida de dispersión es limitada, porque sólo toma los extremos ignorando la naturaleza de esta variación y/o la concentración de los datos, ve sólo la influencia de los extremos. 4.1.1. Rango para Datos No Agrupados: R = Dato Máx - Dato Mín. 103 Ing. Rolando W. Rivera Olivera 4.1.2. Datos Agrupados: Rango R LS k Li1 donde k = última clase Ejemplo: Dadas las dos series de datos: 15; 20; 25; 20; 25 el Rango es 10 15; 16; 20; 17; 18; 19; 20; 21; 23 y 25 el Rango sigue siendo 10 4.2. RANGO INTER CUARTIL (RI): Indica aproximadamente qué tan lejos de la mediana tenemos que ir en cualquiera de las dos direcciones antes de que podamos recorrer una mitad de los valores del conjunto de datos. El RI es una medida que excluye el 25 % más alto y el 25% más bajo, dando un rango dentro del cual se encuentra un 50 % central de los datos observados y a diferencia del Rango no se encuentra afectada por los extremos, su cálculo incluye el uso de la relación: RI Q3 Q1 4.3. RANGO SEMI-INTER CUARTIL (RSIQ): (o Desviación Cuartil) Mide el rango promedio de una cuarta parte de los datos (evita los valores extremos) RSIQ 4.4. Q 3 Q1 2 DESVIACIÓN MEDIA ABSOLUTa (DM): (o Desviación Absoluta Promedio) 104 Ing. Rolando W. Rivera Olivera Es la distancia promedio de los datos a su media. 4.4.1. Datos No Agrupados: n X X DM = 4.4.2. i i 1 n Datos Agrupados: k f DM = 4.5. i 1 i Yi X n VARIANZA: ❖ Poblacional ( 2 ): Es el promedio del cuadrado de la distancia de los datos a su media 4.5.1. Datos No Agrupados: se puede calcular por cualquiera de las formas: X X N 2 i a. 2 = b. 2 Xi 2 i 1 N i 1 N N X2 105 Ing. Rolando W. Rivera Olivera 4.5.2. Datos Agrupados: f Y X k 2 i i a. 2 = b. k 2 f i *Y i 2 i 1 N i 1 N X2 ❖ Para el caso muestral ( s 2 ): La suma de las distancias al cuadrado se divide entre en número de datos menos uno ( N – 1 ): 4.5.3. Datos No Agrupados: x x n 2 i i 1 a. s2 = b. n 2 xi (n x ) 2 2 s i 1 n - 1 n 1 n -1 4.5.4. Datos Agrupados: k a. b. Nota: s2 = f y x i 1 2 i i n -1 k f i y i2 s 2 i 1 n -1 2 (n x ) n - 1 s 2 para muestras “chicas”. Para muestras grandes s 2 o 2 106 Ing. Rolando W. Rivera Olivera prácticamente no difieren. 4.6. DESVIACIÓN ESTÁNDAR: Mide la variación de los datos en términos absolutos. Es la raíz cuadrada positiva de la varianza. 2 ❖ Poblacional: ❖ Muestral: La desviación 𝑠 = √ s2 estándar se interpreta construyendo intervalos alrededor del promedio: a) Teorema de Chebyshev. Si la distribución no es simétrica y unimodal. • Al menos el 75% de los valores cae dentro de 2 desviaciones estándar alrededor de la media: X 2S • Al menos el 89% de los valores caen dentro de 3 desviaciones estándar alrededor de la media: X 3S b) Regla Empírica. Si la distribución es una curva acampanada, unimodal y simétrica: • Aproximadamente el 68% de los datos (población) se encuentran a una desviación estándar alrededor de la media: X S • Aproximadamente el 95% de los datos (población) se encuentran a 2 desviaciones estándar alrededor de la media: X 2S • Aproximadamente el 99% de los datos (población) se encuentran a 3 desviaciones estándar alrededor de la media: X 3S 107 Ing. Rolando W. Rivera Olivera 4.7. COEFICIENTE DE VARIACIÓN (CV): Mide la variación relativa de la variable con respecto a su promedio. Mide la magnitud de la desviación estándar en relación con la magnitud de la media. Se expresa en por cientos. CV = S 100 X Ejercicio de Aplicación de Medidas de dispersión: Calcular a partir de la Tabla 1 del ejemplo del Capítulo 2 en que se muestran todas las medidas de dispersión arriba mencionadas: Interv. Li - Ls Yi fi Yi Y fi Y Y i 1er 149,5 – 154,9 152 3 152 – 165 39 2do 154,5 – 159,5 157 8 157 - 165 64 3er 159,5 – 164,5 162 12 162 - 165 36 4to 164,5 – 169,5 167 14 167 - 165 28 5to 169,5 – 174,5 172 10 172 - 165 70 6to 174,5 – 179,5 177 02 177 - 165 24 7mo 179,5 – 184,5 182 01 182 - 165 17 Total 50 278 a. Calculo de desviación Media (DM): Para calcular la desviación media se utiliza la siguiente fórmula: n Y X DM = i 1 i n 3152 165 8157 165 12162 165 14167 165 10172 165 2177 165 1182 165 50 278 DM 50 DM = 108 Ing. Rolando W. Rivera Olivera DM = 5,56 b. Para el cálculo de Desviación estándar o Típica, se calcula primero la Varianza ( s 2 ) luego se saca la raíz cuadrada de este valor y se obtiene la desviación típica: f y x k S2 = i 1 2 i i n 3152 165 8157 165 12162 165 14167 165 10172 165 2177 165 1182 165 2 S 2 2 2 2 2 2 2 50 s2 = 507+512+108+56+490+288+289 50 = 2250 50 ⇿ s 2 = 45 ; por tanto : s = √45 = 6,71 c. Coeficiente de Variación (CV): este coeficiente de variación se halla utilizando la siguiente relación e indica la homogeneidad o heterogeneidad de la composición de datos; esto es si sobrepasa el 33% será heterogéneo y sino homogéneo: CV = S 6,71 100 reemplazando en la Fórmula CV x 100 CV 4,06 % X 165 Lo que indica que es bastante Homogéneo, se encuentra lejos del 33 %. 4.8. MEDIDAS DE FORMA Proporcionan un valor numérico para saber hacia qué lado de la distribución hay mayor acumulación de frecuencias y si la concentración central de frecuencias es mayor que en los extremos o viceversa sin tener que graficar los datos. 4.8.1. Momento Respecto de la Media: El r-ésimo momento respecto a la media aritmética es: 109 Ing. Rolando W. Rivera Olivera a. Datos No Agrupados: x n mr i 1 x r i n b. Datos Agrupados: f x n mr i 1 i x r i n El primer momento respecto a la media (r=1) siempre es igual a cero. El segundo momento respecto a la media (r=2) es la varianza poblacional. 4.8.2. SESGO: Es el grado de asimetría que tiene la distribución. La distribución puede ser: • Insesgada: Si tiene forma de campana y el área acumulada del centro de la distribución a la derecha es igual a la que se acumula a la izquierda, además se dice que es una distribución normal en las que: Moda=Mediana=Media Insesgada Moda=Mediana=Media 110 Ing. Rolando W. Rivera Olivera • Con sesgo positivo o a la derecha: Si tiene la mayor acumulación de frecuencias a la izquierda y una cola larga a la derecha. Sesgo Positivo (a la derecha) Moda Mediana Media • Con sesgo negativo o a la izquierda: Si la mayor acumulación está a la derecha y tiene una cola larga a la izquierda. Sesgo Negativo (a la izquierda) Moda Mediana Media • Coeficiente Momento de Sesgo ( a 3 ): se calcula dividiendo el tercer momento respecto a la media entre la desviación estándar al cubo: Datos No Agrupados: x n a3 m3 s3 i 1 x 3 i ns 3 Datos Agrupados: f x k a3 m3 s3 i 1 i x 3 i ns 3 111 Ing. Rolando W. Rivera Olivera Coeficiente momento de sesgo Sesgo a3 = 0 No hay sesgo. La insesgada distribución es a3 > 0 La distribución tiene sesgo positivo o a la derecha. a3 < 0 La distribución tiene sesgo negativo o a la izquierda. 4.8.3. CURTOSIS: Mide qué tan puntiaguda es una distribución, con respecto a la Normal o el grado de apuntalamiento. La distribución puede ser: Mesocúrtica: solo la distribución Normal (es el término medio). Leptocúrtica: Las distribuciones más puntiagudas que la Normal. Platicúrtica: Las distribuciones menos puntiagudas que la Normal. Leptocúrtica Mesocúrtica Platocúrtica 4.8.4. Coeficiente momento de curtosis ( a 4 ): se calcula dividiendo el cuarto momento respecto a la media entre la varianza al cuadrado (o la desviación estándar a la cuarta). • Datos No Agrupados: x n m a 4 44 s i 1 x 4 i ns 3 112 Ing. Rolando W. Rivera Olivera • Datos Agrupados: f x x k m a 4 44 s Coeficiente de curtosis 4.9 i 1 momento i 4 i ns 4 Curtosis a4 = 3 La distribución es Mesocúrtica. a4 > 3 La distribución es Leptocúrtica. a4 < 3 La distribución es Platocúrtica. MEDIDAS DE CONCENTRACIÓN En una distribución, ni la media ni la varianza son explicativas de la mayor o menor igualdad en el reparto; para esto usamos las medidas de concentración. Consideremos que la variable en cuestión es el salario. Una distribución muy concentrada indica que pocos individuos reciben la mayor parte del total, mientras que poca concentración supone que todos los individuos tienen un reparto igualitario. 4.9.1. Indice de Gini ( Ig ): k 1 Ig p i 1 i qi k 1 p i 1 i donde: k = número de clases o categorías pi = la proporción acumulada de individuos = 113 fi 100 = n fra x 100 Ing. Rolando W. Rivera Olivera q i = la proporción acumulada del total del producto de f i*xi 0 Ig 1 Si Ig=0, la variable está menos concentrada (mejor repartida). Si Ig=1, la variable está más concentrada (peor repartida). 4.9.2. Curva de Lorenz: Se grafican los valores de la proporción acumulada de individuos (p) y la proporción acumulada del total de la variable (q). La función identidad representa la igualdad absoluta, es decir, a la variable cuando no está concentrada (la recta a 45 grados). La desigualdad absoluta o máxima concentración de la variable indicaría que un solo individuo tenga el total de la variable (el triángulo inferior). Cuanto más se acerque la Curva de Lorenz a la diagonal, más igualitario será el reparto (Ig = 0). Cuanto más se acerque la Curva de Lorenz al triángulo inferior, más concentrada esta la variable (Ig = 1). q p El Indice de Gini calcula el área entre la diagonal y la Curva de Lorenz, como un porcentaje del área del triángulo inferior de la gráfica (mide la desigualdad relativa). Ejemplo: La información que se presenta a continuación representa el salario de los 300 empleados de una empresa y nos interesa saber la concentración de los datos 114 Ing. Rolando W. Rivera Olivera Salario Mensual (en miles) No. de empleados: f Marca de clase: Y f*Y 𝒉𝒊 𝑯𝒊 8 - 10 190 9 1710 63.33 58.163 58.16 5.17 10 - 12 100 11 1100 96.67 37.42 95.58 1.09 12 - 14 10 13 130 100.00 4.42 100.00 0 k 1 Ig p i 1 i qi k 1 p i 1 Q P-Q 5.17 1.09 0.0391 63.33 96.67 i Como podemos observar el resultado refleja que no hay mucha concentración de los datos, es decir, los datos se encuentran bien distribuidos. 115 Ing. Rolando W. Rivera Olivera 116 Ing. Rolando W. Rivera Olivera EJERCICIOS PROPUESTOS N° 4 1. Calcular todas las medidas de dispersión para los datos de la siguiente distribución 𝑳𝒊 (0 𝑳𝒔 - (100 100) 𝒙𝒊 - ((200- (300 300) 800) 200) 90 140 150 - 120 2. Calcular todas las medidas de dispersión para la siguiente distribución, además la Mediana 𝒙𝒊 5 10 15 20 25 𝒇𝒊 3 7 5 3 2 3. Se utiliza 2 máquinas diferentes para fabricar conductos de salida de papel destinados a copiadoras kodak. Los conductos de una muestra de la primera máquina median: 12,2; 11,9; 11,8; 12,1; 11,9; 12,4; 11.3; 12.3 pulgadas. Los conductos hechos con la segunda maquina median: 12,2; 11,9; 11,5; 12,1; 12,2; 11,9 y 11,8 pulgadas. Si se desea utilizar la máquina que produzca conductos de tamaños más uniformes; ¿Qué maquina deberá utilizarse? 4. Se sabe que la media aritmética de la siguiente distribución es 11,5 Calcular la desviación estándar, La mediana, Moda y la Media Armónica. 𝑳𝒊 𝑳𝒔 𝒉𝒊 (4 - 6) 4 (6 - 10) (10 - 16) (16 - 20) (20 - 30) 5 x 3 1 5. Si X es una variable que tiene media 15 y varianza 25; hallar la media, varianza y desviación típica de Y en los siguientes casos. a) Y = 4 + 16X b) Y = 16 - 4X 117 Ing. Rolando W. Rivera Olivera c) Y = ¼ + ¼X 6. Durante un periodo de diez años, los precios de un producto fueron en promedio de $ 80 con una varianza de $ 12,00. En el periodo anterior de 10 años, el promedio fue de $ 50,00 con una varianza de 36 ¿En qué periodo hubo mayor estabilidad? 7. Un grupo de trescientos alumnos llevan el curso de estadística y probabilidad distribuidas en cuatro secciones. Si se sabe que el número de alumnos por sección están en una progresión aritmética cuya razón es 20 y además se conoce que las notas de las secciones A, C y D son 12; 14 y 11 mientras que las varianzas de los grupos A y C son 16 y 4 y las desviaciones estándar de B y D son 3 y 1 respectivamente. Si la nota promedio en el curso es 12,37; hallar e interpretar la desviación estándar de las cuatro secciones juntas. 8. En una empresa donde los salarios tienen una media S/ 2500 y una desviación estándar de S/ 300 el sindicato solicita que cada salario Xi se transforme en Yi, mediante la siguiente relación: Yi = 3.5 Xi + 10 El directorio acoge parcialmente la petición rebajando los salarios propuestos por el sindicato en un 20% , lo que es aceptado. Se pide calcular la varianza de la nueva distribución de salarios 9. Se tienen tres empresas con aproximadamente igual número de trabajadores. El número de inasistencias registradas durante los últimos seis meses en cada una de las tres empresas se da a continuación: empresa: A: 3; 19; 4; 5; 15; 6 B: 7; 8; 11; 9; 14; 16 C: 10; 17; 12; 2; 18; 13 118 Ing. Rolando W. Rivera Olivera En cuál de estas tres empresas existe mayor variabilidad con respecto al número de inasistencias 10. Una empresa de fabricación de productos cerámicos dispone de tres centros de producción. En el centro A, el más grande y moderno, se hace un estudio de los m2 de azulejos producidos al mes durante el año pasado, obteniéndose una media de producción mensual 𝑋̅A = 250000 m2 con una desviación estándar SA = 15000 m2. Se sabe que el centro B, por tener maquinaria más anticuada que A, produce cada mes un tercio de la producción de A, y que el centro C , por tener un horno menos que B, produce cada mes 25000 m 2 menos que B ¿Cuál es la media y la varianza de la producción mensual de C? 11. Se utiliza dos máquinas diferentes para fabricar conductos de salida de papel destinados a copiadoras kodak. Los conductos de una muestra de la primera máquina medían 12,2; 11,9; 11,8; 12,1; 11,9; 12,4; 11,3; 12,3 pulgadas Los conductos hechos con la segundan maquina medían 12,2; 11,9; 11,5; 12,1; 12,2; 11,9; 11,8 pulgadas Si se desea utilizar la máquina que produzca conductos de tamaños más uniformes; ¿Qué maquina deberá utilizarse? 12. Un entrenador de pista y de campo debe decidir a cuál de sus dos velocistas seleccionará para los cien metros planos en una próxima competencia. El entrenador basará la decisión en los resultados de cinco carreras entre los dos atletas, celebrados en el periodo de una hora, con descanso de 15 minutos. Los siguientes tiempos (en segundos) se registraron para las cinco carreras: Atleta Carrera 1 2 3 4 5 Mendoza 11,1 11,0 11.0 15,8 11,1 Ramírez 11,3 11,4 11,4 11,5 11,4 119 Ing. Rolando W. Rivera Olivera Con base en estos datos ¿A cuál de los dos velocistas debe seleccionar el entrenador? ¿Por qué? 13. Las secciones A B y C del curso de estadística General rinden el mismo examen parcial. Los resultados obtenidos se registran en las siguientes tablas: A A B B C C 𝑌𝑖 𝐹𝑖 (𝐿𝑖 𝑌𝑖 . 𝑓𝑖 𝐻𝑖 ℎ𝑖 𝑌𝑖 2 2.5 3 2 - 6 16 0.1 2.5 7.5 8 6 - 10 144 0.2 10 12.5 22 10 - 14 240 0.8 86.4 17.5 30 14 - 18 240 1 45 𝐿𝑠 ) a. En cuál de las secciones las notas son más homogéneas? b. Calcular e interpretar la desviación estándar para las tres secciones juntas 14. Durante un periodo de diez años, los precios de un producto fueron en promedio de $ 180 con una desviación estándar de $ 12. En el periodo anterior de 10 años el promedio fue de $ 150 con una varianza de $64 ¿En qué periodo hubo mayor estabilidad? 15. En la sección financiera de un diario apareció la distribución de la variable discreta adjunta. Se decía en el texto del artículo que la media aritmética era 120 y la varianza 25. Desafortunadamente la publicación apareció con dos manchas de tinta, lo cual impedía comprobar directamente la afirmación. ¿Son admisibles dichos valores de la media y la varianza, teniendo en cuenta lo que puede verse del cuadro? Justificar. 𝑌𝑖 𝑓𝑖 105 110 115 120 125 130 37 90 95 85 60 135 140 16. Los alumnos de un grupo obtuvieron en matemática II una nota media de 68.7 puntos con una desviación estándar de 15.4 y los del otro grupo obtuvieron en la misma asignatura un promedio de 50.9 puntos con una 120 Ing. Rolando W. Rivera Olivera desviación estándar de 19.6 ¿Cuál de los dos grupos tiene un rendimiento más heterogéneo? 17. Si la nota media de unos estudiantes varones es 3 y la desviación estándar de sus notas es 0.25 en tanto que las correspondientes cifras para las estudiantes mujeres son 3.2 y 0.25. ¿Muestran menor variabilidad las notas de los estudiantes varones? ¿Por qué? 18. En el siguiente conjunto de números, se proporcionan los pesos ( redondeados a la libra más próxima ) de los bebes nacidos durante un cierto número de intervalo de tiempo en un hospital: 4; 8; 4; 6; 8; 6; 7; 7; 7; 8; 10: 9; 7; 6; 10; 8; 5; 9; 6; 3; 7; 6; 4; 7; 6 9; 7; 4; 7; 6; 8; 8; 9; 11; 8; 7; 10; 8; 5; 7; 7; 6; 5; 10; 8; 9; 7; 5; 6; 5 a. Calcular las medidas de tendencia central. b. Calcular las medidas de dispersión incluyendo Desviación media, sesgos y curtosis. c. ¿Es esta una distribución sesgada? De ser así, ¿en qué dirección? d. Encontrar el Percentil 24 19. Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico (medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual inferior a 95 y otro formado por los demás; De cada sujeto se anotó el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla: 121 Ing. Rolando W. Rivera Olivera Nivel socioeconómico Sujetos con CI < Sujetos con CI ≥95 95 fi fi 10 75 19 - 16 35 26 16 - 22 20 25 22 - 28 30 30 28 - 34 25 54 34 - 40 15 96 Li - 4 - 10 Ls a) Dibuje un gráfico que permita comparar ambos grupos b) Calcule las medidas de tendencia central para aquellos sujetos con CI < 95 y CI > 95 c) Calcular las medidas de dispersión para aquellos sujetos con CI < 95 y CI > 95 20. Un estudio consistió en anotar el número de palabras leídas en 15 segundos por un grupo de 120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta los resultados de la tabla. Disléxicos 𝒏𝑫 Normales 𝒏𝑵 35 o menos 56 1 26 24 9 27 16 21 28 12 29 29 10 28 30 o mas 2 32 Nro. de palabras leídas Calcule: a) Las medias aritméticas de ambos grupos b) Las medianas de ambos grupos c) Las medias armónicas de ambos grupos. d) La media Geométrica de ambos grupos 122 Ing. Rolando W. Rivera Olivera e) El porcentaje de sujetos disléxicos que superaron la mediana de los normales f) Compare la variabilidad (CV) relativa de ambos grupos. g) La Desviación media, Sesgo y curtosis y señale con gráfico. 123 Ing. Rolando W. Rivera Olivera 124 Ing. Rolando W. Rivera Olivera AUTOEV ALUACIÓN IV NOMBRE………………………………………………… CARRERA…………………. 1. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla Peso Kgs Núm.de [50,60[ [60,70[ [70,80[ [80,90[ [90,100[ [100,110[ [110,20[ 8 10 16 14 10 5 2 Empleads. a. Calcular la Desviación Media. b. Calcular el coificiente de Sesgo y Curtosis. c. Calcular la Desviación Típica. d. Rango Intercuartilico. e. Exprese si son o no homogéneos? 2. Una distribución que tiene los siguientes datos en la tabla: 𝑥𝑖 𝑓𝑖 61 5 64 18 67 42 70 27 73 8 Total 100 Hallar: DM; Varianza; Desviación típ ica; Rango Intercuartílico, y la concentración de los datos, El coeficiente de Variación. 3. Calcular ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ 𝐷𝑀, 𝑠 2 , 𝑠, 𝑅𝐼, 𝐶𝑉: En la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4 125 Ing. Rolando W. Rivera Olivera 4. La siguiente tabla de distribución de frecuencias muestra la edad de un grupo de personas. Si además se sabe que la moda es 27,5: [𝑳𝒊 𝑳𝒔 [ 𝒇𝒊 [10 - [20 - [30 20[ 30[ 40[ a 30 - [40 - 50[ a + 10 20 Hallar: a. Calcular la Desviación Media. b. Calcular el coeficiente de Sesgo y Curtosis. c. Calcular la Desviación Típica. d. Rango Intercuartílico. e. Exprese si son o no homogéneos? 5. Se sabe que la media Aritmética de la siguiente distribución es 11,5: [𝑳𝒊 𝑳𝒔 [ 𝒇𝒊 [4 - 6 [ [6 - 10[ 4 [10 - [16 - [20 16[ 20[ 30[ 5 x 3 - 1 Calcular: a. Halle las medidas de dispersión. b. Exprese si los datos son homogéneos o heterogéneos, por qué? c. Cuáles son los coeficientes de sesgo y Curtosis? 6. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la moda es 60 y pertenece al tercer intervalo, además calcule las medidas de dispersión y exprese su interpretación. (Li - Ls) fi [ 16 - 32 [ 6 [ 32 - 48 [ n [ 48 - 64 [ 8 [ 64 - 80 [ 3n 126 Ing. Rolando W. Rivera Olivera [ 80 - 96 ] 3 CAPITULO V 5 NUMEROS INDICES. 5.1 Concepto. Un número índice es una medida estadística que señala los cambios en una variable o un grupo de variables relacionadas con respecto al tiempo, espacio geográfico o cualquier característica de comparación como la rentabilidad, el costo de vida, la inflación, la natalidad, la mortandad, etc. Las aplicaciones son múltiples por ejemplo para comparar el costo de la canasta básica alimenticia en diferentes años, la producción de Papas, o la cantidad de estudiantes inscritos en la institución durante un periodo de tiempo similar al actual, aunque su principal aplicación está dirigida a los negocios y a la economía, como se ha visto ésta se puede aplicar en todas las disciplinas, se conoce también como series índices. En esta parte nos interesa primordialmente los números índices que muestran cambios con respecto a un tiempo determinado al que llamaremos año o periodo base (𝑝𝑜 ) y (𝑝𝑛 ) al que se llama periodo dado. 5.2 Número índice simple de precio, cantidad y valor Precio = p 𝑖 = (𝑝𝑛 ) 𝑥 100 (𝑝𝑜 ) 127 Ing. Rolando W. Rivera Olivera Cantidad = q (𝑞𝑛 ) 𝑥 100 (𝑞𝑜 ) 𝑖 = Valor = V 𝑖 = ( 𝑉𝑛 ) 𝑥 100 (𝑉𝑜 ) 5.3 Índices relativo de precios En un determinado tiempo los números índices relativos de precios fueron muy aplicados en medidas, en natalidad, índice de costo de vida, índice de mortandad, índice de temperatura/presión, estas, expresan la razón del precio de un bien determinado en un periodo dado a su precio en otro periodo llamado periodo base o periodo de referencia, además se suponen los precios constantes dentro de cualquier periodo, así tenemos las siguientes aplicaciones: - Se aplica en el análisis de costo de vida - Índice de precios - Salud, índice de mortandad, natalidad, abortos. - Intereses, pagos de impuestos - Ingeniería - Economía, para medir indicadores económicos Ejemplo 1: I = 1,24 / 0,49 * 100 = 130,30% I = 1,20 / 1,10 * 100 = 109,09% I= 1,20/0,88 * 100 = 136,36% 𝑖 = (𝑝𝑛 ) 𝑥 100 (𝑝𝑜 ) 128 Ing. Rolando W. Rivera Olivera Año Leche Pan Huevo 1995 0,99 1,10 0,88 2000 1,29 1,20 1,20 Propiedades básicas de los índices precios relativos a. Propiedad de identidad. El precio relativo para un periodo dado con respecto al mismo periodo es igual a 1 o al 100%, es decir: 𝑝𝑎 = 1 𝑎 b. Propiedad de tiempo inverso; cuando sus periodos se intercambian, sus precios relativos resultan recíprocas entre sí, así: 𝑝𝑎 . 𝑝𝑏 = 1 ó 𝑏 𝑎 1 𝑝𝑎 = 𝑝 𝑏 𝑏 𝑎 c. Propiedad cíclica o circular P a/b .Pb/c . Pc/a =1 P a/b . Pb/c . P c/d . P d/a =1 d. Propiedad cíclica o circular modificada P a/b . P b/c = P a/c Ejemplo 2 P a/b . P b/c . Pc/d = P a/d Supongamos que 1 litro de leche que en 1995 y el 2000 fueron 25 y 30 céntimos respectivamente de dólar tomando como 1995 como año base y 2000 como año dado. Halle el precio relativo 𝑖2000 = 0,30 𝑜,25 𝑥 100 = 120 % 129 Ing. Rolando W. Rivera Olivera Esto significa que la leche en el año 2000 se incrementó en un 20% respecto al año 1995. 5.4 Índice de cantidad o volumen relativo Mide cuanto cambia en el tiempo el número o cantidad de volumen al que se le llama una cantidad relativa o volumen relativo; del mismo modo que los precios relativos, estas cantidades o volúmenes se consideran constantes en cualquier tiempo o periodo. Si no lo fueran, podría tomarse una apropiada media aritmética para el periodo y hacer válido el supuesto, siempre que, en vez de comparar precios podemos estar interesados en comparar las cantidades o volúmenes de producción, consumo, exportaciones, etc. 𝑖 = (𝑞𝑛 ) 𝑥 100 (𝑞𝑜 ) 5.5 Índice de valor El índice de valor mide los cambios en el valor monetario total, o de una variable .En efecto combina los cambios de precio y cantidad para presentar un índice más informativo y se compara el valor de una mercancía en un periodo dado con el valor de la mercancía en otro periodo tomado como base, esto se multiplica por 100. 𝑖 = 𝑖 = (𝑝𝑛 𝑞𝑛 ) (𝑝𝑜 𝑞𝑜 ) 𝑝 ( 𝑉𝑛 ) 𝑥 100 (𝑉𝑜 ) 𝑞 = (𝑝𝑛) ( 𝑞𝑛) = precio relativo x cantidad relativa 𝑜 𝑜 Para resolver algunos problemas se asumen las mismas observaciones, notaciones y propiedades que se han visto para los precios y cantidades relativas. En forma particular, si (𝑝𝑎⁄𝑏 ) , (𝑞𝑎⁄𝑏 ) 𝑦 (𝑉𝑎⁄𝑏 ) denotan precios, cantidades y valores relativos en el periodo b con respecto al periodo a, entonces según lo expresado en la parte superior, 130 Ing. Rolando W. Rivera Olivera (𝑉𝑎⁄𝑏 ) = (𝑝𝑎⁄𝑏 ) . (𝑞𝑎⁄𝑏 ) Al que se llama propiedad del factor inverso. Ejemplo 3. Los precios medios en dólares de carbón por tonelada corta de venta al por menor en los Estados Unidos durante los años 2003 – 2008 se dan en la siguiente tabla. Año 2003 2004 2005 2006 2007 2008 Precio medio de carbón a. Tomando 14,95 14,94 15,10 15,65 16,28 16,53 2003 como base, hallar los precios relativos correspondientes 2006 y 2008 𝑖2006 = 15,65 14,95 16,53 𝑥 100 = 104,68 𝑖2008 = 14,95 𝑥 100 = 110,6 En el 2006 subieron en un 4,7% en el 2008 en un 10,6% respecto al año 2003. b. Tomando 2006 como base .Hallar los precios relativos a todos los años dados 2003 2004 2005 2006 2007 95.52 95,46 96,48 100 2008 104,02 105,6 c. Tomando 2003 al 2005 como base. Hallar los precios relativos a todos los años dados: para responder a esta pregunta necesitamos obtener el promedio del periodo base, es decir 2003 al 2005 y 131 Ing. Rolando W. Rivera Olivera luego se divide sobre esta cantidad, los resultados se dan en la siguiente tabla: 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑃𝑟𝑒𝑐𝑖𝑜𝑠2003−2005 = 14,95+14,94+15,10 3 = 15,00 2003 2004 2005 2006 2007 2008 99,7 99,6 100,6 104,3 105,5 110,2 5.6 Índices de Agregación Simple. En este método el índice de precios se expresa como la suma total de los precios de bienes en el año dado como porcentaje del total de los precios de bienes en el año base, así: Índice de precios de agregación simple = ∑ 𝑝𝑛 ∑ 𝑝𝑜 en las que: ∑ 𝑝𝑛 = suma de los precios de bienes que corresponden al año dado ∑ 𝑝𝑛 = suma de los precios de bienes correspondientes al año base. El resultado se expresa en términos porcentuales Inconvenientes: a. No considera el peso relativo de los bienes, así se incluyen como iguales los precios de la leche o de la crema de afeitar o del betún para calzados en el índice del costo de vida. b. Las unidades utilizadas en las cotizaciones de los precios, afectan el valor del índice correspondiente. 5.7 Método de media de Relativos simples. Por éste método existen varias posibilidades dependiendo del promedio empleado para expresar los precios relativos, tal como la media aritmética media geométrica, armónica, mediana, etc. 132 Ing. Rolando W. Rivera Olivera Índice de precios de media aritmética de relativos simples = ∑𝑝𝑛⁄𝑝𝑜 𝑁 ∑ 𝑝𝑛⁄𝑝𝑜 Expresa la suma de todos los precios relativos de bienes. 𝑁 Número de precios relativos de bienes empleados. 5.8 Método de cálculo de los índices por agregación ponderada. Para salvar las inconvenientes que presenta los números índices calculados por el método de precios, cantidades y valores relativos y simples se utilizan los métodos de agregación ponderada en la que se da un peso al precio de cada bien mediante un factor adecuado, tomando a menudo como la cantidad o volumen del bien vendido durante el año base, el año dado o algún año típico que puede ser inclusive la media de varios años. Todos nos indican la importancia de cada bien en particular aparecen básicamente tres posibles fórmulas, según que se utilicen la cantidad del año base, del año dado a de un año típico que se denotan por: 𝑞𝑜 =cantidad base 𝑞𝑛 =cantidad dada 𝑞𝑡 =cantidad típica 5.8.1 Índice de Laspeyres Método del año base. Índice de precios de agregación ponderada con pesos de las cantidades del año base Índice de precios de agregación ponderada año base = 5.8.2 Índice de Paashé 133 ∑ 𝑝𝑛 𝑞𝑜 ∑ 𝑝𝑜 𝑞𝑜 Ing. Rolando W. Rivera Olivera Índice de precios de agregación ponderada o del año dado = ∑ 𝑝𝑛 𝑞𝑛 ∑ 𝑝𝑜 𝑞𝑛 5.8.3 Método del año tipo o Típico Índice de precios con pesos de cantidades del año tipo = ∑ 𝑝𝑛 𝑞𝑡 ∑ 𝑝𝑜 𝑞𝑡 Nota: para t = 0 y t = n , ésta relación se convierte en Laspeyres y Paasche, respectivamente. 5.8.4 Índice de Fisher Este índice indica la media geométrica de los números índices de Laspeyres y Paashe; como se puede apreciar este índice satisface las pruebas del tiempo inverso y del factor inverso explicado en las propiedades de los números de los índices, situación que le da ciertas ventajas teóricas sobre otras forman de cálculos: ∑ 𝑝𝑛 𝑞𝑜 I F = √(∑ 𝑝𝑜 𝑞𝑜 ∑ 𝑝𝑛 𝑞𝑛 ) (∑ 𝑝𝑜 𝑞𝑛 ) Este índice corresponde a la media geométrica de los números de Laspeyres y Paasche, dado anteriormente, también es necesario resaltar que esta relación satisface las pruebas del tiempo inverso y del factor inverso, lo que le da cierta ventaja sobre los otros métodos. 5.8.5 Índice de Marshal-Edgeworth Este índice explica el método de agregación simple corregida, es decir con precios, cantidades y valores ponderados en un año tipo, donde los pesos se toman como la media aritmética de las cantidades del año base y del año dado, es decir: 𝑞𝑡 = ½ (𝑞𝑜 + 𝑞𝑛 ), luego sustituyendo éste en la 134 Ing. Rolando W. Rivera Olivera ecuanción del año tipo descrita en la parte superior, se tiene: ∑ 𝑝 (𝑞 + 𝑞 ) METODO MEDIA RELATIVOS PONDERADA IndiceDE de precios deDE Marshall-Edgeworth = ∑ 𝑝𝑛 (𝑞𝑜 + 𝑞𝑛 ) 5.9 𝑜 𝑜 𝑛 Para salvar los inconvenientes de los métodos de las medias relativas simples se utiliza una media de relativos ponderada. El peso más frecuente utilizado en este caso es la media aritmética ponderada, aunque puede utilizarse en algunos casos la media geométrica ponderada. En este método se pesa cada precio relativo con el valor total del bien en términos de alguna unidad monetaria tal como el dólar, el euro, etc. Puesto que el valor de un bien se obtiene multiplicando el precio del bien por la cantidad, los pesos vienen dados por p y q. Aparecen así tres posibles fórmulas según se utilicen los valores del año base, del año dado o de un año tipo, denotados por: 𝑝𝑜 𝑞𝑜 , 𝑝𝑛 𝑞𝑛 y 𝑝𝑡 𝑞𝑡 Media aritmética ponderada de precios relativos utilizando como en los valores del año base. Media aritmética ponderada de ∑(𝑝𝑛 ⁄𝑝𝑜 )(𝑝𝑜 .𝑞𝑜 ) precios relativos utilizando como = ∑ 𝑝𝑜 .𝑞𝑜 = ∑ 𝑝𝑛 𝑞𝑜 ∑ 𝑝𝑜 𝑞𝑜 pesos los valores del año base Media aritmética ponderada de precios relativos utilizando como = ∑(𝑝𝑛 ⁄𝑝𝑜 ) (𝑝𝑛 . 𝑞𝑛 ) ∑ 𝑝𝑛 . 𝑞𝑛 pesos los valores del año dado Media aritmética ponderada de precios relativos utilizando como 135 = ∑(𝑝𝑛 ⁄𝑝𝑜 ) (𝑝𝑡 . 𝑞𝑡 ) ∑ 𝑝𝑡 . 𝑞𝑡 Ing. Rolando W. Rivera Olivera pesos los valores del año tipo OBSERVACIÓN: se puede advertir que la primera relación es lo mismo que la fórmula de Laspeyres dada anteriormente. 5.10 NÚMEROS INDICES DE CANTIDAD O VOLUMEN. Las formulas descritas anteriormente para calcular los números índices de precios se modifican fácilmente para obtener números índices de cantidad o de volumen por el simple intercambio de p y q por ejemplo: El método de media de relativo simples queda para cantidades de la siguiente manera: Indice de Vol de media aritmética de relativos simples = ∑ 𝑞𝑛 / 𝑞𝑜 𝑁 Análogamente las formulas anteriores de laspeyres y paashe quedarían de modo siguiente: Índice de volumen de laspeyres = Índice de volumen de paashé = 5.11 ∑ 𝑞𝑛 𝑝𝑜 ∑ 𝑞𝑜 𝑝𝑜 ∑ 𝑞𝑛 𝑝𝑛 ∑ 𝑞𝑜 𝑝𝑛 NUMEROS INDICES DE VALOR Del mismo modo que se han obtenido fórmulas para índices de precios y volúmenes por lo menos también se puede llegar a las 136 Ing. Rolando W. Rivera Olivera fórmulas de índices de valor y el más clásico es el siguiente: ∑ 𝑝𝑛 𝑞𝑛 Índice de valor = ∑ 𝑝𝑜 𝑞𝑜 Ejemplo 4. En el 2006 el precio medio de un bien fue 20% más que en el 2005, 20% menos que en el 2004 y 50% más que en el 2007. Reducir los datos a los precios relativos, teniendo como base: a = 2005 b = 2006 c = 2004-2005 Solución a: Precio del 2006 es 20% más que en 2005, el precio correspondiente a 2006 es: 100 + 20 = 120, es decir, el precio de 2006 es el 120% del 2005. Puesto que el precio en 2006 es 20% menos 2004 será 100 – 20 = 80% del 2004 entonces el precio de 2004 es: 1/0,8 = 5/4 = 125 % del precio de 2006; es decir, el precio relativo del 2004 = 125% de 120 y esto es igual a 150 %. El precio en 2006 es 50% más que en 2007, será 100+50 = 150% de 2007. Entonces el precio de 2007 es: 1/1,50 = 2/3 del precio de 2006; es decir: 2/3 de 120 = 80 ; de esta manera se tiene los siguientes resultados en resumen: Año base: 2005 Año 2004 2005 2006 2007 150 100 120 80 Precio relativo Solución b: 137 Ing. Rolando W. Rivera Olivera Se utiliza el método de cambio del periodo base dado en el ejemplo 1; se divide cada precio relativo de la tabla anterior por 120 que es el año base y se expresa en tanto por ciento, lo que se reporta en la tabla siguiente: Año base: 2006 entonces para 2006 corresponde 100 % Año 2004 2005 2006 2007 125% 83,3% 100% 66,67% Precio relativo Solución c: De la primera tabla en este problema se considera la media aritmética de los precios de los años 2004 y 2005 es 125; entonces se procede a dividir a toso los años dados po este valor, de lo cual resulta la siguientes tabla: Año base: 2004 al 2005 = 125 Año 2004 2005 2006 2007 80 % 96 % 64 % Precio relativo 120 % 138 Ing. Rolando W. Rivera Olivera EJERCICIOS PROPUESTOS N° 5 1. La siguiente tabla muestra los precios medios de venta al por mayor de trigo durante varios años. Hallar el precio relativo para (a) el año 2012 tomando 2002 como base, (b) los años 2003 y 2010 tomando 2004 como base, (c) los años 2009-2012 tomando 2001-2003 = 100. ( 1 fanega = 60 libs; 1 TQ = 2000 lbs) Año 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Prom. de trigo 2,66 2,50 2,24 2,29 2,41 2,45 2,49 2,56 2,50 2,39 2,35 2,23 en $ / fanega FUENTE: Departament of commerce USA. 2. Demostrar que a) P a/b P b/c P c/d = 1; b) P a/b P b/c P c/d = P a/d 3. Demostrar que P c/d = P0/1 P 1/2 P 2/3 … P( n-1)n 4. Demostrar que la propiedad circular modificada se deduce directamente de la propiedad circular y de la propiedad del tiempo inverso. 5. La siguiente tabla muestra los precios relativos de un bien con 1999 – 2001 = 100. Determinar los precios relativo con (a) 2008 = 100, (b) 2007-2008 = 100. Año 2007 2008 2009 2010 2011 2012 Precio relativo 135 128 120 150 140 162 (2009-011=100) 6. El precio relativo para el año 2008 con 2010 como base es 62 ½, mientras que el precio relativo para el año 2009 con 2008 como base es 133 1/3. Hallar el precio relativo para el año 2010 con (a) 2009, (b) 2008-2009 como base. 7. En el 2000 el precio medio de un bien disminuyó en un 25% de 1994, pero se incrementó en un 50% del de 1986. Hallar el precio relativo para (a) 1986 y (b) 2000 con 1986 como base. 139 Ing. Rolando W. Rivera Olivera 8. La tabla muestra la energía eléctrica en miles de millones de kilovatios-hora vendidos a particulares en Estados Unidos durante los años 1997-2008. Reducir los datos a cantidades relativas con (a) 2003 y (b) 1997-1999 como base. Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 E.Elect. 3,68 4,25 4,84 5,59 6,42 7,23 8,09 9,04 10,04 11,15 12,26 13,25 M.M/Kw/h 9. En el 2006 la producción de un metal se incrementó en un 40% sobre la de 2005. En el 2007 fue de un 20% menor que la de 2006, pero 16 2/3 superior a la del 2008. Hallar las cantidades relativas para los años 2005-2008 con base ( a ) 2005 , (b) 2008, (c) 2005-2008. 10. En el problema anterior, si la producción del ml en el 2007 fue de 3,20 millones de toneladas cortas, determinar la producción para los años (a)2005, (b) 2006 (c) 2008. 11. La siguiente tabla muestra los precios y cantidades consumidas en Estados Unidos de distintos metales no férreos en los años 2007, 2014 y 2015. Tomando 2007 como base calcular un índice de precios, mediante el método de agregación simple, para el año (a) 2014, (b) 2015. Metales Precios (centavos por libra) 1949 1956 1957 Aluminio 17,00 26,01 27,52 Cobre 19,36 41,88 29,99 Plomo 15,18 15,81 14,46 Estaño 99,32 101,26 96,17 Cinc 12,15 13,49 11,40 140 Ing. Rolando W. Rivera Olivera Metales Cantidades (millones de libras) 1949 1956 1957 Aluminio 1357 3707 3698 Cobre 2144 2734 2478 Plomo 1916 2420 2276 Estaño 161 202 186 Cinc 1872 2018 1424 12. Demostrar que el número índice de agregación simple satisface las pruebas del tiempo inverso y circular pero no satisface la prueba del factor inverso. 13. En la siguiente tabla se da la producción de trigo en millones de fanegas en Estados Unidos durante los años 2007 – 2015. Reducir los datos a cantidades relativas tomando como base (a) 2011 y (b) 2007 – 2010. Año 2007 2008 2009 2010 2011 2012 2013 2014 2015 Producción de Trigo 1019 988 1306 1173 984 935 1004 951 1462 (millones de fanegas) FUENTE: Departamento de agricultura. 14. La cantidad relativa de 2015 con 2006 como base es 105, mientras que la cantidad relativa de 2015 con 2010 como base es 140. Hallar la cantidad relativa del 2010 con 2006 como base. 15. La siguiente tabla muestra en Estados Unidos los precios medios al por mayor y la producción de leche, mantequilla y queso para los años 2005, 2006 y 2014. Calcular un índice de precios al por mayor de agregación simple de estos productos para el año 2014, utilizando como base (a) 2005 y (b) 2005 - 2006. Precios (centavos por libra) Cantidades producidas (Millones de libras) Productos 2005 2006 2014 2005 2006 2014 leche 3,95 3,89 4,13 9,675 9,717 10,436 Mantequilla 61,5 62,2 59,7 117,7 115,5 115,5 Queso 34,8 35,4 38,9 77,93 74,39 82,79 141 Ing. Rolando W. Rivera Olivera 16. Utilizar el método de media aritmética de relativos simples para calcular el índice de precios al por mar de los productos del Problema anterior para el año 2014 con base (a) 2005 (b) 2005 – 2006. 17. Calcular el número índice de precios de Laspeyre para los daos del Problema 15 y para el año 2014 tomando como base (a) 2005 y (b) 2005 – 2006. 18. Mostrar que el índice ideal de Fisher es la media geométrica de los números índice de Laspeyres y Paasche. Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 E.Elect. 3,68 4,25 4,84 5,59 6,42 7,23 8,09 9,04 10,04 11,15 12,26 13,25 M.M/Kw/h 142 Ing. Rolando W. Rivera Olivera AUTOEV ALUACIÓN V NOMBRE…………………………….………………… CARRERA…………………. 1. Un comerciante ha registrado las siguientes ventas anuales. Tomando como base el año 1980. Calcular el índice de ventas para todos los años dados. Año 1980 Ventas ($) 200.000 1981 1982 1983 1984 250.000 200.000 190.000 220.000 2. Determine los índices simples de precios para el año 2000 de las tres mercancías consideradas, usando como año base 1995: Precios y consumo de tres mercancías en un área metropolitana Tabla 1 Mercancía Unidad de Precio Precio Consumo Consumo cotización 1995 2000 1995 2000 Leche Litro 0.99 1.29 15.0 18.0 Pan Pieza de una 1.10 1.20 3.8 3.7 0.80 1.20 1.0 1.2 libra huevos Docena 3. tomando como referencia la tabla 1, determine: a. Los índices simples de cantidad de las tres mercancías consideradas el año 2000, usando 1995 como año base. b. calcule los índices simples de valor para el año 2000, tomando como base el año 1995 4. Calcular el índice agregado de precios de Laspeyres para el año 2000 de las tres mercancías tabla 1, usando como base el año 1995., se recomienda utilizar.∑ y correrspondiente. 143 ∑ aplicar la fórmula Ing. Rolando W. Rivera Olivera 5. Calcule el índice agregado de precios Paasche para el año 2000 de las tres mercancías de la tabla 1, usando como base el año 1995. 6. Tomando como base los resultados del problema anterior, encuentre el valor del índice de Fisher. 7. La siguiente Tabla muestra el índice de Producción industrial de toda la industria para los años 1997 al 2008 con 1997 – 1999 como periodo base. Obtener un nuevo índice con: a. 2001, b. 2003 – 2006; como bases. Año Ind.Produc 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 3,68 4,25 4,84 5,59 6,42 7,23 8,09 9,04 10,04 11,15 12,26 13,25 1997-1999 = 100 144 Ing. Rolando W. Rivera Olivera CAPITULO VI 6. PROBABILIDAD. La Probabilidad es un método por el cual se obtiene la frecuencia de un acontecimiento determinado mediante la realización de un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza un experimento. En otras palabras, su noción viene de la necesidad de medir o determinar cuantitativamente la certeza o duda de que un suceso dado ocurra o no. La teoría de la Probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, las ciencias y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos, por lo tanto es la rama de las matemáticas que estudia, mide o determina a los experimentos o fenómenos aleatorios. Ejemplo: Lanzamos un dado al aire y queremos saber cuál es la probabilidad de que salga un 2, o que salga un número par, o que salga un número menor que 4. Para aplicar el principio de la probabilidad se tienen que cumplir ciertas condiciones como: 6.1. EXPERIMENTOS ALEATORIOS, Son aquellos sucesos que se ejecutan y, que pueden presentar diversos resultados, dentro de un conjunto posible de soluciones, y esto aun realizando el experimento en las mismas condiciones. Por lo tanto, a priori no se conoce cuál de los resultados se va a presentar: Ejemplos: 145 Ing. Rolando W. Rivera Olivera Lanzamos una moneda al aire: el resultado puede ser cara o sello, pero no sabemos de antemano cuál de ellos va a salir o al lanzar un dado en las mismas condiciones y formas veremos que los resultados serán siempre diferentes. La probabilidad está basada en el estudio del análisis combinatorio y se considera fundamento necesario de la estadística, además de otras disciplinas como matemática, física u otra ciencia. En ellas se aplica una teoría de probabilidades, la cual tiene como fin examinar las formas y medios para obtener esas medidas de certeza, así como encontrar los métodos de combinarlos cuando intervienen varios sucesos en un experimento aleatorio o prueba. Cada uno de los resultados obtenidos al realizar un experimento recibe el nombre de suceso elemental. Se llama espacio muestral al conjunto de todos los sucesos elementales obtenidos, de forma que todo subconjunto del espacio muestral es un suceso. Cuando hablamos de probabilidad tenemos que diferenciar los tipos de sucesos que pueden ocurrir, pueden ser: sucesos naturales, son aquellos cuyo resultado podemos predecir; y sucesos por azar, cuyo resultado no podemos predecir, pero que si se conoce los resultados posibles que se pueden dar. Los sucesos por azar se pueden clasificar en: suceso seguro, es aquel que es cierto, que ocurrirá sin lugar a dudas. Por ejemplo, si lanzamos un dado, es seguro que saldrá un número del 1 al 6. En suceso posible, es todo lo que compone un fenómeno determinado. Por ejemplo, al lanzar una moneda, los sucesos posibles son cara o sello. Y de último, tenemos al suceso imposible, el que no pueden ocurrir y se contraponen a un suceso seguro. Por ejemplo, que en una partida de domino dos jugadores tengan la misma ficha, sería imposible 146 Ing. Rolando W. Rivera Olivera porque son 28 fichas diferentes. La probabilidad es 0 cuando el suceso es imposible y 1 cuando el suceso es seguro. En la actualidad existen compañías de seguros que evalúan las probabilidades de los sucesos que les interesan (accidentes de coches, inundaciones, epidemias, etc.) y así poder asignar las cuotas de manera justa. También, las probabilidades son importantes para la ingeniería, específicamente la Civil: características de los materiales, dimensiones de elementos estructurales, carga viva en edificios, carga sísmica y de viento, tránsito de vehículos, entre otras. Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas de la probabilidad. Ejemplo: En lugar de tirar la moneda al aire, directamente seleccionamos la cara. Aquí no podemos hablar de probabilidades, sino que ha sido un resultado determinado por uno mismo. Antes de calcular las probabilidades de un experimento aleatorio hay que definir una serie de conceptos: 6.2. SUCESO ELEMENTAL: hace referencia a cada una de las posibles soluciones que se pueden presentar. Ejemplo: Al lanzar una moneda al aire, los sucesos elementales son la cara y el sello. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6. 6.3. SUCESO COMPUESTO: Es un subconjunto de sucesos elementales. Ejemplo: lanzamos un dado y queremos que salga un número par. El suceso "numero par" es un suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6 O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es un suceso compuesto formado por 18 sucesos elementales (todos los números que van del 1 al 18). 147 Ing. Rolando W. Rivera Olivera Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral. Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las soluciones posibles). Ejemplo: si tiramos una moneda al aíre una sola vez, el espacio muestral será cara o sello. Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio muestral estaría formado por (caracara), (cara-sello), (sello -cara) y (sello -sello). 6.4. RELACIÓN ENTRE SUCESOS Entre los sucesos compuestos se pueden establecer distintas relaciones: 6.4.1. Un suceso puede estar contenido en otro: las posibles soluciones del primer suceso también lo son del segundo, pero este segundo suceso tiene además otras soluciones suyas propias. Ejemplo: lanzamos un dado y analizamos dos sucesos: a: que salga el número 6, y b: que salga un número par. Vemos que el suceso a está contenido en el suceso b. Siempre que se da el suceso a se da el suceso b, pero no al contrario. Por ejemplo, si el resultado fuera el 2, se cumpliría el suceso b, pero no el a. 6.4.2. Dos sucesos pueden ser iguales: esto ocurre cuando siempre que se cumple uno de ellos se cumple obligatoriamente el otro y viceversa. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que salga múltiplo de 2. Vemos que las soluciones coinciden en ambos casos. 6.4.3. Unión de dos o más sucesos: la unión será otro suceso formado por todos los elementos de los sucesos que se unen. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par y b) que el resultado sea mayor que 3. El suceso 148 Ing. Rolando W. Rivera Olivera unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el 6 6.4.4. Intersección de sucesos: es aquel suceso compuesto por los elementos comunes de dos o más sucesos que se intersectan. Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos: a) que salga número par, y b) que sea mayor que 4. La intersección de estos dos sucesos tiene un sólo elemento, el número 6 (es el único resultado común a ambos sucesos: es mayor que 4 y es número par). 6.4.5. Sucesos incompatibles: son aquellos que no se pueden dar al mismo tiempo ya que no tienen elementos comunes (su intersección es el conjunto vacío). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3, y b) que salga el número 6. Es evidente que ambos no se pueden dar al mismo tiempo. 6.3.6. Sucesos complementarios: son aquellos que si no se da uno, obligatoriamente se tiene que dar el otro. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número par, y b) que salga un número impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa). 6.5. CÁLCULO DE PROBABILIDADES Como hemos comentado anteriormente, la probabilidad mide la mayor o menor posibilidad de que se dé un determinado resultado (suceso) cuando se realiza un experimento aleatorio. La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%): El valor cero corresponde al suceso imposible: lanzamos un dado al aire y la probabilidad de que salga el número 7 es cero (al menos, si es un dado certificado por la OMD, "Organización Mundial de Dados"). 149 Ing. Rolando W. Rivera Olivera El valor uno corresponde al suceso seguro: lanzamos un dado al aire y la probabilidad de que salga cualquier número del 1 al 6 es igual a uno (100%). El resto de sucesos tendrá probabilidades entre cero y uno: que será tanto mayor cuanto más probable sea que dicho suceso tenga lugar. ¿Cómo se mide la probabilidad? Uno de los métodos más utilizados es aplicando la Regla de Laplace: define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles. P(A) = Casos favorables / casos posibles 𝑷(𝑨) 𝒉 = 𝒏 h : Casos favorables n : Casos posibles ( espacio muestral) EJEMPLOS: a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable es tan sólo uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier número del uno al seis). Por lo tanto: P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%) b) Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%) c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos posibles. Por lo tanto: P(A) = 4 / 6 = 0,666 (o lo que es lo mismo, 66,6%) 150 Ing. Rolando W. Rivera Olivera d) Probabilidad de que nos toque la "TINKA" : tan sólo un caso favorable, el número que jugamos (¡qué triste...¡), frente a 100.000 casos posibles. Por lo tanto: P(A) = 1 / 100.000 = 0,00001 (o lo que es lo mismo, 0,001%) Merece la pena ...... Por cierto, tiene la misma probabilidad el número 45.264, que el número 00001, pero ¿cuál de los dos comprarías? Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos: a) El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sería cero. b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta regla. A la regla de Laplace también se le denomina "probabilidad apriori", ya que para aplicarla hay que conocer antes de realizar el experimento cuales son los posibles resultados y saber que todos tienen las mismas probabilidades. ¿Y si el experimento aleatorio no cumple los dos requisitos indicados, qué hacemos?, ¿ponemos una denuncia? No, no va a ser necesario denunciar a nadie, ya que en este caso podemos acudir a otro modelo de cálculo de probabilidades que se basa en la experiencia (modelo frecuentista): Cuando se realiza un experimento aleatorio un número muy elevado de veces, las probabilidades de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas probabilidades. Ejemplo: si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara" ha aparecido el 100% de las veces y el suceso "sello" el 0%. Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el suceso "sello" las 3 restantes. En este 151 Ing. Rolando W. Rivera Olivera caso, la probabilidad del suceso "cara" ya no sería del 100%, sino que se habría reducido al 70%. Si repito este experimento un número elevado de veces, lo normal es que las probabilidades de los sucesos "cara" y "sello" se vayan aproximando al 50% cada una. Este 50% será la probabilidad de estos sucesos según el modelo frecuentista. En este modelo ya no será necesario que el número de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad. Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera trucada), es posible que al repetir dicho experimento un número elevado de veces, la "cara" saliera con una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos valores serían las probabilidades de estos dos sucesos según el modelo frecuentista. A esta definición de la probabilidad se le denomina probabilidad a posteriori, ya que tan sólo repitiendo un experimento un número elevado de veces podremos saber cuál es la probabilidad de cada suceso. 6.6. PROBABILIDAD DE SUCESOS Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre sí, así como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cómo se refleja esto en el cálculo de probabilidades. 6.6.1. Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso será menor que la del suceso que lo contiene. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el número 6, y b) que salga un número par. Dijimos que el suceso a) está contenido en el suceso b). P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50 152 Ing. Rolando W. Rivera Olivera Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b). 6.6.2. Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos sucesos son las mismas. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que salga múltiplo de 2. Las soluciones coinciden en ambos casos. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 6.6.3. Intersección de sucesos: es aquel suceso compuesto por los elementos comunes de los dos o más sucesos que se intersectan. La probabilidad será igual a la probabilidad de los elemntos comunes. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que sea mayor que 3. La intersección de estos dos sucesos tiene dos elementos: el 4 y el 6. Su probabilidad será por tanto: P(A ∩ B) = 2 / 6 = 0,33 6.6.4. Unión de dos o más sucesos: la probabilidad de la unión de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso intersección Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que el resultado sea mayor que 3. El suceso unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el 6. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 P (A ∩ B) = 2 / 6 = 0,33∪ Por lo tanto, P (A ∪ B) = (0,50 + 0,50) - 0,33 = 0,666 153 Ing. Rolando W. Rivera Olivera 6.6.5. Sucesos incompatibles: la probabilidad de la unión de dos sucesos incompatibles será igual a la suma de las probabilidades de cada uno de los sucesos (ya que su intersección es el conjunto vacío y por lo tanto no hay que restarle nada). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3, y b) que salga el número 6. La probabilidad del suceso unión de estos dos sucesos será igual a: P(A) = 2 / 6 = 0,333 P(B) = 1 / 6 = 0,166 Por lo tanto, P(A ∪ B) = 0,33 + 0,166 = 0,50 6.6.6. Sucesos complementarios: la probabilidad de un suceso complementario a un suceso (A) es igual a 1 - P(A) Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un número par, luego su complementario, suceso (B), es que salga un número impar. La probabilidad del suceso (A) es igual a : P(A) = 3 / 6 = 0,50 Luego, la probabilidad del suceso (B) es igual a: P(B) = 1 - P(A) = 1 - 0,50 = 0,50 Se puede comprobar aplicando la regla de "casos favorables / casos posibles": P(B) = 3 / 6 = 0,50 6.6.7. Unión de sucesos complementarios: la probabilidad de la unión de dos sucesos complementarios es igual a 1. Ejemplo: seguimos con el ejemplo anterior: a) que salga un número par, y b) que salga un número impar. La probabilidad del suceso unión de estos dos sucesos será igual a: P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 Por lo tanto, P(A ∪ B) = 0,50 + 0,50 = 1 154 Ing. Rolando W. Rivera Olivera 6.7. ANALISIS COMBONATORIO Y PROBABILIDAD. Para aplicar la Regla de Laplace, el cálculo de los sucesos favorables a partir de los sucesos posibles a veces no plantea ningún problema, ya que son un número reducido y se pueden calcular con facilidad. Por ejemplo: Probabilidad de que al lanzar un dado salga el número 2. Tan sólo hay un caso favorable, mientras que los casos posibles son seis. Probabilidad de acertar al primer intento el horóscopo de una persona. Hay un caso favorable y 12 casos posibles. Sin embargo, a veces calcular el número de casos favorables y casos posibles es complejo y hay que aplicar reglas matemáticas. Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de que al menos los miembros de un matrimonio se sienten junto. En este caso, determinar el número de casos favorables y de casos posibles es complejo. Las reglas matemáticas que nos pueden ayudar son el principio fundamental del análisis combinatorio y que incluye el cálculo de factoriales, cálculo de combinaciones, el cálculo de variaciones y el cálculo de permutaciones. 6.7.1. TEORÍA ELEMENTAL DEL ANALISIS COMBINATORIO En la mayoría de los problemas de análisis combinatorio se observa que una operación o actividad aparece en forma repetitiva y es necesario conocer las formas o maneras que se puede realizar dicha operación. Para dichos casos es útil conocer determinadas técnicas o estrategias de conteo que facilitarán el cálculo señalado. El análisis combinatorio también se define como una manera práctica y abreviada de contar las operaciones o actividades que se 155 Ing. Rolando W. Rivera Olivera presentan (conteo de puntos muestrales) y son designadas como eventos o sucesos. Ejemplo : Señalar las maneras diferentes de vestir de una persona, utilizando un número determinado de prendas de vestir * Ordenar 5 artículos en 7 casilleros * Contestar 7 preguntas de un examen de 10 * Designar 5 personas de un total 50 para integrar una comisión * Sentarse en una fila de 5 asientos 4 personas * Escribir una palabra de 7 letras utilizando 4 consonantes y 3 vocales a. PRINCIPIO DE MULTIPLICACIÓN: Si un evento o suceso "A" puede ocurrir , en forma independiente, de "m" maneras diferentes y otro suceso de "n" maneras diferentes, entonces el número de maneras distintas en que pueden suceder ambos sucesos es "m . n" Ejemplo 1: En la etapa final de fútbol profesional de primera, cuatro equipos : CRISTAL ( C ), MELGAR ( M ) ,ALIANZA ( A ), UNIVERSITARIO (U), disputan el primer y segundo lugar (campeón y subcampeón). ¿De cuántas maneras diferentes estos equipos pueden ubicarse en dichos lugares? Solución : METODO 1: utilizando el diagrama del árbol 1er lugar; 2do lugar y 1° ó 2° 156 Ing. Rolando W. Rivera Olivera 1° C 2° 1° ó 2° 1° M 2° 1° ó 2° 1° A 2° 1° ó 2° 1° U 2° 1° ó 2°. Existen 12 maneras diferentes en que estos equipos se pueden ubicar en el primer y segundo lugar. METODO 2: Utilizando el principio de multiplicación. 1°; 2° y 1° ó 2° son 3 circunstancia y 4 Equipos ; entonces: 3 x 4 # maneras = 12 Ejemplo 2: ¿Cuántas placas para automóviles pueden hacerse si cada placa consta de dos letras diferentes seguidas de tres dígitos diferentes? (considerar 26 letras del alfabeto). Solución: 157 Ing. Rolando W. Rivera Olivera Letras Dígitos 26 x 25 x 10 x 9 x 8 # placas = 468 000 b) PRINCIPIO DE ADICIÓN: Supongamos que un evento A se puede realizar de "m" maneras y otro evento B se puede realizar de "n" maneras diferentes, además, no es posible que ambos eventos se realicen juntos, entonces el evento A o el evento B se realizarán de ( m + n) maneras. Ejemplo 1: Un repuesto de automóvil se venden en 6 tiendas en la Calle Puno o en 8 tiendas del Parque Industrial de Apima .¿De cuántas formas se puede adquirir el repuesto? Solución: Por el principio de adición: Puno ó Apima 6 formas + 8 formas = 14 formas Ejemplo 2: Se desea cruzar un río, para ello se dispone de 3 botes, 2 lanchas y 1 deslizador. ¿De cuantas formas se puede cruzar el río utilizando los medios de transporte señalados? Solución : 158 Ing. Rolando W. Rivera Olivera Aplicando el principio de adición se tiene: Bote , lancha , deslizador 3ó2ó1 # maneras = 3 + 2 + 1 = 6 6.7.2. FACTORIAL DE UN NÚMERO: Dado un número natural n se define: El factorial de n se denota por n! y se define por las multiplicaciones sucesivas de n desde el mismo número hasta 1 es decir: n! = n (n -1)(n -2) … 1 ❖ Algunas propiedades de factorial. i. Existe factorial sólo para números positivos es decir: n > 0 y n debe ser N 𝑎 ii. Existe 𝑏 ! sí y sólo si a ≠ b , además b es ≠ 0 iii. El factorial de un número n es igual al producto entre el factorial anterior y el mismo número . iv. n! = n (n -1)! 8! = 8 . 7! v. 1! = 1 ó 20! = 20 . 19! y por convencionalismo 0! = 1 Ejemplos: 1. Simplificar: 7! . 19! 21! 159 = 7 .6! . 19! 21 .20 .19! = 6! 3 . 20 = 6 .5 .4 .3 .2 .1 3 .20 = 12 Ing. Rolando W. Rivera Olivera ( 𝑛+2 ) ! (𝑛+2 ) . 𝑛! 2. Simplificar: Aplicamos la propiedad iii al numerador y simplificando en ambos términos, nos queda: ( 𝑛+2 ).(𝑛+1 ) .𝑛 ! = 𝑛+1 (𝑛+2 ) . 𝑛! 3. Hallar x en la siguiente expresión: ( 𝑥+2 ) ! = 10 (𝑥+1 ) ! ( 𝑥+2 ) ( 𝑥 + 1 )! = 10 ; Simplificando nos queda: (𝑥 +1 ) ! 𝑥 + 2 = 10 𝑙𝑢𝑒𝑔𝑜 𝑥 = 8 4. Hallar el valor de “x” en la expresión. ( 𝑥+2 ) ! = 𝑥! ( 𝑥+2 ) ( 𝑥+1 ) ! (𝑥+1 ) ! 4! 2 = Descomponiendo y aplicando las propiedades tenemos: 4 . 3! Simplificando queda: 2 𝑥 + 2) (𝑥 + 1) = 12 𝑥 2 + 3𝑥 + 2 = 12 𝑥 2 + 3𝑥 − 10 = 0 luego resolvemos la Ec. Cuadrática: ( 𝑥 + 5) (𝑥 − 2 ) = 0 Luego igualando los factores a 0 tenemos las respuestas: ( 𝑥 = − 5) 𝑦 (𝑥 = 2 ) Como no hay factorial para números negativos, la respuesta es sólo 2 5. Hallar el valor de “x” en la siguiente expresión. ( 𝑥−2 )¡ (𝑥−3 ) ¡ . ( 𝑥+ 5)! (𝑥+ 4 )! ( 𝑥−2 ) ( 𝑥−3 )¡ (𝑥−3 ) ¡ . = 30 ( 𝑥+ 5) ( 𝑥−4 )! (𝑥+ 4 )! (x – 2 ) (x + 5) = 30 Descomponiendo en sus factores: = 30 Simplificando Resolviendo el sistema: 𝑥 2 + 3𝑥 − 40 = 0 De la ecuación cuadrática queda: (x +8 ) ( x – 5 ) = 0 por la propiedad i la respuesta es sólo positiva. 160 Ing. Rolando W. Rivera Olivera x=-8 y x=5 6.7.3. COMBINACIONES: Se dice que existe una combinación de n objetos diferentes tomados de k en k corresponde a una selección de k casos de los n objetos sin tener en cuenta a la ordenación de los mismos y esta técnica se representa del modo siguiente: 𝑛𝐶𝑘 ; 𝐶(𝑛, 𝑘); 𝐶𝑛,𝑘 ; ( 𝑛𝑘 ) ó 𝐶𝑘𝑛 = 𝑛! (𝑛−𝑘)! . 𝑘 ! = 𝑛𝑃𝑘 𝑘¡ Se llama combinaciones de n elementos tomados de k en k (n ≥ k) a todas las agrupaciones posibles que pueden hacerse con los n elementos de forma que: No entran todos los elementos. No importa el orden. No se repiten los elementos Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. Ejemplo Calcular las posibles combinaciones de 2 elementos que se pueden formar con los números 1, 2 y 3 3𝑪𝟐 = 𝟑! (𝟑−𝟐)! . 𝟐! = 𝟑! 𝟏! .𝟐! = 𝟑 .𝟐.𝟏 𝟏.𝟐.𝟏 = 𝟑 Esto significa que se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se cuentan una vez. Ejemplos: 20 a. Hallar: 𝐶17 : Solución: 20 𝐶17 = 20! 20 . 19 . 18. 17! 20. 19. 18 = = = 1 140 (20 − 17)! 17! 3! . 17 ! 3. 2. 1 161 Ing. Rolando W. Rivera Olivera b. Si disponemos de 5 puntos no colineales, ¿cuál es el máximo número de triángulos que se podrán formar? Solución: Para dibujar un triángulo solo es necesario 3 puntos en el plano, luego se escogerán 3 puntos (k = 3) de un total de 8 puntos (n = 5). Además no importa el orden, ya que el triángulo ABC es igual al CBA; por lo tanto se trata de una combinación. c. Una señora tiene 3 frutas: manzana, fresa y piña. ¿Cuántos sabores diferentes de jugo podrá preparar con estas frutas? Fresa (F), Piña (P), Manzana (M) Solución: Método 1 : (en forma gráfica) Cuando se escoge una fruta de las tres, los sabores son 3: F, P, M Cuando se escoge 2 de las tres frutas, los sabores son 3: FP, FM, PM Cuando se escoge las 3 frutas los sabores son 1: FPM Total de sabores diferentes: 3 + 3 + 1 = 7 Método 2 : (Empleando combinaciones) Se puede escoger una fruta de las tres ó 2 frutas de las tres ó las tres frutas de las tres, además en este caso no importan el orden; por lo tanto usamos el principio de adición aplicado a la combinación: Sabores diferentes = 3 Sabores diferentes = 1 + 3 .2 2 .1 + 3. 2. 1 3 . 2. 1 = Total de sabores diferentes: 3 + 3 + 1 = 7 162 Ing. Rolando W. Rivera Olivera d. Se desea formar un comité de 7 profesionales seleccionando 4 físicos y 3 matemáticos de un grupo de 8 físicos y 6 matemáticos: a) ¿De cuantas maneras podrá seleccionarse, si no se impone ninguna restricción? b) De cuántas formas se seleccionará si un físico debe pertenecer de hecho al comité? c) De cuántas maneras si 2 físicos y un matemático no deben pertenecer al comité? Solución 1: 1ro. Seleccionamos 4 físicos entre 8 en formas 2º. Seleccionamos 3 matemáticos entre 6 en Luego aplicamos el principio de multiplicación = 70 . 20 = 1400 maneras Solución 2: ➢ Seleccionamos sólo 3 e incluimos a un físico al comité 𝐶37 formas 7𝑥 6𝑥 5 𝐶37 = 3𝑥 2𝑥 1 = 35 ➢ Con los matemáticos no pasa nada, permanecen las mismas condiciones, es decir: 6𝑥 5𝑥 4 𝐶36 = 3𝑥 2𝑥 1 = 20 Luego aplicamos el principio de multiplicación 𝐶37 . 𝐶36 = 35 . 20 = 700 maneras 163 Ing. Rolando W. Rivera Olivera Solución 3: 1° Sustraemos 2 físicos y seleccionamos 4 de lAs 6 restantes 𝐶46 formas: 6𝑥5 𝐶46 = 2 𝑥 1 = 15 2° Sustraemos un matemático y seleccionamos 3 de los 5 restantes 𝐶35 formas : 𝐶35 = 5𝑥4 2𝑥1 = 10 Luego aplicamos el principio de multiplicación 𝐶46 . 𝐶35 = 15 . 10 = 150 maneras NOTA. Existen también casos en que se presentan Combinaciones con repetición: Para calcular el número de combinaciones con repetición se aplica la siguiente fórmula: 𝐶´𝑛, 𝑘 ; 𝐶𝑅𝑘𝑛 = (𝑛 + 𝑘 − 1 ) ! 𝑘! . (𝑛 − 1)! Ejemplo: Calcular 𝐶𝑅410 ó C'10,4 son las combinaciones de 10 elementos con repetición, agrupándolos en subgrupos de 4, en los que 2, 3 o los 4 elementos podrían estar repetidos: Es decir, podríamos formar 715 subgrupos diferentes de 4 elementos. 164 Ing. Rolando W. Rivera Olivera 6.7.4. VARIACIONES : Se denomina Variaciones simples de k objetos tomados de n objetos distantes, a cada uno de los arreglos que se hagan con los n objetos, de manera que estos arreglos difieran en algún elemento o en el orden de colocación. El número de variaciones diferentes de k objetos tomados de n objetos distintos está denotado por: 𝑉𝑘𝑛 = 𝑛! (𝑛 − 𝑘)! Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Ejemplo: 1. Calcular las posibles variaciones de 2 elementos que se pueden establecer con los número 1, 2 y 3. Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos. Con la fórmula se tendría lo siguiente: 3! 𝑉23 = (3−2)! = 3 . 2. 1 1 = 6 2. Calcular 𝑉410 son las variaciones de 10 elementos agrupándolos en subgrupos de 4 elementos: 10 ! 𝑉410 =(10−4)! = 10 .9.8 .7 .6 ! 6! = 5 040 Es decir, podríamos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. ❖ Variaciones con repetición (VR): Se denominan variaciones con repetición de k objetos tomados de n objetos distintos a cada uno de los arreglos que se hagan con los k 165 Ing. Rolando W. Rivera Olivera objetos, de manera que estos arreglos puedan efectuarse de uno mismo de los n objetos. Una variación con repetición se denota por 𝑉𝑅𝑘𝑛 y se expresa por la siguiente relación: 𝑉´𝑛, 𝑘 = 𝑉𝑅𝑘𝑛 = 𝑛𝑘 Ejemplo: Calcular 𝑽𝑹𝟏𝟎 𝟒 que son las variaciones de 10 elementos con repetición, agrupándolos en subgrupos de 4 elementos: 4 𝑽𝑹𝟏𝟎 𝟒 = 10 = 10 000 Es decir, podríamos formar 10 000 subgrupos diferentes de 4 elementos. 6.7.5. PERMUTACIONES: Se denomina permutación de n objetos a cada una de las variaciones de los n objetos distintos, que se denotan por la siguiente expresión: 𝑷𝒏 𝑃𝑛 = 𝑉𝑛𝑛 = 𝑛! Calcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Ejemplos. a. Calcular las posibles formas en que se pueden ordenar los números 1, 2 y 3. Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1) 𝑷𝟑 = 𝑽𝟑𝟑 = 𝟑 ! = 3 . 2. 1 = 6 | b. Calcular 𝑷𝟏𝟎 que son las permutaciones de 10 elementos: 166 Ing. Rolando W. Rivera Olivera 𝑷𝟏𝟎 = 𝑽𝟏𝟎 𝟏𝟎 = 𝒏 ! = 10 ! = 10 . 9. 8. 7. 6. 5. 4. 3. 2. 1 = 3 628 800 Es decir, tendríamos 3.628.800 formas diferentes de agrupar 10 elementos. PERMUTACIONES CON REPETICIÓN: Para calcular el número de permutaciones con repetición se aplica la siguiente fórmula 𝑥 ,𝑥2 …𝑥𝑘 𝑃´ 𝑛1 𝑥 ,𝑥2 ….𝑥𝑘 = 𝑃𝑅𝑛1 = 𝑛! 𝑥1 ! 𝑥2 ! … . 𝑥𝑘 ! Son permutaciones de "n" elementos, en los que uno de ellos se repite " 𝑥1 " veces, otro " 𝑥2 " veces y así... hasta uno que se repite " 𝑥𝑘 " veces. Ejemplo: Calcular las permutaciones de 10 elementos, en los que uno de ellos se repite en 2 ocasiones y otro se repite en 3 ocasiones: Es decir, tendríamos 302,400 formas diferentes de agrupar estos 10 elementos. EJERCICIOS DE APLICACIÓN: 1. Calcular la probabilidad de acertar los 6 signos de la TINKA: Solución: Se aplica la Regla de Laplace (casos favorables / casos posibles). El caso favorable es tan sólo uno (acertar los 6 signos). Los casos posibles se calculan como variaciones con repetición de 6 elementos (1, 2, 3, 4, 5 y X ), tomados de los 45 signos que se nos da. 167 Ing. Rolando W. Rivera Olivera Son variaciones y no combinaciones ya que el orden influye: no es lo mismo (1, 1, X….) que (1, X, 1…..). Y son con repetición, ya que cualquiera de los signos (1, X , ….., 2) se puede repetir hasta 6 veces. Por lo tanto, los casos posibles son: 45 𝑽𝑹𝟒𝟓 = 1,039456375 𝑥 1035 𝟔 = 6 Y la probabilidad de acertar los 6 resultados es: P(A) = 1 1,039456375 𝑥 1035 = 9,620413364 x 10− 36 No, demasiado elevada....pero el que la sigue la consigue. 2. Y la probabilidad de acertar 12 signos de la quiniela: Solución: Aplicamos nuevamente la Regla de Laplace. En este caso los casos favorables se calculan como combinaciones de 14 elementos tomados de 2 en 2, de esta manera obtenemos todas las posibles alternativas de fallar 2 resultados de 14 (lo que equivale a acertar 12 resultados). Utilizamos combinaciones y no variaciones ya que el orden no importa (da lo mismo fallar el 3º y el 6º, que el 6º y el 3º) Los casos posibles siguen siendo los mismos: Por lo que la probabilidad de acertar 12 resultados es: Por lo tanto, tenemos más probabilidades de acertar 12 resultados que 14 (¿será por eso por lo que pagan menos?). 3. Calcular la probabilidad de, en una carrera de 12 caballos, acertar los 3 que quedan primeros (sin importar cuál de ellos queda primero, cual segundo y cual tercero). 168 Ing. Rolando W. Rivera Olivera Solución: Se aplica la Regla de Laplace. El caso favorable es tan sólo uno: los 3 caballos que entran en primer lugar. Los casos posibles se calculan como combinaciones de 12 elementos tomados de 3 en 3 (es decir, determinamos todas las posibles alternativas de 3 caballos que pueden entrar en las 3 primeras posiciones). Como el orden de estos 3 primeros caballos no importa, utilizamos combinaciones en lugar de variaciones. Por lo tanto, los casos posibles son: Por lo que la probabilidad de acertar los 3 caballos ganadores es: Algo mayor que en las quinielas.... Eso sí, se paga menos. 4. Y si hubiera que acertar, no sólo los 3 caballos que ganan, sino el orden de su entrada en meta. Solución: El caso favorable sigue siendo uno: los 3 caballos que entran en primer lugar, colocados en su orden correspondiente. Los casos posibles se calculan ahora como variaciones (ya que el orden influye) de 12 elementos tomados de 3 en 3 (calculamos todas las posibles maneras en que los 12 caballos podrían ocupar las 3 primeras posiciones. Por lo que la probabilidad de acertar los 3 caballos ganadores es: Menor que en el ejemplo 3º. Ya no vale acertar que 3 caballos entran en primer lugar, sino que tenemos que acertar el orden de su entrada. 6.8. PROBABILIDAD CONDICIONADA 169 Ing. Rolando W. Rivera Olivera Las probabilidades condicionadas se calculan una vez que se ha incorporado información adicional a la situación de partida: Ejemplo 1: Se tira un dado y sabemos que la probabilidad de que salga un 2 es 1/6 (probabilidad a priori). Si incorporamos nueva información (por ejemplo, alguien nos dice que el resultado ha sido un número par) entonces la probabilidad de que el resultado sea el 2 ya no es 1/6. Las probabilidades condicionadas se calculan aplicando la siguiente fórmula: P(B/A) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴) Donde: P (B/A) es la probabilidad de que se dé el suceso B condicionada a que se haya dado el suceso A. P (B ∩ A) es la probabilidad del suceso simultáneo de A y de B P (A) es la probabilidad a priori del suceso A En el ejemplo que hemos visto: P (B/A) es la probabilidad de que salga el número 2 (suceso B) condicionada a que haya salido un número par (suceso A). P (B ∩ A) es la probabilidad de que salga el dos y número par. P (A) es la probabilidad a priori de que salga un número par. Por lo tanto: P (B ∩ A) = 1/6 P (A) = 1/2 P (B/A) = (1/6) / (1/2) = 1/3 Luego, la probabilidad de que salga el número 2, si ya sabemos que ha salido un número par, es de 1/3 (mayor que su probabilidad a priori de 1/6). Ejemplo 2: En un estudio sanitario se ha llegado a la conclusión de que la probabilidad de que una persona sufra problemas coronarios (suceso B) es el 0,10 (probabilidad a priori). Además, la probabilidad de que una persona sufra problemas de obesidad (suceso A) es el 0,25 y la probabilidad de que una 170 Ing. Rolando W. Rivera Olivera persona sufra a la vez problemas de obesidad y coronarios (suceso intersección de A y B) es del 0,05. Calcular la probabilidad de que una persona sufra problemas coronarios si está obesa (probabilidad condicionada P(B/A)). P (B ∩ A) = 0,05 P (A) = 0,25 P (B/A) = 0,05 / 0,25 = 0,20 Por lo tanto, la probabilidad condicionada es superior a la probabilidad a priori. No siempre esto es así, a veces la probabilidad condicionada es igual a la probabilidad a priori o menor. Por ejemplo: probabilidad de que al tirar un dado salga el número 2, condicionada a que haya salido un número impar. La probabilidad condicionada es en este caso es cero, frente a una probabilidad a priori de 1/6. PROBABILIDAD COMPUESTA 6.9. La probabilidad compuesta (o regla de multiplicación de probabilidades) se deriva de la probabilidad condicionada: La probabilidad de que se den simultáneamente dos sucesos (suceso intersección de A y B) es igual a la probabilidad a priori del suceso A multiplicada por la probabilidad del suceso B condicionada al cumplimiento del suceso A. La fórmula para calcular esta probabilidad compuesta es: P(A∩B) = P(B/A) . P(A) Ejemplo 1 : Estudiamos el suceso A (porcentaje de varones mayores de 40 años casados) y el suceso B (varones mayores de 40 años con más de 2 hijos) y obtenemos la siguiente información: Un 35% de los varones mayores de 40 años están casados. De los varones mayores de 40 años y casados, un 30% tienen más de 2 hijos (suceso B condicionado al suceso A). 171 Ing. Rolando W. Rivera Olivera Calcular la probabilidad de que un varón mayor de 40 años esté casado y tenga más de 2 hijos (suceso intersección de A y B). Por lo tanto: P (A) = 0,35 P (B/A) = 0,30 P (A∩ B) = 0,35 * 0,30 = 0,105 Es decir, un 10,5% de los varones mayores de 40 años están casados y tienen más de 2 hijos. Ejemplo 2: Estudiamos el suceso A (alumnos que hablan inglés) y el suceso B (alumnos que hablan alemán) y obtenemos la siguiente información: Un 50% de los alumnos hablan inglés. De los alumnos que hablan inglés, un 20% hablan también alemán (suceso B condicionado al suceso A). Calcular la probabilidad de que un alumno hable inglés y alemán (suceso intersección de A y B). Por lo tanto: P (A) = 0,50 P (B/A) = 0,20 P (A ∩ B) = 0,50 * 0,20 = 0,10 Es decir, un 10% de los alumnos hablan inglés y alemán. 6.10. TEOREMA DE LA PROBABILIDAD TOTAL El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso a partir de probabilidades condicionadas: Ejemplo: supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cuál es la probabilidad de que ocurra un accidente si conocemos la probabilidad de que llueva y la probabilidad de que haga buen tiempo. La fórmula para calcular esta probabilidad es: 172 Ing. Rolando W. Rivera Olivera Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que ocurra un accidente) es igual a la suma de multiplicar cada una de las probabilidades condicionadas de este suceso con los diferentes sucesos A (probabilidad de un accidente cuando llueve y cuando hace buen tiempo) por la probabilidad de cada suceso A. Para que este teorema se pueda aplicar hace falta cumplir un requisito: Los sucesos A tienen que formar un sistema completo, es decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe ser el 100%). Ejemplo 1: al tirar una moneda, el suceso "salir cara" y el suceso "salir sello" forman un sistema completo, no hay más alternativas: la suma de sus probabilidades es el 100% Ejemplo 2: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema completo, ya que no contempla todas las opciones (podría salir el 5 o el 6). En este caso no se podría aplicar el teorema de la probabilidad total. Ejercicio 1: En una urna existen 3 papeletas de tres colores, con las siguientes probabilidades de ser elegidas: a) Amarilla: probabilidad del 50%. b) Verde: probabilidad del 30% c) Roja: probabilidad del 20%. Según el color de la papeleta elegida, podrás participar en diferentes sorteos. Así, si la papeleta elegida es: a) Amarilla: participas en un sorteo con una probabilidad de ganar del 40%. 173 Ing. Rolando W. Rivera Olivera b) Verde: participas en otro sorteo con una probabilidad de ganar del 60% c) Roja: participas en un tercer sorteo con una probabilidad de ganar del 80%. Con esta información, ¿qué probabilidad tienes de ganar el sorteo en el que participes?: 1.- Las tres papeletas forman un sistema completo: sus probabilidades suman 100% 2.- Aplicamos la fórmula: Luego, P (B) = (0,50 * 0,40) + (0,30 * 0,60) + (0,20 * 0,80) = 0,54 Por tanto, la probabilidad de que ganes el sorteo es del 54%. Ejercicio 2: De acuerdo a políticas de desarrollo se piensa en cambiar a tu jefe y se barajan diversos nombres y tu esperas que te aumenten el sueldo, cuál es esa probabilidad?: a) Rolando, con una probabilidad del 60% b) Jesús, con una probabilidad del 30% c) Miguel, con una probabilidad del 10% En función de quien sea tu próximo jefe, la probabilidad de que te suban el sueldo es la siguiente: a) Si sale Rolando: la probabilidad de que te suban el sueldo es del 5%. b) Si sale Jesús: la probabilidad de que te suban el sueldo es del 20%. c) Si sale Miguel: la probabilidad de que te suban el sueldo es del 60%. En definitiva, ¿cuál es la probabilidad de que te suban el sueldo?: 1.- Los tres candidatos forman un sistema completo 2.- Aplicamos la fórmula: P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15 Por tanto, la probabilidad de que te suban el sueldo es del 15%. 6.11. TEOREMA DE BAYES 174 Ing. Rolando W. Rivera Olivera El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total: Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente). Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía buen tiempo?). La fórmula del Teorema de Bayes es: Tratar de explicar estar fórmula con palabras es un galimatías, así que vamos a intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema también exige que el suceso A forme un sistema completo. Ejercicio 1: Estamos en la ciudad de Puno y el parte meteorológico ha anunciado tres posibilidades para el fin de semana: a) Que llueva: probabilidad del 50%. b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%. Según estos posibles estados meteorológicos, la posibilidad de que ocurra un accidente en la ciudad es la siguiente: a) Si llueve: probabilidad de accidente del 10%. b) Si nieva: probabilidad de accidente del 20% c) Si hay niebla: probabilidad de accidente del 5%. Resulta que efectivamente ocurre un accidente y como no estábamos en la ciudad no sabemos qué tiempo hizo (nevó, llovió o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades: 175 Ing. Rolando W. Rivera Olivera Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con el 10%). Una vez que incorporamos la información de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori". Vamos a aplicar la fórmula: a) Probabilidad de que estuviera lloviendo: La probabilidad de que efectivamente estuviera lloviendo el día del accidente (probabilidad a posteriori) es del 71,4%. b) Probabilidad de que estuviera nevando: La probabilidad de que estuviera nevando es del 21,4%. c) Probabilidad de que hubiera niebla: La probabilidad de que hubiera niebla es del 7,1%. 6.12. SUCESOS INDEPENDIENTES Dos sucesos son independientes entre sí, si la ocurrencia de uno de ellos no afecta para nada a la ocurrencia del otro: Ejemplo: el suceso estatura de los alumnos de una clase y el color del pelo son independientes: el que un alumno sea más o menos alto no va a influir en el color de su cabello, ni viceversa. 176 Ing. Rolando W. Rivera Olivera Para que dos sucesos sean independientes tienen que verificar al menos una de las siguientes condiciones: ❖ P (B/A) = P (B) es decir, que la probabilidad de que se dé el suceso B, condicionada a que previamente se haya dado el suceso A, es exactamente igual a la probabilidad de B. Ejemplo: la probabilidad de que al tirar una moneda salga cara (suceso B), condicionada a que haga buen tiempo (suceso A), es igual a la propia probabilidad del suceso B. ❖ P (A/B) = P (A) es decir, que la probabilidad de que se dé el suceso A, condicionada a que previamente se haya dado el suceso B, es exactamente igual a la probabilidad de A. Ejemplo: La probabilidad de que haga buen tiempo (suceso A), condicionada a que al tirar una moneda salga cara (suceso B), es igual a la propia probabilidad del suceso A. P (A ∩ B) = P (A) * P (B) es decir, que la probabilidad de que se dé el suceso conjunto A y B es exactamente igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B. Ejemplo: La probabilidad de que haga buen tiempo (suceso A) y salga cara al tirar una moneda (suceso B), es igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B Si el suceso A es independiente del suceso B, entonces el suceso B también es independiente del suceso A. Ejemplo 1: analicemos dos sucesos A y B: Suceso A: la probabilidad de que haga buen tiempo es del 0,4 Suceso B: la probabilidad de tener un accidente es del 0,1 Suceso intersección: la probabilidad de que haga buen tiempo y tener un accidente es del 0,08 177 Ing. Rolando W. Rivera Olivera Veamos si se cumple alguna de las condiciones señaladas: P (B/A) = P (A ∩ B) / P (A) = 0,08 / 0,4 = 0,2 (que no es igual a P (B)) P (A/B) = P (A ∩ B) / P (B) = 0,08 / 0,6 = 0,133 (que no es igual a P (A)) P (A ∩ B) = 0,08 (que no es igual a P (A) multiplicado por P (B)) Por lo tanto, no se cumple ninguna de las tres condiciones señaladas por lo que estos dos sucesos no son independientes, sino que existe algún grado de dependencia entre ellos. Ejemplo 2: analicemos otros dos sucesos: Suceso A: la probabilidad de que haga buen tiempo es del 0,4 Suceso B: la probabilidad de salir cara al lanzar una moneda es del 0,5 Suceso intersección: la probabilidad de que haga buen tiempo y que salga cara es 0,2 Veamos si se cumple alguna de las condiciones señaladas: P (B/A) = P (A ∩ B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P (B)) P (A/B) = P (A ∩ B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P (A)) P (A ∩ B) = 0,2 (igual a P (A) multiplicado por P (B)) Por lo tanto, estos dos sucesos sí son independientes. 6.13. DISTRIBUCIONES DISCRETAS: BERNOUILLI Las distribuciones discretas son aquellas en las que la variable puede pude tomar un número determinado de valores: Ejemplo: si se lanza una moneda al aire puede salir cara o sello; si se tira un dado puede salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32. Las distribuciones continuas son aquellas que presentan un número infinito de posibles soluciones: 178 Ing. Rolando W. Rivera Olivera Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una población (72,5 años, 7,513 años, 72, 51234 años). Distribuciones discretas: Bernouilli Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas) Al haber únicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de éxito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificándose que: p+q=1 Veamos los ejemplos anteriores: Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1 179 Ing. Rolando W. Rivera Olivera Ejemplo 3: Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + 0,99999 = 1 6.14. DISTRIBUCIONES DISCRETAS: BINOMIAL La distribución binomial parte de la distribución de Bernouilli: La distribución de Bernouilli se aplica cuando se realiza una sola vez un experimento que tiene únicamente dos posibles resultados (éxito o fracaso), por lo que la variable sólo puede tomar dos valores: el 1 y el 0 La distribución binomial se aplica cuando se realizan un número "n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido éxitos Ejemplo: Si se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10 La distribución de probabilidad de este tipo de distribución sigue el siguiente modelo: ¿Alguien entiende esta fórmula? Vamos a tratar de explicarla con un ejemplo: Ejemplo 1: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? 180 Ing. Rolando W. Rivera Olivera "k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decíamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6) “n" es el número de ensayos. En nuestro ejemplo son 10 “p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La fórmula quedaría: Luego, P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces? " k " (número de aciertos) toma el valor 4 " n" toma el valor 8 " p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666) La fórmula queda: Luego, P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar un dado 8 veces. 6.15. DISTRIBUCIONES DISCRETAS: POISSON La distribución de Poisson parte de la distribución binomial: Cuando en una distribución binomial se realiza el experimento un número "n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribución de Poisson: 181 Ing. Rolando W. Rivera Olivera Se tiene que cumplir que: " p " < 0,10 " p * n "< 10 La distribución de Poisson sigue el siguiente modelo: Explicando tendríamos que: El número "e" es 2,71828 " " = n * p (es decir, el número de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de éxito en cada ensayo) " k " es el número de éxito cuya probabilidad se está calculando Veamos un ejemplo: La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, ¿cuál es la probabilidad de tener 3 accidentes? Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribución de Poisson. Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9% Otro ejemplo: La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién nacidos haya 5 pelirrojos? 182 Ing. Rolando W. Rivera Olivera Luego, P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién nacidos es del 4,6%. 183 Ing. Rolando W. Rivera Olivera 184 Ing. Rolando W. Rivera Olivera EJERCICIOS PROPUESTOS N° 6 1. Un comerciante tiene 12 unidades de cierto artículo de los cuales 4 tienen algún tipo de defecto. Un cliente muy exigente quiere comprar 3 de tales artículos pero le explica al comerciante que si alguno contiene defectos devolverá la compra y pedirá la devolución de su dinero. Si el comerciante escoge al azar y a la vez 4 de tales artículos, ¿cuál es la probabilidad de que con esos 4 artículos pueda atender satisfactoriamente al cliente? 2. Se va a seleccionar a 3 alumnos de 10 alumnos candidatos compuesto de 7 hombres y 3 mujeres para una determinada tarea. El seleccionador no sabe que los 10 alumnos están calificados de 1 a 10, según su eficiencia en esa tarea. Calcular la probabilidad de que la terna contenga a. Uno de los 2 mejores y dos de los 3 peores candidatos. b. Por lo menos una mujer. 3. En una muestra de 120 arequipeños se encontró que el 60% sufre alguna enfermedad, el 30% tienen al menos 30 años, y el 20% son menores de 30 años y sanos. i uno de tales arequipeños es escogido al azar, ¿cuál es la probabilidad: a. De que sufra alguna enfermedad y tenga al menos 30 años? b. De que sufra alguna enfermedad si tiene al menos 30 años? 4. A un departamento de mercadeo se le ha solicitado que diseñe códigos de color para las 42 líneas de discos compactos vendidos por Godoy Records. Se han de utilizar tres colores en cada línea, pero una combinación de tres colores empleados para una de ellas no puede reordenarse y ser utilizada para identificar una distinta línea de CD. a. ¿serán adecuados siete colores tomados tres a la vez para codificar por color todas las líneas? 185 Ing. Rolando W. Rivera Olivera b. ¿Cuántos colores serían suficientes? 5. Al montar un equipo electrónico, seis alambres se conectan a una caja que tiene seis terminales. ¿De cuántas formas pueden conectarse los alambres a las terminales si sólo entra un alambre en cada terminal? 6. ¿De cuántas maneras puede un maestro escoger uno o más estudiantes a partir de seis elegibles? 7. Suponga que hay ocho maquinas disponibles pero solo tres espacios en el piso del taller donde se han de instalar tales maquinas. ¿de cuántos modos diferentes pueden colocarse las ocho en los tres espacios disponibles? 8. Un entrenador de fútbol tiene un equipo formado por 11 jugadores de los cuales uno es su hijo. ¿Cuántos quintetos de basquetbol se pueden formar si su hijo siempre debe estar dentro del quinteto? 9. En un edificio de 10 pisos entran al ascensor, en el primer piso, 3 personas, cada una baja al azar a partir del segundo piso. ¿De cuántas maneras posibles éstas personas pueden bajar en pisos diferentes? 10. Una caja contiene 8 dulces de piña, 6 de naranja y 4 de fresa. ¿Cuántos elementos tiene el espacio muestral que resulta de extraer un dulce al azar de cada sabor? 11. Hallar los siguientes ejercicios: a. Simplificar E = 9!+8! 7! – ( 5! – 40) b. Calcular x. (𝑥+2) 𝑥! = 3! 3 c. Hallar x en: (𝑥−5)! 𝑥−5 = 720 186 Ing. Rolando W. Rivera Olivera d. Calcular x en la siguiente ecuación. (𝑛 + 4)! (𝑛 + 3)! (𝑛 + 5) . [ ] = 720 (𝑛 + 3)! + (𝑛 + 4)! (𝑛 + 4) e. De la siguiente relación: 8! = 14 𝑎! 𝑏! Calcular: (𝑎2 + 𝑏 2 ) 12. Una compañía desea ascender a 3 de sus 10 gerentes a posiciones de vicepresidentes de ventas, de manufacturas y de finanzas. Halar el número de formas distintas de efectuar los ascensos. 13. Un microbús tiene 29 asientos para pasajeros, distribuidos en 6 filas de 4 asientos cada uno, con un pasillo en el medio y al final 5 asientos juntos. ¿de cuántas maneras diferentes podrán ubicarse 25 pasajeros de modo tal, que los 14 asientos que dan a las ventanillas queden ocupados? 14. La empresa de rodajes ZQF ha producido un lote de 50 rodajes especiales. Estos han sido colocados en tres cajas para enviarlos a los proveedores. Al proveedor A le enviarán 25 rodajes, al proveedor B 10 rodajes y al proveedor C los restantes. El supervisor sabe que existen 4 rodajes defectuosos. Determine el número de formas posibles de hacer los envíos si se quiere que los cuatro rodajes defectuosos lleguen al mismo proveedor. 15. Un estudiante planea matricularse en los cursos A, B y C. Los horarios de a son a las 8, 11 y 15 horas. Los de B son a las 8, 10 y 15 horas y los de C a las 10, 12 y 15 horas. Si las clases son de una hora, ¿cuántos horarios distintos puede preparar en los 3 cursos de manera que no haya cruces? 187 Ing. Rolando W. Rivera Olivera 16. ¿de cuántas formas pueden instalarse en línea 5 focos blancos y 6 focos rojos si deben colocarse a. Alternadamente. b. Los blancos juntos? 17. Un sistema está formado por dos componentes A y B. Si la probabilidad de que A falle es 0,7 y la de que B fracase es 0,8 ¿qué probabilidad hay de que: a. El sistema siga funcionando bien b. Ambos compontes fallen c. Falle cualquiera de ellos. 18. En una fábrica de calzado se manufacturan independientemente costura (toda la parte superior del calzado relacionada con el cuero) , suela y tacón, siendo estas partes armadas aleatoriamente en cada zapato. Se sabe que en este proceso, el 5% de las costuras, el 4% de las suelas y el 1% de los tacones tienen falla; ¿qué porcentaje de pares de zapatos resulta: a. Con fallas en sus tres componentes b. Sin fallas en sus tres componentes 19. Cuatro amigos que se dirigen a un lugar, toman 4 rutas diferentes de acuerdo al riesgo que se corre de tener algún accidente. Si se le asignan las probabilidades de riesgo para cada ruta: 0,2; 0,15; 0,25; 0,10. Hallar la probabilidad: a. Que ninguno tenga dificultades b. Que los cuatro sufran accidentes. c. Que los dos primeros sufran accidentes y los restantes no 20. Un experimento estadístico consiste en lanzar dos dados una o dos veces. Un jugador gana si consigue la suma 7 en el primer lanzamiento; pierde si saca 2 o 12; si consigue otras sumas no pierde n gana, en este último caso tiene opción para un segundo lanzamiento y si en este 188 Ing. Rolando W. Rivera Olivera segundo lanzamiento consigue la suma 7 pierde, en caso contrario gana y termina el juego. ¿Cuál es la probabilidad que el jugador pierda? 21. Entre los doscientos empleados de un departamento Hay 150 graduados, 60 del total consagran parte de su tiempo por lo menos a trabajos de estadística y 40 de los 150 graduados dedican parte de su tiempo por lo menos a trabajos de estadística. Si se toma al azar uno de estos empleados, ¿cuál es la probabilidad de que no sea graduado y no trabaje en estadística? 22. En una encuesta de opinión se encontró que el 25% de los electores votarían por el candidato E. De los que no votarían por E el 20% son mujeres y el resto son hombres. Además la probabilidad de que un elector elegido al azar sea hombre es de 0,7. Si se elige un elector al azar y resulta ser mujer, ¿cuál es la probabilidad de que no vote por E? 23. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es 0,06; mientras que la probabilidad de que al menos dos sean defectuosos es 0,04. Calcular la probabilidad de que: a. Todos los objetos sean no defectuosos b. Exactamente un objeto sea defectuoso 24. En un supermercado el 70% de las compras las realizan las mujeres; de las compras realizadas por estas, el 80% supera los $200, mientras que de las compras realizadas por hombres sólo el 30% supera esa cantidad. a. Elegido un ticket de compra al azar, ¿cuál es la probabilidad de que supere los $200? b. Si se sabe que el ticket de compra no supera los $200 ¿Cuál es la probabilidad de que la compra haya sido hecha por una mujer? 189 Ing. Rolando W. Rivera Olivera 25. Se ha determinado que las probabilidades de que un televidente vea los programas A, B y C son: 0.5,0.4 y 0.7, respectivamente. ¿Cuál es el porcentaje de televidentes que ven por lo menos dos de los programas? Se asume que cada persona ve los programas independientemente uno del otro. 26. En una oficina hay dos computadoras A y B que trabajan de manera independiente. Si en un momento cualquiera la probabilidad de que la máquina B esté en mal estado es ¼ y la probabilidad de que solo la maquina A esté en mal estado es 3/10, ¿cuál es la probabilidad de que solo la máquina B esté en malas condiciones? 27. Un sistema está formado por dos componentes electrónicos cuyas duraciones varían aleatoriamente e indistintamente entre 0 y 5 años, pero la segunda componente actúa como respaldo de la primera tan solo cuando la primera deja de funcionar. Si la primera componente tiene mayor duración, calcular la probabilidad de que ésta dure dos o más años que la segunda. 28. En una etapa de la producción de un artículo se aplica soldadura y para eso se usan tres diferentes robots. La probabilidad de que la soladura sea defectuosa varía para cada uno de los tres, así como la proporción de artículo que cada uno procesa, de acuerdo a la siguiente tabla. Robots defectuosos art. procesados ROBOT DEFECTUOSOS ARTÍCULOS PROCESADOS A 0.002 18% B 0.005 42% C 0.001 40% a. ¿cuál es la proporción global de artículos defectuosos producida por las tres máquinas? 190 Ing. Rolando W. Rivera Olivera b. Si tomo un artículo al azar y resulta con defectos en la soldadura, ¿cuál es la probabilidad de que haya sido soldado por el robot C? 29. Carolina está indecisa con relación a que si se matricula en el curso de estadística o en el curso de Química. aunque Carolina realmente prefiere matricularse en química estima que su probabilidad de aprobar estadística es ¼ mientras que su probabilidad de aprobar química es 1/3. Si Carolina decide matricularse en uno de estos cursos mediante el lanzamiento de una moneda, ¿cuál es la probabilidad de que ella apruebe el curso de química? 30. Un sistema de comunicación binario transmite 0 o 1. Por causas del ruido del sistema a veces n 0 transmitido se recibe como un 1 y viceversa. Suponiendo que la probabilidad de que un 0 se transmita incorrectmente es 0.06, que la probabilidad de que un 1 se transita correactamente es 0.90 y que la probabilidad de transmitir un 0 es de 0.45. Calcular la probabilidad de que en una transmisión no haya error. 31. La probabilidad de que Brunela estudie para su examen final de estadística es 0,20. Si estudia, la probabilidad de que apruebe el examen es 0,80 en tanto que si no estudia la probabilidad es de sólo 0,50. a. ¿Cuál es la probabilidad de que Brunela apruebes su examen final de estadística? b. ¿Dado que Brunela aprobó su examen, ¿cuál es la probabilidad de que ella hay estudiado? 32. Un ingeniero toma un autobús o un microbús para ir a su trabajo con probabilidades 0.3 y 0.7 respectivamente. 30% de las veces que toma el autobús llega tarde al trabajo, mientras que 20% de las veces que toma el microbús llega tarde a su trabajo. a. Si llega tarde al trabajo en un día particular, ¿cuál es la probabilidad de que haya tomado el autobús? 191 Ing. Rolando W. Rivera Olivera b. Si llega temprano al trabajo un día cualquiera, ¿cuál es la probabilidad que haya tomado el microbús? 33. Al examinar los registros anteriores de los balances de una compañía, un auditor descubre que el 15% contienen errores. Además 60% de estos balances incorrectos fueron considerados valores inusuales basándose en los datos anteriores. El 20% de todos los balances se consideraron también valores inusuales. Si los datos de un determinado balance parecen ser inusuales, ¿cuál es la probabilidad de que sea incorrecto? 34. El Señor Rivera tiene tres secretarias con diferentes niveles de competencia. La secretaria A ha escrito el 20% de un trabajo, la secretaria B el 40% y la secretaria C el 40%. Hay un error ortográfico que irrita en especial al señor Rivera, y éste ha calculado que A lo comete el 90% de las veces que tiene que escribir la palabra en cuestión, que B lo comete el 40% de las veces y C nunca. a. ¿Cuál es la probabilidad que no encuentre error? b. Si el señor Rivera encuentra ese error en una página del trabajo, ¿cuál es la probabilidad de que esa página lo haya escrito la secretaria A? c. Si no encuentra error, ¿cuál es la probabilidad de que dicha página haya sido escrita por la secretaria B? 35. El precio del bien A puede tomar cualquier valor entre 0 y 6 soles, mientras que el precio del bien B puede tomar cualquier valor entre 0 y 12 soles. Si usted está dispuesto a gastar más de 6 soles comprando tales bienes, calcule la probabilidad de que pueda comprar 2 unidades de A y 3 unidades de B. 36. Dos gerentes deciden encontrarse en cierto lugar para cerrar un negocio entre las 8pm y las 9pm de un día determinado. Si convienen que cada uno de ellos debe esperar al otro a los más 10 minutos, ¿Cuál es la probabilidad de que se encuentren? 192 Ing. Rolando W. Rivera Olivera 37. Cierta enfermedad en drogadictos se caracteriza por la ocurrencia e al menos uno de dos trastornos. La probabilidad de que ocurra el primer trastorno en un drogadicto es 0.10; y la probabilidad de que ocurra solo el segundo trastorno es 0.29. determinar la probabilidad de que ocurra dicha enfermedad en un drogadicto. 38. Un cuadro clínico se manifiesta por la ocurrencia de tres síntomas (1, 2 y 3). Un grupo de pacientes que posiblemente presenten este cuadro ingresan en un hospital especializado, la probabilidad de que uno de estos pacientes posea el síntoma 1 es 0.95. Uno de cada cuatro pacientes que presentan el síntoma 1 también presentan el síntoma 2. Además se sabe que el 755 de estos pacientes que presentan los síntomas 1 y 2 también presentan el síntoma 3. ¿Cuál es la probabilidad de que un paciente posea el cuadro clínico? 39. Se debe realizar dos inversiones. La probabilidad de que se realice la inversión 1 s 0.3. Si se realiza la inversión I, la probabilidad de ganar 5000 soles es 0.4. si se realiza la inversión II, la probabilidad de ganar 5000 soles es 0.1. a. ¿Cuál es la probabilidad de que se realice la inversión I y se gane 5000 soles? b. ¿Cuál es la probabilidad de que se realice la inversión II y se gane 5000 soles? c. Si se ganó 5000 soles, ¿cuál inversión es la más probable de haber sido realizada? 40. El profesor Medina dicta un curso de estadística y quiere tomar una prueba en cada clase. Sabedor de que a veces se olvida de ir a hacer su clase, ha dado instrucciones a su jefe e prácticas que se haga cargo de la clase cuando él está ausente. Si el profesor Medina hace la clase, la probabilidad es 0,70 de que tome la prueba en tanto que i el jefe de 193 Ing. Rolando W. Rivera Olivera prácticas hace la clase, eta probabilidad es de sólo 0,10. Si el profesor Medina falta el 80% de las clases a. ¿Cuál es la probabilidad de que haya una prueba en una clase dada? b. Suponiendo que hubo prueba en una clase determinada, ¿cuál es la probabilidad de que el profesor Medina haya estado ausente? 41. Tres máquinas, A, B y C, producen el 45%,30% y 25%, respectivamente, del total de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3% , 4% y 5%, respectivamente. a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa. b. Tomamos al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido producida por la máquina B. c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza defectuosa? 194 Ing. Rolando W. Rivera Olivera AUTOEV ALU ACIÓN VI NOMBRE…………………………….………………… CARRERA…………………. 1. Hallar: a. La probabilidad de obtener al menos un 4 en dos lanzamientos de un dado. b. La probabilidad de obtener 2 Ases (Unos) c. Cuál es lo más difícil de acertar en dicho lanzamiento de los dos dados? 2. Asuma que en un sorteo de rifa por el día del padre que la probabilidad de de ganar el primer premio es 2/5 y la probabilidad de ganar el segundo premio es 3/8. Si la probabilidad de ganar al menos uno de los dos premios es ¾, calcular la probabilidad de ganar: a. Sólo uno de los premios. b. Ninguno de los premios 3. Una urna que contiene 5 fichas similares de las cuales 3 son de color rojo y 2 de color azul. Si de esa urna se extraen al azar 3 fichas a la vez, calcular la probabilidad de que sólo una de ellas sea de color rojo. 4. La de manad de dos productos A y B varía aleatoriamente en un rango de 1 000 a 5 000 kilogramos. El distribuidor decide bajar el precio de venta de ambos productos, si la suma de sus demandas varía de 3 000 a 5 000 kilogramos. Hallar la probabilidad de que el precio de venta de ambos productos baje. 5. En un campo de esquí artificial pára navidades, la experiencia indica que hay un tiempo soleado sólo del 15 % de los días. Por otro lado, se ha calculado que cuando un día es soleado, hay una probabilidad del 20 % de que el día posterior también lo sea. Calcular la probabilidad de que, en navidades, un fin de semana completo sea soleado. 195 Ing. Rolando W. Rivera Olivera 6. Asuma que en un proceso de producción se utilizan las máquinas, 1 y 2, que trabajan en forma independiente para producir cierto bien. Si la probabilidad de que ambas máquinas fallen es 1/5 y de que falle sólo la 2 es 2/15, Cuál es la probabilidad de que…. a. Falle sólo la máquina 1? b. La producción continúe? 7. Se asume que la probabilidad de que una empresa B tenga éxito al comercializar un producto es de 0,95; si la empresa que es su más cercano competidor en la misma línea de producción A no interviene esta vez en el mercado y es de 0,15 si ésta (La empresa A) interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0,7: a. ¿Cuál es la probabilidad de que la Empresa B tenga éxito? b. Si la empresa B no tuviera éxito, ¿En cuánto probabilidad de que A intervenga en el mercado?. 8. Calcular, simplificar o deducir según sea el caso: a. E = b. c. d. 1!+2!+3! 0! + (𝑛+7)! (𝑛+5)! (𝑛+6)! +(𝑛+5)! (𝑛+9)! (𝑛+7)! (𝑛+8)! +(𝑛+7)! (1+𝑛!) 𝑛! 6+𝑛! 4!+5!+6! 4! = 15! = 14! = 20 196 se estima la Ing. Rolando W. Rivera Olivera BIBLIOGRAFÍA Spiegel M. R. (2000). ESTADÍSTICA. México: McGraw – Hill Córdova B. Isaac (2009). Estadística aplicada a la investigación. Lima – Perú. Ed. San Marcos. Levin Richard. (1996). ESTADÍSTICA para ADMINISTRADORES. México: Prentice – Hall Hispanoamericana S.A. Moya C. Rufino (2010). Estadística descriptiva, conceptos y aplicaciones. Lima – Perú. Editorial San Marcos. Quezada N. Lucio (2012). Estadística con SPSS 20. Lima - Perú. MACRO E.I.R.L. Pérez L. César. (2011). Métodos estadísticos avanzados con SPSS. México. Editorial Thomson. Sánchez P. (2006). Métodos estadísticos aplicados. Barcelona. España. Kohler Heinz (1996). ESTADÍSTICA para negocios y economía. México: Compañía Editorial Continental, S.A. de C.V. Gutiérrez D. (2009), “ESTADÍSTICA Y PROBABILIDADES”. Arequipa: Editorial UTP. Benito, A. (2003). Citas y referencias. Nueva York: Contoso Press García, M.A. (2006). Cómo escribir una bibliografía. Chicago: Publicaciones Raiman. 197 Ing. Rolando W. Rivera Olivera 198 Ing. Rolando W. Rivera Olivera Universidad Autónoma San Francisco Avda. Parra N° 219, Cercado Arequipa Teléf.(054)225918 www.uasf.edu.pe 199