Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV Datos y Azar Contenidos y ejercicios de preparación PSU Mauricio Andrés Chiong C. Ingeniero Civil Industrial (e) Pontificia Universidad Católica de Chile CEO Grupo Educativo Sinapsis Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 7 COORDINACIÓN DE CONTENIDOS Y EDICIÓN GENERAL Nicolás Pinto P. Lic. en Ciencias. Mención Matemáticas. Universidad de Chile. Ariel Reyes F. Lic. en Ciencias Exactas. Universidad de Chile. 7 DISEÑO Y DIAGRAMACIÓN Nicole Castro B. Distribución gratuita, prohibida su venta. © Todos los derechos reservados. 4 Lic. en Artes Visuales. Diseñadora (e) Pontificia Universidad Católica de Chile. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR PREFACIO Este libro fue confeccionado por Mauricio Chiong Ingeniero Civil Industrial(c) de la Pontificia Universidad Católica de Chile, fundador de la empresa Sacateun7 y Director del Preuniversitario Gauss. En éste se plasma el conocimiento adquirido en arduos años de estudio, desde mi formación escolar en el Instituto Nacional, donde tengo gratos recuerdos de grandes profesores y maestros como Luis Arancibia y Belfor Aguayo, que hicieron que la motivación por la matemática se tradujera en el amor por enseñarla, hasta mi formación profesional, donde la Universidad traspasó su espíritu de excelencia académica y de compromiso social. Espero que este libro sirva de apoyo para lograr un alto puntaje, entrar a la carrera que quieren, y cumplir sus sueños Santiago, 2016 Mauricio Chiong Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 5 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR ÍNDICE GENERAL Prefacio 4 Nomenclatura8 1. Estadística10 Definiciones básicas11 Gráficos13 Medidas de posición o tendencia central 15 Medidas de localización 16 Medidas de dispersión 18 Ejercicios19 2. Probabilidades34 Definiciones Básicas35 Combinatoria35 Probabilidades Clásica y Experimental 36 Distribuciones de Probabilidad 37 Esperanza Matemática 39 Ejercicios40 Respuestas 51 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 7 CAPÍTULO 1 ESTADÍSTICA Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR DEFINICIONES BÁSICAS La estadística tiene dos ramas principales, una es la estadística descriptiva que se dedica a recopilar, organizar y analizar datos, los cuales pueden ser de un estudio de una población o una muestra de ella. Mientras que la otra es la estadística inferencial, la cual se dedica a tratar de deducir características o conductas de los objetos estudiados a partir de una muestra. Nos referiremos a ambos tipos sin distinción por el momento, para dar una serie de definiciones de conceptos básicos que necesitaremos manejar. 7 Población (universo) Es el conjunto de todos los objetos que estamos estudiando u observando, y queremos hacerle un estudio estadístico. 7 Muestra Como en general los universos son muy grandes (por ejemplo si estamos estudiando la raza humana), entonces se toma una porción significativa de ellos para hacer el estudio más simple. A esta porción se le denomina muestra. 7 Variables Son características que se le asocian a los objetos de la muestra y que pueden ser observables o medibles. Las variables se dividen en dos tipos, la primera es la variable cuantitativa que es la que puede ser expresada a través de un número como por ejemplo la edad o la cantidad de hijos que tiene un individuo, que a su vez se dividen en discretas y continuas. Las discretas son las que son expresadas a través de números enteros, mientras que las continuas son expresadas a través de cualquier número real. El segundo tipo son las variables cualitativas las cuales expresan una cualidad de un objeto como por ejemplo su tipo de pelo o su sexo, las que se dividen en ordinales y nominales. Las ordinales son las que pueden ser ordenadas de manera lógica como por ejemplo el nivel de estudio, mientras que las nominales no pueden ser ordenadas como las personas por su color de pelo. 7 Tablas de frecuencia Las tablas de frecuencia sirven para ordenar los datos cuando la muestra es muy grande y que por ello sería muy poco práctico enlistarlas. Estas pueden ser de dos tipos, la primera es cuando el recorrido de la variable es pequeño, que lo ilustramos con el siguiente ejemplo Ejemplo / Veremos la cantidad de e-mails que recibe una persona por día durante un mes, arrojando los siguientes datos Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 9 CAPÍTULO 1 ESTADÍSTICA 1 2 2 3 5 1 Notamos que obtenemos que el recorrido 3 2 1 1 2 1 de la variable va entre 0 y 5, por lo tanto 1 1 0 0 2 3 podemos ponerlos en una tabla donde la 2 2 2 3 3 1 frecuencia será el conteo de los días que 3 2 3 3 5 5 recibió una cantidad fija de e-mails Nº de e-mails Frecuencia 02 18 29 38 40 53 Total30 La otra es cuando el recorrido de la variable también es muy grande y en este caso, usamos intervalos para poder disminuir el recorrido de la variable y quedar en el caso anterior. Por ejemplo si 30 personas llegaron atrasadas a un matrimonio y se les pidió anotar cuantos minutos llegaron tarde, lo que se muestra a continuación 12 23 21 37 52 11 Podemos notar que en este caso el 31 24 15 17 22 recorrido es muy amplio, por lo que 13 19 1 7 5 29 33 22 21 27 38 35 16 30 20 35 38 55 59 Tiempo de atraso si los clasificamos usando intervalos de 10 minutos, entonces se obtiene la siguiente tabla de frecuencia Frecuencia 0-93 10 - 197 20 - 299 30 - 398 40 - 490 50 - 593 Total30 En lo mostrado anteriormente, se usa la frecuencia o frecuencia absoluta (que es representada en general por fi ), que no es más que un conteo de las veces que aparece 10 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR la variable pedida, pero existen otros tipos de frecuencia también 7 Frecuencia relativa Se representa usualmente por hi y es la frecuencia absoluta dividida por el tamaño de la muestra, por lo que representa la razón entre la cantidad de veces que se repite un dato y el tamaño muestral. 7 Frecuencia absoluta acumulada No es más que la suma de todas las frecuencias absolutas de las variables menores o iguales (recordar que las frecuencias absolutas van ordenadas por una tabla) y se denota en general por Fi. 7 Frecuencia relativa acumulada Es lo análogo a la frecuencia absoluta acumulada pero usando la frecuencia relativa en vez de la absoluta. GRÁFICOS Como su nombre lo dice, es la forma gráfica de representar una tabla de datos y existen principalmente tres: Histogramas o gráfico de barras, polígono de frecuencias y gráfico circular. 7 Histogramas Los gráficos de barras se montan en ejes coordenados: en el eje X va el recorrido de las variables (como puntos o intervalos) y en el eje Y va la frecuencia absoluta. Ejemplo / Si consideramos la tabla de frecuencias del ejemplo anterior Tiempo de atraso Frecuencia 0-93 10 - 197 20 - 299 30 - 398 40 - 490 50 - 593 Total30 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 11 CAPÍTULO 1 ESTADÍSTICA Entonces su gráfico de barras o histograma será 9 8 7 3 0 10 20 30 40 50 60 7 Polígono de frecuencia Al igual que antes va en ejes coordenados, pero esta vez en el eje de las X marcamos los puntos medios de los intervalos considerados (representante del intervalo) y en el eje de las Y las frecuencias. Luego marcamos los puntos de la forma (representante del intervalo, frecuencia del intervalo) y los vamos uniendo por una línea. Ejemplo / Usaremos la misma tabla de frecuencias del ejemplo anterior, y obtendremos el siguiente polígono de frecuencia, 9 8 7 3 0 10 20 30 40 50 60 7 Gráfico circular A diferencia de los anteriores, este no utiliza la frecuencia absoluta si no que la frecuencia relativa, asociando la porción de un disco circular correspondiente a su frecuencia relativa. 12 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR Ejemplo / Tomemos la tabla de frecuencia anterior y agreguemos la frecuencia relativa Tiempo de atraso Frecuencia Frecuencia relativa 1 0-9 3 10 - 19 7 20 - 29 9 30 - 39 8 40 - 49 0 50 - 59 3 10 Total 30 1 10 7 30 3 10 4 15 0 1 0 resultante se ve como -9 50 - 59 Por lo tanto, el gráfico circular 20 - 29 10 - 19 30 - 39 MEDIDAS DE POSICIÓN O TENDENCIA CENTRAL Las medidas de posición o de tendencia central son tres: La media aritmética, Mediana y Moda. La primera de estas -la media aritmética- es el promedio que usualmente conocemos, es decir, la suma de todos los datos divididos por la cantidad total de ellos, por ejemplo si lo datos son 1, 2, 3 y 4, entonces el promedio es 1 + 2 + 3 + 4 10 = = 2,5 4 4 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 13 CAPÍTULO 1 ESTADÍSTICA El segundo de ellos -la mediana- es el valor que divide en dos partes iguales a la muestra cuando esta se encuentra ordenada ya sea de forma creciente o decreciente. Por ejemplo, si la muestra es 1, 2, 2, 2, 3, 4, 5, 6, 7, 8 y 9, entonces la mediana es 4, ya que hacia la izquierda y hacia la derecha de 4 podemos encontrar 5 elementos de la muestra. El último de ellos -la moda- es el elemento de mayor frecuencia dentro de una muestra, por ejemplo si la muestra es 1, 2, 2, 2, 3, 3, 4, 5, 6, 7 y 9, entonces claramente la moda es 2, ya que es el único que tiene frecuencia 3. Debemos tener claro que la moda no es necesariamente única, puede ser una muestra bimodal o multimodal, o en caso que todos los elementos presentan la misma frecuencia diremos que la muestra es amodal o que no posee moda. MEDIDAS DE LOCALIZACIÓN Las medidas de localización, como dice su nombre, nos ayudan a saber con alguna precisión la ubicación de cierto elemento de la muestra. La precisión la dará el elemento de localización que usemos que son básicamente tres: Cuartiles, Deciles y Percentiles. 7 Cuartiles Los cuartiles son tres valores que dividen a un conjunto de datos ordenados en cuatro partes porcentualmente iguales y denotaremos a esos valores por Qi. Si tenemos una serie de datos ordenados, entonces una forma de calcular los valores de los cuartiles es 3 Q1: Es la mediana de la primera mitad de los elementos 3 Q2: Es la mediana del conjunto 3 Q3: Es la mediana de la segunda mitad de los elementos 7 Deciles Son básicamente lo mismo que los cuartiles pero en vez de tres elementos dividen los datos en 4 partes porcentualmente iguales, son 9 valores que dividen la muestra en 10 partes porcentualmente iguales y los denotaremos por Di. Para su calculo veremos primero los percentiles y con ellos veremos como a partir de ellos puedo calcular los cuartiles y deciles. 14 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 7 Percentiles Al igual que los anteriores y como dice su nombre, los percentiles son 99 valores que dividen a los datos en 100 partes porcentualmente iguales, a los que denotamos por Pi . Si un dato esta ubicado en el percentil Pi , significa que es mayor o igual , aproximadamente, que el i% de la muestra y menor que el 100 − i% de la muestra. La relación entre los percentiles, deciles y cuartiles es la siguiente P10 = D1 P20 = D2 P25 = Q1 P30 = D3 P40 = D4 P50 = D5 = Q2 = mediana P60 = D6 P70 = D7 P75 = Q3 P80 = D8 P90 = D9 Por lo tanto si aprendemos a calcular los percentiles, sabremos calcular los deciles y los cuartiles. Para el calculo del percentil Pi consideraremos el siguiente valor n⋅i x= 100 donde n es el tamaño de la muestra e i el percentil a calcular. Luego si llamamos E= [x] y D = {x}, entonces la siguiente función nos da el percentil correspondiente Elemento( E + 1) Pi = Elemento( E ) + Elemento( E + 1) 2 Observación Recordemos que [x] es la parte entera de x y {x} es la parte fraccionaria de x y se calcula x-[x] Si D ≠ 0 Si D = 0 Ejemplo / Suponga que se tiene una muestra ordenada de 200 elementos y queremos ubicar el percentil número 70, esto es, el elemento que divide la muestra en dos partes de modo que el 70% de los datos se ubica por debajo de él (y el resto de la muestra corresponde al 30% mayor). Entonces aplicando la fórmula con n = 200 e i = 70, obtendremos que x= 200 ⋅ 70 100 = 2 ⋅ 70 = 140 Luego como x resultó ser un número entero, entonces debemos tomar la segunda rama de la función, es decir, tomaremos el elemento 70 y 71 de la lista, y el promedio resultará ser el percentil buscado. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 15 CAPÍTULO 1 ESTADÍSTICA MEDIDAS DE DISPERSIÓN Las medidas de dispersión son aquellas que nos ayudan a medir qué tan separados están los datos unos de otros. Los que estudiaremos son tres: Desviación media, varianza y desviación estándar. 7 Desviación media Es el promedio de los valores absolutos de las desviaciones, donde las desviaciones son la diferencia entre un dato (o el representante en caso que estemos viendo intervalos) y la media aritmética, es decir, ∑ = N xi − x Dm N i=1 donde xi es la variable (o el representante en caso de intervalos), N el tamaño de la muestra y x la media aritmética. 7 Varianza La varianza se denota por σ2 y es la media aritmética de los cuadrados de las desviaciones, es decir, σ 2 ∑ = N i=1 ( x i − x )2 N 7 Desviación estándar Este concepto se introduce debido a que la varianza esta medida en unidades cuadradas y estas pueden ser difíciles de interpretar. Por ello introducimos la desviación estándar como la raíz cuadrada de la varianza, es decir, σ = σ 2 . 16 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR EJERCICIOS 1. La siguiente tabla muestra la distribución de los puntajes obtenidos por un curso en una prueba Puntaje Nº de alumnos 0-5 4 6 - 11 2 12 - 17 7 18 - 23 11 24 - 29 6 ¿Qué porcentaje de los alumnos del curso obtuvo 12 o más puntos en la prueba? 3. El gráfico de la figura representa el número de iPhones que tiene en su casa los alumnos de un curso. De acuerdo con esta información, el número total de alumnos del curso es Alumnos 10 8 6 A) 80% B) 20% C) 30,5% D) 35% E) Ninguna de las anteriores 4 2 1 2 3 4 5 Número de IPhones 2. Según información del INE (Instituto Nacional de Estadísticas), actualmente en Chile, 25 de cada 1.000 habitantes cursa estudios universitarios. Si en Chile hay 15 millones de habitantes, con la información proporcionada por el INE, es posible afirmar que A) 29 B) 28 C) 27 D) 15 E) 14 A) Cursan estudios universitarios 40.000 habitantes. B) 375.000 habitantes cursan estudios universitarios. C) Quince mil habitantes cursan estudios universitarios. D) 600.000 habitantes cursan estudios universitarios. E) Menos de 300.000 habitantes han estudiado en la universidad. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 17 CAPÍTULO 1 ESTADÍSTICA 4. La siguiente tabla muestra la distribución de personas que asistieron al cine en una semana. ¿Cuál(es) de los siguientes gráficos representa(n) la información de la tabla? Día Nº de personas Lunes 100 Martes 150 Miércoles 200 Jueves 100 Viernes 225 Sábado 200 Domingo 100 III. Dom Lun Sáb Mar Mié Vie Jue A) Solo I B) Solo II C) Solo I y II D) Solo II y III E) I, II y III I. 250 200 5. Se quiere construir un gráfico circular a partir de los datos de la siguiente tabla 150 100 Estatura 50 Lun Mar Mié Jue Vie Sáb Dom II. Nº de alumnos 148 - 152,9 1 153 - 157,9 5 158 - 162,9 11 163 - 167,9 14 168 - 172,9 6 173 - 180 3 250 ¿Cuál debería ser la medida del ángulo correspondiente al intervalo 153 - 157,9? 200 150 100 50 Lun 18 Mar Mié Jue Vie Sáb Dom A) 45º B) 30º C) 20º D) 12,5º E) 8º Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 6. Si el promedio de las notas finales de un curso de 20 alumnos es de 4 y el de otro curso de 30 alumnos es de 6, entonces el promedio de notas finales de los alumnos de ambos cursos es A) 4,2 B) 4,7 C) 5,2 D) 5 E) 5,4 8. De acuerdo con la información entregada por la tabla, que nos muestra los años de escolaridad de menores en situación de abandono, ¿Cuál es la mediana de la muestra? Años de escolaridad 7. La tabla muestra los resultados de una prueba de Matemática Puntaje Nº de alumnos 16 - 28 13 29 - 40 48 41 - 50 61 51 - 60 21 61 - 70 6 71 - 80 1 Menores de edad Frecuencia acumulada 0 3 3 1 0 3 2 1 4 6 3 2 4 3 9 5 6 15 Total 15 A) 5 B) 4,5 C) 4 D) 3,5 E) 3 El representante del intervalo modal es A) 41 B) 50 C) 61 61 D) 150 E) 45,5 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 19 CAPÍTULO 1 ESTADÍSTICA 9. Se realiza un estudio sobre el número de días que los pacientes sufren mejorías de jaqueca crónica con un nuevo medicamento, presentado en la siguiente tabla ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? Días Frecuencia 0 100 1 250 2 300 3 500 4 450 5 2.000 10. Si la media aritmética entre a y b es 3 y la desviación estándar es 3 , entonces el valor de ab es A) 2 B) 4 C) 6 D) 8 E) 10 I. La mediana es igual a la moda II. El porcentaje de pacientes que sintió mejoría a los 5 días es el 55, 5̄ %. III. El recorrido de la variable es 2.000. A) Solo I B) Solo II C) Solo I y II D) Solo I y III E) I, II y III 20 11. Dado los datos 2, 2, 3, 3, 5, 1, 5, 1, 2, 4, ¿cuál es la frecuencia de la moda? A) 2 B) 3 C) 4 D) 5 E) La muestra no posee moda Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 12. En una balanza, se pesan al mismo tiempo 20 personas. Si la balanza registra 1.200 kilogramos, ¿Cuál es el peso promedio de estas personas? 14. Respecto a la tabla de la pregunta anterior, ¿Cuál es la moda? A) 7 B) 6 C) 5 D) 4 E) 3 A) 60 B) 40 C) 50 D) 30 E) 20 13. En la siguiente tabla se muestran las notas de un grupo de estudiantes que rindió una prueba: Nota fi 3 1 4 5 5 2 6 1 7 1 ¿Cuántas personas rindieron la prueba? A) 5 B) 6 C) 8 D) 10 E) 11 15. Una serie de camisas de iguales características valen $5.000, $8.000, $10.000, $10.000 y $15.000. Dados estos datos, ¿Cuál(es) de las siguientes características es(son) verdadera(s)? I. La moda es $10.000 II. La mediana es $10.000 III. La media es $9.600 A) Solo I B) Solo II C) Solo III D) Solo I y II E) I, II y III Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 21 CAPÍTULO 1 ESTADÍSTICA 16. Dada la siguiente tabla Nota Fi N1 F1 N2 F2 N3 F3 N4 F4 17. Dados los datos 1, 1, 2, 3, 5, 1, 5, 2. La media aritmética, la moda y la mediana son respectivamente A) 2, 1 y 5 B) 2, 1 y 2 C) 2.5, 1 y 2 D) 2.5, 1 y 4 E) 2.5, 5 y 4 La media es A) B) N1 + N2 + N3 + N4 4 NF N F + N3F3 + N4F4 + 1 1 2 2 C) 4 NF N F N3F3 + N4F4 + + 1 1 2 2 D) N1 + N2 + N3 + N4 F1 + F2 + F3 + F4 F1 + F2 + F3 + F4 E)Ningunade las anteriores 18. Con los siguientes datos: {A,A,A,B,B,B,C,C,D,D,D,E,E} es posible afirmar que A) No existe moda B) Existen dos modas C) Existen tres modas D) Todos los datos son moda E) El promedio es 1 22 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 19. Según el gráfico, ¿cuál es la moda de los datos? 21. Si el promedio de edades entre 4 hermanos es de 7 años. Si a las edades les agregamos la edad del padre y la madre, entonces el promedio asciende a 15 años. Entonces el promedio de las edades de los padres es 6 A) 28 B) 31 C) 23 D) 35 E) 42 4 3 1 2 3 4 5 6 7 A) 3 B) 3,5 C) 4 D) 4,5 E) 5 20. Un estudio estadístico emplea datos consistentes en el peso corporal de un grupo de personas. Respecto a estos datos, podemos decir que corresponden a una variable I. Cualitativa II. Continua III. Discreta 22. Si se tienen los valores 3, 1, 2, 6, a, 5, 8, 2, 3, entonces se puede saber el valor de a si (1) La mediana es 3 (2) La moda es 2 A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola, (1) ó (2) E) Se requiere información adicional A) Solo I B) Solo II C) Solo III D) Solo I y II E) I, II y III Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 23 CAPÍTULO 1 ESTADÍSTICA 23. Las edades de un grupo de jóvenes misioneros es 12, 13, 15, 12 y 14 años. Entonces ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? I. La media es 11 años II. La mediana es 13 años III. La desviación estándar es 2 años A) Solo I B) Solo II C) Solo III D) Solo I y II E) I, II y III 25. Si la media entre los datos a y b es 3 y la desviación estándar es 3 , entonces a2 +b2 es igual a A) 36 B) 18 C) 72 D) 48 E) 24 26. La tabla adjunta, muestra el resultado obtenido por dos cursos del preuniversitario Gauss en un ensayo de lenguaje. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? 24. La desviación estándar para los datos {1, 2, 3, 4, 4, 1, 2, 1, 1, 1} es A) 14 B) 1,4 C) 0,14 D) 2,4 E) 0,24 Curso Promedio Desviación Estandar Mañana 706 0,5 Tarde 669 1 I. El curso de la mañana es el más heterogéneo II. El curso de la mañana presenta menor dispersión en los puntajes III. La media aritmética (promedio) considerando los puntajes de los alumnos de ambos cursos es 688 A) Solo I B) Solo II C) Solo III D) Solo II y III E) Solo I y II 24 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 27. La tabla adjunta, muestra la distribución de los puntajes de matemática de un grupo de estudiantes del preuniversitario Gauss. De acuerdo con esta información, ¿cuál de las siguientes fórmulas permite determinar el puntaje promedio de la muestra? Puntaje A) B) Frecuencia Pt1 A1 Pt2 A2 Pt3 A3 Pt4 A4 Pt5 A5 A) 69 kilos B) 60 kilos C) 6 kilos D) 62 kilos E) No se puede determinar Pt1 + Pt2 + Pt3 + Pt4 + Pt5 5 A1 + A 2 + A 3 + A 4 + A 5 C) 5 Pt1 + Pt2 + Pt3 + Pt4 + Pt5 D) A1Pt1 + A 2Pt2 + A 3Pt3 + A 4Pt4 + A 5Pt5 E) 28. El promedio (media aritmética) de las masas de 4 personas es 65 kilos. Si la suma de las primeras 3 personas es 200 kilos, ¿cuál es la masa de la última persona? A1 + A 2 + A 3 + A 4 + A 5 5 A1Pt1 + A 2Pt2 + A 3Pt3 + A 4Pt4 + A 5Pt5 A1 + A 2 + A 3 + A 4 + A 5 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 25 CAPÍTULO 1 ESTADÍSTICA 29. El gráfico de la figura muestra el resultado de una encuesta realizada a un grupo de personas sobre su preferencia con respecto a sabores de helado. 14 12 10 8 6 4 30. La tabla adjunta, muestra los resultados obtenidos al lanzar un dado de 8 caras. Número Frecuencia 1 2 2 3 3 4 4 2 5 2 6 6 7 4 8 5 2 Vainilla Piña 3 Leches Frutilla ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? ¿Cuál(es) de las siguientes afirmaciones es(son) falsa(s)? I. La moda es 12 II. El 12,5% de las personas encuestadas prefiere el helado de piña III. La media es 16 A) Solo I B) Solo I y III C) Solo II y III D) I, II y III E) Ninguna de las anteriores 26 I. El total de lanzamientos del dado fue 28 II. La frecuencia de la moda es 6 III. La mediana es 4,5 A) Solo I B) Solo I y II C) Solo II y III D) I, II y III E) Ninguna de las anteriores Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 31. La tabla adjunta, muestra el resultado de 3 cursos del preuniversitario Gauss en un mismo ensayo, ¿Cuál es el promedio (media) entre el total de alumnos de los tres cursos? (los puntajes se aproximan al entero mayor) 32. El gráfico circular de la figura, muestra las matrículas del preuniversitario en los meses de verano, las cuales suman 200 alumnos. Diciembre 15% Curso Nº de alumnos Promedio Mañana 4 755 Tarde 6 804 Noche 5 669 Marzo 35% Enero 17% Febrero 33% A) 740 B) 744 C) 700 D) 745 E) 746 ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? I. Se matricularon 66 alumnos en Febrero II. Se matricularon 50 alumnos entre Diciembre y Enero III. La mayoría se matriculó en Febrero A) Solo I B) Solo I y II C) Solo II y III D) I, II y III E) Ninguna de las anteriores Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 27 CAPÍTULO 1 ESTADÍSTICA 33. Dados los puntajes obtenidos por 5 personas en un ensayo de ciencias: 810, 765, 655, 555 y 605, ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? I. No existe moda II. La media es 678 III. La mediana es 605 A) Solo I B) Solo II C) Solo I y II D) Solo I y III E) I, II y III 35. La tabla adjunta, muestra la cantidad de horas que dura un celular con sistema iOS si lo sometemos a un control de calidad. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? Intervalo de horas Frecuencia [10 - 15[ 10 [15 - 20[ 12 [20 - 25[ 8 I. La marca de clase en el intervalo [20 - 25[ es 22,5 II. La media es el 12 III. La mediana se encuentra en el intervalo [15 - 20[ 34. Si se suman los GB de internet utilizados en el celular durante 21 días y se divide por 21, se obtiene A) La moda B) La mediana C) La desviación estándar D) La media aritmética E) Ninguna de las anteriores 28 A) Solo I B) Solo II C) Solo I y II D) Solo I y III E) I, II y III Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 36. En una muestra de 450 elementos, el elemento correspondiente al percentil 21 es A) 90 B) 92 C) 93 D) 94 E) 95 38. La desviación estándar entre los elementos 1, 1, 1, 1, 1, 2, 2, 2, 3, 4 y 4 es A) B) C) D) 12 11 14 11 14 10 17 10 E)Ningunade las anteriores 37. En la muestra {Pantalón,Pantalón,Pantalón, Zapato, Zapato,Polera,Polera,Polera,Polera}. 39. Si el promedio de los dos mejores alumnos de un curso es 6,7 y el de los dos peores es 4,5, entonces el promedio entre los cuatro será Es correcto afirmar que A) La moda es Zapato B) La media es Zapato C) El promedio es Calcetines D) La moda es Polera E) El promedio es Polera A) 5 B) 5,2 C) 5,6 D) 5,9 E) 4,9 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 29 CAPÍTULO 1 ESTADÍSTICA 40. Sea x > 7. Si se considera el set de datos {1, 1, 2, 3, 7, 7, 7, x}, entonces el valor de x para que la media y la mediana coincidan debe ser A) 12 B) 15 C) 16 D) 19 E) Nunca coincidirán 30 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV ESTADÍSTICA Y PROBALIDIDAD MIS ANOTACIONES Te damos espacio extra para que puedas desarrollar mejor los ejercicios Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com CAPÍTULO 2 PROBABILIDADES CAPÍTULO 2 PROBABILIDADES 32 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR DEFINICIONES BÁSICAS Las probabilidades son la rama de la matemática que estudia el azar, es decir, eventos en los cuales uno conoce todos los posibles resultados pero no se conoce con certeza el resultado de él. Nuestra primera definición es la de experimento aleatorio, que es un objeto matemático en el cual sé los resultados posibles pero no puedo determinar con precisión un resultado particular. Por ejemplo, el lanzamiento de una moneda, sé que tiene sólo dos posibles resultados pero no puedo asegurar la ocurrencia de ninguno de los dos. Luego podemos definir el espacio muestral, que es el conjunto formado por todos los posibles resultados de un experimento aleatorio dado. Por ejemplo, el espacio muestral de lanzar un dado es {1, 2, 3, 4, 5, 6}. Llamaremos eventos o sucesos a cada uno de los subconjuntos del espacio muestral. Por ejemplo, al lanzar un dado el espacio muestral está compuesto por los números 1, 2, 3, 4, 5 y 6. Un evento puede ser obtener un número par (formado por los resultados 2, 4 y 6). Cuando dos eventos no pueden ocurrir de manera simultánea, los llamamos eventos mutuamente excluyentes. Por ejemplo, al lanzar un dado consideremos los eventos A = {1, 3, 5} (obtener un número impar) y B = {2, 4, 6} (obtener un número par). Como ningún resultado posible es simultáneamente par e impar, decimos que A y B son mutuamente excluyentes. PROBABILIDADES CLÁSICA Y EXPERIMENTAL 7 Probabilidad Clásica Si en un experimento aleatorio, todos los resultados son equiprobables, es decir, todos tienen la misma probabilidad de ocurrir, entonces diremos que la probabilidad que ocurra cierto evento A es donde E es el espacio muestral. Cabe resal#A Número de casos de A tar que de la definición anterior se puede P( A ) = = # E Número de casos totales observar que la probabilidad de cualquier evento esta entre los valores 0 y 1, por el hecho que A ⊂ E. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 33 CAPÍTULO 2 PROBABILIDADES 7 Probabilidad Experimental Si tomamos por Fr la frecuencia relativa de un evento A, entonces definimos Fr = Cantidad de veces que ocurre A Cantidad de veces que se realiza el experimento La Ley de los Grandes Números nos dice que si repetimos dicho experimento una cantidad suficiente de veces, entonces el valor de Fr será cada vez más parecido a la probabilidad de ocurrencia del evento A. A continuación presentamos una pequeña lista con propiedades que se cumplen en las probabilidades, donde E siempre será el espacio muestral, P (·) la probabilidad y, A y B eventos. 3 P(E) = 1 3 P(φ) = 0 3 0 ≤ P(A) ≤ 1 3 Si A ∩ B = φ (son mutuamente excluyentes), P(A ∪ B) = P(A) + P(B) 3 Si Ac = E\A, entonces P(Ac) = 1−P(A) 3 Si A ∩ B ≠ φ, entonces P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 3 Si A y B son eventos independientes, entonces P(A ∩ B) = P(A)· P(B) 7 Probabilidad Condicionada Diremos que A y B son eventos dependientes si la ocurrencia de uno influye en la ocurrencia del otro, y en dicho caso tendremos la siguiente regla de probabilidad P( A ∩ B) = P( A ) ⋅ P( B| A ) P( B| A ) = P( A ∩ B) P( A ) donde P(B|A) denota la probabilidad de que ocurra B sabiendo que ocurrió A. Por lo tanto, como consecuencia inmediata de lo anterior, si A y B son eventos independientes, se tendrá que P (B|A) = P (B) DIAGRAMAS DE ÁRBOL A veces los problemas se presentan en varias etapas y para visualizarlos mejor, conviene pensar en las diferentes etapas como problemas separados. Veamos el siguiente ejemplo: Ejemplo: 1 de cada 10 niños cree en las hadas. 9 de cada 10 niños que cree en las hadas puede ver a Peter Pan. 1 de cada 10 niños que no cree en las hadas puede ver a Peter pan. Si Peter Pan visita un niño al azar, ¿Cuál es la probabilidad de que el niño vea a Peter Pan? 34 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR No es fácil dar una respuesta tan sencilla, pues el resultado depende de si el niño cree o no en las hadas. Pensaremos primero en el caso en que el niño cree: Si el niño cree, entonces la probabilidad de que vea a Peter Pan es 0.9; mientras que si no cree, la probabilidad es 0.1. Podemos resumirlo en el siguiente diagrama. 0.1 0.9 Cree No cree 0.1 0.9 Ve a Peter Pan No ve a Peter Pan 0.1 Ve a Peter Pan 0.9 No ve a Peter Pan Para calcular la probabilidad de que el niño vea a Peter Pan, debemos multiplicar las probabilidades de las ramas que nos llevan a un resultado donde el niño ve a Peter Pan. Por ejemplo, en este caso, Debemos multiplicar las probabilidades que nos llevan al primer caso, es decir 0,9 · 0,1 y las que nos llevan al tercer caso (0,1 · 0,9). Al sumar ambas tenemos que la probabilidad de ver a Peter Pan es 2· 0,9 · 0,1. Este tipo de diagramas es conocido como diagrama de árbol y resulta muy útil para resolver este tipo de problemas. COMBINATORIA Ya hemos visto que en un experimento aleatorio donde todos los sucesos elementales son equiprobables, la probabilidad de un evento A cualquiera puede calcularse según la regla de Laplace: P( A ) = # A #Ω En otras palabras, la probabilidad de que ocurra un evento A se obtiene como la razón del número de resultados favorables al evento A y el total de resultados en el espacio muestral. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 35 CAPÍTULO 2 PROBABILIDADES Ejemplo: Una canasta contiene 5 manzanas rojas y 4 manzanas verdes. Si se extrae al azar una de las manzanas del cesto ¿Cuál es la probabilidad de que la fruta extraída sea de color rojo? Solución: El espacio muestral tiene 9 elementos (uno por cada manzana del canasto), luego #Ω = 9. Si se define A como el evento donde se extrae una manzana roja, entonces #A = 5, pues 5 de las manzanas del cesto son rojas. Así, de acuerdo a la regla #A 5 #A 5 = . De donde la probabilidadPbuscada de Laplace, P( A ) = ( A ) = es= . #Ω 9 #Ω 9 A pesar de que el procedimiento detrás de este tipo de problemas es bastante sencillo, hay veces en que encontrar el número de elementos presentes en el espacio muestral o la cantidad de elementos del evento A puede ser muy complicado. Para ayudarnos a resolver estas dificultades, estudiaremos algunos elementos básicos de combinatoria, la rama de las matemáticas que se ocupa del estudio del número de elementos que tienen los conjuntos finitos. 7 Principio aditivo y principio multiplicativo Los principios básicos sobre los que estableceremos toda la teoría de combinatoria y técnica de conteo reciben el nombre de principio aditivo y principio multiplicativo. Estos resultados se presentan a continuación: 3 Principio aditivo: Si un experimento tiene m resultados posibles y otro tiene n resultados posibles, hay m + n maneras en que se puede llevar a cabo solo uno de los experimentos. Ejemplo / Carlos debe escoger entre adoptar un gato o un perro. Si le han ofrecido 4 gatos y 7 perros ¿Cuántas opciones tiene Carlos para adoptar un animal? R: Carlos debe escoger uno de los dos experimentos, adoptar un gato o adoptar un perro. Como hay 4 opciones de gato y 7 de perro, de acuerdo al principio aditivo, Carlos tiene 7 + 4 = 11 opciones para escoger su próxima mascota. 3 Principio multiplicativo: Si en un experimento hay m resultados posibles y en otro hay n resultados posibles, entonces al realizar ambos experimentos se tienen mn resultados posibles. 36 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR Ejemplo / Carlos desea adoptar un gato y un perro. Si le han ofrecido 4 gatos y 7 perros ¿Cuántas opciones tiene para escoger los animales que adoptará? R: Esta vez Carlos debe escoger ambos, un perro y un gato. Como hay 4 opciones para escoger un gato y 7 para escoger un perro, en virtud del principio multiplicativo se tienen 7 · 4 = 28 formas de escoger un animal de cada especie. El siguiente ejemplo tiene por finalidad ilustrar cómo se aplican estos conceptos a problemas de probabilidad. Ejemplo / Carlos desea adoptar dos animales. Le han ofrecido 4 gatos y 7 perros. Si escoge dos animales al azar entre sus opciones y los adopta ¿Cuál es la probabilidad de que adopte dos animales de diferente especie? R: Aplicando la regla de Laplace, se tiene que la probabilidad de que adopte animales de distinta especie se calcula mediante la fórmula: #A P( A ) = #Ω' Donde #A es el número de elementos del evento donde Carlos adopta animales de especie distinta y #Ω representa el total de elementos en el espacio muestral. Para encontrar #Ω se aplica el principio multiplicativo: el experimento consiste en escoger dos animales. Como hay 4 gatos y 7 perros, Carlos tiene 11 opciones para escoger al primer animal (véase el Ejemplo 1). Sin embargo, Para escoger el segundo animal ya no tiene 11 opciones, pues al elegir su primera mascota ha eliminado una opción (No puede adoptar dos veces al mismo animal). En términos simples, una vez que escoge la primera mascota solo tiene 10 formas de escoger su segunda mascota, Así, el principio multiplicativo indica #Ω =11 · 10 = 110. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 37 CAPÍTULO 2 PROBABILIDADES Para hallar #A debemos contar la cantidad de formas en que Carlos puede adoptar animales de especies diferentes. Notemos que esto se puede hacer adoptando primero un gato y luego un perro, o bien adoptando primero un perro y posteriormente un gato. La cantidad de maneras de adoptar un perro en la primera oportunidad es 7, pues hay 7 perros. Si luego se desea adoptar un gato, entonces hay 4 opciones para la segunda elección. Con esto se tiene que de acuerdo al principio aditivo, hay 7 · 4 = 28 maneras de adoptar primero un perro y luego un gato. La otra manera de adoptar dos animales de especies distintas es adoptar un gato primero y después un perro. Como hay 4 maneras de escoger el gato y 7 maneras de escoger el perro, entonces el principio multiplicativo indica que hay 4 · 7 = 28 formas de escoger primero un gato y luego un perro. Con esta información, podemos utilizar el principio aditivo para establecer la cantidad de maneras en que se pueden adoptar dos animales de especies distintas. Esto corresponde a sumar ambas cantidades, es decir, #A=28 + 28, obteniendo como resultado #A = 56. De acuerdo a la regla de Laplace, se tiene P (A) = 56 110 = 28 55' PERMUTACIONES A menudo interesa calcular probabilidades que tienen relación con la cantidad de maneras de ordenar un conjunto de objetos determinado. Las diferentes ordenaciones que puede tener un conjunto son llamadas permutaciones. Para motivar el estudio de las permutaciones, consideremos el siguiente problema: Ejemplo / Fabián tiene una colección de 4 libros ordenados en su repisa según su fecha de lanzamiento. En un descuido, los libros se caen y Fabián los vuelve a poner en la repisa, pero sin percatarse del orden. ¿Cuál es la probabilidad de que el primer y el segundo libro queden en su lugar? 38 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR R: Nuevamente, si se define A como el evento donde el pri- mer y el segundo libro quedan en los lugares que corresponden, la probabilidad de A está dada por #A P( A ) = #Ω' Para hallar #A notemos que si el primer y el segundo libro quedan ubicados correctamente, entonces al ubicar un libro en la tercera posición el orden queda determinado de manera unívoca, pues solo queda una opción para poner en último lugar. En otras palabras, al contar los casos favorables para el evento A basta obtener la cantidad de maneras de ubicar el tercer libro cuando los primeros dos libros están en las posiciones que corresponden. Como hay dos maneras de hacer esto(colocar el tercer libro en su posición o en la posición del cuarto libro), se tiene #A = 2. Por otro lado, para hallar la cantidad #Ω de elementos en el espacio muestral, utilizamos el principio multiplicativo: El libro que ocupa la primera posición puede escogerse de 4 maneras, el libro que le sigue se puede escoger de 3 formas(pues uno de los libros ya está en la repisa). El siguiente se escoge de dos maneras, pues hay dos libros que ya están ubicados. Finalmente, el último libro solo se puede escoger de una manera. Como se deben hacer todas estas cosas simultáneamente, se aplica el principio multiplicativo. Así #Ω = 4 · 3 · 2 · 1. Finalmente, de acuerdo 2 1 a la regla de Laplace: P (A) = = 4 · 3 · 2 · 1 12' Si en el problema anterior hubiese más libros, por ejemplo, 83, el número de elementos en el espacio muestral se habría obtenido a partir de una multiplicación muy tediosa. Si el número de libros es suficientemente grande, ni siquiera cabría en la hoja. Esto genera la necesidad de definir nueva notación para contar la cantidad de permutaciones en un conjunto. A continuación se muestra una función cuyo dominio son los números cardinales y nos ayuda a simplificar este tipo de problemas. 7 Definición: Si n es un número cardinal, se define el factorial de n, anotado n! (se lee “ene factorial”), mediante la recursión: Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 39 CAPÍTULO 2 PROBABILIDADES 0! = 1 (n + 1)! = (n + 1)n! Ejemplo / Calcule los factoriales de todos los enteros comprendidos entre 0 y 5. R: Por definición 0! = 1. De acuerdo a la segunda parte de la definición: 1! = (0+1)! = 1 · 0! = 1 · 1 = 1. Análogamente: 2! = (1 + 1)! = (1 + 1) · 1! = 2 · 1 = 2. Siguiendo de la misma forma: 3! = (2 + 1)! = (2 + 1)2! = 3 · 2! = 3 · 2 = 6. 4! = (3 + 1)! = (3 + 1) · 3! = 4 · 3! = 4 · 3 · 2 = 24. 5! = (4 + 1)! = (4 + 1) · 4! = 5 · 4! = 5 · 4 · 3 · 2 = 120. Observación: para números n mayores que 0, n! = n(n - 1)(n - 2) ··· 2 · 1 Ejemplo / Escriba como multiplicación el factorial de 10 R: De acuerdo a la observación, 10! = 10 · 9 · 8 · 7 · 6 · 5 · 4 · 3 · 2 · 1 7 Propiedad: El número de permutaciones existentes en un conjunto no vacío de n elementos es n! 7 Demostración: Encontrar la cantidad de permutaciones equivale a encontrar la cantidad de maneras en que el conjunto puede ordenarse. El primer elemento se puede escoger de n maneras, el siguiente de n - 1 maneras (el primer elemento no puede ocupar el segundo lugar). El tercer elemento puede escogerse de n - 2 maneras. Prosiguiendo de esta forma hasta que solo queda un elemento se tiene que el número de permutaciones es n(n - 1)(n - 2)(n - 3) ··· 2 · 1. De acuerdo a la observación, esto es n! (note que n ≥ 1 debido a que por hipótesis el conjunto es no vacío). 40 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR Ejemplo / Bernardo pertenece a un curso de 40 alumnos. El profesor hace una interrogación sorpresa y llama, uno a uno, a los 40 estudiantes para hacerles preguntas. ¿Cuál es la probabilidad de que Bernardo sea el último integrante del curso en ser interrogado? R: El espacio muestral se compone de todas las permutaciones existentes para el conjunto formado por los 40 alumnos del curso, es decir #Ω = 40!. Para determinar en cuántas de estas permutaciones Bernardo ocupa el último lugar, notamos que en un ordenamiento donde Bernardo está al final, hay 39! Formas de ordenar al resto del curso. Luego la probabilidad de que Bernardo sea el último estudiante en ser interrogado es: P (A) = 39! 40! = 39! 40 · 39! = 1 40 PERMUTACIONES CON ELEMENTOS INDISTINGUIBLES Hay veces en que en un conjunto se tienen dos elementos que para propósitos prácticos son indistinguibles. Considere el siguiente ejemplo: Ejemplo / ¿Cuántas palabras, con o sin sentido, pronunciables o no pronunciables, pueden formarse con las letras de la palabra MANADA? R: La palabra MANADA consta de 6 letras, de modo que estas se pueden ordenar de 6! Formas diferentes. Sin embargo, Las tres letras A cumplen el mismo rol dentro de la palabra. Así, al intercambiar de lugar las tres letras A se obtiene la misma palabra. Dicho de otra manera, estamos contando más palabras de las que realmente existen al considerar las letras A como diferentes. Una forma de Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 41 CAPÍTULO 2 PROBABILIDADES solucionar este problema es notar que cada palabra se contó 3! veces, pues se puede formar de tantas maneras como se puedan reordenar las letras A. Así, para obtener la verdadera cantidad de palabras existentes, se debe dividir por 3!. Luego, existen 6! = 6 · 5 · 4 · 3! = 6 · 5 · 4 = 1 3! 3! 40 palabras distintas. 7 Propiedad: Si se tienen n elementos agrupados en k clases que se consideran indistinguibles, y el número de elementos en cada clase se anota por n1, n2, …, nk, entonces el número de permutaciones existentes en este conjunto está dado por n! n1 ! n2 ! ··· nk ! Ejemplo / En una orquesta de 20 músicos se necesita un cantante de primera voz, 3 cantantes de segunda voz, 5 flautistas, 4 tecladistas, 2 violinistas y 5 percusionistas. ¿Cuántas opciones tienen para asignar sus roles? R: Hay n = 20 músicos. Se consideran indistinguibles los n1 = 3 cantantes de segunda voz, los n2 = 5 flautistas, los n3 = 4 tecladistas, los n4 = 5 percusionistas, los n5 = 2 violinistas y se forma una clase de un elemento (n6 = 1) donde solo está el cantante de primera voz. Así, la cantidad de opciones está dada por: 20! 3!5!4!5!2!1! PERMUTACIONES SIN PRIMER ELEMENTO (CÍCLICAS) En algunos problemas se desea calcular una permutación sin distinguir un elemento que inicia el orden. En estos casos, se fija un elemento arbitrario y se ordenan los demás a partir de su posición relativa al elemento fijo. En otras palabras, se fija uno y se ordena el resto. De modo que si un conjunto tiene n elementos, entonces hay (n - 1)! Permutaciones cíclicas. 42 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR Ejemplo / Un collar circular está formado por una cadena que contiene 5 piedras: Rubí, zafiro, jade, lapislázuli y amatista. ¿Cuántos diseños pueden existir para estos collares? R: Hay cinco piedras, que pueden ordenarse de 5! maneras diferentes. Sin embargo, al cerrar el collar, algunas ordenaciones se ven iguales(por ejemplo si se ponen en orden Rubí, zafiro, jade, lapislázuli y amatista se forma el mismo collar que al colocar jade, lapislázuli, amatista, rubí y zafiro). Para resolver el problema correctamente, suponemos fija una de las cinco piedras (supongamos que se escoge jade). La piedra que se ubica a la derecha del jade se puede escoger de 4 formas, la que sigue de 3, la siguiente de 2 maneras y la que se ubica a la izquierda solamente de una. Así, hay 4! Maneras de diseñar un collar con estas características. CANTIDAD DE MUESTRAS EN UNA POBLACIÓN FINITA Con las herramientas que manejamos en este momento ya podemos determinar la cantidad de elementos de muchos espacios muestrales. En estadística discreta, a menudo interesa conocer la cantidad de muestras de un tamaño dado que se pueden extraer desde una población finita. Para ello clasificamos los procesos de muestreo de acuerdo a dos criterios. El primer criterio distingue si los elementos pueden extraerse más de una vez (muestreo con reposición) o una vez escogidos no pueden volver a formar parte de la muestra(muestreo sin reposición). El segundo criterio indica si una muestra formada por los mismos elementos en diferente orden se considera una muestra distinta (con orden) o si se considera como la misma muestra (sin orden). La siguiente tabla resume de cuántas formas se puede escoger una muestra de acuerdo a los dos criterios mencionados anteriormente. Si la población tiene n elementos y se extrae una muestra de tamaño k, entonces la cantidad de muestras posibles está dado por Con reposición Con orden Sin orden nk k - 1 ( n + k ) Sin reposición Observaciones n El símbolo se llama combinación k y se lee “n sobre k". Se define como n n! = k k !(n − k )! El símbolo Vkn es llamado variación o arreglo y se lee “variación de n sobre k". Se define mediante la fórmula Vk n = n! (n − k )! La combinación a veces se anota Ckn y la variación a veces se anota Akn. V kn ( nk ) Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 43 CAPÍTULO 2 PROBABILIDADES Ejemplo / El código genético se determina a partir de combinaciones de cuatro bases nitrogenadas: Adenina, Citosina, Guanina y Timina (o Uracilo en el ARN). La unidad de información básica en el proceso de traducción del ARN mensajero es llamada codón y está determinada por una secuencia de tres bases nitrogenadas ¿Cuántos codones distintos pueden armarse con cuatro bases nitrogenadas? R: Una base nitrogenada puede presentarse más de una vez en un codón, por lo tanto, estamos en presencia de un muestreo con reposición. Además, un codón con las mismas bases nitrogenadas en diferente orden almacena información diferente. En consecuencia, el orden es relevante. Como se extrae una muestra de tres bases nitrogenadas a partir de una población de cuatro bases nitrogenadas, con reposición y con orden, el número de codones es 43 = 64. Ejemplo / En el ejército romano, cuando una tropa se acobardaba durante una batalla o mostraba señales de amotinamiento, se aplicaba un castigo conocido como diezmado (decimatio). Consistía en que la tropa se dividía en grupos de 10 personas y en cada grupo se escogía al azar un miembro que debía ser lapidado por los nueve restantes. Si se aplica esta medida en una tropa de 130 miembros, ¿De cuántas formas se pueden escoger los 13 miembros lapidados? R: Al lapidar a los mismos 13 miembros en distinto orden, se tienen exactamente las mismas bajas dentro de la tropa. Esto indica que se realiza muestreo sin orden. Un individuo que es lapidado en un grupo no puede ser lapidado en otro grupo, por lo tanto se muestrea sin reposición. Como se escogen k=13 individuos en una tropa de n=130, se tienen 130 maneras de realizar el diezmado. 13 ( ) 44 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR Ejemplo / Cinco amigos salen de vacaciones en un auto. Si deben escoger un piloto y un copiloto, ¿Cuántas opciones tienen? R: Escoger a los mismos dos individuos intercambiando posiciones es una elección diferente. Por lo tanto, el muestreo es ordenado. Además, no puede escogerse la misma persona de piloto y copiloto, por lo tanto es un muestreo sin reposición. En este caso n=5 y k=2, por lo tanto hay 5! 5! 5 V2 = = = 5 · 4 = 20 (5 − 2)! 3! formas de escoger al piloto y al copiloto en este viaje. Ejemplo / ¿De cuántas formas se pueden colocar 5 bolitas idénticas en 4 urnas enumeradas del 1 al 4? R: Una urna puede contener más de una bolita, por lo tanto es un muestreo con reposición. No importa qué bolita va en qué urna, sino cuántas van en cada una. Por lo tanto no importa el orden. Como se escogen k=5 urnas de un total de n=4, se tienen 5 + 4 − 1 8 = 5 5 formas de llenar las urnas. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 45 CAPÍTULO 2 PROBABILIDADES EJERCICIOS 1. Si se tiene el juego del Loto, donde para cada cartón de juego se eligen 7 números de 35, ¿cuál de las siguientes expresiones representa la cantidad de cartones de juego posibles? A) 35 7 35 B) 7! 7 C) D) 3. ¿De cuántas formas puedo ordenar 3 libros en un estante con 4 espacios? A) 6 B) 18 C) 12 D) 32 E) 24 35! 7! 35 7 E)Ningunade las anteriores 4. Una mujer tiene 3 clósets donde ordenar sus tres tipos de ropa: pantalones, blusas y abrigos. Si cada tipo de ropa va en un único closet, ¿de cuántas maneras distintas se pueden ordenar? 2. Si se tiene un estante con 7 espacios para libros y se desea colocar 4 libros distintos en cualquier orden. ¿De cuántas maneras se pueden colocar los libros? A) 3! B) 4! C) 4! · 3 D) 3! · 3! E) 34 A) 7 4 7 B) 4! 4 C) D) 7! 4! 7 4 E)Ningunade las anteriores 46 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 5. ¿De cuántas maneras pueden sentarse 4 personas en 10 sillas? A) 4! B) 10! C) 104 D) 10 4 E) 5.040 6. Usando combinatoria, diga cual es el número de diagonales de un hexágono regular A) 7 B) 8 C) 9 D) 10 E) 6 7. Hay que colocar a 5 mujeres y 4 hombres en una fila, de modo que los hombres usen las posiciones pares, ¿De cuántas maneras puedo hacer la fila? A) 4! B) 5! C) 9! D) 4!5! E) 9 4 8. ¿Cuántos números de 4 dígitos se pueden formar con las cifras {1, 2, 3, 4, 5, 6, 7, 8, 9}, permitiendo repetición? A) 4! B) 49 C) 94 D) 9 4! 4 E) Ninguna de las anteriores Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 47 CAPÍTULO 2 PROBABILIDADES 9. Si en la pregunta anterior no permitimos repeticiones, entonces ¿cuál es la nueva cantidad de números que puedo formar? 11. ¿Cuál es la probabilidad de que al sacar una carta al azar de un mazo inglés, esta sea un 9 rojo? A) 4! B) 49 C) 94 D) 9 4! 4 A) B) C) 9 E) 4 D) 13 1 52 1 12. ¿Cuál es la probabilidad de que al tirar dos dados no cargados, la suma de los valores obtenidos sea mayor o igual que 10? A) A) 8 3! 3 B) B) 83 C) 4 48 2 1 26 E)Ningunade las anteriores 10. Si a la pregunta anterior, agregamos que los números formados deben terminar en 1 y no se permite repetición, ¿cuál es la nueva cantidad de números que puedo formar? C) 8 D) 9 3! 3 9 E) 3 1 D) E) 5 26 1 6 5 6 1 9 5 36 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 13. Se extraen aleatoriamente, sin reposición, cuatro cartas de una baraja inglesa de 52 cartas. ¿Cuál es la probabilidad de que haya al menos una jota? 15. ¿Cuál es la probabilidad de que al lanzar dos dados uno de ellos sea 3 si la suma de los dos es 7? 1 A) 1 A) 4 B) 4 1 2 C)1− 5 1 B) 3 1 C) 48 ⋅ 47 ⋅ 46 ⋅ 45 52 ⋅ 51⋅ 50 ⋅ 49 D) No se puede calcular E) Ninguna de las anteriores 2 2 D) E) 5 1 6 14. Una caja contiene 8 bolas rojas, 3 blancas, y 9 azules. Si se extraen 3 bolas al azar, ¿Cuál es la probabilidad de que las tres bolas sean azules? A) B) 9 20 3 20 9 3 C) 20 3 12 3 D) 20 3 20 3 E) 9 3 16. Si se ha lanzado una moneda honesta 765 veces, y en todos los lanzamientos se obtuvo un sello. ¿Cuál es la probabilidad que el lanzamiento 766 sea una cara? A) B) C) D) E) 1 2 1 765 1 766 2 766 2 3 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 49 CAPÍTULO 2 PROBABILIDADES 17. ¿Cuál es la probabilidad que al lanzar 3 dados no cargados, se obtengan exactamente tres veces 5? A) B) C) D) E) 1 72 1 A) 0,05882 B) 0,0625 55 1 6 C) D) 1 216 1 1 2 1 4 E) 0,0485 18 18. En una sala de 60 alumnos, se sabe que la probabilidad de escoger uno al azar y que este sea hombre es de 3 5 . De acuerdo a lo anterior, ¿Cuántas mujeres hay en el curso? A) 24 B) 20 C) 19. Si se extraen dos cartas al azar de un mazo inglés ¿Cuál es la probabilidad aproximada de que ambas sean de diamante? 2 5 D) 36 E) Ninguna de las anteriores 50 20. En Chile, una patente está formada por dos consonantes (distintas de ñ) seguidas de cuatro dígitos entre 0 y 9. ¿Cuántas patentes distintas pueden formarse? A) 106 B) 272 · 104 C) 21 · 20 · 10 ·9 · 8 · 7 D) 21 + 21 + 10 + 10 + 10 + 10 E) 212 · 104 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 21. Cuando llueve, la probabilidad de que una 1 jugadora de fútbol anote un gol es . Si la 4 2 probabilidad de que no llueva es , ¿cuál es la 3 probabilidad de que llueva y la jugadora haga un gol? A) B) C) D) 23. De un mazo inglés de cartas (52 cartas), se sacan 2 cartas al azar, entonces ¿Cuál es la probabilidad de que de esas cartas una sea de diamante y la otra de trébol? 1 A) 6 1 B) 12 10 C) 14 1 4 E)Otro valor D) E) 12 1.326 26 1.326 13 204 156 1.326 56 1.326 22. Se tienen 4 monedas, y se define el valor M1 como la probabilidad de sacar sólo una cara y el valor M2 como la probabilidad de sacar tres caras. Entonces el valor de M1 −M2 es A) 1 1 B) 8 1 C) 16 1 D) 32 E) 0 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 51 CAPÍTULO 2 PROBABILIDADES 24. Si tenemos 4 conjuntos de números A, B, C y D dados por A = {1, 2, 3, 4}, B = {1, 2, 3, 4, 5, 6, 7, 8, 9}, C = {5, 6, 7, 8, 9}, D = {1, 2, 3, 4, 5, 6}. Si formamos al azar un número de cuatro dígitos de la forma digAdigBdigCdigD, donde digA es un número del conjunto A y así sucesivamente, entonces ¿Cuál es la probabilidad de que este sea divisible por 2? A) B) C) D) E) 26. En una sala de clases hay 3 hombres y 9 mujeres. Se sabe que 2 de esos hombres y 5 de esas mujeres prefieren clases interactivas y el resto prefiere clases tradicionales. Si se elige una persona al azar, ¿Cuál es la probabilidad de que esa persona sea hombre y prefiera las clases interactivas? A) B) C) 103 1.305 26 D) 25.430 130 E) 1 6 2 3 2 5 1 12 3 5 1.020 156 25.430 12.715 25.430 27. Se tiene una bolsa con pelotitas numeradas del 1 al 25, todas de igual peso y tamaño. Si se extrae una bolita al azar, ¿Cuál es la probabilidad de sacar un número par o múltiplo de 4? 25. ¿Cuál de los siguientes eventos no tiene probabilidad 1 de ocurrencia? A) Escoger un número natural al azar mayor que 1 y que este sea primo o compuesto B) Nacer en un mes que tenga entre 27 y 32 días C) Lanzar un dado y que este nos entregue un número par o impar D) Lanzar tres dados y que el producto sea menor que 216 E) Lanzar una moneda y obtener una cara o un sello 52 A) B) C) D) 20 25 3 25 2 5 22 25 E)Ningunade las anteriores Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 28. Si se lanza un dado de 8 caras, ¿Cuál es la probabilidad de obtener un número impar o un número mayor o igual que 5? 1 A) B) C) 30. Si se lanzan 4 monedas no cargadas, ¿Cuál es la probabilidad de obtener dos caras y dos sellos? A) 6 1 B) 3 3 C) 3 5 5 8 3 8 6 4 D)1 E)0 D) 29. Si se lanzan 3 monedas, ¿Cuál es la probabilidad de obtener dos caras y un sello? 31. Si una gata tiene 4 gatitos, ¿Cuál es la probabilidad de que sean un macho y tres hembras? A) B) C) D) 11 E)Ningunade las anteriores 4 5 3 8 3 5 6 15 E)Ningunade las anteriores A) B) C) D) E) 4 9 1 4 4 5 1 2 1 3 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 53 CAPÍTULO 2 PROBABILIDADES 32. En una caja hay 30 aros de perla de igual peso y tamaño, de las cuales 8 son celestes, 10 son blancos y el resto son rosados. Si se extraen 6 aros al azar, ¿Cuál es la probabilidad de extraer un aro celeste, uno blanco y uno rosado, en ese orden y sin reposición? 8 10 12 A) ⋅ ⋅ 30 30 30 8 10 12 B) ⋅ ⋅ 30 28 26 8 10 12 C) + + 30 28 26 8 10 12 D) ⋅ ⋅ 30 29 28 8 10 12 E) + + 30 29 28 34. Un hotel para mascotas tiene 25 perros entre café y negros, y se sabe que 15 de ellos son café. Si se abre la puerta del lugar y se escapa un perro, ¿Cuál es la probabilidad de que sea negro? A) B) C) D) E) 10 23 5 16 2 5 3 7 4 11 33. Una mochila de un alumno del preuniversitario Gauss tiene 4 guías de lenguaje, 5 guías de matemática y 2 de historia, todos de igual peso y tamaño. Si se extrae una guía al azar, ¿Cuál es la probabilidad de que NO sea de matemática? A) B) C) D) 5 11 4 11 6 11 2 11 E)Ningunade las anteriores 54 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 35. La tabla adjunta muestra el número de empresas que poseen un determinado número de software para administrar sus negocios. Al seleccionar una de estas empresas al azar. Nº de empresas Nº de software 4 0 2 1 1 2 4 3 5 4 6 5 7 6 36. La probabilidad de que al lanzar 2 dados, la suma de los números sea mayor o igual que 5 es A) B) C) D) E) 1 6 5 6 3 4 5 9 6 10 ¿Cuál es la probabilidad de que ésta tenga menos de cuatro software para sus negocios? A) B) C) D) E) 11 29 11 27 15 27 11 30 13 27 37. Si se tiene una moneda cargada, donde la probabilidad de obtener cara es 1 3 y se sabe que esta siempre sale cara o sello, entonces la probabilidad de sacar tres sellos en tres lanzamientos es A) B) C) D) E) 8 27 11 27 15 27 14 27 13 27 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 55 CAPÍTULO 2 PROBABILIDADES 38. En la pregunta anterior, la probabilidad de sacar al menos dos caras en tres lanzamientos es 8 A) B) C) 27 5 A) 27 7 B) 27 11 C) 27 3 D) D) E) 40. Según el problema anterior, la probabilidad de lanzar dos veces el dado y obtenerun 1 y un 6, en ese orden es 2 49 1 49 2 25 1 25 E)Ningunade las anteriores 27 39. Si se sabe que un dado está cargado, donde los números del 2 al 6 tienen la misma probabilidad y el 1 tiene el doble de probabilidad que ellos. Entonces la probabilidad de que al lanzar el dado se obtenga 1 es A) B) C) D) 1 7 2 7 1 5 2 5 E)Ningunade las anteriores 56 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com CAPÍTULO 3 INFERENCIA ESTADÍSTICA Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com CAPÍTULO 3 INFERENCIA ESTADÍSTICA INTRODUCCIÓN La rama de la estadística que veremos a continuación estudia cómo inferir o deducir características de una población a partir de una pequeña parte de ella, debido a que en muchos estudios es imposible tomar la totalidad de la población, esta forma de estudiar colecciones de datos es llamada Inferencia Estadística, y responde a las preguntas: ¿Cómo podemos sacar conclusiones acerca de las características de la población si no conocemos todos sus elementos? ¿Qué tan fiables son estas estimaciones? Para realizar inferencias estadísticas estudiamos una parte pequeña, pero representativa de la población que llamamos una Muestra, y extrapolamos (inferimos) conclusiones sobre la población general a partir de ella. TÉCNICAS DE MUESTREO Llamamos muestreo a las técnicas que utilizamos para escoger una muestra a partir de una población. Los tipos de muestreo se clasifican en muestreos probabilísticos y no probabilísticos. En un muestreo probabilístico, cada elemento de la población tiene una determinada probabilidad de pertenecer a la muestra, y dicha probabilidad se puede calcular sin ambigüedad. En los muestreos no probabilísticos en cambio, se desconoce la probabilidad de que un individuo determinado pertenezca a la muestra. Siempre existe algún error pues la muestra no es completamente fiable, sólo una buena aproximación, y a este error se le llama error de muestreo. 7 Muestreo aleatorio Si todas las muestras posibles de una población pueden ser tomadas con la misma probabilidad, este muestreo es un Muestreo Aleatorio. Distinguimos dos tipos: 3 Sin reposición: Una vez que un individuo es escogido para integrar la muestra, no puede volver a ser escogido Observación Al extraer todas las muestras de un 3 Con reposición (muestreo aleatorio simple): Los individuos pueden aparecer más de una vez en la muestra. tamaño dado en una población finita y calcular el promedio de las medias muestrales se obtiene la media poblacional. 58 El muestreo aleatorio es apropiado para poblaciones grandes y es más simple de implementar que otras técnicas de muestreo, pero requiere de un listado completo de todos los individuos que conforman la población. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR El objetivo de extraer una muestra representativa es estudiar alguna característica de la población representada en una variable estadística, la cual toma la forma de una función que relaciona los miembros de la población con sus cantidades correspondientes, y dando algún patrón a partir del cual sacaremos conclusiones que aplicar a la población general. A estos patrones que encontraremos entre los datos los llamaremos Distribuciones. Observación Por ejemplo: si realizamos un estudio sobre lo que compran los clientes de un supermercado no podremos entrevistar a todos, por lo tanto entrevistaremos a una muestra, y si nuestro estudio está bien hecho podremos obtener un perfil que nos diría cuánto gasta cada tipo de persona del supermercado. Este perfil de los clientes será una distribución de los gastos de los clientes en el supermercado. La inferencia estadística sólo nos dará aproximaciones, nunca dará resultados para cada uno de los miembros de la población. DISTRIBUCIÓN NORMAL La distribución más importante que se estudia es la llamada distribución normal o distribución Gaussiana, y es posible aplicar esta distribución a cualquier grupo de datos cuya distribución se asemeja al siguiente gráfico: X Es decir, un grupo de datos en el cual la mayoría de los datos se agrupa cerca de la media aritmética, y la cantidad disminuye suavemente hacia los extremos, formando una curva simétrica cuyo eje de simetría se encuentra en su media. Rigurosamente, este gráfico representa la siguiente función: f (x) = − 1 e σ 2π ( x − µ )2 2σ 2 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 59 CAPÍTULO 3 INFERENCIA ESTADÍSTICA Donde μ corresponde a la media aritmética de la población y σ corresponde a su desviación estándar. σ2 también es una medida común, y este representa la Varianza de la distribución. 100 Frecuencia 80 60 40 20 0 6 8 10 12 14 16 18 Cuando una variable X sigue una distribución normal de media μ y varianza σ2, escribimos X ∼ N (μ, σ2). 7 Propiedades de la distribución normal 3 La forma de la curva de la distribución depende de sus dos parámetros, la media y la desviación estándar 3 La media indica la posición de la campana. Al incrementar la media, la gráfica de la campana se desplaza hacia la derecha 3 A mayor desviación, la curva se volverá más plana, pues los datos tendrán mayor variabilidad 3 Si X ∼ N(μ, σ2) y se extraen n observaciones de manera independiente en esta población, el promedio obtenido 2 pertenece a una población normal de media μ y varianza σ n 3 Si X∼N(μ, σ2) no depende de Y∼N(v, τ2), entonces X + Y∼ N (μ + v, σ2 + τ2) 60 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 7 Intervalos de una distribución normal El objetivo de la distribución normal es poder conocer qué porcentaje de los datos se encuentran en distintos intervalos, y nos permite responder preguntas como: 3 ¿Qué porcentaje de un grupo de atletas que sigue una distribución normal tiene un buen rendimiento? 3 ¿Cuánto puntaje debo tener para estar en el mejor 10% de los estudiantes que dan la PSU? Estas preguntas tienen una solución que es a la vez simple y complicada. La simple es: El porcentaje de datos que responde estas preguntas es el área bajo la curva de la distribución normal que se encuentra entre los parámetros pedidos. Pero calcular esta área es extremadamente difícil, por lo que utilizamos unos intervalos notables con porcentajes ya conocidos para cualquier distribución normal. Si una población normal tiene media μ y desviación estándar σ, se tiene que: 3 El 68,3% de las observaciones se encuentra en el intervalo [μ - σ,μ + σ], es decir, el 68,3% de los datos se encuentra a menos de una desviación estándar de distancia de la media. 3 El 95,5% de los datos se encuentra en el intervalo [μ - 2σ,μ + 2σ], es decir, el 95,5% de las observaciones se encuentra a menos de dos desviaciones estándar de distancia de la media. 3 El 99,7% de los individuos se encuentra en el intervalo [μ - 3σ,μ + 3σ], es decir, el 99,7% de las observaciones se encuentra a menos de tres desviaciones estándar de distancia de la media. Probabilidad μ (valor estimado) 34% 14% 2% μ - 2σ μ - σ 34% μ μ+σ 2% μ + 2σ Variable Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 61 CAPÍTULO 3 INFERENCIA ESTADÍSTICA 7 Variables estandarizadas (tipificadas) Si se necesita calcular otros percentiles, hay malas noticias: hasta el día de hoy no se ha descubierto un método para calcularla de manera exacta. Sin embargo, existen tablas con muy buenas aproximaciones. Ahora, no es posible escribir una tabla para cada una de las combinaciones posibles de media y desviación estándar, entonces convenimos en utilizar la distribución normal estándar o normal tipificada como referencia, a la cual llevaremos cualquier otra distribución. Definición: Si una variable Z sigue una distribución N(0,1), se dice que Z tiene una distribución normal estándar o normal tipificada. Para llevar una distribución cualquiera a esta distribución N(0,1), utilizamos una técnica llamada estandarización o tipificación, que nos permite relacionar una distribución normal de media y desviación estándar arbitrarias con una distribución N(0,1). X−µ Propiedad: Si X ∼ N (μ, σ2), entonces Z = tiene una distribución normal esσ tándar. Una vez convertida la variable de distribución N(μ, σ2), en una de distribución N(0,1), podemos utilizar una tabla como la siguiente para encontrar los valores necesarios para resolver los problemas. 62 z P(Z < z) 0,67 0,749 0,99 0,839 1,00 0,841 1,15 0,875 1,28 0,900 1,64 0,950 1,96 0,975 2,00 0,977 2,17 0,985 2,32 0,990 2,58 0,995 0 z Z Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 7 Algunos ejemplos de fenómenos que se modelan con distribuciones normales: 3 Puntajes en pruebas nacionales (PSU, SIMCE) e internacionales(TOEFL, exámenes de admisión a distintas universidades). Los puntajes PSU de una generación tienen una distribución normal de media 500 y desviación estándar 110. 3 Indicadores sicológicos como el coeficiente intelectual. 3 Fenómenos meteorológicos como la temperatura. 3 Estaturas y pesos de individuos de la misma edad siguen una distribución normal. 3 El error cometido al hacer mediciones en experimentos sigue una distribución normal. INTERVALOS DE CONFIANZA Puede ocurrir que al tomar dos muestras representativas diferentes dentro de una misma población, se obtengan estadísticos diferentes. Esto no necesariamente significa que el estudio esté mal realizado, sino que simplemente es un reflejo de que hay azar involucrado en el proceso de muestreo. Para estimar el error que induce el azar, se establece un rango de valores que podrían contener el valor del parámetro poblacional estimado, con cierta probabilidad. A esta probabilidad se le conoce como nivel de confianza y su principal objetivo es evaluar la validez del muestreo. Un intervalo de confianza [a,b] para un parámetro poblacional es un intervalo de números reales que con cierto nivel de confianza (95%,99%, etc.) contiene al parámetro estudiado. Si se desea construir un intervalo de confianza para la media de una población normal con varianza conocida σ2, a partir de una muestra de tamaño n, media x, y nivel de confianza (100 - a)% está dado por x − z a σ , x + z a σ n n 2 2 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 63 CAPÍTULO 3 INFERENCIA ESTADÍSTICA Donde z a corresponde al valor tal que el a % de los datos es mayor en una distribu(2) 2 ción normal estándar. σ La cantidad z a es llamada error de muestreo o error y suele ser expresado n 2 como porcentaje. Ejemplo: En un laboratorio, se cuenta con una muestra de 121 frascos con jarabe, se sabe que la cantidad de sacarosa presente en ellos sigue una distribución normal de desviación estándar 10g. Si la media de la cantidad de sacarosa en estos 121 frascos de jarabe es 640g, el intervalo del 95% de confianza, en gramos, está dado aproximadamente por [638,22; 641,78], con un error de 1.782 ya que al reemplazar los valores correspondientes x = 640; σ = 10; n = 121 y z(a)= z0,025 = 1.96 se obtienen 2 dichos valores. Ejemplo / Las estaturas de un grupo de personas siguen una distribución normal de media 1,40m y desviación estándar 20 cm. (a) ¿Qué porcentaje ellos mide entre 1,2m y 1,6m? (b) ¿Qué porcentaje de elos mide menos de 1,8 metros pero más de 1,6? Solución (a) Como el 68,3% de los individuos se ubica a menos de una desviación estándar de la media, podemos asegurar que el 68,3% de los estudiantes tiene una estatura x tal que |x - μ| ≤ σ, es decir, -σ ≤ x - μ ≤ σ. Al sumar μ en cada miembro de la desigualdad, resulta μ - σ ≤ x ≤ μ + σ. Considerando que μ = 1,4 y σ = 0,2 (al medir en metros) se obtiene 1,4 - 0,2 ≤ x ≤ 1,4 + 0,2. Así, se sigue x ∈ [1.2,1.6]. Por lo tanto, el 68,3% de los integrantes mide entre 1,2m y 1,6m. Solución (b) Considerando que el 95,5% de los individuos tiene una estatura que se encuentra en el intervalo [μ - 2σ,μ + 2σ], se tiene que el 95,5% de las estaturas de los individuos se ubica en el intervalo [1,0;1,8]. Si de ese intervalo restamos el 68,3% de las personas cuyas estaturas estaban entre 1,2 y 1,6 (se calculó en (a)). En- 64 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR tonces tenemos que el 27,2% de los sujetos tiene estaturas que se encuentran en el intervalo [1.0,1.2] o que se encuentran en el intervalo [1.6,1.8]. Además, como la gráfica de la distribución es simétrica en torno a su media, se sigue que la cantidad de estudiantes en cada intervalo es la misma. Así, la mitad del 27.2% de los integrantes mide entre 1.6 y 1.8, es decir, el 13.6% de ellos mide menos de 1,8 metros y más de 1,6. Ejemplo / En cierta ciudad, la temperatura diaria sigue una distribución normal de media 18° y desviación estándar 2°. ¿Qué porcentaje de los días habrá una temperatura mayor a 20°? Solución Si llamamos T a la temperatura en un día, se tendrá que T ∼ N(18,4). Al estandarizar, se obtiene que (T - 18) / 2 ∼ N(0,1). El siguiente paso consiste en relacionar la desigualdad T > 20 con una desigualdad que involucre la variable estandarizada. Al restar 18 y dividir por 2 en esta desigualdad resulta T − 18 20 − 18 T − 18 20 − 18 > , es decir, > 1. De acuerdo al valor tabulado, 2 2 2 2 T − 18 20 − 18 el 84,1% de los días satisfacen que ≤ > 1. Por lo tanto, el 2 2 15,9% restante satisface la condición buscada. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 65 MIS ANOTACIONES Te damos espacio extra para que puedas desarrollar mejor los ejercicios Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR EJERCICIOS 1. ¿Cuál de las siguientes afirmaciones es verdadera? A) Al estudiar características de una muestra, se obtiene una estimación de las características de una población B) Una muestra contiene más datos que una población C) Nunca es posible estudiar una población completa D) El muestreo aleatorio simple solo es válido en distribuciones normales E) Ninguna de las anteriores 2. En un estudio estadístico I. El muestreo garantiza ahorro económico al realizar el estudio II. El muestreo permite recolectar datos de manera más rápida III. El muestreo garantiza validez de las conclusiones respecto de la población A) Sólo I B) Sólo II C) I y II D) I y III E) II y III 3. Son ventajas del muestreo aleatorio: I. Al escoger la muestra al azar, se previene cualquier sesgo que pudiese tener origen en la elección del investigador II. Al conocer la probabilidad de cada individuo de pertenecer a la población, se tiene información del error cometido en las conclusiones III. Se clasifica en muestreo sin reposición y con reposición A) Sólo I B) I y II C) I y III D) II y III E) I, II y III 4. Si X ∼ N(1,4) ¿Cuál de estas variables tiene una distribución N(0,1)? A) B) x-1 2 x-1 4 C) x-4 D) x-2 E) Ninguna de ellas Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 67 CAPÍTULO 3 INFERENCIA ESTADÍSTICA 5. Si una población sigue una distribución normal estándar ¿Cuál de estos valores corresponde al percentil 95 de la población? 7. Si Z ∼ N(0,1) ¿Cuál de las siguientes expresiones tiene un valor igual a P(Z < -2)? A) P(Z > -2) B) P(Z ≤ 2) C) P(Z > 2) D) P(-1 < Z < 1) E) Ninguna de las anteriores A) 0,67 B) 1 C) 1,28 D) 1,64 E) 1,96 6. Una población sigue una distribución N(4,25) ¿Cuál de las siguientes afirmaciones es falsa? 8. Una población sigue una distribución N(3,5) ¿Qué distribución tendrá si cada dato se multiplica por 2? A) La mediana de la población es 4 B) La desviación estándar de la población es 25 C) La media de la población es 4 D) Aproximadamente el 68,3% de los datos se ubica en el intervalo [-1,9] E) Ninguna de las anteriores A) N(6,5) B) N(6,10) C) N(3,20) D) N(3,10) E) N(6,20) 68 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 9. ¿Cuál de las siguientes cantidades no sigue una distribución normal? A) Los puntajes de la PSU de historia obtenidos por los postulantes que rindieron la prueba el año 2014 B) Las estaturas de niños de un curso C) El tiempo de vida útil de las ampolletas de una marca dada D) La temperatura media que se registra en un mismo mes E) Ninguna de las anteriores 11. La cantidad de teléfonos celulares por familia en una ciudad se modela por medio de una distribución normal con media μ y varianza 0,25. Se toma una muestra aleatoria de 100 familias de esta ciudad, obteniéndose una media de 3,5 celulares. Para los resultados de esta muestra, ¿Cuál de los siguientes intervalos es el intervalo de confianza de nivel 0,90 para μ? A) [3,5-1,64 · B) [3,5-0,9 · 10. Se dice que un individuo padece de retraso mental si su coeficiente intelectual está entre 70 y 85 puntos. El coeficiente intelectual de los individuos de un país sigue una distribución normal de media 100 y desviación estándar 15. ¿Qué porcentaje de la población de este país padece de retraso mental? A) 95,5% B) 47,75% C) 68,3% D 34,15% E) 13,6% 1 1 ;3,5+1,64 · ] 40 40 1 1 ;3,5+0,9 · ] 200 200 C) [-1,64 · 1 1 ;1,64 · ] 400 400 D) [-0,90 · 1 1 ;0,90 · ] 20 20 E) [3,5 − 1,64 · 1 1 ;3,5 + 1,64 · ] 20 20 12. Al respecto de la gráfica de una campana de gauss se afirma: I. Al incrementar la media poblacional, la gráfica se desplaza hacia la izquierda II. Es simétrica respecto de la media III. La curva se vuelve más plana al incrementar la varianza Es(son) verdadera(s) A) Sólo I B) I y II C) I y III D) II y III E) I, II y III Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 69 CAPÍTULO 3 INFERENCIA ESTADÍSTICA 13. Se desea estimar el tiempo promedio que tarda un atleta en completar una carrera de 100 metros planos. Tras observar a 15 atletas se obtiene un intervalo de confianza de nivel 0,95 dado por [13,20] medido en segundos. ¿Cuál de estas afirmaciones es verdadera? A) El 95% de los atletas tarda en promedio entre 13 y 20 segundos en completar una carrera de 100 metros planos B) Hay una probabilidad de 0,975 de que el tiempo que tardan los atletas en promedio de completar una carrera de 100 metros planos se encuentre en el intervalo [13,20] C) Al observar más atletas, la probabilidad de que el promedio se encuentre en el intervalo de confianza incrementa D) Si el tiempo que tardan los atletas sigue una distribución normal, entonces la media muestral obtenida fue de 16,5 segundos. E) Ninguna de las anteriores 15. Si Z ∼ N(0,1), entonces P(1,15 < Z < 1,28) = A) 0,875 B) 0,900 C) 0,950 D) 0,025 E) 0,125 16. En un estudio se desea estimar el diámetro medio de las piernas en una población de jirafas. Considerando una distribución normal de varianza 25 cm2 para el diámetro de las piernas de las jirafas. Si [⋅] representa la función parte entera, ¿cuál debe ser el tamaño muestral para que la amplitud del intervalo de confianza al nivel 0.99 construido a partir de la muestra sea menor a 2 cm? A) [(5 · 2,32)2 ]+1 14. Una población sigue una distribución normal estándar. ¿Cuál es el máximo valor que puede presentarse en una observación que pertenece al 1% más pequeño? A) -2,58 B) -2,32 C) -2,17 D) -2,00 E) -1,96 70 B) [(5 · 0,839)2 ]+1 C) [(25 · 2,58)2 ]+1 2 5 D) · 2,58 +1 2 E) [(5 · 2,58)2 ]+1 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 17. Un instructor de esgrima desea medir el tiempo que tardan sus deportistas en reaccionar a la señal de partida dada por el árbitro al comenzar los combates. Tras medir los tiempos de retardo en la reacción de sus 16 alumnos obtiene las respuestas 5, 7, 3, 13, 4, 5, 3, 6, 8, 11, 10, 9, 9, 6, 5, 9, medidas en centésimas de segundo. Si deseara tomar una muestra de tamaño 5, ¿Cuál de estas no corresponde a un muestreo sin reposición? A) 5, 3, 4, 5, 11 B) 3, 4, 6, 8, 9 C) 9, 9, 9, 10, 11 D) 5, 7, 5, 7, 3 E) A, C y D son correctas 19. ¿Cuál de los siguientes histogramas representa mejor a una distribucón normal? A) B) C) D) E) 18. El diámetro de los troncos de los sauces sigue una distribución normal de media 15m y desviación estándar 5m. ¿Cuál es la probabilidad de que el diámetro del tronco de un sauce mida menos de 26.6 m? A) 0,977 B) 0,985 C) 0,99 D) 0,995 E) 0,01 20. Un señor del mal tiene 10 esclavos. Cada mañana escoge a 3 por muestreo aleatorio simple con reposición y los castiga. ¿Cuál es la probabilidad de que el mismo esclavo sea castigado 3 veces durante una mañana? A) 1 10 B) 1 100 C) 3 10 D) 2 10 E) 1 1000 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 71 CAPÍTULO 3 INFERENCIA ESTADÍSTICA 21. Con los datos de la pregunta anterior ¿Cuál es la probabilidad de que algún esclavo sea castigado exactamente dos veces durante la misma mañana? A) 27 100 B) 9 1000 C) 9 100 D) 27 1000 E) Otro valor 22. Con los datos de la pregunta 20, ¿Cuál es la probabilidad de que castigue a tres esclavos diferentes durante la mañana? A) 28 100 B) 72 1000 72 C) 100 23. Un practicante de lucha Greco-romana postula a un cupo para un campeonato regional. Los organizadores declaran mediante un comunicado que solo aceptarán a los postulantes que pertenezcan al 1.5% con mejor desempeño en una prueba de fuerza. Si nuestro luchador sabe que los puntajes de dicha prueba siguen una distribución normal con media 4 y desviación estándar 3, ¿Cuál es el mínimo puntaje que debe obtener en la prueba para clasificar? A) 9,88 B) 10,34 C) 10,51 D) 10,96 E) 11,74 24. ¿Cuál de los siguientes histogramas representa una distribución de mayor varianza? A) B) C) D) D) 1 E) Otro valor E) No se puede determinar 72 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 25. La amplitud de un intervalo de confianza para la media poblacional de una distribución normal incrementa si I. La varianza poblacional incrementa II. La media muestral incrementa III. El tamaño muestral incrementa IV. El nivel de confianza del intervalo incrementa Son verdaderas: A) Sólo I B) Sólo IV C) I y IV D) II y III E) I, III y IV 26. Si X N (µ,σ 2 ) entonces P (X < µ)= A) 1 2 B) 1 3 C) 1 4 1 D) 5 E) Otro valor 27. Considere una población de distribución normal de varianza 4. Si se desea construir un intervalo del 95% de confianza a partir de una muestra de tamaño 100, ¿cuál es el error de esta estimación? A) 1.96 5 B) 3.92 5 C) 1.96 50 D) 1.64 5 E) Ninguna de las anteriores 28. Una empresa produce narices de payaso y desea estimar la cantidad de pintura roja necesaria para producir cada unidad. Suponga que la cantidad de pintura utilizada en la producción de una unidad se rige por una distribución normal. Si se desea obtener un error menor que 5% al construir un intervalo de confianza de nivel 90% y la desviación estándar corresponde a 0.05 ml ¿Cuántas narices de payaso, como mínimo, se deben incluir en la muestra? A) 1 B) 2 C) 3 D) 4 E) 5 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 73 CAPÍTULO 3 INFERENCIA ESTADÍSTICA 29. La efectividad de una vacuna en un paciente enfermo se rige por una distribución normal. Si se estudia la efectividad en una muestra de 121 pacientes, obteniendo un error del 10% al construir un intervalo de 99% de confianza ¿Cuál es la desviación estándar de la efectividad de las vacunas? A) 1,21 6,6564 B) 0,1 28,38 C) 11 25,8 D) 1,1 2,32 E) 11 2,58 30. ¿Cuál de las siguientes cantidades no influye en el error de muestreo al construir intervalos de confianza para poblaciones normales? 31. Sean X e Y dos variables aleatorias independientes tales que X ∼ N(0,1) e Y ∼ N(2,3). ¿Cuál es el valor de P(X + Y > 6)? A) 0,045 B) 0,159 C) 0,977 D) 0,023 E) Otro valor 32. Un capitán del equipo de atletismo debe escoger 2 competidores para una carrera de relevos. Tras poner a prueba a sus cinco candidatos en una carrera corta y promediar los tiempos (en segundos) de cada posible pareja obtiene los siguientes resultados: 9, 9, 10, 11, 10, 11, 12, 11, 12, 13 A) La varianza de la población B) La desviación estándar de la población C) La media de la población D) El tamaño muestral E) El nivel de confianza 74 ¿Cuál es el tiempo promedio de los cinco corredores? A) 10 B) 10,8 C) 11 D) 11,8 E) Otro valor Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 33. Si X ∼ N(a + b,a + 2b) e Y ∼ N(a + 2b,a − b) son variables aleatorias independientes ¿Qué valor debe tomar a para que la variable aleatoria X + Y siga una distribución normal estándar? A) 1 2 B) 1 4 C) D) 35. Si X ∼ N (μ, 1) ¿Qué valor debe tener μ para que P(X ≤ 8) = 0,841 A) 7 B) 6 C) 8 D) 0 E) Ninguno de los valores anteriores 1 2 3 4 E) No existe tal valor de a 34. Suponga que X ∼ N (5,92) e Y ∼ N (−3,34). Al respecto se afirma I. La población X es más homogénea que la población Y II. Al extraer muestras aleatorias de 10 individuos de cada población, La media muestral de X tiene una varianza menor a la media muestral de Y III. La campana de Gauss asociada a la variable X tiene a la recta x = 5 como eje de simetría 36. Si X e Y son variables aleatorias independientes de distribución normal estándar ¿Cuál es la probabilidad aproximada de que el interior del cuadrado de centro en el origen, lados paralelos a los ejes y lado 2 contenga al punto (X,Y)? A) 0,68 B) 0,95 C) 0,46 D) 0,90 E) Otro valor Es(son) falsa(s): A) Sólo I B) Sólo II C) I y II D) II y III E) I, II y III Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 75 CAPÍTULO 3 INFERENCIA ESTADÍSTICA 37. Se puede conocer la media poblacional a partir de una muestra si (1) Se conoce la media muestral (2) Se conoce la varianza poblacional A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola E) Se requiere información adicional 38. Se puede conocer la probabilidad de que un individuo de una población pertenezca a una muestra si (1) Se conoce el tamaño muestral (2) La técnica de muestreo es muestreo aleatorio simple A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola E) Se requiere información adicional 76 39. Se puede determinar P(X > μ + 2) si (1) X ∼ N(μ + 2,1) (2) μ + 2 es la mediana de la población A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola E) Se requiere información adicional 40. Se puede conocer la mediana de una población normal si: (1) Se conoce la media (2) Se conoce la varianza A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola E) Se requiere información adicional Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com MIS ANOTACIONES Te damos espacio extra para que puedas desarrollar mejor los ejercicios Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com CAPÍTULO 4 VARIABLES ALEATORIAS Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR VARIABLES ALEATORIAS Una Variable aleatoria es una medida que utilizamos para cuantificar los resultados posibles de un experimento aleatorio, está definida como una función X que relacióna cada elemento del espacio muestral con un número real. Es decir: X : Ω → R El recorrido de esta función entonces, es un subconjunto de los números reales que contiene todos los resultados posibles de esta variable, como imágenes de algún elemento del espacio muestral. Estas variables pueden ser discretas o continuas, dependiendo de la naturaleza de su recorrido. VARIABLES ALEATORIAS DISCRETAS En el caso de una variable discreta, podemos hablar de una función de probabilidad f(x), esta es la función que relaciona cada elemento del recorrido con la probabilidad de que la variable tome dicho valor, es decir f(x0 ) = P(X = x0). Ya que estamos hablando de una probabilidad, sabemos que debe cumplir las siguientes condiciones: 3 3 f(x0) ≥ 0 para todo x0 ∈ Rec(X) ∑ f (i) = 1 i ∈ Rec(X) También podemos definir la función de distribución F(X), que nos indica la probabilidad de que la variable tome un valor igual o menor, es decir: F(x0) = P(X ≤ x0) Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 79 CAPÍTULO 4 VARIABLES ALEATORIAS ESPERANZA Y VARIANZA DE UNA VARIABLE ALEATORIA La Esperanza o Valor Esperado de una variable aleatoria es simplemente el valor promedio que uno obtendría al realizar infinitos experimentos, por lo tanto mientras más experimentos se realicen, más tiende a acercarse el promedio hacia la Esperanza. Esta se define como: E( X ) = ∑ xi ∈ Rec(X) f ( xi ) · xi LEY DE LOS GRANDES NÚMEROS Si entendemos esta esperanza, obtenemos como conclusión la ley de los grandes números que dice: Mientras más experimentos realice, más se acerca la frecuencia relativa de cada evento a su respectiva probabilidad, pero esta forma de enunciar la ley es equivalente a otra que relaciona esta ley con la esperanza: "Mientras más grande sea la muestra, más cercana será su media a la Esperanza de la Variable". La Varianza es ligeramente distinta del concepto que usamos al trabajar con datos, como estos están fijos su varianza sólo mide la dispersión de los datos, en el caso de una variable aleatoria la varianza mide su variación ideal, y se calcula muy fácilmente usando la esperanza: Var(X) = E(X2 ) - [E(X)]2 Luego, la desviación estándar de un variable se encuentra de la misma forma que utilizando datos. StDev( X ) = Var( x ) 80 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR DISTRIBUCIONES IMPORTANTES DE VARIABLES ALEATORIAS 7 Distribución de Bernoulli La distribución de Bernoulli es la forma en la que se distribuyen los resultados de una variable que sólo tiene dos resultados posibles, a estos dos resultados los llamamos un éxito o un fracaso, por ejemplo lanzar una moneda sigue una distribución de bernoulli. La ventaja es que esta moneda no debe ser justa, es decir las probabilidades de éxito o fracaso no necesitan ser mitad y mitad, formalmente: Si X es una variable aleatoria donde p es la probabilidad de éxito y q es la probabilidad de fracaso, se cumple que P(X = 1) = p y P(X = 0) = q = 1 - p. Además, E(X) = p y Var(X) = pq = p(1 - p). 7 Distribución Binomial La distribución binomial es un caso similar al de la distribución de Bernoulli en el que también buscamos éxitos y fracasos, pero en lugar de medir esta probabilidad medimos la probabilidad de obtener cierta cantidad de éxitos en alguna cantidad de experimentos: Una Variable aleatoria X sigue una distribución Binomial si la probabilidad de obtener k éxitos en n experimentos, donde la probabilidad de éxito en cada uno es p. (la frase anterior se resume en X ~ Bin(n,p)): n P( X = k ) = p k (1 − p)n− k k Con esta distribución, podemos tambien obtener la esperanza y varianza fácilmente, entonces: Si X ~ Bin(n,p) → E(X) = np y Var(X) = np(1 - p) Como aprendimos en combinatoria, calcular estos coeficientes binomiales puede resultar complicado, pero una distribución binomial X ~ Bin(n,p) se puede aproximar a una distribución normal X ~ N(np,np(1 - p)) ya que esta tiene la misma Esperanza y Varianza. Mientras más grande sea n, mejor será esta aproximación. Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 81 CAPÍTULO 4 VARIABLES ALEATORIAS VARIABLES ALEATORIAS CONTINUAS En todos los casos anteriores hablamos de variables discretas, entonces tiene sentido pensar en cosas como “sumar todos los resultados del recorrido” porque estas cantidades son finitas, pero estos métodos no funcionan cuando hablamos de variables aleatorias no discretas, por ejemplo no sabemos cuanto es la suma de todos los números racionales entre 0 y 1. Luego, ajustaremos nuestras definiciones para reutilizar los conceptos que vimos en variables aleatorias discretas en continuas. En lugar de hablar de una función de probabilidad, hablaremos de una Función de densidad, y esta mide cual es la probabilidad que una variable aleatoria tome un valor dentro de un intervalo. Ya que existen infinitos resultados posibles para una variable continua, no tiene sentido preguntar por la probabilidad de que caiga en valor particular, por lo que preguntamos cuan posible es que caiga dentro de un rango. Esta función cumple que: 3 La probabilidad de que la variable tome un valor, dentro de un intervalo de su recorrido no puede ser negativa. 3 La probabilidad de que la variable tome un valor dentro del intervalo del total de su recorrido es 1 Es importante notar que el ejemplo más claro y estudiado de una variable de este tipo es la Distribución normal en la cual los intervalos que nos dan la probabilidad son aquellas áreas bajo la curva de la distribución. Así, si vemos la normal como una Variable aleatoria continua, tenemos que el área total bajo la curva es 1, y por lo tanto es exactamente lo mismo preguntar qué porcentaje de esta área se encuentra en un intervalo, a preguntar cual es la probabilidad de caer en ese intervalo si elijo un valor al azar 82 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR EJERCICIOS 1. ¿Cuál de las siguientes es una variable aleatoria? A) El número de caras de un dado B) El punto de ebullición del agua, medido en grados Kelvin C) El resultado obtenido al lanzar un dado común D) El número de habitantes que había en Texas el día 1 de Enero de 1999 E) Ninguna de las anteriores 2. ¿Cuál de las siguientes no se clasifica como una variable aleatoria discreta? A) Se encuesta a 100 personas al azar y se define la variable aleatoria X como el número de mujeres encuestadas. B) Se lanzan 4 dados comunes y se define X como la suma de las puntuaciones obtenidas. C) Se recorren 20 calles de Santiago en Auto y se define X como el número de semáforos que se encuentran en luz roja al pasar por ellos. D) Se observa la carrera de un nadador y se define X como el tiempo que tarda en completar el recorrido. E) Ninguna de las anteriores. 3. Se lanzan dos monedas y se define X = 1 si las monedas tienen el mismo resultado y X = 0 si no lo tienen. ¿Cuál es el dominio de esta variable aleatoria? A) {(cara, cara), (cara, sello), (sello, cara), (sello, sello)} B) {cara, sello} C) {0, 1} D) {0,1,cara, sello} E) No se puede determinar 4. Se define la variable aleatoria X como la suma de los resultados obtenidos al lanzar dos dados comunes. ¿Cuál es el recorrido de X? A) {2,3,4,5,6,7,8,9,10,11,12} B) {(1,1),(1,2),(1,3),(1,4)(1,5),(1,6),(2,1),(2,2),(2,3),(2,4), (2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2), (4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6), (6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} C) {1,2,3,4,5,6} D) {1,2,3,4,5,6,7,8,9,10,11,12} E) Ninguna de las anteriores Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 83 CAPÍTULO 4 VARIABLES ALEATORIAS 5. Una urna contiene 10 bolitas blancas y 4 bolitas negras. Se extraen al azar, sin reposición, 5 bolitas de la urna y se define la variable aleatoria X como el número de bolitas blancas extraídas. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? I. P(X = 0) = 0 II. P (X = 1) = 10 14 7. Se pagan $400, se lanza un dado común y se reciben $100 multiplicado por el valor que muestra el dado. ¿Cuál es el balance esperado? A) -200 B) -50 C) 0 D) 350 E) 50 10 4 3 2 III. P (X = 3) = 14 5 A) Sólo I B) Sólo III C) I y III D) II y III E) I, II y III 1 6. Si X es una variable aleatoria tal que P(X = 1) = 5 y P(X = 2) = 1 , entonces 4 A) P(X = 3) = B) P(X = 3) < C) P(X = 3) ≤ D) P(X = 3) > E) P(X = 3) ≥ 84 11 20 11 20 11 8. Se entrevista a 100 personas de manera independiente y se registra el número de personas bautizadas. Si se sabe que el 48% de la población se ha bautizado, ¿Qué distribución sigue esta variable aleatoria? A) Bernoulli B) Binomial C) Normal D) Hipergeométrica E) Ninguna de las anteriores 20 11 20 11 20 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 9. El tiempo de espera de las personas, en minutos, en cierto paradero de Transantiago, tiene una función de distribución dada por F(x) = 1 - e-2x ¿Cuál es la probabilidad de esperar 2 minutos o menos? A) e-4 B) e-2 C) 1 - e-2 D) 1 - e-4 E) Otro valor 11. Se lanza un dado 20 veces y se definen las variables aleatorias X e Y, donde X es el número de veces que se obtiene un número par e Y es el número de veces que se obtiene un número impar. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)? I. P(X = 4) = P(Y = 16) II. P(X = 5) = P(Y = 5) III. P(X = 9) = P(X = 11) A) Sólo I B) I y II C) I y III D) II y III E) I, II y III 10. En el bosque de caperucita roja se ha instalado un hogar de ancianos. Se sabe que una de cada 10 ancianas que vive en ese hogar es un lobo disfrazado. Si el 60% de la gente que se queda en el hogar son ancianas y se escogen 15 personas mediante muestreo aleatorio simple, al definir la variable aleatoria X como el número de lobos escogidos, resulta P(X = 2) = 12. ¿Cuántas monedas se deben lanzar para que la varianza del número de caras sea 1? A) 1 B) 2 C) 3 D) 4 E) No se puede obtener varianza 1 15 A) 0,62 0,413 2 10 2 13 B) 0,1 0,9 2 15 C) 0,062 0,9413 13 10 D) 0,062 0,9413 2 E) Otro valor Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 85 CAPÍTULO 4 VARIABLES ALEATORIAS 13. ¿Cuál es el recorrido de una variable aleatoria normal de media 3 y varianza 16? A) - {3} B) Q C) [-1,7] D) ]-1,7[ E) 15. Defina la variable aleatoria X como el número obtenido al lanzar un dado común. Suponga que se lanza medio millón de dados comunes y se registran los resultados en una tabla de frecuencias. De acuerdo a la ley de los grandes números, ¿Cuál de estos valores es una mejor estimación para la frecuencia relativa acumulada del número de dados que muestran el número 3 en su cara superior? A) La función de densidad de probabilidad de X evaluada en 3 B) La función de distribución de X evaluada en 3 C) La función de probabilidad de X evaluada en 3 D) El valor esperado de X E) La varianza de X 14. La siguiente tabla muestra la función de probabilidad de una variable aleatoria X. k 1 P(X = k) p 2 2p 3 3p 4 4p ¿Cuál es el valor de la función de distribución de X evaluada en 3? A) 0,1 B) 0,3 C) 0,4 D) 0,6 E) No se puede determinar 86 16. Considere una variable aleatoria discreta X cuya desviación estándar es 8 y su recorrido es un subconjunto del intervalo ]-∞,0]. Considere además que E[X2] = 100. ¿Cuál es el valor esperado de X? A) 6 B) 36 C) 64 D) -6 E) No se puede determinar Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 17. Se lanzan dos dados comunes de manera simultánea y se define la variable aleatoria X como el mayor valor obtenido. ¿Cuál es la función de probabilidad de la variable aleatoria X? x 6 1 B) f(x)= 6 2x − 1 C) f(x)= 36 x D) f(x)= 36 E) Ninguna de las anteriores A) f(x)= 18. En un programa de talentos la probabilidad de que un postulante sea aceptado es 1/10. Si en una sesión hay 8 postulantes ¿Cuál es la probabilidad de que exactamente 3 postulantes sean aceptados? 3 5 3 5 5 1 9 A) 3 10 10 8 1 9 B) 3 10 10 8 1 C) 3 10 3 8 1 D) 3 10 8 1 E) 10 8 19. El número de patos que hay en una laguna al mediodía se rige por una función de probabilidad dada por x 1 , si x ∈N = f ( x ) 2 0, en otros casos Si se observa la laguna al medio día durante 10000 días, de acuerdo a la ley de los grandes números, ¿Cuántas veces se encontrarán exactamente 2 patos? A) Aproximadamente 1/4 B) Aproximadamente 2500 días C) Exactamente 2500 días D) Aproximadamente 5000 días E) Exactamente 1000 días 20. En la tabla adjunta se muestra la función de probabilidad de una variable aleatoria X. X P(X = x) 0 a 1 2a 2 3a 3 4a Se afirma: I. La función de distribución de X, evaluada en 2, corresponde a 0,3 II. La función de probabilidad de X evaluada en 1 corresponde a 0,2 III. El valor esperado de la variable aleatoria es 1,5 No son verdaderas: A) Sólo I B) Sólo II C) Sólo III D) I y III E) II y III Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 87 CAPÍTULO 4 VARIABLES ALEATORIAS 21. En un control de calidad, se dejan caer 1000 botellas de vidrio y se define la variable aleatoria X como el número de botellas que se quiebran. Si la probabilidad de que una botella se quiebre es 9/10, entonces al aproximar esta variable aleatoria mediante una distribución normal X∼ (μ,σ2), el valor de σ es: 23. En un curso de 38 estudiantes, de los cuales 19 son mujeres y 19 son varones, se escoge un integrante al azar. Se define la variable aleatoria X ∼ Bernoulli (p), que toma el valor 1 cuando se escoge una mujer y 0 cuando se escoge un varón. ¿Cuál es el parámetro p para esta variable aleatoria? A) 30 B) 1000 C) 3 10 D) 900 E) 90 A)19 B) 1 C) 0,4 D) 0,5 E) Otro valor 22. Una variable aleatoria X tiene por recorrido al conjunto {1, 2, 3}. Si F(x) es su función de distribución y F(2) = 0,9, entonces P(X = 3) = 24. Una variable aleatoria tiene una distribución binomial de parámetros n y p, ¿Cuál de los siguientes no puede ser el valor de (n,p)? A) 0,1 B) 0,9 C) 1 D) 0 E) Otro valor 1 A) (9, ) 2 4 B) (3, ) 9 1 C) (2, ) 5 9 D) (9, ) 7 E) Ninguna de las anteriores 88 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 25. En un estudio social se entrevistará a 10.000 personas y se preguntará si comen queso en el desayuno. Se estima que el 60% de las personas come queso al desayunar. Si se modela el número de personas encuestadas que responde que come queso durante el desayuno como una variable aleatoria de distribución binomial y se aproxima mediante una distribución normal, la probabilidad de que al menos 4.000 personas respondan que no comen queso es: A) 0,5 B) 0,749 C) 0,67 D) 0,977 E) Otro valor 26. Si X es una variable aleatoria de distribución binomial con parámetros 5 y 0,4 e Y es una variable aleatoria de distribución binomial independiente de X con parámetros 3 y 0,4, entonces 2 A) X + Y Bin(8, ) 5 2 B) X + Y Bin(4, ) 5 4 C) X + Y Bin(8, ) 5 4 D) X + Y Bin(4, ) 5 E) Ninguna de las anteriores 27. Se ordenan al azar las letras de la palabra “PREUGAUSS” y se define la variable aleatoria X como el número de letras que quedan en el lugar correcto. Interpretando el concepto de variable aleatoria como función ¿Cuál es el valor de X (AUEUPRGSS)? A) 1 B) 2 C) 3 D) 4 E) 5 28. Al lanzar un dado común y definir la variable aleatoria X como el resultado obtenido, la función de distribución es: A) F(x) = 1 6 x B) F(x) = 6 C) F(x) = x D) F(x) = 3,5 E) Otro valor Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 89 CAPÍTULO 4 VARIABLES ALEATORIAS 29. Con respecto a una variable aleatoria continua es siempre cierto que: A) Puede tener un recorrido finito B) Todos los elementos del recorrido tienen distinta probabilidad C) Su recorrido es el conjunto de los números reales D) Su dominio es infinito E) Ninguna de las anteriores 31. Se puede conocer el valor esperado de una variable aleatoria discreta X si se sabe: (1) La función de probabilidad toma el mismo valor en todos los elementos del recorrido (2) El recorrido de la variable aleatoria es {1,2,3,4,5,9,11} A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola, (1) ó (2) E) Se requiere información adicional 30. Se lanzan 10 monedas y se define la variable aleatoria X como la razón entre la cantidad de caras y el sucesor de la cantidad de sellos. ¿Cuál de los siguientes números no pertenece al recorrido de X? A) B) 1 2 4 7 8 32. Un ropero tiene n pares de zapatos. Se extraen al azar, sin reposición 2r zapatos y se define la variable aleatoria X como el número de zapatos que fueron extraídos sin extraer a su pareja. Se puede determinar el recorrido de X si (1) r = 3 (2) n = 9 A) (1) por sí sola 3 B) (2) por sí sola D) 10 C) Ambas juntas, (1) y (2) E) Todas las alternativas anteriores pertenecen al recorrido de X E) Todas las alternativas anteriores pertenecen al D) Cada una por sí sola, (1) ó (2) recorrido de X E) Se requiere información adicional C) 90 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR 33. Se tiene una cierta cantidad de fichas rojas y blancas repartidas en dos urnas. Se extrae una ficha de cada urna y se define la variable aleatoria X como “la cantidad de fichas rojas extraídas”. Si en cada urna hay fichas de un único color, entonces el recorrido de la variable aleatoria es: 35. Se tiene una urna con 20 bolitas iguales en cuyo exterior se escribieron números naturales. Si definimos la variable aleatoria X como “la cantidad de números pares que se obtienen al sacar 5 bolitas sin reposición”. Si P(X ≤ 2)=1 podemos asegurar que en la urna: A) {1} B) {0,1} C) {10} D) {0,1, 2, 3, 4, 5, 6, 7, 8, 9,10} E) [0,10] I . Hay 18 números impares y 2 números pares II. Hay como máximo 2 números pares III. La probabilidad de obtener solo números impares al realizar el experimento es 0 A) Solo I B) Solo II C) Solo III D) I y II E) I, II y III 34. Se tiene un saco con fichas de diferentes colores. Se extraen 3 fichas al azar y se define la variable aleatoria X como “la cantidad de fichas azules extraídas”. Si P(X >1) = 0 entonces P(X = 1) = A) 1 B) 0 1 C) 2 1 D) 3 E) No se puede determinar 36. Para el experimento de extraer una bolita de una urna que contiene 18 bolitas iguales coloreadas unas de blanco y otras de azul se define la variable aleatoria X como “la cantidad de bolitas blancas extraídas”. Si sabemos que P(X = 0 )= 4 , entonces 9 P(X ≤ 1) = A) 5 9 B) 1 1 C) 2 8 D) 18 E)No se puede determinar Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 91 CAPÍTULO 4 VARIABLES ALEATORIAS 37. Se lanza una moneda n veces y se define la variable aleatoria S como "la cantidad de sellos que aparecen”. Si P(S = 0) = 1 entonces n = 8 A) 3 B) 8 C) 24 D) 2 E) 1 39. De una urna con bolitas rojas, azules y blancas se extraen dos bolitas y se define la variable aleatoria X como “la cantidad de bolitas blancas extraídas”. Se pueden determinar los posibles valores de X si sabemos que: (1) La probabilidad de que las dos bolitas extraídas sean azules es de un 20%. (2) La probabilidad de no obtener ninguna bolita azul es de un 50%. A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola, (1) ó (2) E) Se requiere información adicional 38. Dado un experimento aleatorio, se define una variable aleatoria X tal que los valores posibles son {0, 1, 2, ..., 19, 20}. Al respecto, es siempre verdadero que I. P(X = 0) = P(X = 1) = P(X = 2) =...= P(X = 20) II. P(X ≤ 10) = 1 2 III. P(X ≤ 20) = 1 A) Solo I B) Solo III C) I y II D) I y III E) I, II y III 40. Un saco contiene 10 fichas con letras del abecedario. Se procede a sacar una ficha de la bolsa, se registra la letra y se devuelve a la bolsa, luego se extrae una segunda ficha y se registra la letra. Se define la variable aleatoria V como “la cantidad de vocales extraídas”. Podemos saber el recorrido de la variable aleatoria V si sabemos que (1) La probabilidad de obtener al menos una consonante es 9 25 (2) La probabilidad de obtener dos consonantes es de 2 50 A) (1) por sí sola B) (2) por sí sola C) Ambas juntas, (1) y (2) D) Cada una por sí sola, (1) ó (2) E) Se requiere información adicional 92 Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com MIS ANOTACIONES Te damos espacio extra para que puedas desarrollar mejor los ejercicios Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com NOMENCLATURA ∀ ∃ {a, b, c . . .} ∈ ∉ ⊂ ∪ ∩ A c φ R2 R3 (a, b) (a, b, c) A × B N N0 Z Q I R C = ≡ ∼ ≅ > < 94 Para todo Existe Conjunto formado por los elementos a, b, c . . . Pertenece No pertenece Subconjunto Unión Intersección Complemento de A Conjunto vacío Plano cartesiano Espacio Euclidiano Par ordenado Trío ordenado Producto cartesiano entre A y B Números naturales Números cardinales Números enteros Números racionales Números irracionales Números reales Números complejos Igualdad Equivalencia Semejantes Congruentes Mayor que Menor que Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com TOMO IV DATOS Y AZAR ≥ ≤ z f(x) f−1(x) ± ln Σ [a, b] (a, b) o ]a, b[ (a, b] o ]a, b] C(n, k) V (n, k) fi x Me Mo σ σ2 PQ / / ⊥ AB sin(α) cos(α) tan(α) m n Mayor o igual que Menor o igual que Conjugado de z Función con variable independiente x Función inversa de f(x) Suma o resta Resta o suma Logaritmo natural o logaritmo en base e Sumatoria Intervalo cerrado desde a hasta b Intervalo abierto desde a hasta b Intervalo semi-abierto desde a hasta b Combinación de n sobre k Variación de n sobre k Frecuencia Media aritmética o promedio Mediana Moda Desviación estándar Varianza Segmento desde el punto P hasta Q Paralelos Perpendicular Arco desde A hasta B Seno de α Coseno de α Tangente de α Pendiente de la recta y = mx + n Coeficiente de posición de la recta y = mx + n Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com 95 ± HOJA DE RESPUESTAS Capítulo 1 Capítulo 2 Capítulo 3 Capítulo 4 Página 17 Página 46 Página 67 Página 83 1A 2B 3B 4C 5A 6C 7E 8C 9C 10 C 11 B 12 A 13 D 14 D 15 E 16 C 17 C 18 C 19 B 20 B 96 21 B 22 B 23 B 24 B 25 E 26 B 27 E 28 B 29 B 30 B 31 E 32 A 33 C 34 D 35 D 36 E 37 D 38 B 39 C 40 A 1A 2B 3E 4A 5E 6C 7D 8C 9D 10 A 11 D 12 B 13 C 14 C 15 B 16 A 17 D 18 A 19 A 20 E 21 B 22 E 23 C 24 E 25 D 26 A 27 E 28 C 29 B 30 C 31 B 32 D 33 C 34 C 35 A 36 B 37 A 38 C 39 B 40 A 1A 2C 3B 4A 5D 6B 7C 8E 9C 10 E 11 E 12 D 13 D 14 B 15 D 16 E 17 D 18 C 19 A 20 B 21 A 22 C 23 C 24 E 25 C 26 A 27 A 28 C 29 C 30 C 31 D 32 B 33 D 34 C 35 A 36 C 37 E 38 E 39 D 40 A 1C 2D 3A 4A 5C 6C 7B 8B 9D 10 C 11 E 12 D 13 E 14 D 15 B 16 D 17 C 18 B 19 B 20 D 21 C 22 A 23 D 24 D 25 A 26 A 27 C 28 B 29 D 30 A 31 C 32 C 33 A 34 E 35 B 36 B 37 A 38 B 39 E 40 D Este material fue descargado para uso exclusivo de Pablo Parada Alegre, [email protected]. Se prohibe su reproducción. Si quieres acceder gratuitamente a este contenido visita www.psuparatodos.com