Universidad de El Salvador Facultad de Ciencias Económicas Escuela de Matematica y Estadistica Docente: Lic. Welman del Carmen Rosa Alvarado Cátedra: Estadística II Grupo teórico: 5 Ciclo: 1 - 2022 Tema: Guia de ejercicios sobre muestreo y distribución de muestreo Fecha de entrega: Domingo 27 de marzo. Presentado por: Keytel Rocio Orellana Mendoza Carnet: OM 19021 Ciudad Universitaria 27, Marzo de 2022 GUÍA DE EJERCICIOS SOBRE MUESTREO Y DISTRIBUCIONES DE MUESTREO 1) Explique brevemente cuál es el propósito del muestreo y por qué surge la necesidad de emplearlo. El muestreo, es un método que permite seleccionar de un marco muestral, los elementos que representarán a la población para su estudio, en una muestra. 2) Explique cuáles son las ventajas de emplear muestreo en una investigación. Este método cuenta con la ventaja de minimizar el costo de transporte, al focalizar un solo sector para seleccionar la muestra. 3) Explique cuál es la diferencia entre estadístico y parámetro. La diferencia entre estadístico y parámetro es su objeto de estudio, ya que el estadístico estudia la muestra y el parámetro estudia la población. 4) Explique por qué a un investigador le interesa obtener conclusiones sobre una población en lugar de simplemente describir los resultados de una muestra. Le interesa porque garantiza que los resultados se generalicen como conclusiones de haber estudiado a la población completa. 5) Identifique cada uno de los siguientes tipos de muestreo: a) Los auditores pueden seleccionar cada veinteavo expediente iniciando, por ejemplo con el quinto en el archivo superior. Después se auditan los expedientes números 25, 45, 65, 85, 105… R/ Muestreo sistemático b) Se dividieron los fabricantes en grupos según el volumen de ventas. Los que tienen más de US$100 millones (de dólares) en ventas se clasificaron como “clase A grande”; los que tienen ventas de US$50 a US$100 millones como “clase A media”; los que tienen de US$25 a US$50 millones..., etc. Después se seleccionaron muestras de cada uno de estos grupos. R/Muestreo estratificado c) Se tiene una lista de 15,800 potenciales consumidores de accesorios para automóviles. Se tomó una muestra de 125 automovilistas, en base a un sorteo. R/ Muestreo aleatorio simple d) Se toman una muestra de 1 por cada 15 personas que pasan por una transitada calle. La muestra se completa al haber abordado a un total de 200 personas. R/ Muestreo no probabilístico. 6- Utilice la tabla de números aleatorios para seleccionar una muestra aleatoria de n= 5 Unidades muestrales de una población de N= 55. Explique exactamente cómo encontró las unidades que se incluirán a la muestra. a-) Se busca un inicio aleatorio en la tabla, puede ser de la fila 3, columna 5 ahí encontramos el bloque de los números. b-) luego se decide una dirección de búsqueda izquierda, derecha, arriba o abajo con tres números. c-) Luego se obtiene los números sorteados para pertenecer a la muestra 7) Use una tabla de números aleatorios para seleccionar una muestra de n=15 unidades muestrales de una población de N = 20,000 elementos. a-) De la tabla de números aleatorios se escoge la fila 12, columna 4. b-) Se sumará el número inmediato a la derecha c-) Se avanzará hacia abajo N1: 3,631 N2: 10,679 N3: 3,771 N4: 7,519 N5: 4,620 N6: 10,906 N7: 5,532 N8: 12,814 N9: 13,961 N10: 10,461 N11: 15,681 N12: 6280 N13: 10,199 N14: 9810 N15: 10,625 8) Suponga que una compañía de teléfonos quiere seleccionar una muestra aleatoria de 30 personas (se elige este número para simplificar cálculos) entre 86,270 clientes que hay en un distrito del municipio de Soyapango, para medir el nivel de satisfacción respecto del servicio que prestan. Si se numeran éstos para poder identificarlos, indique los clientes que se incluirán en la muestra. N° 5 Elementos seleccionados N° Elemento seleccionado 1 100 16 46,118 2 2,111 17 49,178 3 4,756 18 51,868 4 8,999 19 54,744 11,200 20 57,620 6 12,314 21 57,647 7 17,899 22 60,357 8 20,232 23 63,579 9 23,984 24 66,412 10 28,860 25 69,123 11 31,736 26 72,151 12 33,450 27 74,398 13 37,489 28 77,129 14 40,365 29 80,693 15 43,348 30 83,794 Mediante el muestreo probabilístico sistemático K= N/n = 86,270/30 = 2,875.66 K= 2,876 9) Se necesita seleccionar una muestra aleatoria de tamaño 60 de la población estudiantil de la Facultad de Ciencias Económicas, que asciende a 8,685 estudiantes, con el propósito de conocer su opinión respecto de las diversas medidas adoptadas por el GOES ante la pandemia. Describa el procedimiento a seguir si utiliza: a) Muestreo Aleatorio Simple Se puede realizar en excel, colocar la lista y seleccionar el listado a realizar para la muestra. b) Muestreo sistemático. K = 8,685 = 145 60 Se elige el primero de la lista a = 5 y el resto se obtiene adicionando al primero un múltiplo c) Estratificado Se puede seleccionar los estudiantes por carreras y dependiendo de esto solucionar la muestra. d) Conglomerados Aquí se pueden hacer grupos por año en los estudiantes y dependiendo los subgrupos se selecciona la muestra. 10) La Facultad de Ciencias Económicas de la Universidad de El Salvador está interesada en resolver el problema del transporte nocturno de sus estudiantes. Para ello le solicito, a usted que actualmente cursa la asignatura de Estadística II, que diseñe un método para conocer el lugar de residencia de los estudiantes. ¿Qué recomienda? Especifique la metodología. 11) Al efectuar una auditoría en las cuentas de una empresa, es normal que el auditor seleccione una muestra de cuentas para verificar saldos. Explique el procedimiento a realizar para seleccionar una muestra sistemática en 5850 facturas emitidas entre los meses de enero a marzo. Aplicamos la fórmula K= N n K = Intervalo sistemático muestra N = Tamaño de la poblacion n = Tamaño de la muestra K= 5850 90 K = 65 → Donde K = 65 es el intervalo de la muestra 12) Una Institución de Salud tiene 6100 empleados y se quiere determinar cómo es el clima laboral en la organización, usando una muestra de tamaño 250, obtenga el número de empleados a consultar por categoría, si se tiene en cuenta, que las diferentes categorías de empleados que pueden influir en la opinión de los trabajadores, tienen la siguiente distribución: Contabilidad y Costos 80 empleados, Administración 150, operativos 5600, seguridad 180 y otros cargos 90. ¿Qué método de muestreo es el apropiado para este caso? ● Afijación proporcional Departamento Cantidad empleados Muestra Cantidad Contabilidad 80 80/ 6100 *250= 3 Administración 150 150/ 6100 *250= 6 Operativos 5600 5600/ 6100 *250= 230 Seguridad 180 810/ 6100 *2500 7 Otros 90 90/ 6100 *250= 4 Total 6100 ● 250 Muestreo aleatorio simple es el indicado para realizar este ejercicio. 13) La empresa CIEM requiere llevar a cabo un estudio de mercado para determinar la aceptación de los usuarios sobre el servicio de recolección de escombros, para ello, se obtuvo la siguiente información: Usuarios residenciales 125.000 Usuarios industriales 45.000 Otros usuarios 1.500 Encuentre el tamaño de muestra para cada categoría de usuario, si previamente se ha determinado un tamaño global de 380 observaciones. ¿Qué método de muestreo es apropiado? tipo de Usuarios N° de usuarios Muestra Residente 125.000 125,000 / 171,500 * 380= 277 industriales 45.000 45,000 / 171,500 * 380= 100 Otros 1.500 1,500 / 171,500 * 380= 3 Totales 171,500 380 El muestreo apropiado es el estratificado con afijación proporcional 14) Una biblioteca pública está organizada en cinco secciones con los números de libros que se indican en esta tabla: sección 1 sección 2 sección 3 sección 4 sección 5 500 860 1200 700 740 Se quiere seleccionar una muestra de 120 libros mediante muestreo estratificado aleatorio, considerando como estratos las secciones. Determina el número de libros que habría que seleccionar en cada sección si: a) Consideramos la afijación igual. 120 = 24 por cada categoria 5 b) Consideramos afijación proporcional Categoría Cantidad Afiliación proporcional sección 1 500 500/ 4,000*120 = 15 sección 2 860 860 / 4,000*120 = 26 sección 3 1,200 1,200/ 4,000*120 = 36 sección 4 700 700/ 4,000*120 = 21 sección 5 740 740/ 4,000*120 = 22 Total 4,000 120 15) El supervisor de una cadena de ferreterías desea estimar la proporción de circuitos integrados defectuosos enviados a sus almacenes por determinado fabricante. Los circuitos vienen en paquetes de 25 cajas, cada una de las cajas contiene 10 circuitos. ¿Cuál es el procedimiento de selección de una muestra de 30 circuitos utilizando muestreo por conglomerados? n= 30 10 =3 25 (3) = 75 circuitos 16) Un investigador quiere estimar el consumo promedio de agua por familia en una ciudad. Analice los méritos relativos a seleccionar familias individuales, unidades habitacionales (casas para una sola familia, edificios de apartamento, etc.) y manzanas de la ciudad como unidades de muestreo. ¿Cuál tipo de muestreo es el más apropiado?, R/ Por conglomerado ¿Cuál sería el marco de muestreo a utilizar? R/ Aleatorio simple 17) Indique si las poblaciones siguientes se consideran finitas o infinitas. a. Los votantes registrados en el municipio de San Salvador Finita b. Los televisores que pueden ser producidos en una determinada fábrica. Finita d. Las llamadas de emergencia que pueden ser recibidas en una estación de policía. Infinita e. Todas las piezas producidas por Fibercon, Inc., en el segundo turno el 15 de agosto, pasado Finita 18) En 2024 se llevará a cabo la elección de diputados(as) de la Asamblea Legislativa de El Salvador. Un grupo de estudiantes está interesado en conocer las preferencias de la población por los candidatos inscritos. Para ello tienen que definir un muestreo. ¿Qué les sugiere a sus compañeros en cuantoa: a. la población de interés b. marco muestral c. unidades de muestreo d. unidades de análisis e. tipo de muestreo a emplear R/ Jóvenes R/ Edades de los 20 a los 35 años R/ Jóvenes inscritos en el padrón R/ Padrón electoral R/ Aleatorio simple 19) ¿Cuál es la diferencia entre una distribución de probabilidad y una distribución muestral? La diferencia es que una distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria y la distribución muestral presenta cada posible resultado que un estadístico puede tomar en todas las muestras posibles de una población y con qué frecuencia ocurre cada resultado. En esta unidad veremos cómo las proporciones y las medias muestrales se comportan en muestras repetidas. 20) La información siguiente representa los días de ausentismo por año en una población de seis empleados de una compañía pequeña: 1, 3, 6, 7, 7, 12. Suponiendo que se muestra sin reposición: a) Seleccione todas las muestras posibles de tamaño 2 y establezca la distribución muestral de la media. N° de muestras Todas las posibles muestras Media muestrales 1 1 3 2 2 1 6 3.5 3 1 7 4 4 1 7 4 5 1 12 6.5 6 3 1 2 7 3 6 4.5 8 3 7 5 9 3 7 5 10 3 12 7.5 11 6 1 3.5 12 6 3 4.5 13 6 7 6.5 14 6 7 6.5 15 6 12 9 16 7 1 4 17 7 3 5 18 7 6 6.5 19 7 7 7 20 7 12 9.5 21 7 1 4 22 7 3 5 23 7 6 6.5 24 7 7 7 25 7 12 9.5 26 12 1 6.5 27 12 3 7.5 28 12 6 9 29 12 7 9.5 30 12 7 9.5 Suma 180 b) Calcule la media de todas las medias muestrales y calcule también la media de la población. ¿Son iguales? ¿Cómo se llama a esta propiedad? Media poblacional Media de media muestrales M = Σx N M = 36 6 M=6 M𝑥̅ = Σ𝑥̅ m M𝑥̅ = 180 30 M𝑥̅ = 6 ¿ son iguales? si ¿ cómo se llama esta propiedad ? M𝑥̅ = M Es la característica principal de la propiedad de insesgadez. Empleado Días de ausentismo (X-M)² A 1 25 B 3 9 C 6 0 D 7 1 E 7 1 F 12 36 Suma 72 c) Haga las partes a) y b) para todas las muestras posibles de tamaño 3 N° de muestras Todas las posibles muestras Media muestrales 1 1 3 6 3.3333 2 1 3 7 3.6667 3 1 3 7 3.6667 4 1 3 12 5.3333 5 1 6 7 4.6667 6 1 6 7 4.6667 7 1 6 12 6.3333 8 1 7 7 5.0000 9 1 7 12 6.6667 10 1 7 12 6.6667 11 3 6 7 5.3333 12 3 6 7 5.3333 13 3 6 12 7.0000 14 3 7 7 5.6667 15 3 7 12 7.3333 16 3 7 12 7.3333 17 6 7 7 6.6667 18 6 7 12 8.3333 19 6 7 12 8.3333 20 7 7 12 8.6667 Suma 120 Empleado Días de ausentismo (X-M)² A 1 25 B 3 9 C 6 0 D 7 1 E 7 1 F 12 36 Suma 72 Media poblacional Media de media muestrales M = Σx N M = 36 6 M=6 M𝑥̅ = Σ𝑥̅ m M𝑥̅ = 120 20 M𝑥̅ = 6 ¿ son iguales? si ¿ Cómo se llama esta propiedad ? M𝑥̅ = M Es la característica principal de la propiedad de insesgadez. d) Compare la forma de la distribución muestral de la media obtenida en las partes a) y c). ¿Cuál distribución muestral parece tener la menor variabilidad? ¿Por qué? La forma de la distribución del literal A es menos compleja y mucho más fácil de realizar por eso concluimos que el literal B parece tener mejor variabilidad por su complejidad en la educación. 21) Las edades de seis aspirantes a ejecutivos de una compañía (considerada la población) son: Nombre Edad Nombre Edad Andres 54 Dinora 52 Balmore 50 Ernesto 48 Carolina 50 Frida 52 a) ¿Cuántas muestras de tamaño dos son posibles? 6c2 = 15 ó 6! = 15 2!(6.2) b) Seleccione todas las muestras posibles de tamaño dos de la población de ejecutivos y calcule las medias. n° Combinación Media muestral 1 Andres 54 Balmore 50 52 2 Andres 54 Carolina 50 52 3 Andres 54 Dinora 52 53 4 Andres 54 Ernesto 48 51 5 Andres 54 Frida 52 53 6 Balmore 50 Carolina 50 50 7 Balmore 50 Dinora 52 51 8 Balmore 50 Ernesto 48 49 9 Balmore 50 Frida 52 51 10 Carolina 50 Dinora 52 51 11 Carolina 50 Ernesto 48 49 12 Carolina 50 Frida 52 51 13 Dinora 52 Ernesto 48 50 14 Dinora 52 Frida 52 52 15 Ernesto 48 Frida 52 50 758 765 Total 772 c) Organice las medias en una distribución muestral Edad 49 50 51 52 53 255 Frecuencia 2 3 5 3 2 15 d) ¿Cuál es la media de la población y cuál es la media de las medias muestrales? Nombre Edad 1 Andres 54 2 Balmore 50 3 Carolina 50 4 Dinora 52 5 Ernesto 48 6 Frida 52 TOTAL 6 306 media de la población 51 medias muestrales 765 e) ¿Qué forma tiene de distribución de la población? (grafique en eje de “x” las edades y en eje de “y”, las frecuencias) Tota Nombre Edad Andres 54 Balmore 50 Carolina 50 Dinora 52 Ernesto 48 Frida 52 6 306 f) ¿Qué forma tiene la distribución muestral? (grafique en eje de “x” las edades promedio y en eje de “y”, las frecuencias) n° Combinación Media muestral x -ẋ (x-ẋ)² 1 Andres Balmore 52 1 1 2 Andres Carolina 52 1 1 3 Andres Dinora 53 2 4 4 Andres Ernesto 51 0 0 5 Andres Frida 53 2 4 6 Balmore Carolina 50 -1 1 7 Balmore Dinora 51 0 0 8 Balmore Ernesto 49 -2 4 9 Balmore Frida 51 0 0 10 Carolina Dinora 51 0 0 11 Carolina Ernesto 49 2 4 12 Carolina Frida 51 0 0 13 Dinora Ernesto 50 -1 1 14 Dinora Frida 52 1 1 15 Ernesto Frida 50 -1 1 Total 765 Edad 49 50 51 52 53 Frecuencia 2 3 5 3 2 22 Las bolsas de papel para empacar abarrotes están fabricadas de tal forma que su resistencia a la rotura tenga una distribución normal con una media de 5 libras por pulgada cuadrada y una desviación estándar de una libra por pulgada cuadrada a. ¿Qué proporción de las bolsas producidas tiene una resistencia a la rotura entre 5 y 5.5 lb por pulgada cuadrada? Datos: Media: 5 lb/plg² Desviación estándar: 1 lb / plg² P= 5 <×< 5. 5 lb/plg² Z= 5.5−5 = 0.5 1 A (0.5) =0.19146 R/ el 19.15 % de las bolsas resiste entre 5 y 5. 5 lb/plg² b. ¿Qué proporción resiste entre 4 y 4.1 libras? 4 <×< 4.1 lb/plg² Z1 = 4 – 5 = -1 1 Z2 = 4.1 -5 = 0.90 1 A (-1) = 0.34134 A (-0.90) = 0.31594/0.0254 R/ el 2.54 % de las bolsas resiste entre 4 y 4.1 lb/ plg² c. Si se selecciona al azar muchas muestras de 16 bolsas c. 1: ¿ A que se podría esperar que equivaldría la media y el error de la media? Media: 5 lb por pulgada cuadrada N= 16 Desviación estándar = 1 lbs por pulgada cuadrada µ×= 5 lbs/pulg Desviación media = desviación / √n = 1 √16 = 0.25 lbs / pulg ²