ESTADÍSTICA UNIDAD I RECOLECCIÓN, ORGANIZACIÓN Y PRESENTACIÓN DE DATOS 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. 1.8. Introducción a la Estadística. Estadística: definición y clasificación. El método estadístico. Conceptos básicos. Variables: concepto y clasificación. Escalas de medición: concepto y clasificación. Cuadros estadísticos. Gráficos estadísticos. 1.1. Introducción a la Estadística Aunque no existe una definición rigurosa, o más bien existen varias, para nuestro estudio definiremos la Estadística como “parte del método científico que, mediante el análisis matemático de conjuntos numéricos, nos permite obtener información sobre la realidad que nos rodea”. La estadística es tan antigua como el hombre puesto que las primeras sociedades organizadas ya sentían la necesidad de contar con datos numéricos de su población y sus condiciones materiales de existencia. Sin embargo es en el siglo XVII cuando cobra interés en los modernos países europeos el estudio de censos económicos, militares y de cualquier aspecto relacionado con la población. Aunque el hueso de astrágalo sitúa los juegos de azar en los albores de la humanidad, el estudio de este tipo de problemas podemos datarlo también en el siglo XVII con la correspondencia entre Fermat y Pascal a propósito de las cuestiones planteadas por el Caballero de Méré sobre ciertas apuestas en juegos con dados. Dado el fundamento matemático de estas dos partes de la Estadística, es en el siglo XIX cuando ambas se desarrollan vertiginosamente siguiendo la estela del desarrollo matemático de esta época. Con la conciencia de que se posee potentes herramientas que se desperdician en juegos de azar y contabilidad de existencias, llegamos al siglo XX donde ambas disciplinas, que hasta el momento habían seguido caminos separados, se unen para dar lugar a la Estadística moderna. El objetivo de nuestras aplicaciones estadísticas será un mejor conocimiento sobre alguna(s) característica(s) de cierto conjunto de elementos, generalmente de tamaño inabordable, por lo que se experimentará sólo sobre alguno de ellos, obteniendo una serie de datos u observaciones que nos darán información sobre dicho subconjunto, información que bajo ciertas condiciones será extrapolable al conjunto total. Estadística - M.Sc. Emerson D. Norabuena F. 2 1.2. Estadística: definición y clasificación. Definición: La Estadística es una ciencia que permite a través de un conjunto de métodos y procedimientos recopilar, clasificar y describir los datos en forma adecuada, para luego tomar decisiones o predecir algo acerca de la población a partir de los datos extraídos de la misma. TEORÍA DE MUESTREO POBLACIÓN MUESTRA INFERENCIA ESTADÍSTICA ESTADÍSTICA ESCRIPTIVA Clasificación: La Estadística se clasifica en: estadística descriptiva e inferencial. Estadística Descriptiva Trata de la planificación, recopilación, organización, presentación, análisis e interpretación de los datos. Estadística Inferencial Nos proporciona la teoría necesaria para afirmar acerca de las características de la población en base a los datos extraídos a partir de una muestra. 1.3. El método estadístico. La aplicación de la Estadística a un problema determinado, comprende las siguientes etapas: Planificación del estudio: planificar es esencial no sólo para calcular el tiempo que durará la investigación, el personal que se requiere y el presupuesto necesario, sino con el fin de que la investigación se realice con metas perfectamente definidas. Recolección de datos. Organización de datos. Presentación de datos. Análisis e interpretación de los resultados. 1.4. Conceptos básicos. Población Se denomina población a un conjunto de elementos (personas, objetos, etc) que contienen una o más características observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos. Estadística - M.Sc. Emerson D. Norabuena F. 3 Muestra Es un subconjunto de la población que es tomada aleatoriamente, para ser estudiada como parte representativa de la población. Unidad de muestreo Elemento sobre el que se aplicará la técnica de selección. Unidad de análisis Es el elemento indivisible que será estudiado en una población. Parámetro Es la medida descriptiva que resume una característica de la población (media μ, varianza σ2, etc), calculada a partir de los datos observados de toda la población. Estadígrafo Es la medida descriptiva que resume una característica de la muestra (media x , varianza s2, etc), calculada a partir de los datos observados de una muestra aleatoria. Dato Es el resultado de medir una característica observable de una unidad elemental, denominado también, valor observado. 1.5.Variables: concepto y clasificación. Concepto: Se denomina variable estadística una característica definida en la población por la tarea o investigación estadística, que puede tomar dos o más valores (cualidades o numéricos). Ejemplo: Género: masculino, femenino. Estado civil: soltero, casado, viudo, divorciado, conviviente. Número de hermanos: 0, 1, 2,… Clasificación: Las variables se clasifican en cualitativas y cuantitativas. Variables Cualitativas: Son aquellos que están asociados a una cualidad o atributo que presenta una población o muestra. Ejemplo: Género. Estado civil. Raza de ganado. Religión. Variables Cuantitativas: Son aquellos que están asociados a una característica que puede ser medida (valor cuantificable). Los valores cuantitativos pueden ser: Estadística - M.Sc. Emerson D. Norabuena F. 4 Discretos: Es cuando sus valores correspondientes sólo pueden ser expresados por números enteros, con frecuencia son el resultado de la enumeración o del conteo. Ejemplo: Número de hermanos. Número de docentes. Continuas: Es cuando sus valores pueden ser expresados como números reales, con frecuencia es el resultado de la medición. Ejemplo: Talla de un estudiante. Peso de un estudiante. 1.6. Escalas de medición: concepto y clasificación. Concepto: Se denomina escala de medición a un instrumento de medida, con el que se asigna valores (cualidades o números) a las unidades estadísticas para una variable definida, su conocimiento es importante pues cada una de ellas tiene métodos estadísticos específicos. Clasificación: Las escalas de medición se clasifican en: nominal, ordinal, interválica y de razón. Escala Nominal Se define una escala nominal si dos o más valores de una variable, sólo permiten percibir las diferencias o semejanzas de las unidades estadísticas que se midan. Tales valores son como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes entre sí. Ejemplo: Género. Estado civil. Religión. Escala Ordinal Es una escala ordinal donde los valores de la variable se pueden ordenar en forma ascendente o descendente. En una escala ordinal, los valores reflejan el orden de las unidades estadísticas, sólo son válidas las relaciones de igualdad, de no igualdad y de orden. Ejemplo: Nivel educativo. Cargos en una empresa. Escala de Intervalos Estadística - M.Sc. Emerson D. Norabuena F. 5 Son aquellos que suponen un orden y grados de distancia iguales entre las diversas categorías, pero no tienen un origen natural, sino convencional, es decir, tiene el cero relativo. Ejemplo: Coeficiente intelectual. Temperatura. Escala de Razón Es una escala de intervalos con un origen natural, es decir, tiene el cero absoluto. Ejemplo: Talla. Peso. Número de hermanos. 2. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS V.A. CONTINUAS 2.1. Tabla de Distribución de Frecuencias Después de la recopilación de los datos, es necesario resumirlos y representarlos en forma tal, que faciliten su comprensión, su posterior análisis y utilización, para ello se organizan en tablas estadísticas. La tabla de distribución de frecuencia, es el ordenamiento del conjunto de datos en forma de tabla, útil y necesaria para organizar grandes cantidades de datos, con la finalidad de conocer los patrones de comportamiento del conjunto de datos. Las tablas estadísticas presentan ordenadamente los datos en filas y columnas, clasificados y agrupados de acuerdo a un criterio específico 2.1.1. Componentes de la tabla de distribución de frecuencias Una tabla debe contener los siguientes elementos: a. b. c. d. e. Número de tabla. Título. Encabezamiento o conceptos. Cuerpo. Notas al pié o llamadas. Estadística - M.Sc. Emerson D. Norabuena F. 6 Tabla 1 Cantidad de productos agroquímicos por lotes empleados para la producción de Arándano (Vaccinium corimbosum L.) , Yachakuy Perú, 2021. Kilogramos Lotes n % L01 20 40% L02 6 12% L03 3 6% L04 5 10% L05 6 12% L06 10 20% Total 50 100% Nota: Datos tomados de la producción de arándano, Fundo Chingal 2021. 2.1.2. Construcción de la tabla de distribución de frecuencias Considerando que se cuenta con “n” datos y una variable cuantitativa continua “X”, se siguen los siguientes pasos: Paso 1: Alcance o recorrido (A) Es el intervalo definido por el menor y mayor de los datos. [Xmin - Xmax] Xmín Xmáx Paso 2: Rango (R) Es la diferencia entre el mayor y menor dato. R = Xmax - Xmin Paso 3: Número de Intervalos (k) El número de intervalos óptimo, se determina según la regla propuesta por Sturges. k 1 3.32 Log (n) Dónde: n, es el número total de datos Paso 4: Ancho de Clase (w) Es la diferencia que hay entre los extremos de cada intervalo de clase o la división entre el rango y el número de intervalos. w Li 1 Li R k Paso 5: Intervalos de Clase (𝑰𝒊 ) Son intervalos que resultan de particionar el alcance o recorrido. I i [ Li Li 1 , i = 1, 2, 3,…K. Donde: 𝐿𝑖+1 = 𝐿𝑖 + 𝑤 Estadística - M.Sc. Emerson D. Norabuena F. 7 Paso 6: Conteo Es la tabulación de cada uno de los datos en la clase que pertenece Paso 7: Marca de Clase (𝑿′𝒊 ) Son los puntos medios de los intervalos de clase. X i' Li Li 1 2 Paso 8: Frecuencia Absoluta Simple (𝒇𝒊 ) Es el número de datos que cae dentro de cada intervalo. 0 ≤ 𝑓𝑖 ≤ 𝑛 𝑘 𝑛 = ∑ 𝑓𝑖 𝑖=1 Paso 9: Frecuencia Absoluta Acumulada (𝑭𝒊 ) Es aquella que resulta de sumar sucesivamente las frecuencias absolutas simples. i Fi f j , i 1, k j 1 Paso 10: Frecuencia Relativa Simple (𝒉𝒊 ) Es el cociente entre la frecuencia absoluta y el número total de datos. fi n 0 hi 1 hi k h 1 i 1 i Paso 11: Frecuencia Relativa Acumulada (𝑯𝒊 ) Resulta de sumar sucesivamente las frecuencias relativas simples. i Hi hj , i 1, k j 1 Paso 12: Frecuencia Porcentual Simple (𝒑𝒊 ) Resulta de multiplicar la frecuencia relativa simple por 100%. 𝑝𝑖 = ℎ𝑖 × 100% Paso 13: Frecuencia Porcentual Acumulada (𝑷𝒊 ) Resulta de multiplicar la frecuencia relativa acumulada por 100%. 𝑃𝑖 = 𝐻𝑖 × 100% Estadística - M.Sc. Emerson D. Norabuena F. 8 Caso 01: La empresa Yachakuy Perú s.a.c, realizó un estudio de mercado para evaluar el costo de habitaciones por día (S/) para los asistentes al Congreso Nacional de Estudiantes de Ingeniería de Civil, Huaraz 2021. Para dicho estudio fue necesario una muestra piloto de 40 hospedajes y se logró recopilar: 39 47 37 56 43 45 53 39 43 50 60 47 33 43 41 58 44 42 40 54 39 47 33 45 49 50 61 51 45 48 47 51 42 44 58 48 61 43 53 45 a. b. c. d. Construir la tabla de distribución de frecuencias ¿Cuántos hospedajes tienen un precio entre S/ 32 y menos de S/ 37? ¿Cuántos hospedajes tienen un precio superior e igual a S/ 47? ¿Qué porcentaje de hospedajes cuestan menos de S/ 42? Solución I. Datos generales Población objeto de estudio: Hospedajes de la ciudad Huaraz. Muestra: 40 hospedajes de la ciudad de Huaraz Variable de estudio(X): El precio de la habitación por día en soles (S/). Tipo de variable: Cuantitativa continua. Escala de medición: Razón II. Datos de estudio Para la construcción de la tabla d distribución de frecuencias, seguiremos los siguientes pasos: Paso 1: Alcance o recorrido (A) Xmin=33 Xmax=61 Paso 2: Rango (R) R = xmax – xmin = 61–33 = 28 Por lo tanto: R = 28 Paso 3: Número de Intervalos (k) 𝒌 = 1 + 3.32 log(40) = 6,32 Por lo tanto: 𝒌 ≈ 6 Paso 4: Ancho de Clase (w) 𝒘= 28 = 4,6 ≈ 5 6 0 𝑋𝑚𝑎𝑥 = 𝒌𝒘 + 𝑿𝒎𝒊𝒏 = 30 + 33 = 63 Estadística - M.Sc. Emerson D. Norabuena F. 9 𝑿𝟎𝒎𝒂𝒙 = 63 𝑿𝒎𝒂𝒙 = 61 Diferencia 63 – 61 = 2 Luego dividirlo en dos partes (1), sumarle al valor máximo y restarle al valor mínimo. Si dicha diferencia es impar asignarle una unidad más a la parte superior Luego los nuevos límites son: 𝑿∗𝒎𝒂𝒙= Xmax + 1 = 61 + 1 = 62 𝑿∗𝒎𝒊𝒏= Xmin - 1 = 33 - 1 = 32 Xmin = 33 Xmax= 61 ∗ 𝑋𝑚𝑖𝑛 = 32 ∗ 𝑋𝑚𝑎𝑥 = 62 Por lo tanto, la tabla queda de la siguiente manera: Tabla 1 Precio de las habitaciones por día (S/) de los hospedajes de la ciudad de Huaraz, 2018. Precio S/ Tabulación II [32 - 37) VI [37 - 42) XII [42 - 47) XI [47 - 52) IIII [52 - 57) V [57 – 62] 𝑿′𝒊 34,5 39,5 44,5 49,5 54,5 59,5 𝑭𝒊 2 6 12 11 4 5 n = 40 𝒇𝒊 2 8 20 31 35 40 𝑯𝒊 0,050 0,150 0,300 0,275 0,100 0,125 𝒉𝒊 0,050 0,200 0,500 0,775 0,875 1.000 𝑷% 5% 15% 30% 28% 10% 12% 𝒑% 5% 20% 50% 78% 88% 100% 1.000 2.2. Gráficas Estadísticos La representación gráfica se utiliza para facilitar al lector la comprensión de los resultados; el objetivo de las gráficas es que la información “impacte” directamente al lector y que se exprese el “perfil” de la distribución. - El diagrama de barras o rectángulos, consistente en asociar a cada modalidad de la variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en horizontal y la escala de frecuencias absolutas o relativas en vertical. Los rectángulos suelen representarse separados en este tipo de gráficas, que también pueden aparecer con las barras horizontales y las modalidades situadas verticalmente. También es usada para variables discretas. Estadística - M.Sc. Emerson D. Norabuena F. 10 - El diagrama de sectores, que refleja como sectores de un círculo las frecuencias de cada modalidad. Como el radio es constante en un círculo, para cumplir la regla fundamental de proporcionalidad basta hacer al ángulo de cada sector proporcional a la frecuencia, lo que se consigue multiplicando los 360º del círculo por la frecuencia relativa de cada modalidad. Este tipo de gráficas es muy útil para comparar los resultados de una variable cualitativa en dos o más muestras. - El histograma, que es la gráfica adecuada para representar variables cuantitativas continuas. En la práctica, lo que se hace es agrupar los valores en intervalos y gráficamente se representan rectángulos cuyas bases descansan sobre la horizontal y cuyas alturas son tales que el área de cada rectángulo sea proporcional a la frecuencia de cada intervalo. - Polígono de frecuencias, es la recta que une los extremos de las variables de una distribución. Estadística - M.Sc. Emerson D. Norabuena F. 11 - Ojivas, En este gráfico se emplea un polígono de frecuencia o curva suavizada con una característica muy particular: muestra las frecuencias absolutas o relativas acumuladas. 2.3. Medidas de Tendencia Central Media o Promedio aritmético ( x ) Es el cociente entre la suma de todos los datos y el número de ellos (teniendo en cuenta que si un valor se repite hay que considerar estas repeticiones). Datos sin agrupar Datos agrupados n x x i 1 m fX i n x i 1 i ' i n Mediana (Me): Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales. Datos sin agrupar xn xn 1 2 2 , si 2 Me x n1 , si n 2 n es es impar par Estadística - M.Sc. Emerson D. Norabuena F. 12 Datos agrupados Fi 1 n Fi 2 n Fi 1 M e Li wi 2 fi Donde: Li : Límite inferior del intervalo i. wi : Ancho de clase del intervalo i. Moda (Mo): Es el valor de la variable que más veces se repite. En algunos casos existen varias modas. Datos sin agrupar La moda es el valor de la variable correspondiente a la mayor frecuencia absoluta. Datos agrupados f i f i 1 M o Li wi ( f i f i 1 ) ( f i f i 1 ) Dónde: f i = Frecuencia absoluta más alta. Estadística - M.Sc. Emerson D. Norabuena F. 13 Feedback Casos de estudio a. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2002 son los siguientes: 440 560 335 587 613 400 424 466 565 393 Construya la tabla de frecuencia. 453 650 407 376 470 560 321 500 528 526 Identifique la población, muestra y la variable, 570 430 618 537 409 600 550 432 591 428 obtener X ,𝑀𝑒 y 𝑀𝑜 . 440 340 558 460 560 607 382 667 512 492 450 530 501 471 660 470 364 634 580 450 574 500 462 380 518 480 625 507 645 382 b. Se distribuye el número de empresas según sus inversiones en millones de soles. [𝐿𝑖 − 𝐿𝑖+1 > 𝑓𝑖 4 – 10 1 10 – 16 3 16 – 22 6 22 – 28 12 28 – 34 11 34 – 40 5 40 – 46 2 ¿Cuántas empresas intervienen en menos de 25 millones de soles?, obtener X ,𝑀𝑒 y 𝑀𝑜 . c. Se tiene las temperaturas observadas en el hemisferio norte durante 24 días en °C. [𝐿𝑖 − 𝐿𝑖+1 > 𝑓𝑖 ℎ𝑖 -19 - -17 -17 – -15 2 -15 – -13 8 -13 – -11 0.125 -11 – -9 4 -9 – -7 0.2083 ¿Durante cuántos días se obtuvo una temperatura de –16 a –10? , obtener X ,𝑀𝑒 y 𝑀𝑜 . d. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente número de artículos defectuosos por lote: 3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3 Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de lotes tienen 2 o más pero menos de 4 artículos defectuosos? Estadística - M.Sc. Emerson D. Norabuena F. 14 e. Dado el siguiente cuadro estadístico referente a los pesos de cierto número de pacientes en un hospital. [𝐿𝑖 − 𝐿𝑖+1 > 𝑓𝑖 0 – 12 5 12 – 24 24 24 – 36 18 36 – 48 36 48 - 60 17 ¿Cuántos pacientes pesan más de 19 y menos de 38 kilos?, obtener X ,𝑀𝑒 y 𝑀𝑜 . En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el siguiente histograma de frecuencias, entonces la nota promedio del curso es: 16 14 12 10 8 6 4 2 0 Alumnos Notas 4 6 8 10 12 14 f. Al calcular la media de 125 datos, resultó 42. Un chequeo posterior mostró que en lugar del valor 12.4 se introdujo 124. Corregir la media. g. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la moda es 60 y pertenece al tercer intervalo. Calcular además, X ,𝑀𝑒 [𝐿𝑖 − 𝐿𝑖+1 > 16 – 32 32 – 48 48 – 64 64 – 80 80 - 96 𝑓𝑖 6 n 8 3n 3 h. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de familias se obtuvo la siguiente información: [𝐿𝑖 − 𝐿𝑖+1 > 10 – 30 30 – 50 50 – 70 70 90 𝑓𝑖 20 20 Estadística - M.Sc. Emerson D. Norabuena F. 15 Además, x 54 y f 2 / f 3 1 / 5 , calcular el número de familias con ingreso no menos de 50 mil soles. i. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la mediana vale 61.6 y que pertenece al quinto intervalo. [𝐿𝑖 − 𝐿𝑖+1 > 20 – 30 30 – 40 40 – 50 𝑓𝑖 3 1 2 j. De una muestra de tamaño tres se sabe: la suma de los cubos de las tres observaciones es 1971, la media aritmética es 7 y la mediana es 6. Calcular el valor de cada una de las observaciones. k. De las edades de cuatro personas, se sabe que la media es igual a 24 años, la mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas. l. De la curva de frecuencias de los sueldos de 30 empleados de una empresa, se sabe que Mo =$200, Me =$220, y X =$250. Califique como verdadera o falsa las siguientes afirmaciones, justificando su respuesta: a) El sueldo más frecuente es de $200 y más de la mitad de todos empleados gana más de esa cantidad. b) Con una suma de $3,300 se asegura el pago de la mitad de los empleados y con $7,500 el de todos los empleados. m. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la mediana vale 36 y que pertenece al tercer intervalo. [𝐿𝑖 − 𝐿𝑖+1 > 20 – 26 26 – 32 32 – 38 38 – 44 44 - 50 𝑓𝑖 8 4 n 6 10 n. Las notas de un examen se presentan a continuación: 09, 18, 12, 16, 10, 11, 12, 14, 17, 12, 15, 07. Calcular e interpretar: X ,𝑀𝑒 y 𝑀𝑜 Estadística - M.Sc. Emerson D. Norabuena F. 16 o. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 familias. [𝐿𝑖 − 𝑓𝑖 𝐹𝑖 𝐿𝑖+1 > 12 - 270 - 300 30 90 126 330 50 ¿Cuántas familias tienen un ingreso comprendido entre 260 y 320? p. Se tiene la siguiente distribución simétrica. [𝐿𝑖 − 𝐿𝑖+1 > 12 - 24 - 𝑓𝑖 𝐹𝑖 ℎ𝑖 8 1/5 17 Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo [12 – 20>? q. Completar el siguiente cuadro que corresponden a las notas de un examen: Intervalos Marca de clase 6 𝐻𝑖 0.15 - 0.45 - 0.70 - 13.5 Total ℎ𝑖 0.10 - - ¿Qué porcentaje de notas se encuentran aproximadamente en el intervalo de 8 – 14? r. En una compañía en sueldo mínimo y máximo de 200 empleados es de $150 y $300 respectivamente. Tales sueldos se tabulan en una distribución de frecuencias de 5 intervalos de igual amplitud. Si se sabe que 20 empleados ganan al menos $150, pero menos de $180, 60 ganan menos de $210, 110 ganan menos de $240, 180 ganan menos Estadística - M.Sc. Emerson D. Norabuena F. 17 de $270 y el 10% restante de empleados gana a lo más $300; reconstruir la distribución de frecuencias. s. La organización del tiempo, en minutos, que tardaron 100 obreros para ejecutar cierta tarea, ha dado una tabla de frecuencias de cuatro intervalos de igual amplitud cuyo histograma correspondiente es simétrico. Si el intervalo 1 = [6, >, la frecuencia absoluta: 𝑓2 = 2𝑓1 + 5, y si se sabe que el 85% de los obreros demoraron menos de 12 minutos. Completar la distribución de frecuencias. t. Las notas de un examen se tabularon en una distribución de frecuencias de 3 intervalos de amplitud iguales a 5. si la nota mínima es igual a 5, el 48% de las notas son menores que 12, y si el 80% de las notas con inferiores a 16, reconstruir la distribución de frecuencias. Estadística - M.Sc. Emerson D. Norabuena F. 18 Seminario a. Realice una distribución de frecuencias para cada uno de los siguientes conjuntos de datos, que contenga Frecuencias: Absoluta; Relativa; Acumulada; Relativa Acumulada; además realice un gráfico adecuado e interprete los resultados Los siguientes datos representan la distancia en Km. que recorren diariamente 30 personas desde sus casas a los sitios de trabajo: 2,0 1,5 1,6 3,0 4,0 6,0 0,3 5,9 5,6 3,3 1,8 6,0 1,3 4,7 1,2 0,4 0,7 0,2 0,2 4,5 2,0 6,0 0,3 1,5 5,5 1,5 1,6 6,5 0,5 2,3 0,2 2,5 5,0 b. Los contenidos de nicotina, en miligramos, hallados en los dedos de 40 fumadores se registran a continuación: 1,09 1,70 1,71 1,72 1,92 2,17 1,85 2,09 2,31 2,55 1,82 1,75 1,79 2,11 1,79 1,63 2,28 1,86 2,46 2,37 1,74 1,90 1,88 1,75 1,47 1,68 2,08 1,69 1,97 1,51 1,67 1,58 0,85 2,03 1,37 0,72 1,24 1,64 1,93 1,40 c. Los siguientes datos pertenecen a la distribución de la producción de papas (en Tn.) en 40 zonas del país. 𝑋1′ = 20 𝑓2 - 𝑓5 = 2 𝑋5′ = 100 𝑓1= 4 𝑓3 = 20 Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase. Reconstruya los intervalos de clase y obtenga las frecuencias absolutas y relativas. Nº de pares vendidos d. La siguiente gráfica recoge la cantidad de parejas de zapatos de mujer vendidas en una tienda a lo largo del día: 35 30 25 20 15 10 5 0 36 37 38 39 40 Nº de zapato - ¿Cuántas parejas de zapatos del número 37 se han vendido? Pasa los datos a una tabla de frecuencias absolutas. ¿Cómo se llama la gráfica que nos han dado? ¿Qué porcentaje de zapatos vendidos eran números del 39 o 40? Estadística - M.Sc. Emerson D. Norabuena F. 19 e. En la tabla de frecuencias que se da a continuación faltan algunos datos. Complétela, y represéntela gráficamente. Valores 0 1 2 3 4 5 Total 𝑿′𝒊 𝒇𝒊 𝑭𝒊 2 5 9 14 𝒉𝒊 𝑯𝒊 0,70 0,20 f. En la tabla de frecuencia que se brinda a continuación faltan algunos datos. Complétela y represéntela gráficamente. Clases 20 - 24 24 - 28 - 32 32 - 40 Total - 𝑋𝑖′ 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 0.10 0.25 0.55 0.85 1.00 11 Obtener el porcentaje de datos que se encuentran entre 22 a 30. g. El siguiente cuadro de distribución de frecuencias representa a la cantidad de residuos orgánicos (en kilogramos) que generan en un día 40 familias de la Ciudad de Huaraz. Valores -8 - 17 Total - 𝑋𝑖′ 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖 5 24 0,20 0,90 1,00 Complete el cuadro, y calcule el porcentaje de familias que generan en un día entre 10,5 a 15,5 kilogramos de residuos orgánicos h. Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mínima ganancia es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el 50% de los establecimientos ganan más de 25.58 dólares diarios, 𝐻2 =0.15, 𝐹2 =120, ℎ3 =0.25, 𝐻5 =0.93, 𝑓4 =304, 𝑓2 =2𝑓1. Reconstruir la distribución de todas las frecuencias. Estadística - M.Sc. Emerson D. Norabuena F. 20 i. Los tiempos de vida útil (en días) de un tipo de batería, se tabuló en una distribución de 5 intervalos de igual amplitud con frecuencias relativas acumuladas: 0.10, 0.25, 0.55, 0.80, 1.00. Determine la distribución de frecuencias absolutas si la tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el límite inferior del cuarto intervalo es 12. j. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución de frecuencias simétrica de 5 intervalos de igual amplitud resultando: ingreso mínimo $125, marca de clase del cuarto intervalo $300. Si el 8% de los ingresos son menores que $165 y el 70% de los ingresos son menores a $275, ¿Qué porcentaje de ingresos son superiores a $285? k. El tiempo (en horas) de 120 familias que utilizan su computadora se tabularon en una distribución de frecuencias de 5 intervalos de amplitud iguales a 4, siendo; el tiempo mínimo de uso 2 horas, la primera y segunda frecuencias iguales al 10% y 15% del total de casos respectivamente. Si el 73.75% de las familias lo usaron menos de 17 horas y el 85% menos de 19 horas, determine las frecuencias. l. Los puntajes de una prueba de aptitud se tabularon en una distribución de frecuencias de 6 intervalos de igual amplitud. Si se tienen: marca de clases dos y cuatro, 40 y 80 respectivamente, frecuencias: , ℎ1 =, ℎ6 , , ℎ3 =, ℎ5 , , ℎ4 =0.25, ℎ2 = ℎ4 - ℎ1 , ℎ3 = ℎ1 +0.10 y 𝐹6 = 60, completar la distribución de frecuencias absolutas. Estadística - M.Sc. Emerson D. Norabuena F. 21