Subido por Emerson Damián Norabuena Figueroa

Manual Estadística (1)

Anuncio
ESTADÍSTICA
UNIDAD I
RECOLECCIÓN, ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.
1.8.
Introducción a la Estadística.
Estadística: definición y clasificación.
El método estadístico.
Conceptos básicos.
Variables: concepto y clasificación.
Escalas de medición: concepto y clasificación.
Cuadros estadísticos.
Gráficos estadísticos.
1.1. Introducción a la Estadística
Aunque no existe una definición rigurosa, o más bien existen varias, para nuestro estudio
definiremos la Estadística como “parte del método científico que, mediante el análisis
matemático de conjuntos numéricos, nos permite obtener información sobre la realidad
que nos rodea”.
La estadística es tan antigua como el hombre puesto que las primeras sociedades
organizadas ya sentían la necesidad de contar con datos numéricos de su población y sus
condiciones materiales de existencia. Sin embargo es en el siglo XVII cuando cobra
interés en los modernos países europeos el estudio de censos económicos, militares y de
cualquier aspecto relacionado con la población.
Aunque el hueso de astrágalo sitúa los juegos de azar en los albores de la humanidad, el
estudio de este tipo de problemas podemos datarlo también en el siglo XVII con la
correspondencia entre Fermat y Pascal a propósito de las cuestiones planteadas por el
Caballero de Méré sobre ciertas apuestas en juegos con dados.
Dado el fundamento matemático de estas dos partes de la Estadística, es en el siglo XIX
cuando ambas se desarrollan vertiginosamente siguiendo la estela del desarrollo
matemático de esta época. Con la conciencia de que se posee potentes herramientas que
se desperdician en juegos de azar y contabilidad de existencias, llegamos al siglo XX
donde ambas disciplinas, que hasta el momento habían seguido caminos separados, se
unen para dar lugar a la Estadística moderna.
El objetivo de nuestras aplicaciones estadísticas será un mejor conocimiento sobre
alguna(s) característica(s) de cierto conjunto de elementos, generalmente de tamaño
inabordable, por lo que se experimentará sólo sobre alguno de ellos, obteniendo una serie
de datos u observaciones que nos darán información sobre dicho subconjunto,
información que bajo ciertas condiciones será extrapolable al conjunto total.
Estadística - M.Sc. Emerson D. Norabuena F.
2
1.2. Estadística: definición y clasificación.
Definición:
La Estadística es una ciencia que permite a través de un conjunto de métodos y
procedimientos recopilar, clasificar y describir los datos en forma adecuada, para luego
tomar decisiones o predecir algo acerca de la población a partir de los datos extraídos de
la misma.
TEORÍA DE
MUESTREO
POBLACIÓN
MUESTRA
INFERENCIA
ESTADÍSTICA
ESTADÍSTICA
ESCRIPTIVA
Clasificación:
La Estadística se clasifica en: estadística descriptiva e inferencial.
Estadística Descriptiva
Trata de la planificación, recopilación, organización, presentación, análisis e interpretación
de los datos.
Estadística Inferencial
Nos proporciona la teoría necesaria para afirmar acerca de las características de la población
en base a los datos extraídos a partir de una muestra.
1.3. El método estadístico.
La aplicación de la Estadística a un problema determinado, comprende las siguientes etapas:
 Planificación del estudio: planificar es esencial no sólo para calcular el tiempo que
durará la investigación, el personal que se requiere y el presupuesto necesario, sino con
el fin de que la investigación se realice con metas perfectamente definidas.
 Recolección de datos.
 Organización de datos.
 Presentación de datos.
 Análisis e interpretación de los resultados.
1.4. Conceptos básicos.
Población
Se denomina población a un conjunto de elementos (personas, objetos, etc) que contienen
una o más características observables de naturaleza cualitativa o cuantitativa que se pueden
medir en ellos.
Estadística - M.Sc. Emerson D. Norabuena F.
3
Muestra
Es un subconjunto de la población que es tomada aleatoriamente, para ser estudiada
como parte representativa de la población.
Unidad de muestreo
Elemento sobre el que se aplicará la técnica de selección.
Unidad de análisis
Es el elemento indivisible que será estudiado en una población.
Parámetro
Es la medida descriptiva que resume una característica de la población (media μ,
varianza σ2, etc), calculada a partir de los datos observados de toda la población.
Estadígrafo
Es la medida descriptiva que resume una característica de la muestra (media x ,
varianza s2, etc), calculada a partir de los datos observados de una muestra aleatoria.
Dato
Es el resultado de medir una característica observable de una unidad elemental,
denominado también, valor observado.
1.5.Variables: concepto y clasificación.
Concepto:
Se denomina variable estadística una característica definida en la población por la
tarea o investigación estadística, que puede tomar dos o más valores (cualidades o
numéricos).
Ejemplo:
 Género: masculino, femenino.
 Estado civil: soltero, casado, viudo, divorciado, conviviente.
 Número de hermanos: 0, 1, 2,…
Clasificación:
Las variables se clasifican en cualitativas y cuantitativas.
Variables Cualitativas: Son aquellos que están asociados a una cualidad o atributo
que presenta una población o muestra.
Ejemplo:
 Género.
 Estado civil.
 Raza de ganado.
 Religión.
Variables Cuantitativas: Son aquellos que están asociados a una característica que
puede ser medida (valor cuantificable). Los valores cuantitativos pueden ser:
Estadística - M.Sc. Emerson D. Norabuena F.
4
 Discretos: Es cuando sus valores correspondientes sólo pueden ser expresados por
números enteros, con frecuencia son el resultado de la enumeración o del conteo.
Ejemplo:
 Número de hermanos.
 Número de docentes.
 Continuas: Es cuando sus valores pueden ser expresados como números reales, con
frecuencia es el resultado de la medición.
Ejemplo:
 Talla de un estudiante.
 Peso de un estudiante.
1.6. Escalas de medición: concepto y clasificación.
Concepto:
Se denomina escala de medición a un instrumento de medida, con el que se asigna valores
(cualidades o números) a las unidades estadísticas para una variable definida, su
conocimiento es importante pues cada una de ellas tiene métodos estadísticos específicos.
Clasificación:
Las escalas de medición se clasifican en: nominal, ordinal, interválica y de razón.
Escala Nominal
Se define una escala nominal si dos o más valores de una variable, sólo permiten percibir
las diferencias o semejanzas de las unidades estadísticas que se midan. Tales valores son
como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí.
Ejemplo:
 Género.
 Estado civil.
 Religión.
Escala Ordinal
Es una escala ordinal donde los valores de la variable se pueden ordenar en forma
ascendente o descendente. En una escala ordinal, los valores reflejan el orden de las
unidades estadísticas, sólo son válidas las relaciones de igualdad, de no igualdad y de orden.
Ejemplo:
 Nivel educativo.
 Cargos en una empresa.
Escala de Intervalos
Estadística - M.Sc. Emerson D. Norabuena F.
5
Son aquellos que suponen un orden y grados de distancia iguales entre las diversas
categorías, pero no tienen un origen natural, sino convencional, es decir, tiene el cero
relativo.
Ejemplo:
 Coeficiente intelectual.
 Temperatura.
Escala de Razón
Es una escala de intervalos con un origen natural, es decir, tiene el cero absoluto.
Ejemplo:
 Talla.
 Peso.
 Número de hermanos.
2. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS V.A. CONTINUAS
2.1. Tabla de Distribución de Frecuencias
Después de la recopilación de los datos, es necesario resumirlos y representarlos en forma tal,
que faciliten su comprensión, su posterior análisis y utilización, para ello se organizan en
tablas estadísticas.
La tabla de distribución de frecuencia, es el ordenamiento del conjunto de datos en forma de
tabla, útil y necesaria para organizar grandes cantidades de datos, con la finalidad de conocer
los patrones de comportamiento del conjunto de datos.
Las tablas estadísticas presentan ordenadamente los datos en filas y columnas, clasificados y
agrupados de acuerdo a un criterio específico
2.1.1. Componentes de la tabla de distribución de frecuencias
Una tabla debe contener los siguientes elementos:
a.
b.
c.
d.
e.
Número de tabla.
Título.
Encabezamiento o conceptos.
Cuerpo.
Notas al pié o llamadas.
Estadística - M.Sc. Emerson D. Norabuena F.
6
Tabla 1
Cantidad de productos agroquímicos por lotes empleados para la producción de
Arándano (Vaccinium corimbosum L.) , Yachakuy Perú, 2021.
Kilogramos
Lotes
n
%
L01
20
40%
L02
6
12%
L03
3
6%
L04
5
10%
L05
6
12%
L06
10
20%
Total
50
100%
Nota: Datos tomados de la producción de arándano, Fundo Chingal 2021.
2.1.2. Construcción de la tabla de distribución de frecuencias
Considerando que se cuenta con “n” datos y una variable cuantitativa continua “X”, se siguen
los siguientes pasos:
Paso 1: Alcance o recorrido (A)
Es el intervalo definido por el menor y mayor de los datos. [Xmin - Xmax]
Xmín
Xmáx
Paso 2: Rango (R)
Es la diferencia entre el mayor y menor dato.
R = Xmax - Xmin
Paso 3: Número de Intervalos (k)
El número de intervalos óptimo, se determina según la regla propuesta por Sturges.
k  1  3.32 Log (n)
Dónde: n, es el número total de datos
Paso 4: Ancho de Clase (w)
Es la diferencia que hay entre los extremos de cada intervalo de clase o la división entre el
rango y el número de intervalos.
w  Li 1  Li 
R
k
Paso 5: Intervalos de Clase (𝑰𝒊 )
Son intervalos que resultan de particionar el alcance o recorrido.
I i  [ Li  Li 1  , i = 1, 2, 3,…K.
Donde: 𝐿𝑖+1 = 𝐿𝑖 + 𝑤
Estadística - M.Sc. Emerson D. Norabuena F.
7
Paso 6: Conteo
Es la tabulación de cada uno de los datos en la clase que pertenece
Paso 7: Marca de Clase (𝑿′𝒊 )
Son los puntos medios de los intervalos de clase.
X i' 
Li  Li 1
2
Paso 8: Frecuencia Absoluta Simple (𝒇𝒊 )
Es el número de datos que cae dentro de cada intervalo.
0 ≤ 𝑓𝑖 ≤ 𝑛
𝑘
𝑛 = ∑ 𝑓𝑖
𝑖=1
Paso 9: Frecuencia Absoluta Acumulada (𝑭𝒊 )
Es aquella que resulta de sumar sucesivamente las frecuencias absolutas simples.
i
Fi   f j ,
i  1, k
j 1
Paso 10: Frecuencia Relativa Simple (𝒉𝒊 )
Es el cociente entre la frecuencia absoluta y el número total de datos.
fi
n
0  hi  1
hi 
k
h 1
i 1
i
Paso 11: Frecuencia Relativa Acumulada (𝑯𝒊 )
Resulta de sumar sucesivamente las frecuencias relativas simples.
i
Hi   hj ,
i  1, k
j 1
Paso 12: Frecuencia Porcentual Simple (𝒑𝒊 )
Resulta de multiplicar la frecuencia relativa simple por 100%.
𝑝𝑖 = ℎ𝑖 × 100%
Paso 13: Frecuencia Porcentual Acumulada (𝑷𝒊 )
Resulta de multiplicar la frecuencia relativa acumulada por 100%.
𝑃𝑖 = 𝐻𝑖 × 100%
Estadística - M.Sc. Emerson D. Norabuena F.
8
Caso 01:
La empresa Yachakuy Perú s.a.c, realizó un estudio de mercado para evaluar el costo de
habitaciones por día (S/) para los asistentes al Congreso Nacional de Estudiantes de Ingeniería
de Civil, Huaraz 2021. Para dicho estudio fue necesario una muestra piloto de 40 hospedajes y
se logró recopilar:
39 47 37 56 43 45 53 39 43 50
60 47 33 43 41 58 44 42 40 54
39 47 33 45 49 50 61 51 45 48
47 51 42 44 58 48 61 43 53 45
a.
b.
c.
d.
Construir la tabla de distribución de frecuencias
¿Cuántos hospedajes tienen un precio entre S/ 32 y menos de S/ 37?
¿Cuántos hospedajes tienen un precio superior e igual a S/ 47?
¿Qué porcentaje de hospedajes cuestan menos de S/ 42?
Solución
I. Datos generales





Población objeto de estudio: Hospedajes de la ciudad Huaraz.
Muestra: 40 hospedajes de la ciudad de Huaraz
Variable de estudio(X): El precio de la habitación por día en soles (S/).
Tipo de variable: Cuantitativa continua.
Escala de medición: Razón
II. Datos de estudio
Para la construcción de la tabla d distribución de frecuencias, seguiremos los siguientes pasos:
Paso 1: Alcance o recorrido (A)
Xmin=33
Xmax=61
Paso 2: Rango (R)
R = xmax – xmin = 61–33 = 28
Por lo tanto: R = 28
Paso 3: Número de Intervalos (k)
𝒌 = 1 + 3.32 log(40) = 6,32
Por lo tanto: 𝒌 ≈ 6
Paso 4: Ancho de Clase (w)
𝒘=
28
= 4,6 ≈ 5
6
0
𝑋𝑚𝑎𝑥
= 𝒌𝒘 + 𝑿𝒎𝒊𝒏 = 30 + 33 = 63
Estadística - M.Sc. Emerson D. Norabuena F.
9
𝑿𝟎𝒎𝒂𝒙 = 63
𝑿𝒎𝒂𝒙 = 61
Diferencia
63 – 61 = 2
Luego dividirlo en dos partes (1), sumarle al valor máximo y restarle al valor mínimo.
Si dicha diferencia es impar asignarle una unidad más a la parte superior
Luego los nuevos límites son:
𝑿∗𝒎𝒂𝒙= Xmax + 1 = 61 + 1 = 62
𝑿∗𝒎𝒊𝒏= Xmin - 1 = 33 - 1 = 32
Xmin = 33
Xmax= 61
∗
𝑋𝑚𝑖𝑛
= 32
∗
𝑋𝑚𝑎𝑥
= 62
Por lo tanto, la tabla queda de la siguiente manera:
Tabla 1
Precio de las habitaciones por día (S/) de los hospedajes de la ciudad de Huaraz, 2018.
Precio S/ Tabulación
II
[32 - 37)
VI
[37 - 42)
XII
[42 - 47)
XI
[47 - 52)
IIII
[52 - 57)
V
[57 – 62]
𝑿′𝒊
34,5
39,5
44,5
49,5
54,5
59,5
𝑭𝒊
2
6
12
11
4
5
n = 40
𝒇𝒊
2
8
20
31
35
40
𝑯𝒊
0,050
0,150
0,300
0,275
0,100
0,125
𝒉𝒊
0,050
0,200
0,500
0,775
0,875
1.000
𝑷%
5%
15%
30%
28%
10%
12%
𝒑%
5%
20%
50%
78%
88%
100%
1.000
2.2. Gráficas Estadísticos
La representación gráfica se utiliza para facilitar al lector la comprensión de los
resultados; el objetivo de las gráficas es que la información “impacte” directamente al
lector y que se exprese el “perfil” de la distribución.
- El diagrama de barras o rectángulos, consistente en asociar a cada modalidad de la
variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen
situar en horizontal y la escala de frecuencias absolutas o relativas en vertical. Los
rectángulos suelen representarse separados en este tipo de gráficas, que también pueden
aparecer con las barras horizontales y las modalidades situadas verticalmente. También
es usada para variables discretas.
Estadística - M.Sc. Emerson D. Norabuena F.
10
- El diagrama de sectores, que refleja como sectores de un círculo las frecuencias de
cada modalidad. Como el radio es constante en un círculo, para cumplir la regla
fundamental de proporcionalidad basta hacer al ángulo de cada sector proporcional a la
frecuencia, lo que se consigue multiplicando los 360º del círculo por la frecuencia relativa
de cada modalidad. Este tipo de gráficas es muy útil para comparar los resultados de una
variable cualitativa en dos o más muestras.
- El histograma, que es la gráfica adecuada para representar variables cuantitativas
continuas. En la práctica, lo que se hace es agrupar los valores en intervalos y
gráficamente se representan rectángulos cuyas bases descansan sobre la horizontal y
cuyas alturas son tales que el área de cada rectángulo sea proporcional a la frecuencia de
cada intervalo.
- Polígono de frecuencias, es la recta que une los extremos de las variables de una
distribución.
Estadística - M.Sc. Emerson D. Norabuena F.
11
- Ojivas, En este
gráfico se emplea un polígono de
frecuencia o curva suavizada con una característica muy particular: muestra las
frecuencias absolutas o relativas acumuladas.
2.3. Medidas de Tendencia Central
Media o Promedio aritmético ( x )
Es el cociente entre la suma de todos los datos y el número de ellos (teniendo en cuenta
que si un valor se repite hay que considerar estas repeticiones).
Datos sin agrupar
Datos agrupados
n
x
x
i 1
m
fX
i
n
x  i 1
i
'
i
n
Mediana (Me):
Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal
forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el
número de datos es impar la mediana será el valor central, si es par tomaremos como
mediana la media aritmética de los dos valores centrales.
Datos sin agrupar
 xn  xn
1
 2
2
, si

2
Me  

 x n1 , si n
2

n
es
es
impar
par
Estadística - M.Sc. Emerson D. Norabuena F.
12
Datos agrupados
Fi 1 
n
 Fi
2
n

  Fi 1 

M e  Li  wi  2
 fi 




Donde:
Li : Límite inferior del intervalo i.
wi : Ancho de clase del intervalo i.
Moda (Mo):
Es el valor de la variable que más veces se repite. En algunos casos existen varias modas.
Datos sin agrupar
La moda es el valor de la variable correspondiente a la mayor frecuencia absoluta.
Datos agrupados


f i  f i 1

M o  Li  wi 
 ( f i  f i 1 )  ( f i  f i 1 ) 
Dónde: f i = Frecuencia absoluta más alta.
Estadística - M.Sc. Emerson D. Norabuena F.
13
Feedback
Casos de estudio
a. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en
el año 2002 son los siguientes:
440 560 335 587 613 400 424 466 565 393
 Construya la tabla de frecuencia.
453 650 407 376 470 560 321 500 528 526
 Identifique la población, muestra y la variable,
570 430 618 537 409 600 550 432 591 428
obtener X ,𝑀𝑒 y 𝑀𝑜 .
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
b. Se distribuye el número de empresas según sus inversiones en millones de soles.
[𝐿𝑖 − 𝐿𝑖+1 >
𝑓𝑖
4 – 10
1
10 – 16
3
16 – 22
6
22 – 28
12
28 – 34
11
34 – 40
5
40 – 46
2
¿Cuántas empresas intervienen en menos de 25 millones de soles?, obtener X ,𝑀𝑒 y 𝑀𝑜 .
c. Se tiene las temperaturas observadas en el hemisferio norte durante 24 días en °C.
[𝐿𝑖 − 𝐿𝑖+1 > 𝑓𝑖
ℎ𝑖
-19 - -17
-17 – -15
2
-15 – -13
8
-13 – -11
0.125
-11 – -9
4
-9 – -7
0.2083
¿Durante cuántos días se obtuvo una temperatura de –16 a –10? , obtener X ,𝑀𝑒 y 𝑀𝑜 .
d. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente número de
artículos defectuosos por lote:
3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3
Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de lotes tienen 2 o
más pero menos de 4 artículos defectuosos?
Estadística - M.Sc. Emerson D. Norabuena F.
14
e. Dado el siguiente cuadro estadístico referente a los pesos de cierto número de pacientes
en un hospital.
[𝐿𝑖 − 𝐿𝑖+1 >
𝑓𝑖
0 – 12
5
12 – 24
24
24 – 36
18
36 – 48
36
48 - 60
17
¿Cuántos pacientes pesan más de 19 y menos de 38 kilos?, obtener X ,𝑀𝑒 y 𝑀𝑜 .
En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el
siguiente histograma de frecuencias, entonces la nota promedio del curso es:
16
14
12
10
8
6
4
2
0
Alumnos
Notas
4
6
8
10
12
14
f. Al calcular la media de 125 datos, resultó 42. Un chequeo posterior mostró que en lugar
del valor 12.4 se introdujo 124. Corregir la media.
g. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la
moda es 60 y pertenece al tercer intervalo. Calcular además, X ,𝑀𝑒
[𝐿𝑖 − 𝐿𝑖+1 >
16 – 32
32 – 48
48 – 64
64 – 80
80 - 96
𝑓𝑖
6
n
8
3n
3
h. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de familias
se obtuvo la siguiente información:
[𝐿𝑖 −
𝐿𝑖+1 >
10 –
30
30 –
50
50 –
70
70 90
𝑓𝑖
20
20
Estadística - M.Sc. Emerson D. Norabuena F.
15
Además, x  54 y f 2 / f 3  1 / 5 , calcular el número de familias con ingreso no menos
de 50 mil soles.
i. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la

mediana vale 61.6 y que pertenece al quinto intervalo.
[𝐿𝑖 − 𝐿𝑖+1 >
20 – 30
30 – 40
40 – 50
𝑓𝑖
3
1
2
j. De una muestra de tamaño tres se sabe: la suma de los cubos de las tres observaciones
es 1971, la media aritmética es 7 y la mediana es 6. Calcular el valor de cada una de
las observaciones.
k. De las edades de cuatro personas, se sabe que la media es igual a 24 años, la mediana
es 23 y la moda es 22. Encuentre las edades de las cuatro personas.
l. De la curva de frecuencias de los sueldos de 30 empleados de una empresa, se sabe que
Mo =$200, Me =$220, y X =$250. Califique como verdadera o falsa las siguientes
afirmaciones, justificando su respuesta:
a) El sueldo más frecuente es de $200 y más de la mitad de todos empleados gana más
de esa cantidad.
b) Con una suma de $3,300 se asegura el pago de la mitad de los empleados y con
$7,500 el de todos los empleados.
m. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la
mediana vale 36 y que pertenece al tercer intervalo.
[𝐿𝑖 − 𝐿𝑖+1 >
20 – 26
26 – 32
32 – 38
38 – 44
44 - 50
𝑓𝑖
8
4
n
6
10
n. Las notas de un examen se presentan a continuación: 09, 18, 12, 16, 10, 11, 12, 14, 17,
12, 15, 07. Calcular e interpretar: X ,𝑀𝑒 y 𝑀𝑜
Estadística - M.Sc. Emerson D. Norabuena F.
16
o. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200
familias.
[𝐿𝑖 −
𝑓𝑖
𝐹𝑖
𝐿𝑖+1 >
12
- 270
- 300
30
90
126
330 50
¿Cuántas familias tienen un ingreso comprendido entre 260 y 320?
p. Se tiene la siguiente distribución simétrica.
[𝐿𝑖 −
𝐿𝑖+1 >
12 - 24
-
𝑓𝑖
𝐹𝑖
ℎ𝑖
8
1/5
17
Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo [12 – 20>?
q. Completar el siguiente cuadro que corresponden a las notas de un examen:
Intervalos
Marca
de
clase
6
𝐻𝑖
0.15
-
0.45
-
0.70
-
13.5
Total
ℎ𝑖
0.10
-
-
¿Qué porcentaje de notas se encuentran aproximadamente en el intervalo de 8 – 14?
r. En una compañía en sueldo mínimo y máximo de 200 empleados es de $150 y $300
respectivamente. Tales sueldos se tabulan en una distribución de frecuencias de 5
intervalos de igual amplitud. Si se sabe que 20 empleados ganan al menos $150, pero
menos de $180, 60 ganan menos de $210, 110 ganan menos de $240, 180 ganan menos
Estadística - M.Sc. Emerson D. Norabuena F.
17
de $270 y el 10% restante de empleados gana a lo más $300; reconstruir la distribución
de frecuencias.
s. La organización del tiempo, en minutos, que tardaron 100 obreros para ejecutar cierta
tarea, ha dado una tabla de frecuencias de cuatro intervalos de igual amplitud cuyo
histograma correspondiente es simétrico. Si el intervalo 1 = [6, >, la frecuencia
absoluta: 𝑓2 = 2𝑓1 + 5, y si se sabe que el 85% de los obreros demoraron menos de 12
minutos. Completar la distribución de frecuencias.
t. Las notas de un examen se tabularon en una distribución de frecuencias de 3 intervalos
de amplitud iguales a 5. si la nota mínima es igual a 5, el 48% de las notas son menores
que 12, y si el 80% de las notas con inferiores a 16, reconstruir la distribución de
frecuencias.
Estadística - M.Sc. Emerson D. Norabuena F.
18
Seminario
a. Realice una distribución de frecuencias para cada uno de los siguientes conjuntos de datos,
que contenga Frecuencias: Absoluta; Relativa; Acumulada; Relativa Acumulada; además
realice un gráfico adecuado e interprete los resultados
Los siguientes datos representan la distancia en Km. que recorren diariamente 30 personas
desde sus casas a los sitios de trabajo:
2,0
1,5
1,6
3,0
4,0
6,0
0,3
5,9
5,6
3,3
1,8
6,0
1,3
4,7
1,2
0,4
0,7
0,2
0,2
4,5
2,0
6,0
0,3
1,5
5,5
1,5
1,6
6,5
0,5
2,3
0,2
2,5
5,0
b. Los contenidos de nicotina, en miligramos, hallados en los dedos de 40 fumadores se
registran a continuación:
1,09
1,70
1,71
1,72
1,92
2,17
1,85
2,09
2,31
2,55
1,82
1,75
1,79
2,11
1,79
1,63
2,28
1,86
2,46
2,37
1,74
1,90
1,88
1,75
1,47
1,68
2,08
1,69
1,97
1,51
1,67
1,58
0,85
2,03
1,37
0,72
1,24
1,64
1,93
1,40
c. Los siguientes datos pertenecen a la distribución de la producción de papas (en Tn.) en 40
zonas del país.
𝑋1′ = 20 𝑓2 - 𝑓5 = 2 𝑋5′ = 100
𝑓1= 4 𝑓3 = 20
Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase. Reconstruya
los intervalos de clase y obtenga las frecuencias absolutas y relativas.
Nº de pares vendidos
d. La siguiente gráfica recoge la cantidad de parejas de zapatos de mujer vendidas en una
tienda a lo largo del día:
35
30
25
20
15
10
5
0
36
37
38
39
40
Nº de zapato
-
¿Cuántas parejas de zapatos del número 37 se han vendido?
Pasa los datos a una tabla de frecuencias absolutas.
¿Cómo se llama la gráfica que nos han dado?
¿Qué porcentaje de zapatos vendidos eran números del 39 o 40?
Estadística - M.Sc. Emerson D. Norabuena F.
19
e. En la tabla de frecuencias que se da a continuación faltan algunos datos. Complétela,
y represéntela gráficamente.
Valores
0
1
2
3
4
5
Total
𝑿′𝒊
𝒇𝒊
𝑭𝒊
2
5
9
14
𝒉𝒊
𝑯𝒊
0,70
0,20
f. En la tabla de frecuencia que se brinda a continuación faltan algunos datos.
Complétela y represéntela gráficamente.
Clases
20 - 24
24 - 28
- 32
32 - 40
Total
-
𝑋𝑖′
𝑓𝑖
𝐹𝑖
ℎ𝑖
𝐻𝑖
0.10
0.25
0.55
0.85
1.00
11
Obtener el porcentaje de datos que se encuentran entre 22 a 30.
g. El siguiente cuadro de distribución de frecuencias representa a la cantidad de residuos
orgánicos (en kilogramos) que generan en un día 40 familias de la Ciudad de Huaraz.
Valores
-8
- 17
Total
-
𝑋𝑖′
𝑓𝑖
𝐹𝑖
ℎ𝑖
𝐻𝑖
5
24
0,20
0,90
1,00
Complete el cuadro, y calcule el porcentaje de familias que generan en un día
entre 10,5 a 15,5 kilogramos de residuos orgánicos
h. Las ganancias diarias de los establecimientos de un centro comercial se presentan en
una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mínima ganancia
es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el 50% de los
establecimientos
ganan
más
de
25.58
dólares
diarios,
𝐻2 =0.15, 𝐹2 =120, ℎ3 =0.25, 𝐻5 =0.93, 𝑓4 =304, 𝑓2 =2𝑓1. Reconstruir la distribución de
todas las frecuencias.
Estadística - M.Sc. Emerson D. Norabuena F.
20
i. Los tiempos de vida útil (en días) de un tipo de batería, se tabuló en una distribución
de 5 intervalos de igual amplitud con frecuencias relativas acumuladas: 0.10, 0.25,
0.55, 0.80, 1.00. Determine la distribución de frecuencias absolutas si la tercera
frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el límite
inferior del cuarto intervalo es 12.
j. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en
una distribución de frecuencias simétrica de 5 intervalos de igual amplitud
resultando: ingreso mínimo $125, marca de clase del cuarto intervalo $300. Si el 8%
de los ingresos son menores que $165 y el 70% de los ingresos son menores a $275,
¿Qué porcentaje de ingresos son superiores a $285?
k. El tiempo (en horas) de 120 familias que utilizan su computadora se tabularon en una
distribución de frecuencias de 5 intervalos de amplitud iguales a 4, siendo; el tiempo
mínimo de uso 2 horas, la primera y segunda frecuencias iguales al 10% y 15% del
total de casos respectivamente. Si el 73.75% de las familias lo usaron menos de 17
horas y el 85% menos de 19 horas, determine las frecuencias.
l. Los puntajes de una prueba de aptitud se tabularon en una distribución de frecuencias
de 6 intervalos de igual amplitud. Si se tienen: marca de clases dos y cuatro, 40 y 80
respectivamente, frecuencias: , ℎ1 =, ℎ6 , , ℎ3 =, ℎ5 , , ℎ4 =0.25, ℎ2 = ℎ4 - ℎ1 , ℎ3 =
ℎ1 +0.10 y 𝐹6 = 60, completar la distribución de frecuencias absolutas.
Estadística - M.Sc. Emerson D. Norabuena F.
21
Descargar