x - Gobierno de Canarias

Anuncio
Tema 2
ESTADÍSTICA DESCRIPTIVA
1.- DISTRIBUCIONES UNIDIMENSIONALES.
CÁLCULO DE PARÁMETROS
PARÁMETROS DE CENTRALIZACIÓN
En la búsqueda de la concreción y la simplificación, la información recogida en una tabla o
gráfica estadística suele resumirse en unos pocos valores que nos informan del
comportamiento de todos los individuos del colectivo estudiado. Estos valores,
representativos de todos los datos de una distribución, se llaman parámetros o medidas de
centralización.
MEDIA ARITMÉTICA
Media aritmética de una variable estadística es el cociente que resulta de dividir la suma de todos los
valores por el número total de éstos. Se representa por x .
Su cálculo se realiza, según las expresiones que siguen, atendiendo a la presentación de los datos.
Para datos sin frecuencias
Si la variable toma los N valores x1, x2,...,xn la media aritmética adopta la expresión:
x
x1  x2  ...  xn  xi

N
N
Para datos con frecuencias
Si la variable toma los valores o marcas de clase x1, x2 , xn, siendo f1, f2,.... fn las frecuencias
absolutas correspondientes de la distribución, la media aritmética se calcula con la expresión:
x
x1 f1  x2 f 2  ...  xn f n  xi f i  xi f i


f1  f 2  ...  f n
f
i N
Pg. nº 1/17
Tema 2
Para datos ponderados
La media ponderada se calcula cuando todos los valores de la variable no tienen el mismo “peso”. Su
fórmula es análoga a la vista con anterioridad, cambiando las frecuencias f i, por los pesos pi, y, en el
denominador, N por la suma de todos los pesos pi , por lo que resulta:
x
x1 p1  x2 p2  ...  xn pn  xi pi

p1  p2  ...  p n
 pi
Consideraciones sobre la media aritmética.






La media aritmética es el parámetro de centralización más utilizado.
Presenta la ventaja de tener en cuenta todos los datos de la distribución, además de
resultar muy sencillo su cálculo.
Tiene el inconveniente de que si la distribución posee valores extremos,
excepcionalmente raros y pocos significativos, éstos producen una distorsión sobre el
valor de la media.
No siempre es posible calcular la media aritmética y, a veces, aunque sea posible
calcularla, carece de significado como sucede en las variables cualitativas o se trata de
intervalos abiertos. En estos casos deben utilizarse otras medidas de centralización.
Si se suma una constante a todos los valores de la variable, la media aritmética aumenta
en el mismo valor.
Si se multiplican todos los valores de la variable por un mismo número, la media queda
multiplicada por el mismo número.
MODA
Se denomina moda de una variable estadística al valor de la variable que tiene mayor
frecuencia absoluta. Se representa por Mo.
La moda de una variable discreta es fácil de calcular, basta buscar el valor de la variable que
presenta mayor frecuencia. Puede ocurrir que la moda no sea única, es decir, la distribución
puede tener 2, 3 o más modas, recibiendo el nombre de bimodal, trimodal, etc.
En el caso de que los datos se encuentren agrupados en intervalos, la clase con mayor
frecuencia se denomina clase modal. Puede tomarse como moda la marca de clase de la
clase modal.
Si se desea mayor precisión en el cálculo de la moda, ésta puede obtenerse mediante la
expresión:
M o  Li  c
D
D  D
Li= Límite inferior del intervalo.
C= Amplitud del intervalo.
D=Diferencia entre la frecuencia absoluta del intervalo modal y los vecinos.
Pg. nº 2/17
Tema 2
Cálculo de la moda por el método gráfico.
Para las distribuciones que se encuentran agrupadas en intervalos existe un método gráfico
muy sencillo que permite obtener la moda con bastante aproximación. Para ello se
representa el histograma de frecuencias absolutas, al ser posible en papel milimetrado, con
el fin de poder obtener mayor precisión. Seguidamente se unen, con líneas los extremos de
la clase modal con las contiguas. La moda viene dada por la abscisa del punto de corte.
Consideraciones sobre la moda.




Puede ocurrir que existan distribuciones que no tengan moda; eso ocurre cuando las
frecuencias de todos los datos, o casi todos, son iguales.
Puede ser muy útil cuando se trata de variables cualitativas.
En su cálculo no intervienen todos los datos de la distribución.
Aun cuando es una medida de centralización, es relativamente frecuente encontrar
modas situadas en los extremos de la distribución.
MEDIANA
La mediana de una distribución estadística es el valor de la variable, tal que el número de
datos menores que él es igual al número de datos mayores que él. Se representa por Me.
Si la distribución es de una variable discreta y el número de datos es impar, la mediana es el
valor central, y si el número de datos es par, la mediana es la media de los valores centrales.
Si la distribución es de una variable continua, el intervalo que contiene a la mediana se
denomina clase mediana o intervalo mediano. Puede tomarse como mediana, en una
primera aproximación, la marca del intervalo mediano.
Si se desea mayor precisión en el cálculo de la mediana, ésta se obtiene, dentro del intervalo
mediano, mediante la expresión:
N
 Fi 1
M e  Li  c 2
fi
Variable discreta:
N impar  Me  X( n 1)/ 2
N par  Me   Xn / 2  Xn / 21  / 2
Li= Límite inferior del intervalo.
C= Amplitud del intervalo.
N= Número total de datos
Fi-1= Frecuencia absoluta acumulada de la clase anterior a la clase mediana.
fi= Frecuencia absoluta de la clase mediana.
Pg. nº 3/17
Tema 2
Consideraciones sobre la mediana.



La mediana es particularmente útil en los siguientes casos:
 Cuando entre los datos existen valores ostensiblemente extremos.
 Cuando los datos están agrupados en intervalos y alguno es abierto.
La mediana depende del orden de los datos y no de su valor.
Cuando en su cálculo, el valor N/2 cae justo en el límite de un intervalo, se hace la media
entre la frecuencia de este y del posterior.
Relación entre Media, Mediana y Moda.
Si una distribución es simétrica o ligeramente asimétrica,
experimentalmente que se cumple la siguiente relación:
se
puede
comprobar
Media – Moda = 3 (Media – Mediana)
Gracias a esta relación se puede obtener, con un cierto error, alguno de estos parámetros en
función de los otros dos.
Veamos a continuación tres distribuciones en las que se sitúan los parámetros:
CUANTILES
La mediana de los valores de una variable estadística divide a la distribución en dos partes
iguales. Es decir, la mediana parte la distribución en dos mitades, cada una corresponde al
50% de los datos. Generalizando la idea anterior, se puede pensar en obtener valores que
dividan a distribución en diversas partes iguales, dando lugar a los cuantiles. Los más
importantes y usados, sobretodos en las ciencias sociales y médicas, son:
CUARTILES
Se llaman cuartiles a tres valores que dividen la distribución en cuatro partes iguales. Se
representan y designan como cuartil primero (Q1), segundo (Q2 ) y tercero (Q3). Cada
parte agrupa, por tanto, al 25%, al 50% y al 75% de los datos de la distribución.
Pg. nº 4/17
Tema 2
Es obvio que el segundo cuartil, por definición, coincide con la mediana. El cálculo de los
otros cuartiles sigue las pautas de la mediana y se obtienen a través de las expresiones:
N
 Fi 1
Q1  Li  c 4
fi
3N
 Fi 1
4
Q3  Li  c
fi
DECILES
Análogamente, se llaman deciles a nueve valores de la variable que dividen a la
distribución en diez partes iguales. Es decir, los deciles agrupan a los datos en diez partes
correspondientes cada una con el 10% de la distribución. Se representan por D 1, D2, ...,
D9 y la expresión que permite calcularlos es:
kN
 Fi 1
Dk  Li  c 10
fi
K=1, 2, 3,...,9
PERCENTILES
De la misma manera, decimos que se llaman percentiles a 99 valores que divide la
distribución en 100 partes iguales Se representa por P1, P2, ..., P99 y se calculan a través
de la expresión
xN
 Fi 1
100
Px  Li  c
fi
X=1, 2, 3,...,99
Cálculo gráfico de los cuantiles
Para calcular gráficamente los cuantiles de una distribución existe un método muy sencillo
que consiste en representar el polígono de frecuencias porcentuales acumuladas (Pi),
situando en el eje abscisa la variable discreta o los intervalos, y en el eje de ordenadas los
porcentajes correspondientes. Convine realizar la representación en papel milimetrado
para mayor precisión.
Pg. nº 5/17
Tema 2
Ejemplo.
Pg. nº 6/17
Tema 2
PARÁMETROS DE DISPERSIÓN
Las medidas de centralización vistas con anterioridad necesitan de otras que las
complementen en el estudio de las distribuciones de frecuencias de las variables
estadísticas. Estas nuevas medidas, que denominamos parámetros de dispersión,
informan de las desviaciones que sufren los datos respecto de los valores centrales, en
especial con relación a la media aritmética.
Los parámetros de dispersión más usuales son:
RECORRIDO
Recorrido o rango de una variable estadística es la diferencia entre el mayor y el menor
valor de los datos observados. Se representa por R. Así, se tiene: R = Xmax - Xmin
VARIANZA
Varianza de una variable estadística es la media aritmética de los cuadrados de las
desviaciones de todos los datos o marcas de clase respecto de la media. Se representa
por σ2 ó S2
Las expresiones equivalentes que permiten calcular la varianza son:


2
 f (x

i
i
 x )2

N
2
fx

2
i i
N
 x2
Es importante conocer que la varianza es siempre positiva, o nula en caso de que
todos los valores de la variable sean iguales.
DESVIACION TIPICA
Se denomina desviación típica de una variable estadística a la raíz cuadrada positiva de la
varianza.
Se representa por σ ó S.

 f (x
i
i
 x )2
 
N
fx
i
N
2
i
 x2
Consideraciones sobre la desviación típica




La desviación típica es el parámetro de dispersión más utilizado.
Si se suma una constante a todos los valores de la variable, la desviación típica no
varía.
Si se multiplican todos los valores de la variable por un mismo número, la desviación
típica queda multiplicada por el mismo número.
No se puede calcular, es obvio, en el caso de que no se pueda calcular la media.
Pg. nº 7/17
Tema 2
ESTUDIO CONJUNTO DE x y σ
La media aritmética, x , y la desviación típica, σ , son los parámetros estadísticos por
antonomasia. La media es la medida central más utilizada y la desviación típica es la
medida de dispersión o variabilidad por excelencia.
En toda distribución estadística, el estudio del comportamiento conjunto de la media
aritmética y la desviación típica nos aporta numerosa información sobre la distribución de
frecuencias estudiada.
En casi todas las distribuciones estadísticas de comportamiento normal se verifican de
forma aproximada los porcentajes descritos a continuación que, referidos a la media y la
desviación típica, expresan la distribución de datos.
Para una distribución estadística de comportamiento normal, se cumple:
En ( x -σ x +σ ) está el 68% del total de individuos.
En ( x -2σ x +2σ) está el 95% del total de individuos.
En ( x -3σ x +3σ) está el 99% del total de individuos.
Coeficiente de variación de Pearson
Para comparar el grado de dispersión de dos o más distribuciones no podemos confrontar
simplemente las desviaciones típicas, puesto que esas medidas de dispersión vienen
afectadas por la escala de la medida representativa de la variable. Es necesario por lo
tanto eliminar esa influencia convirtiendo dichas medidas en números abstractos.
Para ello utilizaremos el coeficiente de variación de Pearson:
cv 

x
 100
Como sabemos que las medidas de centralización son más representativas cuanto más
concentrada estén, vamos a establecer las siguientes condiciones:

Menos de 30%
representativa.

Entre 30% y 45% MEDIA concentración, y por lo tanto la media es medianamente
representativa.

Mayor de un 45% BAJA concentración, y por lo tanto la media es poco o muy
poco representativa.
ALTA concentración, y por lo tanto la media es altamente
El inconveniente que tiene C.V. es que deja de ser útil cuando la media es igual a 0.
Pg. nº 8/17
Tema 2
Coeficiente de asimetría de Pearson
Una distribución será simétrica o asimétrica, según lo sea su representación gráfica. Será
asimétrica hacia la derecha (asimetría positiva), o a la izquierda (asimetría negativa), si su
representación gráfica está más estirada hacia la derecha o izquierda.
La medida de asimetría más utilizada es el coeficiente de asimetría de Pearson:
x - Mo
As =
σ
Si As = 0
No existe asimetría y por lo tanto la distribución es Simétrica.
Si As > 0
Existe Asimetría positiva o a la derecha.
Si As < 0
Existe Asimetría negativa o a la izquierda.
Ahora bien, por diversas razones, este coeficiente no se puede aplicar en los siguientes
casos:
 Cuando la distribución no es unimodal. En este caso, se puede solucionar
aplicando la relación empírica:
Media – Moda = 3 (Media – Mediana)
Por lo que el coeficiente quedaría:
3 ( x – Mediana)
As =
σ
 Cuando la distribución no es campaniforme, y especialmente cuando adopta
forma de U. En este caso abría que aplicar el coeficiente G1, que no veremos.
Pg. nº 9/17
Tema 2
2.- Puntuaciones típicas o normalizadas
Para poder comparar dos datos correspondientes a dos distribuciones distintas, hay que
“tipificar o normalizar” dichos valores, es decir, calcular los valores “z” de cada uno de
ellos por medio de:
z
(x  x)

Una vez obtenidos dichos valores se pueden comparar, ya que las distintas distribuciones
están pasadas a unidades de desviación estándar, y por lo tanto perfectamente
comparables.
Las puntuaciones típicas o normalizadas, también llamadas puntuaciones z, tienen las
siguientes propiedades:

Si se transforma una distribución en puntuaciones típicas, no varía la forma de la
distribución original.

La media aritmética de las puntuaciones normalizadas es cero, es decir, z  0 .

La desviación típica de las puntuaciones típicas es la unidad, es decir,  z  1
Pg. nº 10/17
Tema 2
EJERCICIOS RESUELTOS
1. La estación meteorológica del Roque de los Muchachos registró 88 días de lluvia el pasado año,
según muestra la tabla siguiente:
Litros/m2
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
Nº de días
3
7
19
23
18
12
6
Calcula la precipitación media durante los días de lluvia.
Litros/m2
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
2.
Xi
fi
Fi
2,5
7,5
12,5
17,5
22,5
27,5
32,5
Σ
3
7
19
23
18
12
6
88
3
10
29
52
70
82
88
Xifi
7,5
52,5
237,5
402,5
405
330
195
1630
x
i
N
i
;
x
1630
 18,523
88
Por tanto, el año pasado la
precipitación media durante los días
de lluvia fue de 18,523 l/m 2.
La calificación media que han obtenido los alumnos de Ingeniería Técnica Agrícola de cierta
Universidad, en la asignatura de Estadística durante los cuatro últimos cursos han sido: 5,8; 6,3;
6,7 y 7,2, respectivamente. En el primero de estos cursos se examinaron 180 alumnos, en el
segundo 200, en el tercero 275 y en el cuarto 220. ¿Cuál es la calificación media de estos cursos
en dicha asignatura?
Nota media N" de alumnos
Xi
fi
5,8
180
6,3
200
6,7
275
7,2
220
Σ
875
xifi
1 044
1 260
1 842,5
1 584
5 730,5
Calcularemos la media aritmética ponderada, en
la que el número de alumnos son los pesos
correspondientes a las calificaciones medias de
cada año.
x
xf
f
i i
i
3.
x f
;
x
5730,5
 6,55
875
Calcula la moda y la mediana correspondiente a la variable litros/m2 durante los días de lluvia en
la estación meteorológica del Roque de los Muchachos, según la distribución citada en el
ejercicio 1.
La moda
El mayor valor de la frecuencia, 23, corresponde al intervalo [15, 20) que recibe el nombre de intervalo
modal. En una primera aproximación se puede tomar la moda como la marca de clase, es decir,
Mo=17,5.
Para obtener una mayor precisión utilizamos la fórmula:
M o  Li  c
D
;
D  D
M o  15  5
23  19
 17,22
(23  19)  (23  18)
El dato que más se repite es de 17,22 litros/m2
La mediana
El intervalo mediano es [15, 20), ya que contiene el dato 88/2=44.
88
N
 29
 Fi 1
2
2
;
M

15

5
 18,26
M e  Li  c
e
23
fi
El 50% de los días de lluvia se recogieron más de 18,26 Litros/m 2 y el otro 50% de los días por debajo.
Pg. nº 11/17
Tema 2
4.
Se ha pasado un test de 80 preguntas a 600 personas. El número de respuestas correctas se
refleja en la siguiente tabla:
RESPUESTAS
CORRECTAS
NÚMEROS DE
PERSONAS
a)
b)
c)
d)
e)
f)
g)
[0, 10)
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60)
[60, 70)
[70, 80]
40
60
75
90
105
85
80
65
Efectuar la tabla de frecuencias y porcentajes.
Determinar el primer y tercer cuartil.
Determinar el tercer decil.
Determinar el percentil 45.
Una persona que respondió 64 preguntas, ¿qué percentil tiene?
Se desea seleccionar a los 24 mejores, ¿a partir de cuántas preguntas se encuentran?
Se selecciona al 40% de los mejores, ¿cuántas personas son y a partir de que puntuación se
encuentran?
Respuestas
correctas
[0, 10)
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60)
[60, 70)
[70, 80]
∑
Marca
clase
Xi
5
15
25
35
45
55
65
75
fi
Fi
hi
Hi
pi
Pi
40
60
75
90
105
85
80
65
40
100
175
265
370
455
535
600
0,067
0,100
0,125
0,150
0,175
0,142
0,133
0,108
0,067
0,167
0,292
0,441
0,617
0,758
0,892
1
6,7
10
12,5
15
17,5
14,2
13,3
10,8
6,7
16,7
29,2
44,1
61,7
75,8
89,2
100
600
1
3  600
 175
c) D3  30  10 10
 30,55 ;
90
45  600
 265
d) P45  40  10 100
 40,48 ;
105
x  600
 455
e) 64  60  10 100
80
100
N
 Fi 1
Q1  Li  c 4
fi
150  100
Q1  20  10
 26.67
75
b)
El 25% de las personas acertaron menos de 27
preguntas.
450  370
Q3  50  10
 59,41
85
El 75% de las personas acertaron menos de 59
preguntas.
El 30% de las personas acertaron menos de 31 pregunta, o el
70% acertaron más de 31 preguntas.
El 45% de las personas con menos aciertos contestaron
correctamente como máximo 40 preguntas.
; x=81,17% Tiene un percentil 81. También que el 19% de las personas
contestaron correctamente más de 64 preguntas.
f) 24 personas equivale al 4%; como se toman de la parte superior de la distribución
trabajamos con:
96  600
 535
P96  70  10 100
 76,31
65
Los 24 mejores tienen más de 76 preguntas contestadas
correctamente.
60  600
 265
g) El 40% de las personas son 240 personas. P60  40  10 100
 49,05 ;
105
Esto quiere decir que el 40% de las personas que contestaron mejor, respondieron
correctamente más de 49 preguntas.
Pg. nº 12/17
Tema 2
5. Completar la tabla del ejercicio 4 y determinar:
a) La media.
b) La moda.
c) La mediana.
d) La desviación típica.
e) El grado de concentración de la distribución.
f) Si consideramos que la distribución tiene un comportamiento “normal”, ¿entre qué valores se
encuentra el 95% de las personas que ocupan el centro de la distribución?
Marca
Respuestas
clase
correctas
Xi
[0, 10)
5
fi
Fi
40
40
pi
Pi
xifi
Xi2fi
0,067 0,067
6,7
6,7
200
1000
hi
Hi
[10, 20)
15
60
100
0,100 0,167
10
16,7
900
13500
[20, 30)
25
75
175
0,125 0,292
12,5
29,2
1875
46875
[30, 40)
35
90
265
0,150 0,441
15
44,1
3150
110250
[40, 50)
45
105
370
0,175 0,617
17,5
61,7
4725
212625
[50, 60)
55
85
455
0,142 0,758
14,2
75,8
4675
257125
[60, 70)
65
80
535
0,133 0,892
13,3
89,2
5200
338000
[70, 80]
75
65
600
0,108
10,8
100
4875
365625
∑
a) x 
600
x f
i
i
N
b) M o  Li  c
x
;
D
;
D  D

1
1
100
25600 1345000

25600
 42,6 ;
600
M o  40  10
15
 44,286
15  20
El número de preguntas acertadas que más se repite es 44.
600
N
 265
 Fi 1

2
c) M  L  c 2
;
M

40

10
 43,3
e
e
i
105
fi
El 50% de las personas respondieron correctamente menos 43 de preguntas.
fx
d)  
i
2
i
N
e) cv 

x
 100 ;
 x2 ;
cv 
 

1345000
 42,6 2  20,524
600
20,525
 100  48,105
42,6
Como es mayor de 45 se considera que tiene una concentración más bien baja.
f) Teniendo en cuenta que en el intervalo ( x -σ
x +σ ) está el 68% del total de individuos


(42,6  20,524;42,6  20524 )  (22,14;63,19)
Esto quiere decir, que el 68% de las personas del centro de la distribución contestaron entre 22 y 63
preguntas correctamente.
Pg. nº 13/17
Tema 2
6. Dadas las siguientes distribuciones:
Los pesos de los toros de lidia de una ganadería se distribuyen con una x1  510 kg y una
 1  25 kg
Los pesos de los perros de una exposición canina se distribuyen con una x 2  19 kg y una
 2  10 kg.
Determinar cuál de las dos distribuciones está más dispersa.
La desviación típica de los pesos de la manada de los toros bravos es superior que la de los perros. Sin
embargo, esos 25 kg son poca cosa para el enorme peso de los toros (es decir, los toros de esa manada son
muy parecidos en peso), mientras que 10 kg en relación con el peso del perro es mucho (imaginamos que en
la exposición canina habrá perros muy dispares: caniches, "salchichas", dogos, mastines...
Comparando los coeficientes de variación:
CVtoros=(25/510)100=4,9%
CVperros=(10/19)100=52,6%.
Con estos parámetros se ve claramente que el peso de los perros de la exposición canina es mucho más
disperso que el de los toros de la manada.
7. Una empresa debe cubrir un cierto número de puestos de trabajo de dos tipos A, y B. Se somete a los
aspirantes a dos pruebas, ambas puntuables de 0 a 50, diseñadas para valorar sus aptitudes en uno y
otro tipo de trabajo. En la Prueba A, la media de calificaciones ha sido x A  28 , y la desviación típica
 A  3,4 . En la B han sido, respectivamente, x B  24 y  B  2,1 . Dígase: ¿Qué tipo de puesto de
trabajo asignaríamos a un aspirante que hubiera obtenido 33 puntos en la prueba A y 28 en la B?
En ambos casos se halla por encima de la media. Su puntuación es más alta en la prueba A (33 frente a 28),
así como su desviación respecto de la media (+5 frente a +4). No obstante, valorar igual los puntos obtenidos
en ambas pruebas puede ser un error de apreciación".
En efecto: Las desviaciones típicas indican que los resultados de la prueba B se hallan más agrupados que
los de la A. En esas condiciones, "cuatro puntos sobre la media" en la prueba B puede indicar mayor aptitud
para el trabajo B, frente a los demás aspirantes, de lo que indican "cinco puntos sobre la media" en la prueba
para el trabajo A.
Saldremos de dudas calculando e interpretando las puntuaciones típicas del aspirante en ambas pruebas.
Son
ZA 
33  28
 1,471
3,4
ZB 
28  24
 1,905
2,1
Esto significa que su calificación en la prueba A se halla "1,471 desviaciones" sobre la medía y, en la
prueba B, "1,905 desviaciones” sobre la media.
Por tanto, está más cualificado para ocupar un puesto de trabajo tipo B que un puesto tipo A, si lo
comparamos con el resto de los aspirantes.
Pg. nº 14/17
Tema 2
EJERCICIOS
1.
Se ha tallado a los alumnos de un cierto curso y se ha llegado a los siguientes resultados, que se dan en el
orden en que se obtuvieron (en centímetros):
173,
177,
170,
184,
174,
169,
174,
166,
156,
166,
179,
168,
173,
177,
177,
167,
165,
162,
162,
172,
171,
171,
173,
185,
159,
164,
154,
176,
153,
178,
169,
183,
171,
174,
163,
179,
172,
172,
163,
174,
173,
171.
169,
169,
180,
172,
185,
170,
174,
174,
186,
163,
166,
175,
162,
180,
167,
174,
156,
172,
173,
159,
172,
164,
175,
176,
1 70
182,
166,
171,
188,
174,
173,
168,
162,
163,
167,
169,
175,
169,
170,
173,
171,
157,
166,
161,
158,
170,
151,
160,
Determinar:
a) La media.
b) La moda.
c) La mediana.
d) El primer cuartil.
e) El segundo decil.
f) El percentil 65.
g) El porcentaje de alumnos con una estatura superior a 176.
h) Un alumno tiene una estatura de 168 cm. ¿qué percentil tiene?
i) La desviación típica.
j) ¿Están los datos muy dispersos?
k) Si se desea seleccionar el 68% de los alumnos que forman la parte central de la distribución ¿entre qué
estaturas estarán los alumnos?
l) Representa los datos con una gráfica adecuada.
2.
Los pesos (en kilogramos) de los enfermos de una cierta residencia sanitaria son:
64,
92,
71,
63,
83,
84,
50,
63,
66,
80,
67,
78,
66,
44,
48,
64,
52,
85,
94,
60,
81,
78,
51,
65,
80,
98,
70,
57,
44,
71,
78,
62,
65,
89,
53,
77,
61,
76,
71,
55,
48,
62,
59,
68,
85,
76,
70,
81,
58,
75,
65,
56,
43,
51,
69,
47,
69,
74,
65,
84,
55,
90,
69,
87,
67,
60,
67,
55,
96,
68,
73,
57,
63,
50,
53,
67,
60,
90,
53,
72
42,
75,
52,
61,
Determinar:
a) La media.
b) La moda.
c) La mediana.
d) El primer cuartil.
e) El segundo decil.
f) El percentil 65.
g) El porcentaje de enfermos con un peso superior a 82 kg.
h) Un enfermo tiene un peso de 68 kg. ¿qué percentil tiene?
i) La desviación típica.
j) ¿Están los datos muy dispersos?
k) Si se desea seleccionar el 68% de los enfermos que forman la parte central de la distribución ¿entre qué
pesos estarán?
l) Representa los datos con una gráfica adecuada.
3. Se ha pasado un test de 80 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente
tabla:
RESPUESTAS
CORRECTAS
[0, 10)
[10, 20)
[20, 30)
[30, 40)
[40, 50)
[50, 60)
[60, 70)
[70, 80)
NUMERO DE
PERSONAS
40
60
75
90
105
85
80
65
Determinar:
a) La media.
b) La moda.
c) La mediana.
d) El primer cuartil.
e) El percentil 65.
f) El porcentaje de personas con más de 58 respuestas
correctas.
g) Una persona que responde correctamente 66
preguntas, ¿qué percentil tiene?
h) La desviación típica.
i) ¿Están los datos muy dispersos?
Pg. nº 15/17
Tema 2
EJERCICIOS
1.
Se ha tallado a los alumnos de un cierto curso y se ha llegado a los siguientes resultados, que se dan en el orden
en que se obtuvieron (en centímetros):
173,
177,
170,
184,
174,
169,
174,
166,
156,
166,
179,
168,
173,
177,
177,
167,
165,
162,
162,
172,
171,
171,
173,
185,
159,
164,
154,
176,
153,
178,
169,
183,
171,
174,
163,
179,
172,
172,
163,
174,
173,
171.
169,
169,
180,
172,
185,
170,
174,
174,
186,
163,
166,
175,
162,
180,
167,
174,
156,
172,
173,
159,
172,
164,
175,
176,
1 70
182,
166,
171,
188,
174,
173,
168,
162,
163,
167,
169,
175,
169,
170,
173,
171,
157,
166,
161,
158,
170,
151,
160,
Determinar:
a) La media.
b) La moda.
c) La mediana.
d) El primer cuartil.
e) El segundo decil.
f) El percentil 65.
g) El porcentaje de alumnos con una estatura superior a 176.
h) Un alumno tiene una estatura de 168 cm. ¿qué percentil tiene?
i) La desviación típica.
j) ¿Están los datos muy dispersos?
k) Si se desea seleccionar el 68% de los alumnos que forman la parte central de la distribución ¿entre qué
estaturas estarán los alumnos?
l) Representa los datos con una gráfica adecuada.
Estatura
xi fi Fi hi
Hi
en cm.
[150 155) 152,5 3 3 0,033 0,0333
[155 160) 157,5 6 9 0,067 0,1000
[160 165) 162,5 12 21 0,133 0,2333
[165 170) 167,5 17 38 0,189 0,4222
[170 175) 172,5 32 70 0,356 0,7778
[175 180) 177,5 11 81 0,122 0,9000
[180 185) 182,5 5 86 0,056 0,9556
[185 190) 187,5 4 90 0,044 1,0000

90
1,000
xifi
457,50
945,00
1950,00
2847,50
5520,00
1952,50
912,50
750,00
Xi2fi
69768,75
148837,50
316875,00
476956,25
952200,00
346568,75
166531,25
140625,00
35
[150 155)
30
[155 160)
25
[160 165)
20
[165 170)
15
[170 175)
10
[175 180)
[180 185)
5
[185 190)
0
1
15335,00 2618362,50
15335
 170,39 cm
90
15
 172,08 cm
15  21
90
 21
45  38
4
 171,09 cm
 165,44 cm
c) M e  170  5
d) Q1  165  5
32
17
65  90
2  90
 38
9
100
10
 163,75 cm
 173,20 cm
e) D2  160  5
f) P65  170  5
32
12
x  90
x  90
 70
 21

100
100
 x  80,22 ; El 20% aprox. h) 168  165  5
 x  34,6 ; El perc. 35
g) 176  175  5
11
17
a) x 
i)

2618362 ,5
 170,39 2  7,75658
90
b) M o  170  5
j)
CV 
7,75658
 100  4,55  Muy concentrado
170,39
Pg. nº 16/17
Tema 2
2.
Los pesos (en kilogramos) de los enfermos de una cierta residencia sanitaria son:
64,
92,
71,
63,
83,
84,
50,
63,
66,
80,
67,
78,
66,
44,
48,
64,
52,
85,
94,
60,
81,
78,
51,
65,
80,
98,
70,
57,
44,
71,
78,
62,
65,
89,
53,
77,
61,
76,
71,
55,
48,
62,
59,
68,
85,
76,
70,
81,
58,
75,
65,
56,
43,
51,
69,
47,
69,
74,
65,
84,
55,
90,
69,
87,
67,
60,
67,
55,
96,
68,
73,
57,
63,
50,
53,
67,
60,
90,
53,
72
42,
75,
52,
61,
Determinar:
La media.
La moda.
La mediana.
El tercer cuartil.
El sexto decil.
El percentil 35.
El porcentaje de enfermos con un peso superior a 82 kg.
Un enfermo tiene un peso de 68 kg. ¿qué percentil tiene?
La desviación típica.
¿Están los datos muy dispersos?
Si se desea seleccionar el 95% de los enfermos que forman la parte central de la distribución ¿entre qué pesos
estarán?
Representa los datos con una gráfica adecuada.
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
Pesos
en kg
[40 45)
[45 50)
[50 55)
[55 60)
[60 65)
[65 70)
[70 75)
[75 80)
[80 85)
[85 90)
[90 95)
95 100)
xi fi Fi hi
Hi
xifi
Xi2fi
42,5 4 4 0,048 0,048
170
7225
47,5 3 7 0,036 0,083 142,5 6768,75
52,5 9 16 0,107 0,190 472,5 24806,25
57,5 8 24 0,095 0,286
460
26450
62,5 12 36 0,143 0,429
750
46875
67,5 15 51 0,179 0,607 1012,5 68343,75
72,5 8 59 0,095 0,702
580
42050
77,5 8 67 0,095 0,798
620
48050
82,5 7 74 0,083 0,881 577,5 47643,75
87,5 4 78 0,048 0,929
350
30625
92,5 4 82 0,048 0,976
370
34225
97,5 2 84 0,024 1,000
195 19012,5

a) x=
84
1,000
5700
 67,857 kg
84
d ) Q3  75  5
5700
b) M o  65  5
63  59
 77,5 kg
8
29, 4  24
 62,25 kg
12
x  84
 36
100
h) 68=65+5
;  x=54
15
f ) P35  60  5
j ) CV=
402075
13,492
 100  20%  No
67,857
3
 66,5 kg
3 7
e) D6  65 
c) M e  65  5
42  36
 67 kg
15
50, 4  36
 69,8 kg
15
x  84
 67
100
g ) 82=80+5
 x=83,09 kg; 100-83,09=16,9117%
7
i)  =
402075
 67,857 2  13,492 kg
84
k ) (X  2 , X  2 )  95%; (40,87; 94,84)  entre 41 y 95 kg.
Pg. nº 17/17
Descargar