1.- Terminología estadística 2.- Tablas de frecuencias

Anuncio
2º BACHILLERATO – MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II – TEMA 3.- ESTADÍSTICA DESCRIPTIVA
PROFESOR: RAFAEL NÚÑEZ
-----------------------------------------------------------------------------------------------------------------------------------------------------------------
1.- Terminología estadística
Estadística descriptiva
Es la ciencia que estudia conjuntos de datos obtenidos de la realidad.
Estos datos son interpretados mediante tablas, gráficas y otros parámetros como la media, moda,
varianza, etc.
Población
Es el conjunto formado por todos los elementos que queremos estudiar.
Por ejemplo, si vamos a estudiar el peso de los jóvenes de 16 años nacidos en España, la población
sería precisamente el conjunto formado dichos jóvenes
Variable estadística
Es la característica que queremos estudiar de la población.
Hay distintos tipos de variables estadísticas
Cualitativa
Si los valores son cualidades. Por ejemplo, partido político preferido, color del pelo, etc.
Discreta
Cuando los valores son aislados.
Por ejemplo, nº de hermanos, edad, etc.
Cuantitativa
Si los valores son números. Por ejemplo, nº de
Continua
hermanos, estatura, peso, edad, temperatura,
Cuando entre dos valores, aunque estén muy
etc.
próximos entre sí, siempre es posible tomar otro
valor.
Por ejemplo, la temperatura, el peso, etc.
2.- Tablas de frecuencias
Los datos obtenidos en estadística se organizan en unas tablas, llamadas tablas de frecuencias.
Tabla de frecuencias para datos aislados
Ejemplo: Edades de un grupo de alumnos
de alumnos
xi
fi
Fi
hi
Hi
13
6
6 30% 30%
14
5
11 25% 55%
15
7
18 35% 90%
16
1
19 5%
95%
18
1
20 5% 100%
Suma total 20 = n - 100%
-
Tabla de frecuencias para datos agrupados
Ejemplo: Notas en un examen de un grupo
fi
Fi
hi
Hi
Clases
[2,3)
3
3 15% 15%
[3,4)
2
5 10% 25%
[4,5)
3
8 15% 40%
[5,6)
5
13 25% 65%
[6,7)
3
16 15% 80%
[7,8)
4
20 20% 100%
Total 20 = n - 100%
-
xi representa los valores que hay en los datos. En el caso de datos agrupados, las clases son los
intervalos
fi se llama frecuencia absoluta y representa las veces que aparece cada valor en los datos
En el caso de datos agrupados, fi representa el nº de datos que hay en el intervalo o clase
Fi es la frecuencia absoluta acumulada y se calcula sumando uno a uno los valores de la columna fi.
hi se llama frecuencia relativa y se calcula dividiendo cada valor fi entre el nº total de datos y se
expresa en %
Hi es la frecuencia relativa acumulada y se calcula sumando uno a uno los valores de la columna hi.
3.- Gráficos estadísticos
Diagrama de barras
Se representan los valores xi en un eje horizontal y para cada valor xi se dibuja una barra cuya altura
sea la frecuencia de xi que se quiera representar. Las barras deben ser de la misma anchura y
debemos dibujarlas separadas.
Uniendo los extremos superiores de las barras por su punto medio, se obtiene una línea quebrada
llamada polígono de frecuencias
Ejemplo: Número de hijos de un grupo de matrimonios
xi
fi
0
4
1
9
2
12
3
10
4
8
5
4
6
2
7
1
Total 50 = n
El diagrama de barras se suele utilizar para variables discretas con “pocos” valores
y para variables cualitativas
Histograma
Es similar al diagrama de barras, sólo que la base de cada barra es el intervalo de la tabla de
frecuencias y por tanto no hay espacios entre las barras.
Ejemplo:
Notas de 20 alumnos en un examen:
Uniendo los extremos superiores de las barras por su punto medio, se obtiene la línea quebrada
llamada polígono de frecuencias.
Los histogramas se utilizan cuando los datos los agrupamos en intervalos
Página 2
Diagrama de sectores
Para dibujar el diagrama de sectores se dibuja un círculo y se divide en tantos sectores (quesitos)
como valores haya en los datos.
Ejemplo:
Deporte preferido por un grupo de 30 alumnos
fi hi (en %) Ángulo del sector
Deporte
Baloncesto 12
40
40% de 360º = 144º
Natación
3
10
10% de 360º = 36º
Fútbol
9
30
30% de 360º = 108º
Ninguno
6
20
20% de 360º = 72º
Total
30
100%
360º
El diagrama de sectores se suele utilizar para variables discretas con “pocos” valores y para
variables cualitativas
4.- Parámetros estadísticos
La media aritmética
Es la suma de todos los datos dividida entre el número total de datos, n.
 (x i f i ) (
Se calcula con la fórmula x =
 significa suma)
n
x

)
Notas en un examen de un grupo de amigos
xi
fi
xifi
4
1
4
5
2
10
6
4
24
7
3
21
Total n = 10 59
fi
x in
(
Ejemplo:

59
 5,9
10
Si los datos están agrupados en intervalos, se toma como x i el punto medio del intervalo, llamado
marca de clase
Ejemplo:

)
x
fi
x in
(
Gasto mensual en teléfono móvil de un grupo de
jóvenes

239
 11,95 €
20
Página 3
fi
xifi
Clases xi
[10,11) 10,5
4
42
[11,12) 11,5
6
69
[12,13) 12,5
7
87,5
[13,14) 13,5
3
40,5
Total
n = 20 239
El rango, la varianza, la desviación típica y el coeficiente de variación
Ejemplo: Se pregunta a un grupo de hoteleros cuántas habitaciones tiene su hotel
xi
xi fi
fi
clases
xi2fi
[0,100)
[100,200)
[200,300)
[300,400)
[400,500)
Total
50
150
250
350
450
20
50
60
30
40
n = 200
1 000
50 000
7 500 1 125 000
15 000 3 750 000
10 500 3 675 000
18 000 8 100 000
52 000 16 700 000
El rango: Es la diferencia entre el mayor y el menor valor de xi . En este caso, rango = 500 – 0 = 500
Se puede calcular con la fórmula: s

2
)
En este caso, como x 
fi
xin
(
La varianza
(s2):

x 2i .fi


n

x2
2 16 700 000
52000
 2602  15 900
 260 , sustituyendo: s 
200
200
La desviación típica (s): Es la raíz cuadrada de la varianza. En este caso, s  15 900  126,0952
El coeficiente de variación (CV): Se puede calcular con la fórmula: CV 
En este caso, el coeficiente de variación es C.V. 
s
x
126,0952
 0,485
260
2.- Muestras estadísticas
Una muestra es una parte de la población que elegimos para estudiar la población.
El número de elementos de la muestra se llama tamaño de la muestra y el proceso de elección de
una muestra se llama muestreo estadístico.
Hay varios tipos de muestreo estadístico. Los más usados son:
Muestreo aleatorio simple
Consiste en tomar al azar unos pocos elementos de la población.
Muestreo aleatorio estratificado con afijación proporcional
Consiste en dividir la población en grupos, llamados estratos, y tomar aleatoriamente en cada estrato
una muestra proporcional al nº de elementos del estrato.
Suponiendo que la población la podemos dividir en 3 estratos (E 1,E2,E3), procedemos así:
Se construye una tabla como la siguiente:
E1 E2 E3 Total
Estratos
Nº de elementos de la muestra
x
y
z
n
Nº de elementos de la población N1 N2 N3
N
El número de elementos x , y , z deben ser proporcionales a N1 , N2 y N3 , luego
x
y
z
n



N1
N2
N3 N
Página 4
ACTIVIDADES
1 Se considera la población {2, 4, 6}. Escriba todas las posibles muestras de tamaño dos elegidas
mediante muestreo aleatorio simple y determine la desviación típica de las medias muestrales.
(Propuesto para selectividad 2013)
2 En un centro docente la tercera parte de los alumnos estudia el idioma A, la mitad el idioma B y el
resto el idioma C (cada alumno estudia sólo uno de estos idiomas).
a) Se desea seleccionar una muestra de 60 alumnos, mediante muestreo aleatorio estratificado con
afijación proporcional al número de los alumnos de cada idioma. ¿Cómo debería estar conformada la
muestra?
b) En otra muestra seleccionada por el procedimiento anterior, el número de alumnos tomados del
idioma A es 14. Determine cuántos se han elegido de los otros dos idiomas.
(Propuesto para selectividad 2014)
3 Una población de 6000 personas se ha dividido en 3 estratos, uno con 1000 personas, otro con
3500 y otro con 1500. En esa población se ha realizado un muestreo estratificado con afijación
proporcional, en el que se han elegido al azar 15 personas del tercer estrato. Determine el tamaño de
la muestra total obtenida con este muestreo y su composición.
(Propuesto para selectividad 2013)
4 Resuelva los siguientes apartados:
a) Dada la población {7, 4, 1} , construya todas las muestras posibles de tamaño 2 que puedan
formarse mediante muestreo aleatorio simple, y halle la varianza de las medias muestrales de todas
esas muestras. (Propuesto para selectividad 2013)
b) Determine todas las muestras de tamaño 2 que, mediante muestreo aleatorio simple, se pueden
extraer del conjunto {6, 9, 12} y calcule la varianza de las medias de estas muestras.
(Propuesto para selectividad 2014)
c) A partir de una población de elementos 1, 2, 3, 4 se seleccionan, mediante muestreo aleatorio
simple, todas las muestras de tamaño 2. Escriba dichas muestras y calcule la varianza de las medias
muestrales. (Propuesto para selectividad 2012)
d) Una empresa fabrica cuatro productos A, B, C y D, de los que elabora diariamente 40, 15, 25 y 120
unidades respectivamente. Si un día se quiere elaborar una muestra de 40 unidades con los
productos fabricados, por muestreo aleatorio estratificado con afijación proporcional, ¿qué
número de unidades de cada producto se debe elegir?
(Propuesto para selectividad 2014)
e) Una ciudad de 2000 habitantes está poblada por personas de pelo negro, rubio o castaño.
Se ha seleccionado, mediante muestreo aleatorio estratificado con afijación proporcional, una
muestra constituida por 28 personas de pelo negro, 32 de pelo rubio y 20 de pelo castaño.
Determine cuál es la composición, según el color del pelo, de esa ciudad.
(Propuesto para selectividad 2001)
f) En una ciudad viven 400 hombres y 320 mujeres y se quiere seleccionar una muestra de tamaño 54
utilizando muestreo estratificado por sexos, con afijación proporcional, ¿cuál sería la composición de
la muestra?
(Propuesto para selectividad 2012)
g) Una población de tamaño 1000 se ha dividido en 4 estratos de tamaño 150, 400, 250 y 200.
Utilizando muestreo aleatorio estratificado con afijación proporcional se han seleccionado 10
individuos del tercer estrato, ¿cuál es el tamaño de la muestra? (Propuesto para selectividad 2011)
Página 5
Descargar