Introducción a la Estadística - Mates en el CEPA "CARMEN CONDE

Anuncio
Matemáticas I
CEPA ”Carmen Conde Abellán”
Introducción a la Estadística
Melilla
Definición de Estadística
La E s ta d í s ti ca trata del recuento, ordenación y clasificación de los datos obtenidos
por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Un es tu d i o es ta d í s ti co consta de las siguientes fases.
- Recogida de datos
- Organización y representación de los datos
- Análisis de los datos
- Conclusiones del estudio
Conceptos de Estadística
Población
Una p o b l aci ó n es el conjunto de todos los elementos a los que se somete a un
estudio estadístico.
Individuo
Un i n d i v i d u o o u n i dad es t ad í s t i ca es cada uno de los elementos que componen
la población.
Muestra
Una muestra es un conjunto representativo de la población de referencia, el número de
individuos de una muestra es menor que el de la población.
Muestreo
El m u es t reo es la reunión de datos que se desea estudiar, obtenidos de una
proporción reducida y representativa de la población.
1
Estadística
CEPA ”Carmen Conde Abellán”
Matemáticas I
Valor
Un v a l o r es cada uno de los distintos resultados que se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato
Un d a to es cada uno de los valores que se ha obtenido al realizar un estudio estadístico.
Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Variable estadística
Tipos
Las v a ri a b l es cu a l i t a ti v a s se refieren a ca ra cte rí s ti ca s o cu a l i d a d es que
n o pueden ser medidas con n ú mero s . Ejemplo: El estado civil de una persona, el tipo
de medalla que has ganado en una competición, el color de los ojos de un amigo o
amiga…
Una v a ri a b l e cu a n ti ta ti v a es la que se expresa mediante un n ú me ro , por tanto
se pueden realizar op er a ci o n es a ri t mé ti ca s con ella. Podemos distinguir dos tipos,
pero nosotros sólo vamos a trabajar con uno:
Variable discreta
Una v a ri a b l e d i s cre ta es aquella que toma v a l o res a i s l a d o s , es decir n o
admite v a l o res i n ter med i o s entre dos valores específicos. Por ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Distribución de frecuencias
La d i s tri b u ci ó n d e f recu en ci a s o t a b l a d e f recu en ci a s es una
o rd en a ci ó n en forma de ta b l a de los d a to s es ta d í s ti co s , asignando a cada
d a to su f recu en ci a c o rres p o n d i en te.
Tipos de frecuencias
• Frecuencia absoluta
La f r ecu en ci a a b s o l u ta es el n ú me ro d e v eces que aparece un determinado
v a l o r en un estudio estadístico. Se representa por f i . La s u ma d e l a s
f recu en ci a s a b s o l u ta s es igual al número total de datos, que se representa por N.
2
Estadística
Matemáticas I
CEPA ”Carmen Conde Abellán”
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula)
que se lee suma o sumatoria.
• Frecuencia relativa
La f re cu en ci a r el a t i v a es el co ci en te entre la fr ecu en ci a a b s o l u ta de un
determinado valor y el n ú mero to ta l d e d a to s . Se puede expresar en tantos por
ciento y se representa por n i . La suma de las frecuencias relativas es igual a 1.
• Frecuencia acumulada
La f re cu en ci a a cu mu l a d a es la s u ma d e l a s f recu en ci a s a b s o l u ta s de
todos los v a l o res i n f eri o res o i g u a l es al v a l o r considerado.
Se representa por F i .
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30,
31, 30, 31, 34, 33, 33, 29, 29.
xi
Recuento
fi
Fi
ni
Ni
27
I
1
1
0.032
0.032
28
II
2
3
0.065
0.097
29
6
9
0.194
0.290
30
7
16
0.226
0.0516
31
8
24
0.258
0.774
32
III
3
27
0.097
0.871
33
III
3
30
0.097
0.968
34
I
1
31
0.032
1
31
1
3
Estadística
CEPA ”Carmen Conde Abellán”
Matemáticas I
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en
la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. Este
tipo de ta b l a s d e f recu en ci a s se utiliza con v a ri a b l es d i s creta s .
Representación gráfica de los datos estadísticos
Diagrama de barras
Un d i a g ra ma d e b a rra s se utiliza para de presentar d a to s cu a l i ta ti v o s o
d a to s cu a n ti ta ti v o s d e ti p o d i s creto .
Se representan sobre unos ejes de coordenadas, en el eje d e a b s ci s a s se colocan los
v a l o res d e l a v a ri a b l e, y sobre el ej e d e o rd en a d a s las frecu en ci a s
a b s o l u ta s o rel a ti v a s o a cu mu l a d a s .
Los d a to s se representan mediante b a rra s de una a l tu ra p ro p o rci o n a l a la
f recu en ci a .
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo
sanguíneo ha dado el siguiente resultado:
Grupo
f
sanguíneo i
A
6
B
4
AB
1
0
9
20
4
Estadística
CEPA ”Carmen Conde Abellán”
Matemáticas I
Polígonos de frecuencia
Un p o l í g o n o d e f recu en ci a s se forma uniendo los ex tre mo s de las b a rras
mediante s eg men to s .
También se puede realizar trazando los p u n to s que representan las f re cu en ci a s y
uniéndolos mediante s eg men to s .
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:
Hora Temperatura
6
7º
9
12°
12
14°
15
11°
18
12°
21
10°
24
8°
Diagrama de Sectores
Un d i a g ra ma d e s e c to res se puede utilizar para todo tipo de va r i ab l es , pero se
usa frecuentemente para las v a ri a b l es cu a l i ta ti v a s .
Los d a to s se representan en un cí rcu l o , de modo que el á n g u l o de cada s ec to r es
p ro p o rci o n a l a la f recu en ci a a b s o l u ta correspondiente.
El diagrama circular se construye con la ayuda de un transportador de ángulos.
5
Estadística
CEPA ”Carmen Conde Abellán”
Matemáticas I
Ejemplo
En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al
fútbol y el resto no practica ningún deporte.
Alumnos
Ángulo
Baloncesto
12
124°
Natación
3
36°
Fútbol
9
108°
Sin deporte
6
72°
Total
30
360°
Parámetros estadísticos
Definición de parámetro estadístico
Un p a rá me tro es ta d í s ti co es un n ú mero que se obtiene a partir de los d a to s de
una d i s tri b u ci ó n esta d í s ti ca . Los p a rá metro s es ta d í s ti co s sirven para
sintetizar la información dada por una tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tr es ti p o s p a rá metro s es ta d í s ti co s :
- De centralización.
- De posición
- De dispersión.
6
Estadística
Matemáticas I
CEPA ”Carmen Conde Abellán”
Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos. La med i d a s d e
cen tra l i za ci ó n son:
• Media aritm ética
La med i a es el valor p ro med i o de la distribución. La med i a a ri t méti ca es el
v a l o r obtenido al s u ma r todos los d a to s y d i v i d i r el resultado entre el n ú me ro
total de d a to s .
es el símbolo de la med i a a ri t méti ca .
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
• Mediana
La med i a n a es la p unta ci ó n de la escala que s ep a ra l a mi ta d s u p eri o r de la
distribución y l a i n f eri o r, es decir divide la serie de datos en d o s p a rt es i g u a l es .
Cálculo de la mediana
1 O rd en a mo s los d a t o s de men o r a ma y o r.
2 Si la serie tiene un n ú me ro i mp a r d e med i d a s la me d i a n a es la
p u n tu a ci ó n cen tra l de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5
3 Si la serie tiene un número p a r de puntuaciones la med i a n a es la med i a entre
las dos p u n tu a ci o n es cen tra l es .
7, 8, 9, 10, 11, 12Me= 9 . 5
• Moda
La mo d a es el v a l o r que má s s e r ep i te en una distribución.
7
Estadística
CEPA ”Carmen Conde Abellán”
Matemáticas I
Medidas de dispersión
Las med i d a s d e d i s p ers i ó n nos informan sobre cuánto se alejan del centro los
valores de la distribución. Las med i d a s d e d i sp ers i ó n son:
• Rango o recorrido
El ra n g o es la d i f er en ci a entre el ma y o r y el men o r de los d a to s de una
distribución estadística.
• Varianza
La v a ri a n za es la med i a a ri t mé ti ca del cu a d ra d o d e l a s d es v i a ci o n es
respecto a la med i a . La varianza se representa por
.
Para simplificar el cá l cu l o d e l a v a ri a nza vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.
• Desviación típica
La d es v i a ci ó n tí p i c a es la ra í z cu a d ra d a de la v a ri a n za . Es decir, la raíz
cuadrada de la media de los cuadrados de las puntuaciones de desviación. La
d es v i a ci ó n tí p i ca se representa por σ. Para simplificar el cálculo vamos o utilizar
las siguientes expresiones que son equivalentes a las anteriores.
Cuanta más pequeña sea la d es v i a ci ó n tí pi ca mayor será la co n ce n tra ci ó n d e
d a to s alrededor de la med i a .
• Coeficiente de variación
El co ef i ci en te d e v a ri a ci ó n es la relación entre la d es v i a ci ó n tí p i ca de una
muestra y su med i a .
8
Estadística
CEPA ”Carmen Conde Abellán”
Matemáticas I
El co ef i ci en te d e v a ri a ci ó n se suele expresar en p o rc en ta jes :
El co ef i ci en te d e v a ri a ci ó n permite comparar las d i s p ers i o n es de dos
distribuciones distintas, siempre que sus med i a s sean p o s i ti v a s . Se calcula para
cada una de las distribuciones y los valores que se obtienen se comparan entre sí.
La ma y o r d i s p ers i ó n corresponderá al valor del co ef i ci en te d e v a ri a ci ó n
ma y o r.
Ejercicio
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos
presenta mayor dispersión?
La primera distribución presenta mayor dispersión.
9
Estadística
Descargar