Introducción a la Estadística Descriptiva

Anuncio
Estadística
Introducción a la Estadística
Descriptiva
Área de Matemática Cerp Florida
Reforma de Ed. Inicial y Primaria, 2009
1
Contenido de Estadística según la Propuesta Programática para el año 2009
para la Educación Inicial y Primaria
5 años
La producción de
información estadística.
-La determinación de la
población y los elementos
que la integran.
-Las organización icónica de
la información cualitativa
1° año
2° año
3° año
Los datos estadísticos
-El análisis de la frecuencia
de los sucesos.
-La representación en tablas.
La información estadística.
-La descripción e
interpretación de la I
información en tablas
-La representación gráfica de
la
in información.
El trabajo estadístico.
-La muestra y la variable para
precisar la recolección de
datos.
-Las conclusiones a partir de
la interpretación de tablas.
4° año
El tratamiento de la información
estadística.
-La frecuencia absoluta y relativa
-Las representaciones en diagrama de
barras.
Área de Matemática Cerp. Florida
5°año
6°año
Los instrumentos estadísticos. - Las medidas de tendencia central:
moda, media y mediana.
Las representaciones en
histogramas.
La relación estadística.
-Las medidas de dispersión: rango.
-Las representaciones en polígonos de
frecuencia.
Reforma de Ed. Inicial y Primaria, 2009
2
¿Para qué sirve la estadística y
de que se ocupa?
Esta rama del conocimiento se ocupa en general de fenómenos observables
La Estadística Descriptiva ,en particular, trata la descripción de datos
experimentales,
Más específicamente de la recopílación, organización y análisis de datos sobre
algunas características de ciertos individuos pertenecientes al grupo de estudio.
Se desarrolla observando hechos, formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes
La Estadística se utiliza como tecnología al servicio de las ciencias donde la
variabilidad y la incertidumbre forman parte de su naturaleza
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
3
Definición
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y
presentación de los datos referentes a un fenómeno
que presenta variabilidad o incertidumbre para su
estudio metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
4
Método científico y estadística
Área de Matemática Cerp. Florida
Plantear
hipótesis
Diseñar
experimento
Obtener
conclusiones
Recoger datos
y analizarlos
Reforma de Ed. Inicial y Primaria, 2009
5
Población y muestra
Población es el conjunto sobre el que estamos interesados en
obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.
Muestra es un subconjunto de la población al que tenemos
acceso y sobre el que realmente hacemos las observaciones
(mediciones)
Debería ser “representativa”
Esta formado por miembros “seleccionados” de la
población.
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
6
Variables
Una variable es una característica, propiedad o cualidad observable que
toma distintos “valores” entre los diferentes individuos de una población.
En los individuos de la población uruguaya, de uno a
otro es variable:
El grupo sanguíneo (Variable Cualitativa)
{A, B, AB, O}
Su nivel de felicidad “declarado”
(Var. Cualitativa Ordinal)
El número de hijos (Variable Cuantitativa, Discreta)
{Deprimido, Ni fu ni fa, Muy Feliz}
{0,1,2,3,...}
La altura (Variable Cuantitativa Continua)
{1,62 ; 1,74; ...}
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
7
Tipos de variables
Cualitativas
Si sus “valores” permiten clasificar a los individuos y sólo podemos decidir sobre
la igualdad o la desigualdad entre ellos (no tiene sentido hacer operaciones
algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar
Ordinales: Si sus valores se pueden ordenar
Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
Cuantitativas
Son aquellas que pueden medirse numericamente (tiene sentido hacer
operaciones algebraicas con ellos)
Discretas: Si toma valores finitos o infinitos numerables
Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
Continuas: es aquella que puede tomar cualquier valor, al menos teóricamente en algún
intervalo de números reales.
Altura, Presión intraocular, Dosis de medicamento administrado, edad
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
8
Es buena idea codificar las variables
como números para poder procesarlas
con facilidad en una computadora.
Es conveniente asignar “etiquetas” a
los valores de las variables para
recordar qué significan los códigos
numéricos.
Sexo (Cualit: Códigos arbitrarios)
Raza (Cualit: Códigos arbitrarios)
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz
Se pueden asignar códigos a
respuestas especiales como
1 = Blanca
2 = Negra,...
Felicidad Ordinal: Respetar un orden al
codificar.
1 = Hombre
2 = Mujer
0 = No sabe
99 = No contesta...
Estas situaciones deberán ser tenidas
en cuentas en el análisis. Datos
perdidos
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
9
Aunque se codifiquen con números, debemos recordar
siempre el verdadero tipo de las variables y su significado.
No todo está permitido con cualquier tipo de variable.
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
10
Los posibles valores de una variable pueden agruparse en clases
(intervalos)
Edades:
Hijos:
Menos de 20 años, de 20 a 50 años, más de 50 años
Menos de 3 hijos, De 3 a 5, 6 o más hijos
Las clases deben formar un sistema exhaustivo y excluyente
Exhaustivo: Todo valor de la variable debe pertenecer a alguna clase
Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
Bien: ¿Cuál es su grupo sanguíneo? (A,B,AB,O)
Excluyente: No puede un elemento estar en dos categorías
simultáneamente
Estudio sobre el ocio
Mal: De los siguientes, qué le gusta: (deporte, cine)
Bien: Le gusta el deporte: (Sí, No)
Bien: Le gusta el cine: (Sí, No)
Estudio sobre el número de hijos
Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
11
Presentación ordenada de datos
7
Género
Frec.
Hombre
4
6
5
4
3
2
Mujer
6
1
0
Hombre
Mujer
Las tablas de frecuencias y las representaciones
gráficas son dos maneras de presentar la información.
Las dos exponen ordenadamente la información
recogida en una muestra con características diferentes.
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
12
Tablas de frecuencia
Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).
Frecuencias absolutas: Contabilizan el número de individuos de cada categoria
Frecuencias relativas: proporción que representa su frecuencia absoluta con respecto al número
total de observaciones
Tipo de Escuela
Rural
Urbana
Suburbana
Total
ni (F.Abs)
15
24
8
47
Nivel de felicidad
Categorías
Muy Feliz
Bastante feliz
No demasiado feliz
Subtotal
No contesta
Total
Área de Matemática Cerp. Florida
Frec. Abs.
Frec. Relativa
467
872
165
1504
13
1517
0.308
0.575
0.109
0.991
0.9
1
Porcentaje de los que
responden
31.1
58
11
100
Reforma de Ed. Inicial y Primaria, 2009
13
Datos desordenados y ordenados en tablas
Variable: Género
Género Frec.
Frec. relat. y/o
porcentaje
Hombre 4
4/10=0,4=40%
Mujer
6/10=0,6=60%
Modalidades:
H = Hombre
M = Mujer
6
10=tamaño
muestral
Muestra:
MHHMMHMMMH
es igual a
HHHH MMMMMM
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
14
Ejemplo
¿Cuántos individuos tienen
menos de 2 hijos?
frec.
indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos
¿Qué
porcentaje de
individuos tiene 6 hijos o
menos?
97,3%
¿Qué
cantidad de hijos
es tal que al menos el
50% de la población
tiene una cantidad
inferior o igual?
2
Número de hijos
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.
419
255
375
215
127
54
24
23
17
1509
Porcent.
(válido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0
Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0
≥50%
hijos
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
15
Gráficos para v. cualitativas
Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o
rel.)
Se pueden aplicar también a variables discretas
Diagramas de sectores (tortas)
No usarlo con variables ordinales.
El área de cada sector es proporcional a su
frecuencia (abs. o rel.)
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
16
Pictogramas
Son gráficos con dibujos alusivos al carácter que se está
estudiando
Se suelen construir utilizando uno de los siguientes
criterios:
Cada categoría se simboliza por un único dibujo, cuyo tamaño
es directamente proporcional a la frecuencia que representa
Para todas las categorías se utilizan dibujos de igual tamaño;
la cantidad de éstos en cada una de ellas es directamente
proporcional a su frecuencia
o
o
o
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
17
Ventajas y desventajas de las representaciones
graficas anteriores
Los gráficos de barras potencian las diferencias de frecuencias entre las
categorias
Los gráficos circulares atenúan las diferencias entre las diferentes
categorías
La utilización de gráficos circulares es aconsejable para variables con un
número no muy alto de categorías
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
18
Gráficos para variables cuantitativas
419
400
Son diferentes en función de que las
variables sean discretas o continuas.
Valen con frec. absolutas o relativas.
300
Recuento
375
255
215
200
127
100
54
24
Diagramas barras para v. discretas
0
Se deja un hueco entre barras
para indicar los valores que no
son posibles
Histogramas para v. continuas
2
3
4
5
6
7 Ocho o más
250
200
150
El área que hay bajo el
histograma entre dos puntos
cualesquiera indica la frecuencia
relativa de individuos en el
Reforma de Ed. Inicial y Primaria, 2009
Área de Matemática
Cerp. Florida
intervalo.
17
Número de hijos
Recuento
1
23
100
50
20
40
60
80
Edad del encuestado
Poligonos de frecuencias para v. continuas
19
Otra representación gráfica:
Variable Discreta
N°de
hermanos
Frec. Abs
1
1
2
3
3
5
4
3
Área de Matemática Cerp. Florida
Ojiva
Reforma de Ed. Inicial y Primaria, 2009
20
Variable Continua:
Polígono de Frecuencias
Ejemplo: En el estudio de pautas de
crecimiento en niños, una variable
importante es la edad del niño cuando
comienza el crecimiento rápido de la
adolescencia. Las siguientes
observaciones fueron obtenidas en un
estudio de 35 varones
16
14.9
14.1
14.8
14.4
14.0
14.6
15.2
14.7
13.6
14.6
16.1
13.2
13.2
14.9
14.1
15.4
15.3
14.4
14.8
14.8
13.5
15.1
13.5
15
14.6
15.4
15.9
13.7
15.9
14.7
14.5
14.4
13.8
15.3
Área de Matemática Cerp. Florida
LIMITES
FRECUENCIA
FRECUENCIA
RELATIVA
1
[13.2,13.7)
5
0.143
2
[13.7,14.2)
5
0.143
3
[14.2,14.7)
7
0.2
4
[14.7, 15.2)
9
0.257
5
[15.2, 15.7)
5
0.143
6
[15.7, 16.2)
4
0.114
CATEGORÍA
Reforma de Ed. Inicial y Primaria, 2009
21
Variable continua: Ojiva
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
22
¿Qué hemos visto?
Definición de estadística
Población
Muestra
Variables
Cualitativas
Cuantitativas
Presentación ordenada de datos
Tablas de frecuencias
absolutas
relativas
acumuladas
Representaciones gráficas
Cualitativas
Cuantitativas
Área de Matemática Cerp. Florida
Reforma de Ed. Inicial y Primaria, 2009
23
Estadística Descriptiva
MEDIDAS ESTADÍSTICAS
Área de Matemática Cerp.
Florida
Reforma de Ed. Inicial y Primaria,
2009
24
Propiedades deseables de una medida de tendencia central.
1)
Definida objetivamente a partir de los datos de la serie.
2)
Que dependa de todas las observaciones.
3)
De significado sencillo y fácil de entender.
4)
De cálculo rápido y fácil.
5)
Poco sensible a las fluctuaciones del muestreo(valor
parecido al de la población)
6)
Adecuado a cálculos algebraicos posteriores.
Estas propiedades son conocidas como las PROPIEDADES DE YULE
Área de Matemática Cerp.
Florida
Reforma de Ed. Inicial y Primaria, 2009
25
Media
Calificaciones de un alumno en un año
La media es el cociente
entre la suma de los
valores de la variable y el
número de valores.
N
x ≡
∑x
i =1
i
N
733
x =
= 8 1, 4
9
Área de Matemática Cerp. Florida
Datos
84
91
84
78
81
72
76
80
87
Datos ordenados
72
76
78
80
81
84
84
87
91
Media
81,4
Reforma de Ed. Inicial y Primaria, 2009
26
Mediana
Calificaciones de un alumno en un año
La mediana es el valor de
la variable que divide el
grupo de datos en dos
partes iguales: uno con
valores mayores y otro con
valores menores que tal
mediana.
Área de Matemática Cerp. Florida
Datos
84
91
84
78
81
72
76
80
87
Datos ordenados
72
76
78
80
81
84
84
87
91
Mediana
81
Reforma de Ed. Inicial y Primaria, 2009
27
Moda
Calificaciones de un alumno en un año
La moda es el valor de la
variable que se repite más
veces, es decir aquel que
tiene mayor frecuencia
absoluta.
Dicha medida se puede
calcular en cualquier tipo
de variable y en cualquier
escala de medida.
Según la moda, las
distribuciones
de
las
variables
se
pueden
clasificar en unimodales y
multimodales.
Área de Matemática Cerp. Florida
Datos
84
91
84
78
81
72
76
80
87
Datos ordenados
72
76
78
80
81
84
84
87
91
Moda
84
Reforma de Ed. Inicial y Primaria, 2009
28
Rango
Calificaciones de un alumno en un año
El Rango es la diferencia
entre el valor mayor y valor
menor de un conjunto de
datos.
Es una medida de la
dispersión de los datos, sin
embargo tiene en cuenta
solo dos: el máximo y el
mínimo.
Área de Matemática Cerp. Florida
Datos
84
91
84
78
81
72
76
80
87
Datos ordenados
72
76
78
80
81
84
84
87
91
Rango
19
Reforma de Ed. Inicial y Primaria, 2009
29
Descargar