Organización y presentación de datos estadísticos

Anuncio
TEMA 2: ESTADÍSTICA DESCRIPTIVA: ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
DISTRIBUCIONES DE FRECUENCIA: TABLAS Y GRAFICOS
Una distribución de frecuencias es una tabla de resumen en la que los datos se disponen en
agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente.
Construcción de la tabla de distribución de frecuencias
• Selección del número de clases (K)
Criterio para definir el número:
Fórmula
◊ K = "N
◊ K = 1 + 3.322 Log N
Entre 5 y 20 intervalos
• Obtención de los intervalos de clase
Rango: (R) = (X max − X min) Iv = [X min; X max]
Ancho intervalo (): R / K
◊ Igual para todos los Ii
◊ Diferente
• Establecimiento de los límites de clase
• Cifras significativas:
El mismo número que poseen las observaciones (Redondear si es necesario)
Una cifra significativa más que las que poseen las observaciones
• Valor del límite inferior del primer Inter. y lim. superior del último
LI1 = X min LSk = X max. [LI1 " xi " LSk]
LI1 " X min LSk " X max. [LI1 " xi " LSk]
[LIi " xi < LSi)
• Clases abiertas para el primer y último intervalo
Menos de LI1 Más de LSk−1
Marca de clase (mi o mc)
1
La marca de clase (mi) es el punto medio entre los limites de cada clase y es representativa de los
datos de esa clase.
mi = (LIi + LSi)/2
Frecuencias
La frecuencia es el Nº de observaciones presentes en cada intervalo.
fi = número de observaciones pertenecientes a un intervalo.
fir = fir / n
fir% = fir * 100
Fi = Número de observaciones menores que LSi
Fir = Fi / n
Fir% = Fir * 100
PRESENTACIÓN DE DATOS EN TABLAS
Indicaremos los pasos a seguir en forma detallada para la organización y presentación de datos en una
tabla de frecuencias tomando como base un ejemplo.
Ejemplo: los datos que se brindan a continuación corresponden a 110 mediciones de altura (cm) de
plantas de un cultivar de Soja en un determinado estado fenológico del ciclo
56.5 57.0 58.5 59.0 60.5 61.2 61.5 62.0 62.1 62.5 63.1 63.2 63.4 63.5 63.8 64.0 64.1 64.6 64.7 64.9 65.3 65.3
65.6 65.7 66.1 66.2 66.2 66.4 66.5 66.6 66.9 67.0 67.1 67.1 67.5 67.7 67.8 67.9 68.0 68.1 68.1 68.1 68.1 68.2
68.4 68.6 68.8 69.0 69.0 69.2 69.3 69.4 69.4 69.5 69.5 69.5 69.9 70.0 70.1 70.1 70.4 70.5 70.5 70.6 70.6 71.0
71.5 71.7 72.2 72.2 72.3 72.4 72.5 72.5 72.6 73.0 73.0 73.2 73.4 73.5 73.5 73.5 73.5 73.7 73.7 74.1 74.5 74.7
75.0 75.0 75.3 75.4 75.8 76.2 76.3 77.7 77.9 78.1 78.2 78.3 78.5 79.4 79.5 80.4 80.7 81.2 82.6 82.8 83.5 84.3
X = Altura de plantas de un cultivar de soja (cm.)
Clasificación: V. Cuantitativa Continua.
1.− K = "n = "110 " 11
2.− R = (X max − X min) = (84.3 − 56.5) = 27.8 cm.
() = R / K = 27.8 / 11 = 2.53 " 3
Tabla de frecuencias
Marca
Intervalos
56.5 − 59.5
Recuento
////
Clase
58
fi
fir
Fir%
Fi
Fir
Fir%
4
0.0367
3.67
4
0.0364
3.64
2
59.5 − 62.5
62.5 − 65.5
65.5 − 68.5
68.5 − 71.5
71.5 − 74.5
74.5 − 77.5
77.5 − 80.5
80.5 − 83.5
83.5 − 86.5
////
//// //// ///
//// //// //// //// ///
//// //// //// //// /
//// //// //// ////
//// ////
//// ////
////
//
61
64
67
70
73
76
79
82
85
5
13
23
21
20
9
9
4
2
0.0455
0.1182
0.2091
0.1910
0.1818
0.0818
0.0818
0.0367
0.0182
4.55
11.82
20.91
19.10
18.18
8.18
8.18
3.67
1.82
9
22
45
66
86
95
104
108
110
0.0818
0.2000
0.4091
0.6000
0.7818
0.8636
0.9455
0.9818
1
8.18
20.00
40.91
60.00
78.18
86.36
94.55
98.18
100
Fi = fi = n Fir = fir = 1 Fir% = fir% = 100
3
Organización de datos numéricos Discretos
Los siguientes datos corresponden al número de plantas de la especie Setaria leiantha, por tramo de
transecta.
21001011413221
120314
X = Número de plantas por transecta
Clasificación: V. Cuantitativa Discreta.
Tabla de frecuencias
Nº de plantas
0
1
2
3
4
fi
4
8
4
2
2
fir
0.20
0.40
0.20
0.10
0.10
fir%
20
40
20
10
10
Fi
4
12
16
18
20
Fir
0.20
0.60
0.80
0.90
1
Fir%
20
60
80
90
100
4
Descargar