TRABAJO DE ESTADÍSTICA "estadística es el estudio de los INTRODUCCIÓN

Anuncio
TRABAJO DE ESTADÍSTICA
INTRODUCCIÓN
Si bien no hay una definición de estadística exacta, se puede decir que la "estadística es el estudio de los
métodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias
científicas partiendo de tales datos".
Esta definición cubre gran parte de la actividad del científico. Es importante observar que el objeto del que
realiza el análisis estadístico son los datos y las observaciones científicas por sí mismos, mas que el material
químico que interviene en el estudio.
Para poder comprender eficientemente los procesos estadísticos, se realizará un trabajo completo con lo hecho
en clases para poner en práctica los conceptos de población, muestra, inferencia, distribución de
frecuencia, variable, moda, mediana, media, percentiles, etc.
Se tomará un curso de 50 personas (población) para estudiar las notas de un ramo llamado Ingeniería del
Software de una Universidad y con esta información se obtendrán resultados que eventualmente podrían
compararse con el mismo ramo de otras universidades.
Explicare también todos los pasos que se deben realizar para la confección de un informe adecuado y de fácil
comprensión para el lector.
OBJETIVOS
• Comprender los pasos necesarios para realizar un estudio de una población.
• Ejercitar los procesos y los cálculos para obtener información de la población.
• Entender los conceptos y definiciones que utiliza la estadística para el estudio de la población o
muestra.
LA POBLACIÓN
La población consiste en 50 estudiantes que tuvieron las siguientes calificaciones en el ramo de Ingeniería de
Software de una universidad.
45
61
38
31
45
51
47
29
32
44
La unidad de análisis es el estudiante y las variables son las calificaciones obtenidas en dicho ramo. Las
calificaciones pueden ser de 10 a 70, siendo 10 la calificación mínima y 70 la calificación máxima.
Esta variable es de tipo cuantitativa − discreta, pues no pueden haber valores decimales y si los hubiese, el
profesor está obligado a aproximar. También estas calificaciones están en una escala de razón.
Ahora bien, necesitamos tabular los datos, pero antes se podría haber realizado un cálculo que permite
determinar el número de intervalos y la amplitud. Se sugiere que no sean más de 14 ni menos de 4. Pero en
este caso es fácil realizar la tabulación sin la necesidad de hacer el cálculo.
1
Intervalos
10 − 19
20 − 29
30 − 39
40 − 49
50 − 59
60 − 70
fi
1
5
8
19
9
8
En la tabla 1 podemos observar que se divide en dos columnas, la primera son los intervalos y la segunda son
las frecuencias absolutas que indican el numero de calificaciones que se encuentran en dicho rango. Una vez
obtenida esta información se procederá a obtener mayor análisis de los datos obtenidos de la población.
Tabla 1
DISTRIBUCIONES Y GRÁFICOS
Una vez obtenida la población con sus respectivas frecuencias se podrá analizar más detalladamente los datos.
Vimos además que la tabla anterior estaba compuesta de 2 columnas. Sin embargo, ahora se agregarán
columnas necesarias para un estudio más específico de la población.
Intervalos
10 − 19
20 − 29
30 − 39
40 − 49
50 − 59
60 − 70
Xi
15
25
35
45
55
65
fi
1
5
8
19
9
8
Fi
1
6
14
33
42
50
hi
0,02
0,1
0,16
0,38
0,18
0,16
Hi
0,02
0,12
0,28
0,66
0,84
1
Tabla 2
Se puede observar que la tabla 2 tiene más columnas que la tabla 1 y estas significan lo siguiente: ya he
explicado lo que significa la primera y la tercera columna. La segunda columna Xi es el promedio del
intervalo y se utiliza para hacer algunos cálculos más adelante. La cuarta columna Fi indica las frecuencias
acumuladas, que sirve para interpretar algunos datos como lo siguiente: 14 estudiantes de un total de 50
reprobaron el ramo, pues han obtenido una calificación inferior a 40. La quinta columna hi obtiene una
proporción con respecto al total de la población para cada intervalo y se pueden interpretar los datos de la
siguiente manera: el 10% de los estudiantes han obtenido una calificación entre 20 y 29. Finalmente la sexta
columna indica la proporción acumulada de los estudiantes según sus calificaciones. Por ejemplo: el 28% de
los alumnos han reprobado el ramo.
Estos datos se pueden graficar de distintas maneras para poder estudiarlos de una manera distinta.
La figura 1 representa la distribución de los alumnos según sus calificaciones.
Figura 1
2
En la figura 2 podemos observar que el gráfico tiene un comportamiento similar al gráfico anterior, sin
embargo este muestra los límites existentes entre las calificaciones. Estos intervalos tiene la misma amplitud y
la altura de los rectángulos es igual a la frecuencia. Este gráfico recibe el nombre de Histograma.
Figura 2
Finalmente, en la figura 3 podemos observar el gráfico llamado ojiva. Esta representa la información similar a
la figura 1 pero con las frecuencias acumuladas.
Figura 3
MEDIDAS DE RESUMEN
En esta sección utilizaremos las medidas de resumen para obtener mayor información a la obtenida
anteriormente.
Estas medidas de resumen consisten en 3 grandes grupos:
• Medidas de Posición
• Medidas de Dispersión
• Medidas de Forma
1.− Dentro de las medidas de posición tenemos los siguientes resultados.
1.1 Medidas de dependencia central:
Media : 45,32
Mediana : 45
Moda : 40 43 45 46 51
1.2 Medidas no centrales:
Primer decil : 29
Segundo cuartil : 45
Tercer quintil : 47
3
2.− Dentro de las medidas de Dispersión tenemos los siguientes datos.
Rango : 52
Desviación media : 9,73
Varianza : 153,97
Desviación Std. : 12,4
3.− Finalmente, dentro de las medidas de Forma tenemos lo siguiente.
• Medida de Asimetría:
Coef. de simetría : 0.03
CONCLUSIÓN
Hemos observado y estudiado las diferentes formas de estudiar los datos de una población. Hemos
comprendido los pasos a realizar un estudio detallado de los datos, en este caso, las calificaciones de los
alumnos del curso Ingeniería de Software.
Lo más importante es la interpretación de estos datos con respecto a la población. Esto es por ejemplo,
determinar el porcentaje de aprobados y reprobados con las frecuencias acumuladas o las proporciones
acumuladas.
Hemos observado también que el estudio de la información a través de los gráficos ayuda la comprensión de
los datos con respecto a la población.
Finalmente hemos omitidos los pasos para el calculo de las medidas de resumen, pues en cualquier parte se
pueden encontrar las formulas correspondientes a cada tipo de dato.
4
Descargar