Matemáticas I CEPA ”Carmen Conde Abellán” Introducción a la Estadística Melilla Definición de Estadística La E s ta d í s ti ca trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un es tu d i o es ta d í s ti co consta de las siguientes fases. - Recogida de datos - Organización y representación de los datos - Análisis de los datos - Conclusiones del estudio Conceptos de Estadística Población Una p o b l aci ó n es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Individuo Un i n d i v i d u o o u n i dad es t ad í s t i ca es cada uno de los elementos que componen la población. Muestra Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población. Muestreo El m u es t reo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población. 1 Estadística CEPA ”Carmen Conde Abellán” Matemáticas I Valor Un v a l o r es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato Un d a to es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Variable estadística Tipos Las v a ri a b l es cu a l i t a ti v a s se refieren a ca ra cte rí s ti ca s o cu a l i d a d es que n o pueden ser medidas con n ú mero s . Ejemplo: El estado civil de una persona, el tipo de medalla que has ganado en una competición, el color de los ojos de un amigo o amiga… Una v a ri a b l e cu a n ti ta ti v a es la que se expresa mediante un n ú me ro , por tanto se pueden realizar op er a ci o n es a ri t mé ti ca s con ella. Podemos distinguir dos tipos, pero nosotros sólo vamos a trabajar con uno: Variable discreta Una v a ri a b l e d i s cre ta es aquella que toma v a l o res a i s l a d o s , es decir n o admite v a l o res i n ter med i o s entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Distribución de frecuencias La d i s tri b u ci ó n d e f recu en ci a s o t a b l a d e f recu en ci a s es una o rd en a ci ó n en forma de ta b l a de los d a to s es ta d í s ti co s , asignando a cada d a to su f recu en ci a c o rres p o n d i en te. Tipos de frecuencias • Frecuencia absoluta La f r ecu en ci a a b s o l u ta es el n ú me ro d e v eces que aparece un determinado v a l o r en un estudio estadístico. Se representa por f i . La s u ma d e l a s f recu en ci a s a b s o l u ta s es igual al número total de datos, que se representa por N. 2 Estadística Matemáticas I CEPA ”Carmen Conde Abellán” Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria. • Frecuencia relativa La f re cu en ci a r el a t i v a es el co ci en te entre la fr ecu en ci a a b s o l u ta de un determinado valor y el n ú mero to ta l d e d a to s . Se puede expresar en tantos por ciento y se representa por n i . La suma de las frecuencias relativas es igual a 1. • Frecuencia acumulada La f re cu en ci a a cu mu l a d a es la s u ma d e l a s f recu en ci a s a b s o l u ta s de todos los v a l o res i n f eri o res o i g u a l es al v a l o r considerado. Se representa por F i . Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. xi Recuento fi Fi ni Ni 27 I 1 1 0.032 0.032 28 II 2 3 0.065 0.097 29 6 9 0.194 0.290 30 7 16 0.226 0.0516 31 8 24 0.258 0.774 32 III 3 27 0.097 0.871 33 III 3 30 0.097 0.968 34 I 1 31 0.032 1 31 1 3 Estadística CEPA ”Carmen Conde Abellán” Matemáticas I En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. Este tipo de ta b l a s d e f recu en ci a s se utiliza con v a ri a b l es d i s creta s . Representación gráfica de los datos estadísticos Diagrama de barras Un d i a g ra ma d e b a rra s se utiliza para de presentar d a to s cu a l i ta ti v o s o d a to s cu a n ti ta ti v o s d e ti p o d i s creto . Se representan sobre unos ejes de coordenadas, en el eje d e a b s ci s a s se colocan los v a l o res d e l a v a ri a b l e, y sobre el ej e d e o rd en a d a s las frecu en ci a s a b s o l u ta s o rel a ti v a s o a cu mu l a d a s . Los d a to s se representan mediante b a rra s de una a l tu ra p ro p o rci o n a l a la f recu en ci a . Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el siguiente resultado: Grupo f sanguíneo i A 6 B 4 AB 1 0 9 20 4 Estadística CEPA ”Carmen Conde Abellán” Matemáticas I Polígonos de frecuencia Un p o l í g o n o d e f recu en ci a s se forma uniendo los ex tre mo s de las b a rras mediante s eg men to s . También se puede realizar trazando los p u n to s que representan las f re cu en ci a s y uniéndolos mediante s eg men to s . Ejemplo Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones: Hora Temperatura 6 7º 9 12° 12 14° 15 11° 18 12° 21 10° 24 8° Diagrama de Sectores Un d i a g ra ma d e s e c to res se puede utilizar para todo tipo de va r i ab l es , pero se usa frecuentemente para las v a ri a b l es cu a l i ta ti v a s . Los d a to s se representan en un cí rcu l o , de modo que el á n g u l o de cada s ec to r es p ro p o rci o n a l a la f recu en ci a a b s o l u ta correspondiente. El diagrama circular se construye con la ayuda de un transportador de ángulos. 5 Estadística CEPA ”Carmen Conde Abellán” Matemáticas I Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte. Alumnos Ángulo Baloncesto 12 124° Natación 3 36° Fútbol 9 108° Sin deporte 6 72° Total 30 360° Parámetros estadísticos Definición de parámetro estadístico Un p a rá me tro es ta d í s ti co es un n ú mero que se obtiene a partir de los d a to s de una d i s tri b u ci ó n esta d í s ti ca . Los p a rá metro s es ta d í s ti co s sirven para sintetizar la información dada por una tabla o por una gráfica. Tipos de parámetros estadísticos Hay tr es ti p o s p a rá metro s es ta d í s ti co s : - De centralización. - De posición - De dispersión. 6 Estadística Matemáticas I CEPA ”Carmen Conde Abellán” Medidas de centralización Nos indican en torno a qué valor (centro) se distribuyen los datos. La med i d a s d e cen tra l i za ci ó n son: • Media aritm ética La med i a es el valor p ro med i o de la distribución. La med i a a ri t méti ca es el v a l o r obtenido al s u ma r todos los d a to s y d i v i d i r el resultado entre el n ú me ro total de d a to s . es el símbolo de la med i a a ri t méti ca . Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio. • Mediana La med i a n a es la p unta ci ó n de la escala que s ep a ra l a mi ta d s u p eri o r de la distribución y l a i n f eri o r, es decir divide la serie de datos en d o s p a rt es i g u a l es . Cálculo de la mediana 1 O rd en a mo s los d a t o s de men o r a ma y o r. 2 Si la serie tiene un n ú me ro i mp a r d e med i d a s la me d i a n a es la p u n tu a ci ó n cen tra l de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5 3 Si la serie tiene un número p a r de puntuaciones la med i a n a es la med i a entre las dos p u n tu a ci o n es cen tra l es . 7, 8, 9, 10, 11, 12Me= 9 . 5 • Moda La mo d a es el v a l o r que má s s e r ep i te en una distribución. 7 Estadística CEPA ”Carmen Conde Abellán” Matemáticas I Medidas de dispersión Las med i d a s d e d i s p ers i ó n nos informan sobre cuánto se alejan del centro los valores de la distribución. Las med i d a s d e d i sp ers i ó n son: • Rango o recorrido El ra n g o es la d i f er en ci a entre el ma y o r y el men o r de los d a to s de una distribución estadística. • Varianza La v a ri a n za es la med i a a ri t mé ti ca del cu a d ra d o d e l a s d es v i a ci o n es respecto a la med i a . La varianza se representa por . Para simplificar el cá l cu l o d e l a v a ri a nza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. • Desviación típica La d es v i a ci ó n tí p i c a es la ra í z cu a d ra d a de la v a ri a n za . Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La d es v i a ci ó n tí p i ca se representa por σ. Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Cuanta más pequeña sea la d es v i a ci ó n tí pi ca mayor será la co n ce n tra ci ó n d e d a to s alrededor de la med i a . • Coeficiente de variación El co ef i ci en te d e v a ri a ci ó n es la relación entre la d es v i a ci ó n tí p i ca de una muestra y su med i a . 8 Estadística CEPA ”Carmen Conde Abellán” Matemáticas I El co ef i ci en te d e v a ri a ci ó n se suele expresar en p o rc en ta jes : El co ef i ci en te d e v a ri a ci ó n permite comparar las d i s p ers i o n es de dos distribuciones distintas, siempre que sus med i a s sean p o s i ti v a s . Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La ma y o r d i s p ers i ó n corresponderá al valor del co ef i ci en te d e v a ri a ci ó n ma y o r. Ejercicio Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión? La primera distribución presenta mayor dispersión. 9 Estadística