Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Unidad 1: Estadística Descriptiva La estadística es entendida como un conjunto de técnicas que nos permiten, por un lado, recoger, representar, clasificar, resumir datos de un colectivo (Estadística descriptiva). Por otro lado, nos permiten obtener conclusiones a partir de esos datos (Estadística inferencial). El análisis descriptivo, constituye el primer nivel de análisis, y sus funciones son las de establecer cuál es la forma de distribución de una, dos o tres variables en el ámbito global del colectivo, cuántas unidades se distribuyen en categorías naturales o construidas de esas variables, cuál es la magnitud de ella expresada en forma de una síntesis de valores, cuál es la dispersión con que se da entre las unidades del conjunto, etc. La estadística descriptiva se encarga de las muestras. Las muestras provienen de poblaciones, sin embargo, el objetivo de la estadística descriptiva no son las poblaciones. La estadística descriptiva no afirma ni niega nada en relación a las poblaciones de origen, ni sobre los fenómenos generales. Las distribuciones de datos son el resultado de la recogida de información en los experimentos. Las distribuciones de datos organizan por medio de variables. La estadística descriptiva se encarga de cuantificar características de las variables asociadas a las muestras. Antes de proseguir daremos algunas definiciones de conceptos. Individuos o elementos: personas u objetos que contienen cierta información que se desea estudiar. Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes. En relación al tamaño de la población, ésta puede ser: • Finita, • Infinita, Muestra: subconjunto representativo de una población, esto significa que la muestra debe ser como un modelo a escala de la población, es decir, debería verse reflejada la diversidad de rasgos presente en la población. Parámetro: función definida sobre los valores numéricos de características medibles de una población. Estadístico: función definida sobre los valores numéricos de una muestra. Caracteres: propiedades, rasgos o cualidades de los elementos de la población. Estos caracteres pueden dividirse en cualitativos y cuantitativos. Modalidades: diferentes situaciones posibles de un carácter. Las modalidades deben ser a la vez exhaustivas y mutuamente excluyentes (cada elemento posee una y sólo una de las modalidades posibles). Clases: conjunto de una o más modalidades en el que se verifica que cada modalidad pertenece a una y sólo una de las clases. 1 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia TIPOS DE VARIABLES Cuando hablemos de variable hacemos referencia a un símbolo (X, Y, X1, X2, .. ,) que puede tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos dominio de la variable. En función del tipo de dominio, las variables las clasificamos del siguiente modo: Variables cualitativas o no métricas, son las que tienen por modalidades cantidades no numéricas, por lo que no podemos hacer operaciones aritméticas con ellas. Dentro de este tipo de variables podemos distinguir escalas de medidas: Escala Nominal, en este caso los valores asignados a cada característica se comportan como etiquetas. Por ejemplo, Lugar de nacimiento (Talcahuano, Concepción, Chillán, etc), Bebida favorita (Fanta, Sprite, Coca cola, etc). Las variables medidas en escala nominal no admiten puntuaciones numéricas ordenadas significativamente, aunque para efectos principalmente de procesos computacionales asignamos números a estas categorías. Por ejemplo, si medimos el genero de una persona, podemos asignar 1 al valor hombre y 2 al valor mujer. Esto no significa la mujer sea mayor que el hombre (2>1) ni el doble (2=2x1) como tampoco que existan personas intermedias (1,5). Una exigencia básica de las escalas nominales es que los objetos han de poder clasificarse en categorías que sean mutuamente excluyentes y exhaustivas, es decir, un objeto debe poder asignarse a una y sólo una categoría, y todos los elementos han de poder clasificarse en las categorías existentes. Ordinales, son las que, aunque sus modalidades son de tipo nominal, es posible establecer un orden entre ellas. Ejemplo, clase social (indigente, baja, media y alta). La variable “actitud hacia el aborto legal” podría ordenar el grado de acuerdo mediante el uso de categorías de respuestas; totalmente de acuerdo, de acuerdo, no sabe, en desacuerdo, totalmente en desacuerdo. Este conjunto de valores ampliamente utilizado se denomina escala de Likert. Aquí también podemos usar número para indicar los valores de las categorías, sin embargo estos tienen el sentido de distinguir y ordenar, pero no las diferencias ni las razones. Variables cuantitativas, son las que tienen por modalidades cantidades numéricas con las que podemos hacer operaciones aritméticas. Dentro de este tipo de variables podemos distinguir dos grupos: Variables Discretas, sólo pueden tomar un número un número determinado de valores en un intervalo determinado. En general, las variables discretas se asocian a variables que indiquen un conteo. Variables Continuas, pueden tomar un número infinito de valores en un intervalo dado. Por otra parte las variables cuantitativas se clasifican en dos grupos de acuerdo a su escala de medición; de Intervalo y de Razón. 2 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Una escala de intervalo posee las característica de una nominal (diferentes valores representan diferentes características de los objetos) y de la ordinal (mayor valor representa mayor presencia de la característica). Sin embargo, la escala de intervalo, añade una nueva propiedad; la diferencia también tiene sentido. Las variables de intervalo identifican las diferencias en monto, cantidad, grado o distancia. Las variables de intervalo dan sentido de “cuánto” o “de que tamaño”, qué tan caliente, que tan obstinado, qué tan conservador, que tan deprimido, que tan largo, que tan pesado. Una de las características de las escalas de intervalo es que, el cero es arbitrario, es decir, no es absoluto. En estas escalas no tienen sentido las razones, por ejemplo, si medimos la temperatura en grados celsius y un objeto mide 20°C y otro 10°C podemos decir que uno tiene el doble de temperatura que otro, pero si estas mismas temperaturas las medimos en grados Fahrenheit no es cierto ya que 20°C ⇔ 68°F y 10°C ⇔ 50°F, en el que obviamente 68°F no es doble de 50°F. Una escala de razón tiene las mismas propiedades de las escalas de intervalos pero, además, las razones si tienen sentido. Estas escalas tienen un valor base cero natural. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS A fin de fijar ideas comenzaremos con un ejercicio: Ejercicio: El jefe de producción de una compañía dedicada a la fabricación de alfombras con más de 500 telares, tiene que medir la producción diaria (en metros) de cada telar. El consciente de lo tedioso del problema registra la producción diaria de sólo 30 telares a fin de llegar a una conclusión sobre su problema. A continuación se muestran los datos obtenidos de medir los 30 telares: 16.2 15.7 16.4 15.4 16.4 15.8 16.0 15.2 15.7 16.6 15.8 16.2 15.9 15.9 15.6 15.8 16.1 15.9 16.0 15.6 16.3 16.8 15.9 16.3 16.9 15.6 16.0 16.8 16.0 16.3 Observe el conjunto de datos, ¿qué puede indicar?. Los datos presentados son conocidos como información cruda y no como conocimientos en sí. La secuencia que va desde los datos hasta el conocimiento es: Datos Æ Información Æ Hechos Æ Conocimiento Los datos se convierten en información, cuando se hacen relevantes para la toma de decisión a un problema. La información se convierte en hecho, cuando es respaldada por los datos. Los hechos son lo que los datos revelan. Sin embargo el conocimiento instrumental es expresado junto con un cierto grado estadístico de confianza. 3 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Un primer paso en el estudio es determinar la variable de medición, que tipo de variables es, en qué escala está medida y en que objeto (unidad experimental) estamos efectuando la medición. La identificación de estos elementos nos indicará por una parte que pasos debemos seguir y por otra nos ayudará en la interpretación de nuestros resultados. En nuestro ejemplo, la variable de medición es la producción diaria, variable continua, medida en escala de razón. Cuando se examina la distribución de los datos, debemos buscar algunas características importantes, tales como forma, ubicación, variabilidad, y valores inusuales. Transformar los datos en información implica realizar procesos que ayuden a la toma de decisiones. Un primer paso es conocer las características más importantes de la variable en estudio como por ejemplo, la distribución de los datos, la forma, ubicación, variabilidad, valores inusuales, etc. Un primer paso, tal vez, es ordenar los datos en orden ascendente, así 15.2 15.7 15.9 16.0 16.2 16.4 15.4 15.7 15.9 16.0 16.3 16.6 15.6 15.8 15.9 16.0 16.3 16.8 15.6 15.8 15.9 16.1 16.3 16.8 15.6 15.8 16.0 16.2 16.4 16.9 ¿Qué se observa ahora? A pesar de las ventajas que muestra el ordenamiento de los datos este en si no resulta útil puesto que da una lista de todos los valores, lo cual es una forma incómoda de mostrar grandes cantidades de datos. Necesitamos comprimir aún más la información y ser capaces de utilizarla para su interpretación y para la toma de decisiones. Una forma de comprimir los datos es la tabla de distribución de frecuencias que corresponde a una lista de clases o categorías de datos junto con el número de valores que caen dentro de cada una. Tabla de distribución de frecuencias para variables continuas: No existe una regla fija para determinar el número apropiado de clases para una distribución de frecuencias, pero en general estas deben ser entre 5 y 20. Dos reglas bastante usadas para determinar el número aproximado k de clases son: i) Determinar el número k (k ∈ Ζ +) de clases tal que 2 k > n. ii) Determinar el número k (k ∈ Ζ +) de clases tal que k ≈ 1+3,3log10n (regla de Sturge) donde n representa el total de observaciones. El número de clases debe ser un entero positivo, luego, como regla practica, toda vez que el valor de K no resulte entero este será aproximado al entero siguiente independiente del decimal resultante. 4 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Una vez fijado el número de clases se deben construir las clases, ojalá de igual amplitud para facilitar su interpretación. Las clases corresponden a intervalos cerrados de la forma [a , b] donde a es llamado limite inferior de la clase y b el limite superior. Se debe tener en cuenta que las clases deben ser inclusivas y mutuamente excluyentes, es decir, por una parte deben incluir todos los valores del conjunto de datos y por otra, un dato debe pertenecer claramente a una y sólo una clase. Calculo de la amplitud, A. Rango A= k donde Rango = valor máximo – valor mínimo k : número de clases Como criterio y como una forma de facilitar la interpretación, la amplitud deberá presentarse con la misma cantidad de decimales que los datos originales por lo tanto está debe aproximarse hacia arriba de acuerdo al formato de los datos. Para escribir las clases, un criterio es comenzar a anotar los limites inferiores de cada clase, correspondiendo al limite inferior de la primera clase el valor mínimo luego a este sumamos la amplitud y obtenemos el limite inferior de la segunda clase y por sumas sucesivas de la amplitud al valor obtenido vamos obteniendo los restantes limites inferiores de las clases siguientes. Para escribir los limites superiores de cada clase se procede de la siguiente forma: El limite superior de la primera clase corresponde al valor del limite inferior de la segunda clase menos una unidad de paso (up), donde 1 si los datos son enteros 0,1 si los datos tienen un decimal up = 0,01 si los datos tienen dos decimales y así sucesivamente Una vez escrita las k clases, llamadas también intervalos de clases o limites aparentes, debemos contar cuantos datos pertenecen a cada clase, a estos valores los llamaremos frecuencia absoluta de la clase y lo denotaremos por ni (frecuencia absoluta de la clase i). De nuestro ejemplo tenemos: n= 30 k= 1 + 3,3 log1030=5,87 ≈ 6 A= 16,9 − 15,2 =0,283 ≈ 0,3 (los datos se presentan con un decimal) 6 5 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Así la tabla de distribución de frecuencias es: Intervalos de clase 15,2 15,5 15,8 16,1 16,4 16,7 - frecuencia absoluta 2 5 11 6 3 3 15,4 15,7 16,0 16,3 16,6 16,9 Observe la tabla de distribución de frecuencias ¿qué puede comentar ahora?. Trabajar con cifras absolutas no da una idea de la real dimensión respecto de la importancia del dato, de aquí, que se acostumbra a agregar a la tabla de distribución de frecuencias una columna con las frecuencias relativas fi. Adicionalmente, también se agregan las columnas con las frecuencias absolutas acumuladas Ni, frecuencias relativas acumuladas Fi y las marcas de clases mi, donde: fi = ni n i Ni = ∑ n j Fi = j =1 Ni = n i ∑f j =1 j mi = lim . inf i + lim.sup i 2 Con estas nuevas columnas las tabla de distribución de frecuencias anterior queda: Intervalos clase 15,2 15,5 15,8 16,1 16,4 16,7 - 15,4 15,7 16,0 16,3 16,6 16,9 de frecuenc ia absoluta ni 2 5 11 6 3 3 Frecuencia relativa Frecuencia absoluta acum. Frecuencia relativa acum. Marca de clases fi Ni Fi mi 0,067 0,167 0,367 0,200 0,100 0,100 2 7 18 24 27 30 0,067 0,234 0,601 0,801 0,901 1,000 15,3 15,6 15,9 16,2 16,5 16,8 Comente e interprete algunos valores. 6 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Tabla de distribución de frecuencias para variables cualitativas. Cuando se trate de variables cualitativas, las clases serán naturales, correspondiendo cada modalidad de la variable a una clase. Ejemplo. En una encuesta realizada a un grupo de empleados de una empresa se les solicitó que marcaran una actividad de mayor preferencia, para realizar el día viernes, después de terminar su jornada laboral. Las opciones eran: 1.- Salir a bailar 2.- Hacer deporte 3.- Jugar juego de salón. 4.- Ir al cine 5.- Ir a casa a descansar 6.- Otro no especificado Las respuestas de esta encuesta fueron las siguientes: 2 2 3 6 5 2 6 1 3 2 2 1 1 1 5 2 1 3 5 2 3 5 2 3 2 1 2 1 1 2 4 5 5 6 6 3 2 4 3 6 Escriba la tabla de distribución de frecuencias. Ya tenemos claro que la variable de estudio es cualitativa, si embargo aún nos faltan algunas preguntas que responder: ¿en que escala está medida?, ¿cuál es la unidad experimental? Respondida estas preguntas estamos en condiciones de escribir la tabla de distribución de frecuencias. Clases Salir a bailar Hacer deportes Jugar juego de salón Ir al cine Ir a casa a descansar Otro no especificado Total frecuencia absoluta 8 12 7 2 6 5 40 Observe la tabla de distribución de frecuencias y comente. 7 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Tabla de distribución de frecuencias para variables discretas. Para agrupar los datos de una variable discreta se recomienda en primer término contar el número de valores diferentes de la variable. Si este es menor o igual a 10, la variable es tratada como una variable cualitativa, en caso contrario es tratada como variable continua. Ejemplo: En un centro de computación se registra el número de veces que un computador se detiene por errores de hardware. Durante un periodo de 63 días se obtuvieron los siguientes datos: 5 1 0 2 0 7 3 2 2 5 1 0 0 0 1 0 0 0 0 0 0 4 1 1 3 3 0 2 0 6 1 2 0 2 0 0 0 0 1 1 3 0 6 1 2 4 2 0 3 2 0 3 0 4 1 0 4 4 0 2 0 1 2 Escriba la tabla de distribución de frecuencias. Comente e interprete algunos valores. A continuación se proporcionan dos ejercicios para su desarrollo. Ejercicio 1: Rob Whitner, propietario de Whitner Pontiac, está interesado en reunir información sobre los precios de ventas de los vehúlos vendidos en su agencia. Los datos que se muestran a continuación corresponden al precio pagado por 80 clientes para cada vehículo. Ayude Ud. a Rob Whitner. 20.197 16.587 15.8 15.9 15.10 15.11 26.760 15.8 20.372 20.169 16.873 16.688 18.981 18.722 29.492 27.655 17.454 32.851 22.251 20.657 21.052 16.331 15.890 19.442 20.591 16.251 22.277 23.613 22.799 19.817 18.740 14.891 23.651 17.047 25.034 17.895 12.794 16.766 19.374 17.818 24.453 21.285 21.533 17.203 15.263 17.633 21.571 23.237 14.266 21.324 24.443 20.765 33.625 17.962 22.449 17.445 15.021 21.609 16.889 22.783 14.399 19.845 25.337 18.556 25.683 25.670 17.004 23.661 14.968 23.285 17.642 18.639 27.872 12.546 14.357 29.277 17.356 24.896 20.613 21.296 Ejercicio 2: Los siguientes registros corresponden 80 determinaciones de la emisión diarias (en toneladas) de óxidos de azufre de una planta industrial. 15.826.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2 22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7 26.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7 19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0 18.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5 14.4 29.6 19.4 17.0 20.8 24.3 22.5 15.9 24.6 18.4 18.1 8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8 25.9 10.5 27.5 18.1 17.9 9.4 24.1 20.1 28.5 8 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Representación Gráfica Para transmitir un sentido de proporción se describe numéricamente la distribución de una variable de manera porcentual. Las distribuciones numéricas, sin embargo, tienen sentido sólo si una persona tiende a pensar de manera proporcional. Por consiguiente a menudo nos valemos de recursos gráficos para motivar directamente el sentido proporcional. Los gráficos constituyen un excelente soporte al célebre refrán “Una imagen dice más que mil palabras”. La gráfica a realizar depende del tipo de variable: Gráficos para variables continuas. Los gráficos más utilizados en este tipo de variable son el histograma, el polígono de frecuencias y la ojiva. El histograma es un conjunto de barras rectangulares, de ancho igual a la amplitud y de altura igual a la frecuencia absoluta o relativa. Para dibujar el histograma en el eje de las abscisas ubicamos los limites reales y en el eje de las ordenadas la frecuencia. Para obtener los limites reales procedemos de la siguiente forma: 1 1 up lim. real sup.j = lim. sup.j + up 2 2 Del ejemplo de las emisiones de azufre el histograma queda: lim. real infj = lim. inf.j - j = 1, ....,n Distrib u ció n d e las em isio n es d iarias 20 18 16 N º de días 14 12 10 8 6 4 2 0 6,15 9,45 12,75 16,05 19 ,35 22 ,65 25 ,9 5 29 ,25 32 ,55 E misiones diarias (en toneladas) El Polígono de frecuencias es un gráfico que muestra un perfil más suavizado de la forma de la distribución de la variable. Para dibujar el polígono de frecuencias ubicamos en el eje de las abscisas las marcas de clases y en el eje de las ordenadas la frecuencia absoluta o la frecuencia relativa, luego mediante trazos rectos unimos dichos puntos. Esta gráfica se muestra como una curva cerrada, luego bajamos un trazo a ambos extremos de la curva. El polígono de frecuencias se puede dibujar de manera independiente o junto al histograma. 9 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia D ist rib ución de las em isiones de a z ufre 0 .23 0 .23 0 .17 0 .17 fre cuen ci a relativa frec uenc ia relativa D istrib ución de las em isio nes de a zufre 0 .11 0 .06 0 .00 0 .11 0 .06 0 .00 E m is io n (en toneladas ) E m is io n (en tone ladas ) La Ojiva es una gráfica en que se representan las frecuencias acumuladas y se usa para determinar cuántas observaciones hay mayores o menores que un valor determinado en una distribución. Para dibujar la ojiva, en el eje de las abscisas se ubican los limites reales de cada clases y en el eje de las ordenadas las frecuencias relativas acumuladas. Cada punto de la gráfica es unido mediante una curva suavizada. O jiva, ejem plo em isión de a zufre Fi 1 0.8 0.6 0.4 0.2 0 6.15 9.45 12.75 16 .0 5 19.35 22.65 25 .9 5 2 9.25 32.55 Em i si on e s d e a z ufre (tone l a d a s) Ojiva, ejemp lo emisión de azufre Ojiva, eje mp lo em isión de azu fre Fi Fi 1 1 0. 8 0 .8 0. 6 0 .6 0. 4 0 .4 0. 2 0 9.45 12.75 16 .05 5 9,0% 0 .2 55,1 % 6 .1 5 1 0,3% 19.35 22 .65 25 .9 5 Em isione s de a zu fr e (tone la d a s) 29.25 32.55 3 0,7% 0 6.15 9.45 1 2.7 5 16.05 1 9.3 5 22.65 25.95 2 9.2 5 3 2.55 Em ision e s de a z u fre (tone lad a s) 10 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Gráficos para variables cualitativas Los gráficos más utilizados en este tipo de variable son el gráfico de barras, el gráfico de torta o pastel y el pictograma. El gráfico de barras es un conjunto de rectángulos de ancho arbitrario (pero único) y de altura igual a la frecuencia absoluta o relativa. En el eje de las abscisas ubicamos cada categoría de la variable y en el eje de las ordenadas la frecuencia. Ejemplo: En una consulta a personas de 50 años o más acerca de una pregunta “¿a cuántos minutos de recorrido en auto considera Ud. que debe estar el hospital más cercano a su casa cuando se jubile?, se obtuvo el siguiente gráfico de barras. D is trib uc ió n d e lo s min u to s en a uto 160 Nº de p erso na s 140 120 100 80 150 60 128 94 40 67 47 20 0 5 m inu to s o 6 a 10 11 a 15 16 a 20 m ás d e 20 m e nos m inu to s m inu to s m inu to s m inu to s Gráfico de torta o de pastel, es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Este tipo de gráfico es particularmente útil cuando se quiere hacer hincapié en los tamaños relativos de las componentes de los datos. Para determinar la porción del pastel que corresponde representar de una categoría determinada se usa la expresión: x 0 = 360 ni = 360 f i n Del ejemplo anterior el gráfico de torta es: D istribució n de los minutos en auto 19% 10% 5 m inutos o m enos 6 a 10 minutos 31% 14% 11 a 15 m inutos 16 a 20 m inutos 26% más de 2 0 m inutos 11 Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia Pictogramas: Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. Generalmente estos dibujos se hacen representado a diferentes escalas un mismo dibujo. Producción de carne de conejo por criadero 40 kg. C riadero A 70 kg. C riadero B 110 kg. C riadero C Gráficos para variables discretas Para representar las variables discretas debemos tomar en cuenta lo mencionado anteriormente, es decir, primero contar el número de valores diferentes de la variable. Si este es menor o igual a 10 la variable es tratada como una variable cualitativa, en caso contrario es tratada como variable continua. Estadísticos descriptivos o Estadígrafos Anteriormente ya resumimos un conjunto de datos en un grupo de clases a fin de estudiar su comportamiento, posteriormente representamos dicha información gráficamente. Ahora veremos algunas medidas que resumen la información en un único valor, tales medidas se clasifican en tres categorías: Las medidas de tendencia central, las de variación y las de posición relativa. Antes de dar las definiciones describiremos la notación a ser usada. Una observación cualquiera de un conjunto de datos es descrita mediante la notación xi, mientras que un conjunto de n observaciones será descrito por la notación x1,x2,...,xn. Las observaciones descritas por estas notaciones corresponden a los datos en bruto, no siguen ningún orden sino que aparecen tal como han sido registradas. Si el conjunto de datos anterior, procedemos a ordenarlo en forma ascendente entonces usaremos por notación x(1), x(2),...,x(n), donde se cumple que x(1) ≤ x(2) ≤ ... ≤ x(n). El número entre paréntesis indica la posición del número dentro del conjunto de datos ordenados. Medidas de tendencia central Son medidas que describen el centro de un conjunto de datos,es decir, medidas de ubicación que dan la información sobre el lugar hacia donde existe la tendencia central dentro de un grupo de números. Las tres medidas de tendencia central más comunes son la media o promedio, la mediana y la moda. 12