Medidas de tendencia central INDICE 2.1- ORDENAMIENTO DE DATOS Diagrama de tallo y hojas Distribución de frecuencias Tabla de frecuencias Grafica de Histograma Polígono de frecuencias 2.2- MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN Central Mediana Media Moda Dispersión Rango Varianza de población Desviación estándar 2.3- TIPOS DE DISTRIBUCIONES Distribución binomial Presentación gráfica y uso de tablas binomiales Media de distribución binomial Desviación estándar para una distribución binomial 2.1 ORDENAMIENTO DE DATOS Diagrama de tallo y hoja Distribución de frecuencias Frecuencia: uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir recoger la información de la muestra resumida en una tabla en la que cada valor de la variable se le asocia determinados números que representa el número de veces que ha aparecido, estos números se denominan frecuencia. Existen cuatro tipos de frecuencias: 1) Frecuencia Absoluta = (ni) : Es el número de veces que el valor Xi está en el conjunto (X1, X2,…Xn) Ejemplo: 2, 2, 4, 3, 6, 8, 2, 6, 1, 8 ni 1= 1 ni 2= 3 ni 3= 1 ni 4= 1 ni 6= 2 ni 8= 2 2) Frecuencia Absoluta Acumulada = (Ni): Esla suma de frecuencia absoluta de los valores menores o iguales a Xi, es decir Ni= n1 + n2 +,…,+ ni. Ejemplo: Ni1= 1 Ni2= ni + n2 = 1+3=4 3) Frecuencia Relativa = (fi): es la frecuencia absoluta dividida entre el número total de elementos. fi= ni fi= Frecuencias Relativa N ni= Frecuencia Absoluta N= Número total de elementos 0≤ fi ≤1 ∑𝑘𝑖=1 𝑓𝑖 = f1+f2+,…+ fk= 1 Ejemplo: fi1= 1/10 = 0.1 fi2= 3/10 = 0.1 fi3= 1/10 = 0.1 fi4= 1/10 = 0.1 fi6= 2/10 = 0.1 fi8= 2/10 = 0.1 ∑10 𝑖=1 𝑓𝑖 = 0.1 + 0.3 + 0.1+ 0.1+ 0.2 + 0.2 = 1 1=1 4) Frecuencia Relativa Acumulada = (Fi): es la frecuencia absoluta acumulada entre el número total de elementos. Fi= Ni Ejemplo: Fi1= 1/10 = 0.2 N Fi2= 4/10 = 0.25 Tabla de frecuencias Un profesor tiene una lista de notas de matemáticas de 30 alumnos de su clase. Las notas son las siguientes: Construir una tabla de frecuencias y representarlo en una gráfica de barras. Tabla de Frecuencias xi 3 4 5 6 7 8 9 10 Total Frec Abs ni 2 4 6 7 5 3 2 1 30 Frec Abs Ac Ni 2 6 12 19 24 27 29 30 30 Frec Rel fi=ni/N 0,07 0,13 0,2 0,23 0,17 0,1 0,07 0,03 1,00 Frec Rel Ac fi= Ni/N 0,07 0,2 0,4 0,63 0,8 0,9 0,97 1 1 Frec Rel X100 7 13 20 23 17 10 7 3 100 Frec Rel Ac X100 7 20 40 63 80 90 97 100 100 El 7% de los alumnos obtuvo una calificación de 3 lo cual representa a 2 de 30 alumnos. Y solo el 3% obtuvo el 10 de calificación lo cual representa 1 solo alumno. Encuestamos a 50 matrimonios respecto al número de hijos que tiene cada uno de ellos, se obtuvieron los siguientes datos: 2 2 3 2 1 4 2 2 0 4 2 2 3 3 2 3 3 3 2 3 1 2 4 1 2 2 6 1 2 4 2 3 3 2 3 4 2 3 3 3 3 2 4 2 2 0 2 5 3 2 Construir una tabla estadística, gráfica que represente dichos datos. TABLA DE FRECUENCIA Frec Abs ni 2 4 21 15 6 1 1 50 xi 0 1 2 3 4 5 6 Total Frec Abs Ac Ni 2 6 27 42 48 49 50 50 Frec Rel fi=ni/N 0,04 0,08 0,42 0,3 0,12 0,02 0,02 1 Frec Rel Ac fi= Ni/N 0,04 0,12 0,54 0,84 0,96 0,98 1 1 Frec Rel X100 4 8 42 30 12 2 2 100 GRAFICA DE BARRAS 25 21 20 15 15 10 6 5 4 2 1 1 5 6 0 0 1 2 3 4 Frec Rel Ac X100 4 12 54 84 96 98 100 100 El 4% de los matrimonios lo cuales representan 2 de los 50 matrimonios encuestados no tienen hijos. Y solo el 2% que representa 1 matrimonio de los 50 encuestados tiene 6 hijos. Grafica de Histograma Representación de datos a través de histograma ¿Qué es un histograma? Es una gráfica de la distribución de un conjunto de datos. Es un tipo especial de gráficas de barras, en la cual una barra va pegada a la otra y cada una de ellas representa un subconjunto de datos. ¿Qué muestra un histograma? Muestra la acumulación o tendencia, la variabilidad o dispersión y la forma de la distribución. Ejemplo: los siguientes datos muestran el tiempo de atención en minutos al cliente en una caja bancaria. Y max – Y min = Rango 223 – 141 = 92 6 Clases: 141 – 157 157 – 173 No. De clases 173 -189 deseadas 189 – 205 205 – 221 221 – 237 141-157 157-173 173-189 189-205 205-221 221-237 Total Frec Abs ni 2 13 22 11 1 1 50 Frec Rel fi=ni/N 0,04 0,26 0,44 0,22 0,02 0,02 1 Frec Rel X100 4 26 44 22 2 2 100 = 92 = 15.33 = 16 6 Graficas de Histograma 25 Numero de clientes CLASES Amplitud de clase = Rango 22 20 15 13 11 10 5 2 1 1 205-221 221-237 0 141-157 157-173 173-189 189-205 Tiempo de atencion al cliente El 4% que representa 2 clientes de 50 totales son atendidos en el lapso de 141-157 minutos, mientras que el 2% que representa solo 1 cliente es atendido en el lapso de 221-237 minutos. Polígono de frecuencia xi 141-157 157-173 173-189 189-205 205-221 221-237 Total Frec Abs ni 2 13 17 14 3 1 50 Frec Rel fi=ni/N 0,04 0,26 0,34 0,28 0,06 0,02 1 Frec Rel Ac fi= Ni/N 0,04 0,3 0,64 0,92 0,98 1 1 Frec Rel X100 4 26 34 28 6 2 100 Xi 133 129 165 181 197 213 34 18 Número de clientes 16 28 26 14 12 10 8 6 4 2 6 4 2 0 0 0 133 149 165 181 197 213 229 245 Tiempo de atención al cliente Para la elaboración del polígono de frecuencia se busca el promedio entre rango. 141 + 157 = 149 2 157 + 173 = 165… 2 Haciendo apertura de la serie con el 0 %, el 4% representando al promedio del tiempo en el que son atendidas 2 del total de 50 clientes; así sucesivamente identificando cada dato, finalizando el polígono de frecuencia con el 0%. 2.2 Medidas de tendencia central y de dispersión Central • Media • Mediana • Moda Dispersión • Rango • Varianza de población • Desviación estándar Medidas de tendencia central Media o promedio (para datos no agrupados): Casi siempre cuando nos referimos al promedio de algo estamos hablando de la media aritmética, se refiere a la suma de todos los elementos entre el número total de los elementos. Ejemplo: 3, 6, 7, 4, 2, 4, 6, 7 = 3+6+7+4+2+4+6+7 = 39 = 4.7 = 5 8 8 Media de la población = x N Media para la muestra X= x n Media para datos agrupados: X= ( f*x) N Dónde: X= Media f= Frecuencia absoluta X= Punto medio de cada clase n= Número total de elementos Ejemplo. Tiempo de atención en minutos al cliente en una caja bancaria Clases 141-157 157-173 173-189 189-205 205-221 221-237 Total Frec Abs ni 2 13 17 14 3 1 50 Xi 149 165 181 197 213 229 𝑓 X = (F*x)= 9,146 = 1812.92 N 50 f*x 298 2145 3077 2758 639 229 9146 Mediana: La mediana es una medida de tendencia central. Es un solo valor del conjunto de datos que mide la observación central de todo el conjunto. Ésta sola observación es el elemento que está en el centro del conjunto, la mitad de ellos está por arriba de este punto y la otros mitad por debajo. Para hallar la mediana, primero se organizan los datos en orden ascendente o descendente. Si el conjunto contiene un número impar de elementos el de en medio de estos es la mediana, y si contiene un número par de elementos la mediana será el promedio de ambos números del centro del conjunto. Ejemplo: Número impar de elementos (n+1) 2, 3, 4, 5, 8, 5, 3 2 n: número de elementos 2, 3, 3 ,4, 5,5,8 M= 7+1= 8= 4 2 =2 M: Número par 2, 3, 4, 5, 8, 5, 3, 8 M= 4+5= 9= 4.5 2 =2 2, 3, 3, 4, 5, 5, 8, 8 M= 8+1= 9= 4.5 2 =2 Moda: Es el número que más se repite dentro del conjunto de datos. Medidas de tendencia central Rango: Diferencia entre el más alto y el más pequeño de los valores observados. Y max – Y min 10-7= 3 Varianza de población: Cada población contiene una varianza su símbolo es 2. Para calcular la varianza de una población, la suma de los cuadrados n2 de las distancias entre la media y cada elemento de la población, se divide entre el número total de observaciones en la población. Al elevar al cuadrado cada distancia, logramos que todos los números sean positivos y al mismo tiempo asignamos más peso a las observaciones más grandes. (desviación es la distancia entre la media y un valor). 2 = (x-)2 N 2 : varianza de población X: elemento u observación : medida de la población N: número total de elementos Desviación estándar de la población: La desviación estándar de la población: = Es simplemente la raíz cuadrada de la varianza de la población = √ 2 = √(x - ) 2 N Ejemplo: calificaciones 30 alumnos 2 = (x-)2 = 90.967 N 30 2 = 3.03 al cuadrado Desviación estándar = √ 2 = √ 3.03 = 1.74 Ejercicios 14. Unos grandes almacenen disponen de un aparcamiento para sus clientes. Los siguientes datos que se refieren al número de horas que permanecen en el aparcamiento una serie de coches: a) Calcular la tabla de distribución de frecuencias. b) Representar los datos en su grafica de barras. 4 5 5 1 7 4 4 3 6 5 3 2 4 4 3 6 6 1 5 5 6 4 3 3 4 5 4 3 2 4 5 2 4 7 3 6 2 2 4 1 2 1 3 7 3 1 5 1 7 2 4 4 2 4 5 3 6 3 5 3 Tabla de frecuencia Frec Abs ni 5 8 12 15 10 6 4 60 xi 1 2 3 4 5 6 7 Total Frec Abs Ac Ni 5 13 25 40 50 56 60 60 16 Frec Rel fi=ni/N 0,08 0,13 0,2 0,25 0,17 0,1 0,07 1 Frec Rel Ac fi= Ni/N 0,08 0,22 0,42 0,67 0,83 0,93 1 1 15 14 12 12 10 10 8 8 6 6 5 4 4 2 0 1 2 3 4 5 6 7 Frec Rel X100 8,33 13,33 20 25 16,67 10 6,67 100 Frec Rel Ac X100 8,33 21,67 41,67 66,67 83,33 93,33 100 100 15. Un fabricante de neumáticos ha recabado, de los diferentes concesionarios, información sobre la cantidad de miles de kilómetros recorridos por un modelo concreto de esos neumáticos hasta que se ha producido un pinchazo o un reventón del neumático. Los concesionarios la han proporcionado los siguientes datos: a) Calcular la tabla de distribución de frecuencias para datos agrupados utilizar 7 clases. b) Representar los datos en su grafica de barras histograma. c) Representar los datos en su grafica de polígono de frecuencia. 52 48 44 63 84 55 47 49 48 74 51 61 80 50 65 41 70 40 55 71 67 57 60 74 4 35 37 75 34 65 50 46 78 53 55 56 58 41 44 51 36 59 55 61 66 41 49 84 86 48 62 37 73 75 59 49 85 59 72 29 48 90 67 51 Frec Abs ni 2 2 19 28 30 12 7 100 4-17, 17-30 30-43 43-56 56-69 69-82 82-95 Total Frec Rel fi=ni/N 0,02 0,02 0,19 0,28 0,3 0,12 0,07 1 35 61 89 67 46 35 48 30 60 76 61 34 30 Frec Rel X100 2 2 19 28 30 12 7 100 25 20 15 10 5 0 4-17, 17-30 35 30 25 20 15 10 5 0 4-17, 17-30 30-43 57 65 69 64 61 28 48 33 38 68 58 37 35 Tabla de frecuencia Clases 61 69 67 46 45 66 41 41 10 53 41 82 43-56 56-69 69-82 82-95 30-43 43-56 56-69 69-82 82-95 2.2 Medidas de tendencia central y de dispersión. a) Calcular la medida (para datos no agrupados), la mediana, moda, y las medidas de tendencia central (rango, varianza de población y desviación estándar de la población) del ejercicio 14. Media aritmetica para datos no agrupados xi 1 2 3 4 5 6 7 Total Frec Abs ni 5 8 12 15 10 6 4 60 ∑ 5 16 36 60 50 36 28 231 3,85 Mediana= 4 Moda= 4 Calculo de la desviacion y varianza xi 1 2 3 4 5 6 7 Total Frec Abs ni 5 8 12 15 10 6 4 60 3,85 3,85 3,85 3,85 3,85 3,85 3,85 (x-u) (x-u) 2 -2,85 -1,85 -0,85 0,15 1,15 2,15 3,15 40,62 27,38 8,67 0,34 13,23 27,74 39,69 157,67 Rango Ymax-Ymin= 6 Varianza de poblacion ∑ 2,63 Desviacion estandar ∑ 1,63 b) Calcular la media (para datos agrupados), la mediana, la moda y las medidas de tendencia central (rango, varianza de la población y desviación estándar de la población) del ejercicio 15. Media aritmetica para datos agrupados Clases 4-17, 17-30 30-43 43-56 56-69 69-82 82-95 Total Frec Abs ni 2 2 19 28 30 12 7 100 xi f+x 10,5 23,5 36,5 49,5 62,5 75,5 88,5 21 47 693,5 1386 1875 906 619,5 5548 ∑ 𝑓 55,48 Mediana Moda 50 41 y 61 Calculo de la desviacion y varianza xi 10,5 23,5 36,5 49,5 62,5 75,5 88,5 Total Frec Abs ni 2 2 19 28 30 12 7 100 u (x-u) (x-u)2 55,48 55,48 55,48 55,48 55,48 55,48 55,48 -44,98 -31,98 -18,98 -5,98 7,02 20,02 33,02 4046,41 2045,45 6844,57 1001,3 1478,42 4809,61 7632,25 27858,01 Rango Ymax-Ymin= 86 Varianza de poblacion ∑ 278,59 al cuadrado Desviacion estandar ∑ 16,7 2.3 Tipos de distribución Distribución binomial Formula Binomial Probabilidad de éxitos en n intentos= = n! *𝑝𝑟 *𝑞 𝑛−𝑟 r !(n-r)! p= probabilidad característica o probabilidad de tener éxito q= (1-p)= probabilidad de fracaso r= número de éxitos deseados n= número de intentos hechos Ejemplo: Probabilidad de obtener exactamente dos caras en cualquier orden, en 3 lanzamientos de una moneda. Datos: r=2 P (2E) EN (3I) n=3 p= 0.5 q= 1- 0.5= 0.5 3! * 0.5 *0.53− = 2! (3-2)! 6 * (0.25) * (0.5)= 2 (1) 6 * (0.25) (0.5)= 0.375 2 P (2E) EN (3I)= 0.375 o 37.5% Ejercicios. Las máquinas de llenado moderno están diseñadas para trabajar de manera eficiente y con una alta confiabilidad. Estos mecanismos pueden llenar unos tubos de dentífrico con una escala de presión de 0.1 onzas el 80% de las veces. Un visitante de la plaza observa como los tubos ya llenados son empaquetados en una caja. ¿Cuáles son las posibilidades de que exactamente la mitad de los tubos de una caja seleccionada al azar estén llenos de 0.1 onzas del nivel deseado, si cada caja contiene 6 tubos? Datos: r=3 P (3E) EN (6I) n=6 p= 0.8 q= 1- 0.8= 0.2 6! * 0.8 3 *0.26−3 = 3! (6-3)! 720 * (0.512) * (0.008)= 36 20 (0.512) (0.008)= 0.00819* 100 P (3E) EN (6I)= 8.19% Presentaciones gráficas y uso de tablas binomiales. Ejemplo. Para ilustrar tales distribuciones, considere la siguiente situación. Es frecuente que los empleados lleguen tarde a trabajar a la farmacia unión y hay 5 empleados en ella. El propietario ha estudiado durante cierto periodo y determino que hay una probabilidad de 0.4 de que cualquier empleado llegue tarde y que las llegadas de los mismos son independientes entre sí. ¿Cómo podrías trazar una distribución binomial de probabilidad que ejemplifique las probabilidades de que 0,1,2,3,4 o 5 empleados lleguen tarde simultáneamente? Datos: r= 0, 1, 2, 3, 4, 5 p (0) de (5)= 0.0778 n=5 p (1) de (5)= 0.2592 p= 0.4 p (2) de (5)= 0.3456 q= 0.6 p (3) de (5)= 0.2804 p (4) de (5)= 0.0768 p (5) de (5)= 0.0102 Datos: r=2 P (2E) EN (5I) n= 5 * 0.4 5! *0.65− = 2! (5-2)! p= 0.4 120 q= 0.6 12 * (0.16) * (0.216)= 10 (0.16) (0.216)= 0.3456* 100 = 34.56% PROBABILIDAD (p) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 PROBABILIDAD (p) Media de distribución binomial. : np n= número de ensayo p= probabilidad de tener éxito 5 6 Desviación estándar para una distribución binomial. 2 = √𝒏. 𝒑. 𝒒 q= probabilidad de fracaso n= número de ensayo p= probabilidad de tener éxito Para ver como se utilizan, tomemos el caso de una maquina empacadora que produce el 20% de paquetes defectuosos. Si tomamos una muestra aleatoria de 10 paquetes entonces. Datos: p= 0.20 = (10) (0.2) = 2 n= 10 Desviación estándar. Datos: p= 0.20 2 = √ 10 0.2 0.8 n= 10 q= 0.8 2 = 0.5 Ejercicios Para una distribución binomial con n=12 y p = 0.45, use la tabla 3 del apéndice para encontrar P(r = 8) = 0.0762 P(r > 4)= 0.170 P(r > 10)= 0.0068 Encuentre la media y la desviación estándar de las siguientes distribuciones binomiales: A) n= 16, p= 0.40 = (16)(0.40) =6.4 2 = √ 16 0.40 0.60 = 1.9595 2 = 1.9595 B) n=10, p= 0.75 = (10)(0.75) =7.5 2 = √ 10 0.75 0.25 = 1.3693 2 = 1.3693 C) n= 22, p= 0.15 = (22)(0.15) =3.3 2 = √ 22 0.15 0.85 = 1.674 2 = 1.674 D) n=350, p= 0.90 = (350)(0.90) =315 2 = √ 350 0.90 0.10 = 5.6124 2 = 5.6124 E) n=78, p= 0.05 = (78)(0.05) =3.9 2 = √ 78 0.05 0.95 = 1.9248 El último sondeo político nacional 2 = 1.9248 indica que la probabilidad de estadounidenses elegidos al azar sean conservadores es de 0.55; de que sean liberales es de 0.30, y que estén entre una y otra orientación es de 0.15. Supóngase que estas probabilidades son exactas y responden a las siguientes preguntas referidas a un grupo de 10 estadounidenses seleccionados de manera aleatoria. (No use la tabla 3 del apéndice.) a) ¿Cuál es la probabilidad de que cuatro sean liberales? Datos: n=10 __10!__ * (0.30)4 *(0.70)10-4 r= 4 4!(10-4)! p=0.30 q=(1-0.3)=0.70 3,628,000 * (0.008)*(0.1176) 24(720) 210* 0.0009525= 0.20002 P(4) en (10i)= 0.20002 o 20.002% b) ¿Cuál es la probabilidad de que ninguno sea conservador? Datos: n=10 r= 0 p=0.55 q= (1-0.55)=0.45 __10!__ * (0.55)0 *(0.45)10-0 0! (10-0)! 3, 628,000 * 1 * 0.00034 3, 628,000 P (0) en (10i)= 0.00034 o 0.034% c) ¿Cuál es la probabilidad de que dos estén entre una y otra orientación? Datos: n=10 __10!__ * (0.15)2 *(0.85)10-2 r= 2 2! (10-2)! p=0.15 q= (1-0.15)=0.85 3, 628,000 * (0.0225)*(0.2724) 2(40,320) 45* 0.006129= 0.2758 P (2) en (10i)= 0.2758 o 27.58% d) ¿Cuál es la probabilidad de que al menos ocho sean liberales? Datos: n=10 __10!__ * (0.15)2 *(0.85)10-2 r= 8 8! (10-8)! p=0.30 q= (1-0.30)=0.70 3, 628,000 * (0.0225)*(0.2724) 2(40,320) 45* 0.006129= 0.2758 P (2) en (10i)= 0.2758 o 27.58% Distribución De Poisson Se utiliza para describir ciertos tipos de proceso, en los que se encuentran la distribución de llamadas telefónicas que llegan a un conmutador, las solicitudes del paciente que requieren servicio en una institución de salud, las llegadas de camiones y automóviles a una caseta de cobro. Formula de poisson: p(x)= λ * e- λ X! P(X): Probabilidad de tener exactamente por ocurrencia. λ : Lambda (número medio de presentaciones por intervalos de tiempo) elevado a la X potencia. e-λ : e o 2-71828 X!: X Factorial Suponga que estamos investigando la seguridad de una peligrosa intersección los registros policiacos indican 5 accidentes mensuales en esta intersección. El número de accidentes está distribuido de acuerdo a una distribución de poisson y el departamento de seguridad de transito desea que calculemos la probabilidad de que en cualquier mes ocurra 0, 1, 2, 3 o 4 accidentes. Para 1: Para 0: Datos: Datos: X: 0 λ:5 e: 2.71828 P (0)= (5)0* e- λ X: 1 λ :5 e: 2.71828 P (1)= (5)1* e- λ 1! 0! x: 0…4 = 5*(6.73 x 10-3) = 1*(6.73 x 10-3) 1 1 =0.00673 *100% = 0.763% = 0.03365 = 0.03365 * 100= 3.365 1 Para 2: Para 3: X: 2 X: 3 P (2)= (5)2*e-5= 25*(6.73 x 10-3) P (3)= (5)3*e-5= 125*(6.73 x 10-3) 2! 2 = 0.16825 = 0.084125 * 100 = 8.4125% 3! 3 = 0.84125 = 0.1402 * 100 = 14.02% 2 6 Para 4. X: 4 P (4)= (5)3*e-5= 625*(6.73 x 10-3) 4! 24 = 4.2062 = 0.1752* 100 = 17.52% 24 Tomaremos medidas para mejorar la seguridad de la intersección si la probabilidad de que ocurran más de 5 accidentes mensuales excede a o.5 o debemos tomar medidas, si las probabilidades exceden un 65%? 0- 0.0067 1.0.265= 0.735 1- 0.0337 0.735 ˃ 0.65 2- 0.0842 3- 0.1404 Si se deben de tomar medidas por que el porcentaje de que ocurra 0.265 un accidentes excede el 0.65% Dado que λ =6.1 para una distribución de Poisson encuentre λ =6.1 𝒆 =2.7182x8 a) P(x≤ 𝟑) P(3) = (6.1)3 * 𝑒 −6.1 = 226.981* (0.0022) = 0.0832 o 8.32% 3! 6 b) P(x≥ 𝟐) P(2) = (6.1)2 * 𝑒 −6.1 = 37.21 * (0.0022) = 0.04093 o 4.09% 2! 2 c) P(x 𝟔) P(6) = (6.1)6 * 𝑒 −6.1 = 51,520.3743* (0.0022) = 0.1574 o 15.74% 6! 720