DATOS ESTADISTICOS Son números que pueden ser comparados, analizados e interpretados. El campo del cual son tomados los datos estadísticos se identifican como población o universo. En un estudio estadístico los métodos que se aplican son: A) RECOPILACION: De acuerdo con la localización de la información los datos estadísticos pueden ser internos y externos. Los internos son los registros obtenidos dentro de la organización que hace un estudio estadístico, Los externos se obtienen de datos publicados y encuestas. B) ORGANIZACIÓN: En la organización de los datos recopilados, el primer paso es corregir cada uno de los elementos recopilados. C) REPRESENTACION: Hay 3 maneras de presentar un conjunto de datos mediante enunciados tablas estadísticas y gráficas estadísticas. D) ANALISIS: Después de los datos anteriores los datos estadísticos están listos para hacer analizados, para lo cual frecuentemente se emplean operaciones matemáticas durante el proceso de análisis. Si una muestra es representativa de una población se pueden deducir importantes deducciones acerca de esta a partir del análisis de la misma. Una muestra es un conjunto de medidas u observaciones tomadas a partir de una población dada. CONCEPTO DE POBLACION: Se define como la totalidad entre todas las posibles mediciones y observaciones bajo consideración en una situación dada de un problema. A las características medibles de una población se les denomina parámetros. MUESTRA: Es un conjunto de medidas u observaciones tomadas a partir de una población dada. A las características medibles de una muestra se les denomina estadístico. 45 72 67 91 14 15 a) Población 52 21 74 18 42 22 b)Tamaño de población 86 71 24 82 12 60 c) Muestra 34 21 72 92 74 21 d) Tamaño de muestra 1 54 26 74 22 65 51 e) Parámetro f) Estadística. VARIABLES DISCRETAS Y CONTINUAS: La variable que tiene resultados o valores que tienden a variar de observación en observación debido a los factores relacionados con el azar recibe le nombre de variable aleatoria. Las variables aleatorias pueden ser discretas y continuas Una variable discreta se considera así si los valores que asume se pueden contar. Una variable continua es aquella que pueden asumir cualquier valor dentro de un intervalo, por lo cual tiene un numero infinito de valores posibles. EJERCICIOS. Cual de las siguientes variables son discretas y cuales continuas. • numero de águilas en 6 lanzamientos de una moneda discreta • tiempo para resolver un examen. Continua • altura del mercurio en un barómetro discreta • numero de dientes de un niño discreta • máxima temperatura ambiental durante el día continua • numero de juegos ganados por un equipo de basketball continua • numero de hijos de una familia. Continua • litros de gasolina vendidos el martes anterior en una gasolinera. Continua. 2 DEFINIRA LA DISTRIBUCION DE FRECUENCIA Una distribución de frecuencia es una tabla en la cual se agrupan los valores posibles para una variable y se registran para una variable el numero de valores observados que corresponde a cada clase. La siguiente es una tabla de distribución de frecuencia de alturas registradas de 100 estudiantes. ALTURAS ESTUDIANTES •5 • 18 • 42 • 27 •8 100 Conviene recordar frecuencia absoluta es él numero de datos contenidos en determinado intervalo. FRECUENCIA RELATIVA: Es el porcentaje que representa la frecuencia absoluta de determinado intervalo con respecto al total de datos proporcionados. FRECUENCIA ACOMULADA: Es la suma acumulativa de las frecuencias absolutas de cada uno de los intervalos. FRECUENCIA ACUMULADA RELATIVA: Es el porcentaje que expresa la frecuencia acumulada con respecto al total de datos proporcionados. Los números extremos 60 y 62 de la tabla anterior se conocen como los limites de clase. El numero menor 60 es el limite inferior de la clase y el 62 es el superior. El punto medio de clase que también se llama marca de clase se obtiene sumando los limites inferior y superior y dividiendo entre dos. A veces se necesita obtener lo que llamamos frontera de clase o limites exactos y esto se logra efectuando una suma entre el límite inferior de la clase inmediata cuyo resultado se divide entre dos. 1.− de la siguiente tabla de una distribución de frecuencia de salarios semanales de 65 empleados de una compañía. SALARIOS EMPLEADOS 28,000 − 32,949 8 32,950 − 37,899 10 37,900 − 42,849 16 3 42,850 − 47,799 14 47,800 − 52,749 10 52,750 − 57,699 5 57,700 − 62.649 2 65 • el limite inferior de la sexta clase 54,750 • el limite superior de la cuarta clase 47,799 • frecuencia de la tercera clase 16 • marca de clase de la tercera clase 40,374.5 • tamaño del quinto intervalo de clase 4949 • la frecuencia relativa de la tercera clase 24.6% • la frontera de clase de la tercera clase 42,849.5 En una prueba de aptitudes, 3 trabajadores recibieron calificaciones de 90, 85, 80 tres trabajadoras recibieron calificaciones de 89, 86, 92. de las siguientes declaraciones realizadas con base en estas calificaciones identifique aquellas que se derivan de la inferencia estadística y aquellas que se derivan de métodos descriptivos. • la calificación promedio de 3 trabajadores es de 8.5 y la calificación promedio de las trabajadoras es 8.9 descriptiva • la aptitud promedio de todas las trabajadoras es probablemente mayor que la de los trabajadores. Inferencial • en la siguiente prueba de aptitudes probablemente los trabajadores reciben calificaciones más bajas que las 4 de las trabajadoras. Inferencial PARAMETRO M.C F. A F.R 350 − 379 3 369.5 3 1.5% 380 − 409 8 394.5 11 4% 410 − 139 10 424.5 21 5% 440 − 469 13 454.5 34 6.5% 470 − 499 33 484.5 67 16.5% 500 − 529 40 514.5 107 20% 530 − 559 35 544.5 142 17.5% 560 − 589 30 574.5 172 15% EJERCICIO 2 SALARIOS NO. DE EMPLEADOS $ 250.00 − 259.99 8 $ 260.00 − 269.99 10 $ 270.00 − 279.99 16 $ 280.00 − 289.99 14 $ 290.00 − 299.99 10 $ 300.00 − 309.99 5 $ 310.00 − 319.99 2 65 a) el limite inferior de la sexta clase: 300 b) el limite superior se la cuarta clase: 289.99 c) la marca de clase de la tercera clase: 274.995 d) las fronteras de clase del quinto intervalo: 289.995 e) la anchura del quinto intervalo de clase: 289.99 − 299.99 = 10 5 f) frecuencia de la tercera clase: 16 . g) la frecuencia relativa de la tercera clase: 24.6% h) el intervalo de clase con máxima frecuencia que se llama intervalo de clase modal: en este caso es la tercera porque tiene de frecuencia 16 seria: 279.99 − 270 = 9.99 i)el porcentaje de empleados que cobran menos de 280.00 a la semana: 52.3% j) el porcentaje de empleados que cobran menos d 300.00 pero al menos 260.00 por semana. 76.9% DE LA TABLA F.ACUMULADA F. R LIMITES EXACTOS 8 12.30% 249.99 − 259.99 18 15.38% 259.99 − 269.99 34 24.61% 269.99 − 279.99 48 21.53% 279.99 − 289.99 58 15.38% 289.99 − 299.99 63 7.69% 299.99 − 309.99 65 3.07% 309.00 − 319.99 HISTOGRAMA Definirá histogramas y polígonos de frecuencia. Un histograma es una serie de resultados cada uno proporcional en amplitud al rango de valores de una clase de valores y proporcional en altura al numero de elementos que caen en cada clase. Un polígono de frecuencia es una gráfica trazada sobre las marcas de clase también se puede obtener uniendo los puntos medios de los techos de los rectángulos de un histograma. Los datos no agrupados es un conjunto de información si ningún orden que no nos establece relación clara con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una tabulación que nos conduce a una tabla de frecuencias como se ha visto anteriormente. El numero de intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos. Para construir un histograma y polígonos de frecuencia se necesita formar distribuciones de frecuencia y para ello se sugieren las siguientes reglas: 6 1.− determinar el mayor y el menor entre los datos registrados para así encontrar el rango. 2.− dividir el rango entre un numero conveniente de intervalos de clase del mismo tamaño siempre que sea posible. 3.− determinar el numero de observaciones que caen dentro de cada intervalo de clase esto es encontrar la frecuencia de clase. NUMEROS NO AGRUPADOS 53 63 69 73 77 57 64 70 74 78 58 66 71 74 78 61 67 72 75 81 61 68 73 77 82 82 − 53 = 29 rango 29 = 9.6= 10 3 frecuencia 53 − 63 6 63 − 73 9 73 − 83 10 25 OJIVA Es una gráfica en donde en los ejes de x van las marcas de clase y en los ejes y la frecuencia acumulada. 138, 146, 168, 146, 161, 164, 158, 126, 176, 145. • encontrar el mayor y el menor 176 − 126 = 50 • 50 = 12.5 4 frecuencia frecuencia acumulada 126 − 138.5 2 2 7 • − 151 3 5 • − 163.5 2 7 163.5 − 176 3 10 marca de clase frecuencia relativa • 20% • 30% • 20% 169.75 30% El arreglo de los ingresos obtenidos un sábado por 20 estudiantes de 4 semestre de la Alfonso reyes son los siguientes: 54, 34, 45, 80, 73, 43, 65, 90, 29, 103, 108, 75, 65, 59, 127, 108, 51, 45, 110, 126. se pide elaborar un histograma y un poligono de frecuencia. 127 − 29 = 98 98 = 19.6 5 frecuencia frecuencia acumulada 29 − 48.6 − 5 5 48.6 − 68.2 − 4 9 68.2 − 87.8 − 3 12 87.8 − 107.4 − 2 14 107.4− 127 − 5 19 25 marca de clase frecuencia relativa • 20% • 16% 78 12% • 8% • 20% La población en B.C. en 1990 ascendió 1660,855 habitantes distribuidos por municipios de la siguiente manera: tecate, ensenada, Mexicali, Tijuana Frecuencia frecuencia relativa 8 51,486 0.030 10.8 260,754 .156 56.16 601,230 .362 130.32 747.385 .452 162.72 1660,855 1.000 360 9