DOCUMENTO DE TRABAJO Nº. 1 Estadistica ASIGNATURA Malla 2011 CÓDIGO Matematica 1 REQUISITO(S) OBLIGATORIA/LECTIVA ANUAL DIURNA/VESPERTINA TEÓRICO-PRÁCTICA/PRÁCTICA CARÁCTER PLAN DE ESTUDIO 2 HORAS SEMANALES II. Aprendizajes Esperados: Definir conceptos importantes de la Estadística Definir e Identificar tablas de frecuencias simple y con intervalos. Construir tablas de frecuencias simple y con intervalos. Interpretar las tablas simple y con intervalos. III. Síntesis esquemática de Contenidos 1.1. Introducción a la ciencia estadística: El término estadística tiene su raíz en la palabra Estado, pero además nace como una función matemática asociadas a datos. La importancia radica en la cuantificación para su uso con fines económicos o militares o gubernamentales. La estadística es una ciencia y la encontramos presente en muchas disciplinas se puede decir que se encuentra en la totalidad del resto de ciencias. La razón es clara: por una parte la estadística proporciona técnicas precisas para obtener información, (recogida y descripción de datos) y por otra parte proporciona métodos para el análisis de esta información. La estadística de divide en: 1. ESTADÍSTICA DESCRIPTIVA: Basada en una muestra de datos (recogida según una técnica concreta), y obtener la descripción de las características más importantes, entendiendo como características, aquellas cantidades que nos proporcionen información sobre el tema de interés del cual hacemos el estudio. 2. ESTADÍSTICA INFERENCIAL: Conjunto de técnicas y métodos basado en los datos obtenidos a partir de una muestra y así poder inferir a través de estimadores la característica de una población. 1.2. Conceptos básicos. POBLACIÓN: Es el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales queremos obtener un resultado. VARIABLE: Es la característica que estamos midiendo. Existen dos categorías o tipo de variables: 1. Variable cualitativa: Es aquella que expresa un atributo o característica, ejemplo: Rubio, moreno, etc. 2. Variable cuantitativa: Es aquella que podemos expresar numéricamente: edad, peso, nº. De hijos, etc. A su vez la podemos subdividir en: 2.1. Variable discreta, aquella que entre dos valores próximos puede tomar a lo sumo un número finito de valores. Ejemplos: el número de hijos de una familia, el de obreros de una fabrica, el de alumnos de la universidad, etc. 2.2. Variable continua la que puede tomar los infinitos valores de un intervalo. En muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan que puedan existir todos los valores del intervalo. Ejemplos, peso, estatura, distancias, etc. La variable se denota por una letra mayúscula X. A su vez cada una de estas variables puede tomar distintos valores, colocando un subíndice x1 , x2 ,...,xi ,...,xk Cualitativas Variables Discretas Cuantitativas Continuas 3. Muestra: Conjunto de elementos que forman parte de población. La muestra representa a esta población. 4. Tamaño muestral: Es le número total de elementos que conforman la muestra. Se denota por n. 5. Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable. 1.3. Distribuciones de frecuencias. Frecuencia absoluta: Llamaremos así al número de veces que se presenta una observación. Se representa por fi. Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos (n), se suele expresar en tanto por uno, siendo su valor i - ésimo. hi fi n La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad. Frecuencia absoluta acumulada: es la suma acumulada de los distintos valores de la frecuencia absoluta. La última frecuencia absoluta acumulada es igual al tamaño de la muestra n F1 = f1 F2 = f1+ f2 Fp = f1 + f2 +. . . . . . + fp-1 + fp= n Frecuencia relativa acumulada: es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele representar con la notación: Hi , o puede ser definido a partir de la frecuencia relativa, como suma de los distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La última frecuencia relativa acumulada es igual a la unidad. Tabla de frecuencia simple: Variables discretas X fi Fi hi Hi x1 f1 F1=f1 h1=f1/n H1=h1 x2 f2 F2=f1+f2 h2=f2/n H2=h1+h2 x3 f3 F3=f1+f2+f3 h3=f3/n H2=h1+h2+h3 : : : xi fi Fi=f1+f2+..+fi hi=fi/n Hi=h1+h2+..+hi : : : xp fp Fp=f1+f2+…+fp=n hp=fp/n Hp=h1+h2+..+hp=1 fi = n hi = 1 Ejemplos: 1) En cierta comuna del país se desea investigar que pasa con el numero medio de hijos por familia y compararlo con el obtenido década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos: 2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4 3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1 Se pide: a) ¿Cuál es la población objeto de estudio? b) ¿Cuál es el tamaño de la muestra? c) ¿Qué variable estamos estudiando? d) ¿Qué tipo de variable es? e) Construir la tabla de frecuencias f) ¿Cuál es el número de familias que tiene como máximo 2 hijos? g) ¿Cuántas familias tienen más de 1 hijo, pero como máximo 3? h) ¿Qué porcentaje de familias tiene más de 3 hijos? Solución: a) La población objeto de estudio es el conjunto de familias de un determinado país. b) El tamaño es el correspondiente a la cantidad de familias encuestadas: 50 familias c) La variable que estamos estudiando es el número de hijos por familia d) El tipo de variable es discreta ya que el número de hijos solo puede tomar determinados valores enteros (es imposible tener medio o un cuarto de hijo). e) Para construir la tabla de frecuencias tenemos que ver cuantas familias tienen un determinado número de hijos. Podemos ver que el número de hijos, toma los valores existentes entre 0 hijos, los que menos y 6 hijos, los tendremos: que más y xi fi Fi hi Hi 0 2 2 0.04 0.04 1 4 6 0.08 0.12 2 21 27 0.42 0.54 3 15 42 0.30 0.84 4 6 48 0.12 0.96 5 1 49 0.02 0.98 6 1 50 0.024 1 n = 50 1 f) El número de familias que tienen dos o menos hijos es: 2+4+21 = 27 g) El número de familias que tienen más de un hijo pero tres como máximo es: 21 + 15 = 36 h) Por último el porcentaje de familias que tiene más de tres hijos, son aquellos que tienen 4; 5 y 6 son decir 6+1+1= 8. El porcentaje será el tanto por uno multiplicado por cien es decir, la frecuencia relativa de dichos valores multiplicado por 100: ( 0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 % IV. Actividades ( individuales o grupales) GUÍA - TALLER N° 1 CLASIFICACIÓN DE VARIABLES, TABLAS DE FRECUENCIA Y GRÁFICOS 1. En los siguientes casos identifique: Población, Variable. Clasifique la variable: a) b) c) d) e) f) 2. En la empresa Alfa se desea estudiar el número de horas no trabajadas por sus empleados. En una fábrica se desea medir el tiempo que cada trabajador demora en armar cierto producto. En una empresa de seguros se desea estudiar el monto de las primas contratados por los clientes. En la Municipalidad de Santiago se estudia las marcas de automóviles que tienen su patente obtenida en dicha Municipalidad. En un Instituto Profesional se estudia las carreras que los alumnos siguen. En una cooperativa se desea estudiar el nivel de educación que tienen sus socios. La tabla muestra el número de medicamentos que se pueden clasificar en una hora por número de empleados: a) b) c) Medicamentos por hora Frecuencia 20 15 30 20 40 25 50 30 60 10 Identifique población y variable en estudio. Clasifique la variable Interprete f4 3. La siguiente información corresponde al número de piezas que los empleados de una fábrica logran armar en un tiempo de 12 horas de trabajo. 4 4 9 9 9 4 6 8 8 8 8 4 4 5 5 6 4 4 9 7 7 7 7 7 7 9 9 4 4 5 5 6 9 4 9 4 7 6 6 6 6 6 7 6 6 4 4 5 Determine la población y variable. ¿Qué tipo de variable es? Construya una tabla de frecuencias que represente la información. La fábrica considera que el empleado es de alto valor si la cantidad de piezas armadas supera las 5 piezas. ¿Qué % de empleados de la fábrica tiene alto valor? 4. La siguiente tabla corresponde a los sueldos que paga en la actualidad una empresa comercial (en miles de $): a) b) c) 5. Sueldo Número de empleados 50 – 100 100 – 120 120 – 140 140 – 160 160 – 180 180 – 200 7 20 33 25 11 4 Identifique población y variable. Clasifique la variable involucrada. Complete la tabla de frecuencias. Interprete f2, F3, h3 y H5 La recaudación anual de impuestos de 40 contribuyentes está dada en la siguiente tabla ( en miles de pesos) a) b) Identifique la población y la variable. Clasifique la variable. Complete la tabla de frecuencia e interprete f2, F3, h1, H3 Impuesto Frecuencia 50 – 70 6 70 – 90 10 90 – 110 8 110 – 130 9 130 – 150 7 6. La siguiente tabla corresponde a la distribución de las ventas diarias (en miles de pesos) de un grupo de empleados de una tienda: a) b) Ventas Frecuencia 200 – 300 6 300 – 400 15 400 – 500 13 500 – 600 9 Identifique variable y población en estudio. Complete la tabla de frecuencias e interprete los valores de f1, h3, F2 y H3. 7. El departamento de personal de la empresa ALFA LTDA, realizó un estudio de las pérdidas anuales (en miles de $) ocasionadas por las horas de atraso que registraron cada uno de sus 84 operarios. La siguiente tabla muestra las observaciones obtenidas: 154 131 122 100 113 121 128 112 115 117 110 104 125 85 124 108 136 115 117 127 100 114 136 122 102 93 171 123 86 119 133 126 90 105 111 129 146 94 91 126 145 85 93 120 135 116 103 123 137 102 141 137 128 150 93 105 124 97 130 109 134 112 126 103 112 141 119 131 147 109 115 126 103 93 104 a) Identifique y clasifique la variable en estudio. b) Construya una tabla de distribución de frecuencias. 135 106 128 91 107 146 87 115 115 8. De 2000 chips de computadores inspeccionados por un fabricante. Se registraron los siguientes números de defectos: Defectos a) 9. fi Orificio no abierto 182 Conexiones deficientes. 31 Chips de tamaño incorrecto 5 otros 7 Complete la tabla de frecuencia La tabla muestra el número de medicamentos que se pueden clasificar en una hora por número de empleados: Medicamento por hora Frecuencia 20 15 30 20 40 25 50 30 60 10 a) Complete la tabla de frecuencia 10. Dada la siguiente información complete la tabla Edad Frecuencia 18 10 20 15 22 25 24 30 Porcentaje Grados 11. En un experimento la rama de psicología, pide a varios individuos que memoricen cierta secuencia de palabras. Los datos representan los tiempos en segundos, que necesitaron los participantes del experimento de la memorización 100 100 130 102 88 149 79 110 117 93 106 96 85 79 125 53 93 99 66 123 70 118 62 69 138 112 61 146 43 93 142 30 135 98 135 89 127 112 107 149 75 107 62 126 128 102 88 73 135 122 98 109 90 88 99 50 108 80 114 45 119 105 34 87 52 78 41 84 64 94 95 100 100 129 129 58 79 37 88 123 77 107 57 110 32 145 85 126 118 96 99 50 64 90 116 103 76 57 46 73 a) Construya una tabla de frecuencia b) Construya una grafica adecuada que, en su opinión, interprete los datos. 12. El Banco Estado decide hacer un registro con las 40 cuentas de ahorro personal con saldo bajo (en miles de pesos). Los resultados son: 179 112 1150 100 109 470 780 352 1200 1482 695 952 510 783 890 1595 937 217 712 293 579 287 1112 1394 1101 501 711 1202 415 602 1312 1175 783 1390 666 1555 1422 1273 185 100 a) Construya una tabla de frecuencia b) Construya una grafica adecuada que, en su opinión, interprete los datos 13. La tabla de frecuencia representa los sueldos de los empleados de la empresa ENCAL LTDA. medidos en miles de pesos: Intervalos de sueldo Frecuencia 400 - 420 10 420 - 440 15 440 - 460 20 460 - 480 30 480 - 500 5 500 - 520 10 Complete la tabla con marca de clase, frecuencia porcentual, frecuencia acumulada ascendente. Construya una grafica adecuada que, en su opinión, interprete los datos 14. El siguiente Histograma presenta el número de pasajeros de 50 vuelos de una empresa aérea. Pasajeros por vuelo 20 18 16 14 12 10 8 6 4 2 0 18 12 8 7 3 50-60 2 60-70 70-80 80-90 90-100 100-110 a) Identifique la población en estudio, la variable y de qué tipo es. b) Construya una tabla de frecuencias. c) Interprete f3, h5, F2 y H4. 15. La siguiente tabla de frecuencias indica el ingreso familiar (mensual) de una muestra de 50 familias de un edificio del centro de Santiago. Completar. Ingreso Familiar (Miles $) 200-250 250-300 300-350 350-400 400-450 450-500 f F h H Mc 8 0,2 0,6 11 375 47 Evaluación de la actividades Se deben desarrollar las actividades indicadas en el mapa Vi. Síntesis de los contenidos : Estadística descriptiva Estadística inferencial Población Variable cualitativa Variable cuantitativa Variable discreta Variable continua Muestra Tamaño muestral Dato Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada VARIABLE VII. Glosario 1. ESTADÍSTICA DESCRIPTIVA: Basada en una muestra de datos (recogida según una técnica concreta), y obtener la descripción de las características más importantes 2. ESTADÍSTICA INFERENCIAL: Conjunto de técnicas y métodos basado en los datos obtenidos a partir de una muestra y así poder inferir a través de estimadores la característica de una población. 1.2. Conceptos básicos. POBLACIÓN: Es el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales queremos obtener un resultado. VARIABLE: Es la característica que estamos midiendo. Existen dos categorías o tipo de variables: 1. Variable cualitativa: Es aquella que expresa un atributo o característica 2. Variable cuantitativa: Es aquella que podemos expresar numéricamente 2.1. Variable discreta, aquella que entre dos valores próximos puede tomar a lo sumo un número finito de valores. 2.2. Variable continua la que puede tomar los infinitos valores de un intervalo. En muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan que puedan existir todos los valores del intervalo La variable se denota por una letra mayúscula X. A su vez cada una de estas variables puede tomar distintos valores, colocando un subíndice 3. Muestra: Conjunto de elementos que forman parte de población. La muestra representa a esta población. 4. Tamaño muestral: Es le número total de elementos que conforman la muestra. Se denota por n. 5. Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable. 1.3. Distribuciones de frecuencias. Frecuencia absoluta: Llamaremos así al número de veces que se presenta una observación. Se representa por fi. Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos (n), se suele expresar en tanto por uno, siendo su valor i - ésimo. La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad. Frecuencia absoluta acumulada: es la suma acumulada de los distintos valores de la frecuencia absoluta. La última frecuencia absoluta acumulada es igual al tamaño de la muestra n Frecuencia relativa acumulada: es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele representar con la notación: Hi, o puede ser definido a partir de la frecuencia relativa, como suma de los distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La última frecuencia relativa acumulada es igual a la unidad. Links de interés http://www.vitutor.com/estadistica/descriptiva/d_2.html http://www.eumed.net/libros/2007a/239/2g.htm