Estadística y Probabilidad Patricia de Pavía Iturralde 08 2 Cuatrimestre CENTRO DE ESTUDIOS AVANZADOS DE LAS AMÉRICASLICENCIATURA EN NEGOCIOS INTERNACIONALES ESTADÍSTICA Y PROBABILIDAD 1 ESTADÍSTICA Y PROBABILIDAD ANTOLOGÍA Esta reproducción se realiza para uso interno exclusivo como un apoyo a los profesores y alumnos del Centro de Estudios Avanzados de las Américas y no persigue fines de lucro, la compilación está hecha por personal de la institución y supervisada por el representante legal de la misma en estricto apego a la Ley Federal de derechos de autor; por ello, y en apego al título 5°, capítulo 3°, artículos 123, 124, 125, 126, 127 y 128 a la página última en esta compilación se menciona para dar crédito al autor original de la obra así como a la casa editorial que la ha publicado, en concordancia con esta idea se sugiere de manera amplia al lector de esta antología y si así lo considera conveniente adquiera la . obra original pues esta reproducción solo tiene un fragmento de la misma CENTRO DE ESTUDIOS AVANZADOS DE LAS AMÉRICAS Río Tíber 12 Col. Cuauhtémoc, Del. Cuauhtémoc c.p. 06500 México D.F. Tel. 52 07 91 01 México, 2008 Tabla de contenido UNIDAD 1 UNIDAD 8 NOCIONES FUNDAMENTALES DE ESTADÍSTICA Clasificación de Estadística DISTRIBUCIÓN NORMAL. 2 Continua UNIDAD 2 UNIDAD 9 ESTADÍSTICA DESCRIPTIVA TEORÍA BÁSICA DEL MUESTREO. Distribución de Frecuencias UNI DAD 8 3 78 UNIDAD 10 MEDIDAS DE TENDENCIA CENTRAL Estadística Descriptiva Muestreo 71 ESTIMACIÓN E INTERVALOS DE CONFIANZA 26 Intervalos de confianza 93 UNIDAD 4 MEDIDAS DE DISPERSIÓN Estadística Descriptiva 35 UNIDAD 5 PRINCIPIOS DE PROBABILIDAD Probabilidad 42 UNIDAD 6 DISTRIBUCIONES DE PROBABILIDAD Discreta 55 UNIDAD 7 DISTRIBUCIONES DE PROBABILIDAD Discreta 63 BIBLIOGRAFÍA 101 UNIDAD 1 1. NOCIONES FUNDAMENTALES DE ESTADÍSTICA Estadística descriptiva e inferencial Concepto de variable Aplicaciones de la estadística 2 ESTADÍSTICA Introducción La palabra "estadística" suele utilizarse bajo dos significados distintos, a saber: 1º Como colección de datos numéricos.- Esto es el significado más vulgar de la palabra estadística. Se sobrentiende que dichos datos numéricos han de estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación. Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico publicado por el Instituto Nacional de Estadística, El Anuario de Estadísticas del Trabajo,… 2º Como ciencia.- La Estadística es una rama de la matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales. En este significado, La Estadística estudia el comportamiento de los fenómenos de masas. Como todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento. Así por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos para obtener después la proporción de varones. Es muy frecuente enfrentarnos con fenómenos en los que es muy difícil predecir el resultado; por ejemplo, no podemos dar una lista de las personas que van a morir 3 a una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo,… Por lo tanto, el objetivo de la Estadística es hallar las regularidades que se encuentran en los fenómenos de masa. La Estadística cuenta con procedimientos para recoger, organizar y presentar información acerca de un problema determinado, y con métodos para establecer la validez de las conclusiones obtenidas a partir de la información recogida. CLASIFICACIÓN DE LA ESTADISTICA La Estadística se clasifica en: Estadística descriptiva y Estadística Inferencial. La Estadística descriptiva, se encarga de los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son: la media y la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos. La Estadística descriptiva presenta la información en forma cómoda, utilizable y comprensible. La Estadística Inferencial se dedica a la generación de los modelos, deducciones y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población de estudio, es decir, se ocupa de la generalización de esa información haciendo deducciones acerca de las poblaciones. POBLACIÓN Y DATOS. Al aplicar estadística a un problema científico, industrial o social, se comienza con un proceso o población a ser estudiado. Esta puede ser una población de personas en un país, de granos cristalizados en una roca o de bienes manufacturados por una fábrica en particular durante un periodo dado. También 4 podría ser un proceso observado en varios instantes y los datos recogidos de esta manera constituyen una serie de tiempo. Por razones prácticas, en lugar de compilar datos de una población entera, usualmente se estudia un subconjunto seleccionado de la población, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos: descripción e inferencia. La población puede ser según su tamaño de dos tipos: Población finita: cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos de un centro de enseñanza, o grupo clase. Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita. CLASIFICACIÓN DE VARIABLES Los datos pueden ser de muy diversos tipos, por lo que los podemos clasificar en dos grandes clases: Variables Cuantitativas. Variables Cualitativas, Atributos o nominales. Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el peso, Altura, Edad, Número de Alumnos… A su vez este tipo de variables se puede dividir en dos subclases: Cuantitativas discretas. Aquellas a las que se les puede asociar un número entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos, páginas de un libro, etc. Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc. 5 No obstante en muchos casos el tratamiento estadístico hace que a variables discretas las trabajemos como si fuesen continuas y viceversa. Los atributos son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc. NIVELES DE MEDICIÓN Hay cuatro tipos de mediciones o escalas de medición en estadística. Los cuatro tipos de niveles de medición (nominal, ordinal, intervalo y razón) tienen diferentes grados de uso en la investigación estadística. Las medidas de razón, en donde un valor cero y distancias entre diferentes mediciones son definidas, dan la mayor flexibilidad en métodos estadísticos que pueden ser usados para analizar los datos. Las medidas de intervalo tienen distancias interpretables entre mediciones, pero un valor cero sin significado (como las mediciones de coeficiente intelectual o temperatura en grados Celsius). Las medidas ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden interpretable para sus valores. Las medidas nominales no tienen ningún rango interpretable entre sus valores. La escala de medida nominal, puede considerarse la escala de nivel más bajo. Se trata de agrupar objetos en clases. La escala ordinal, por su parte, recurre a la propiedad de “orden” de los números. La escala de intervalos iguales está caracterizada por una unidad de medida común y constante. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta escala, además de poseer las características de la escala ordinal, permite determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. La escala de coeficientes o Razones es el nivel de medida más elevado y se diferencia de las escalas de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total 6 de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. APLICACIONES En la actualidad, México se encuentra en un proceso de apertura e internacionalización, por tal motivo es de suma importancia estar inmerso a través de diferentes tratados comerciales con diferentes países, creando con esto nuevas oportunidades de negocios. La Estadística es una rama de la ciencia en pleno desarrollo y cuya aplicación en todos los ámbitos de la sociedad amplía las posibilidades de integración en el mundo laboral. La Estadística en los negocios ha tenido crecientes, continuas e innovadoras aplicaciones de sus métodos en esta área y una constante investigación en Estadística se lleva a cabo a partir de problemas que surgen en diversas áreas de los Negocios como Investigación de Mercados, Finanzas, Administración de Riesgos, entre otras. En los negocios y la industria la Estadística esta presente, por ejemplo, en la fabricación de productos ayudando a incrementar la satisfacción de los clientes aplicando técnicas de control de calidad y mejorando los procesos de producción, de bienes y servicios o el sustento de toma de decisiones en las empresas de los más diversos giros. En el área de Mercadotecnia permite el diseño de experimentos para determinar la viabilidad de los productos en el mercado, y predice la respuesta de los consumidores ante su venta. En el área de Economía, se ha logrado el desarrollo de indicadores e índices econométricos. Estudios de comportamiento de mercado, de la bolsa y análisis de inversiones. Empleo de estadística actuarial de riesgos y seguros. En consultoría trabajando en proyectos con las más importantes empresas del país en diferentes áreas. En Ingeniería utilizando técnicas de optimización que minimicen costos de producción y maximicen la eficiencia, detectando posibles problemas de fabricación. 7 2 UNIDAD 2. ESTADÍSTICA DESCRIPTIVA Distribución de frecuencias Representaciones gráficas 8 DESCRIPCIÓN DE LOS DATOS Para estudiar el comportamiento de un fenómeno se requiere información y ¿Cómo recopilarla? 1) Por medio de encuestas (interrogatorio oral o escrito que se aplica a varias personas acerca del problema). 2) Por medio del registro de las observaciones que se hacen de él. DISTRIBUCIÓN DE FRECUENCIAS La información obtenida debe presentarse en forma organizada. ¿Cómo? Se puede utilizar una distribución de frecuencias (o también llamada tabla de frecuencias), en donde se asocia a cada dato o subgrupo de datos (llamado intervalo de clase o clase) una frecuencia (número de observaciones que corresponden a cada dato o a cada grupo de datos). La presentación de los datos puede hacerse en forma ordenada, si son datos: Cualitativos Cuantitativos - Orden alfabético - Forma creciente (menor al mayor). - Escribir, primero el que más se repite, luego el que sigue y así sucesivamente. - Forma menor) 9 decreciente (mayor al EJEMPLO: A) Se preguntó a un grupo de alumnos de Ingeniería Industrial su materia preferida. Distribución de frecuencia Respuestas obtenidas datos frecuencia Administración 6 Ingeniería Económica 5 Ingeniería Industrial 11 Investigación de operaciones. 6 Matemáticas 12 Probabilidad y Estadística 10 Total 50 N= ¿Observaste que los datos se colocaron en orden alfabético? 10 B) Se preguntó a un grupo de alumnos su estatura en centímetros. Distribución de frecuencia Respuestas obtenidas datos f 152 163 154 170 164 154 166 151 1 163 162 168 168 172 170 160 152 1 161 158 165 165 151 161 157 154 2 160 155 158 158 170 169 168 155 2 155 156 162 162 166 168 160 156 1 157 1 158 2 160 4 161 2 162 2 163 2 164 1 11 165 2 166 2 168 5 169 1 170 3 172 1 Tot N = 35 ¿Observaste que los datos al ser cuantitativos se ordenaron en forma creciente? Pero, ¿cuándo los datos son cuantitativos y se presentan más de 15 valores diferentes, se recomienda resumir la información? ¿Y cómo? Acomodándolos en grupos (llamados clases o intervalos de clase). 12 Grupos (clases) Frecuencia 151-155 6 156-160 8 161-165 9 166-170 11 171-175 1 N= 35 Los grupos deben formarse de igual tamaño. (tamaño de clase : c) El total de grupos o clases no deben ser menor a 5 ni mayor a 15 A los límites extremos de cada clase se les llama límite Inferior y límite superior de clase respectivamente. En la clase 151, ese es el límite inferior y 155 es el límite superior. Marca de clase es el punto medio de cada clase y se obtiene sumando los límites de clase y dividiéndolos entre dos. El tamaño o anchura de clase es la diferencia entre los límites de clase. Por ejemplo: En la distribución de frecuencias anterior se tiene: 13 Clases LI LS Marcas de f Tamaño Clase X de Clase 151-155 6 153 156-160 8 158 161-165 9 163 166-170 11 168 171-175 1 173 c=4 N=35 Pero, ¿cómo se calcula el tamaño de clase? ¿Cómo saber cuántas clases se deben manejar? Para determinar el número de clases óptimo, existe una regla que sugiere utilizar como el número de clases el menor número (k) tal que k2 sea mayor que el número de observaciones. En el ejemplo anterior hay 35 observaciones (N=35). Dos elevado a la quinta potencia es 32. Entonces debemos tener al menos 5 clases. Eventualmente utilizaríamos 6. Para determinar el tamaño, intervalo o amplitud de clase, que generalmente debe ser el mismo, y deben cubrir al valor menor y al mayor, se recomienda el uso la siguiente expresión: i H L k 14 En donde H es el valor mayor observado, L es el menor y k es el número de clases. Para el ejemplo anterior: H= 172, L= 151 y k=5, entonces tenemos: i 172 151 4.2 5 En el ejemplo se usó 4. Si en lugar de 4.2 se hubiese tenido 4.5 o más se hubiera redondeado a 5. También se pueden hallar: Frecuencias acumuladas.- la suma de cada frecuencia con la frecuencia de la clase contigua superior. Frecuencias relativas.- Dividiendo cada frecuencia entre el número total de observaciones y multiplicándolas por l00 para tenerlas en forma de porcentaje. Frecuencias relativas acumuladas.- La suma de cada frecuencia relativa con la frecuencia relativa de la clase contigua superior. También se pueden obtener dividiendo cada frecuencia acumulada entre el total de frecuencias por l00. Entonces en nuestro ejemplo tenemos: 15 Clases frecuencia Frecuencia Frecuencia acumulada relativa (%) 151-155 6 6 156-160 8 14 161-165 9 23 166-170 11 34 171-175 1 35 Frecuencia relativa acumulada (%) (6/35)100= (6/35)100= 17.1 17.1 (8/35)100= 22.9 (14/35)100= 40 (9/35)100= (23/35)100= 25.7 65.7 (11/35)100= (34/35)100= 31.4 97.1 (1/35)100= 2.9 (35/35)100= 100 ¿Y para qué nos sirven estas frecuencias? Para contestar preguntas tales como: 1) ¿Cuántos alumnos tienen estatura entre 156 y 160 centímetros? R = Se busca en la columna de frecuencia y la respuesta es 8. 2) ¿Cuántos alumnos tienen estatura de l65 o menos? R = Se busca en la columna de frecuencia acumulada y la respuesta es 23. 3) ¿Qué porcentaje de alumnos tienen estatura entre 166 y 170 centímetros? R = Se busca en la columna de frecuencia relativa y la respuesta es 31.4%. 4) ¿Qué porcentaje de alumnos tienen estatura menor o igual que l60? 16 R = Se busca en la columna de frecuencia relativa acumulada y la respuesta es 40%. PRESENTACIÓN DE LA INFORMACIÓN A TRAVÉS DE GRÁFICAS. En dos grupos de una escuela se realizó un examen de matemáticas y los resultados se presentaron de la manera siguiente: Reporte de calificaciones del Grupo1 Calificación Frecuencia 5 3 6 8 7 14 8 9 9 4 10 2 Total 40 17 Reporte de calificaciones del Grupo2 ¿Cuál de los dos reportes te pareció mejor y porqué? Realmente se observa mejor la gráfica, llama más la atención y se puede interpretar mejor y más rápido. Es por ello que se utilizan las gráficas para la representación de la información. Existen una serie de gráficas como son: -DIAGRAMA DE BARRAS Ó GRÁFICA DE BARRAS. -HISTOGRAMA. -POLÍGONO DE FRECUENCIAS. -GRÁFICA CIRCULAR O GRÁFICA DE PASTEL. -PICTOGRAMA. -OJIVA Ó POLÍGONO DE FRECUENCIAS ACUMULADAS. -OJIVA PORCENTUAL Ó POLÍGONO ACUMULADAS. 18 DE FRECUENCIAS RELATIVAS DIAGRAMA DE BARRAS Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato. Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas durante el verano de l991 en un estado de la República Mexicana. Datos (vacunas) frecuencia miles) (en Frecuencia relativa (%) (redondeado) BCG 47 17 SABIN 111 41 DPT 73 27 SARAMPION 41 15 TOTAL 272 100 19 El diagrama de barras o gráfica de barras suele elaborarse con algunas variantes; por ejemplo, se pueden utilizar líneas en vez de rectángulos ó barras, ó líneas horizontales en vez de verticales. Si se tienen datos cuantitativos se grafica en el eje de las x los valores centrales (marcas de clase), cuyas alturas son proporcionales a sus frecuencias. Así en la distribución de frecuencias de las alturas de 35 alumnos se tiene: 20 HISTOGRAMA. Se utiliza para datos cuantitativos representados en distribuciones de frecuencia. La gráfica son rectángulos verticales unidos entre sí, en donde sus lados son los límites reales inferior y superior de clase y cuya altura es igual ala frecuencia de clase. Con la distribución de frecuencia anterior se tiene: 21 POLÍGONO DE FRECUENCIAS: Consiste en una serie de segmentos que unen los puntos cuyas abscisas (valores de x) son los valores centrales de cada clase y cuyas ordenadas (valores de y) son proporcionales a sus frecuencias respectivas. GRÁFICA CIRCULAR: Se forma al dividir un círculo en sectores circulares de manera que: a) Cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa. b) La unión de los sectores circulares forma el círculo y la suma de sus porcentajes es 100. 22 Datos (vacunas) Frecuencia en miles Frecuencia Grados relativa(%) (redondeados) BCG 47 17 .17 x 360 = 61 SABIN 111 41 .41 x 360 = 148 DPT 73 27 .27 x 360 = 97 SARAMPION 41 15 .15 x 360 =54 TOTAL 272 100 360 23 PICTOGRAMA: Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se lee en forma aproximada. Ejemplo: En una biblioteca de una escuela se tienen los siguientes libros: Libros frecuencia Biología 25 Matemáticas 30 Física 43 Química 20 Filosofía 10 Total 128 24 OJIVA O POLÍGONO DE FRECUENCIAS ACUMULADAS: Una gráfica de distribución de frecuencias acumuladas es llamada una ojiva. Se trazan los límites reales inferiores (límite inferior menos 0.5) contra las frecuencias acumuladas. OJIVA PORCENTUAL Ó POLÍGONO DE FRECUENCIAS ACUMULADAS. Se trazan los límites reales superiores contra las frecuencias relativas acumuladas. 25 RELATIVAS 3 UNIDAD 3. Medidas de tendencia central Media Mediana Moda 26 MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo número. Para tal fin, desde luego, no se usará el valor más elevado ni el valor más pequeño como único representante, ya que solo representan los extremos más bien que valores típicos. Entonces sería más adecuado buscar un valor central. Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual. Entre las medidas de tendencia central tenemos: La media, la mediana, la moda y los percentiles. MEDIA La medida de tendencia central mas ampliamente usada es la media aritmética, usualmente abreviada como media ó promedio. La media aritmética de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n. Propiedades de la media aritmética 1. Puede ser calculada en distribuciones con escala de razón y de intervalo. 2. Todos los valores son incluidos en el cómputo de la media. 3. Una serie de datos solo tiene una media. 4. Es una medida muy útil para comparar dos o más poblaciones. 5. Es la única medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos. Desventajas de la media aritmética 27 1. Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es el promedio apropiado para representar la serie de datos. 2. No se puede determinar si en una distribución de frecuencias hay intervalos de clase abiertos. Las siguiente expresión es útil para el cálculo de la media con datos agrupados (tablas de frecuencia) y datos no agrupados. xi representa el valor de la variable o en su caso la marca de clase. Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los siguientes datos corresponden al kilometraje de cada uno de ellos: 56,000 23,000 42,000 73,000 Encuentre la media aritmética del kilometraje de los autos: µ = (56,000 + … + 73,000)/4 = 48,500 El ejemplo anterior es con datos no agrupados. Para calcular la media se han utilizado todos los datos, por esta razón se representa a la media con la letra µ. En caso de trabajar con una muestra de los datos se representará la media con 𝑥̅ . Ejemplo 2: La siguiente tabla muestra los resultados de una muestra de 10 cines en una gran área metropolitana, que contó el número total de películas en exhibición la última semana. Calcule el número medio de películas en exhibición. 28 Películas cartelera en Frecuencia (f) Marca de clase (X) (f)(X) 1–3 1 2 2 4–6 2 5 10 7–9 3 8 24 10 – 12 1 11 11 13 – 15 3 14 42 Total 10 X f x= 89 fX 89 8.9 n 10 El anterior es un ejemplo con datos agrupados (distribución de frecuencia) Otros métodos para calcular la media son: Media geométrica: La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G. Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual. Media armónica: La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente. 29 MEDIANA La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua. Cálculo de la mediana en el caso discreto: Tendremos en cuenta el tamaño de la muestra. Si N es Impar hay un término central el término, 𝑥𝑛+1 mediana. Si N es Par, hay dos términos centrales, 𝑥𝑛 de esos dos valores 2 , 𝑥𝑛+2 2 2 será el valor de la la mediana será la media Veamos un ejemplo. N par N Impar 1,4,6,7,8,9,12,16,20, 24,25,27 N=12 𝑥𝑛 12 𝑥𝑛+2 14 = = 6, = =7 2 2 2 2 1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13 𝑥𝑛+1 14 = =7 2 2 Términos Centrales el 6º y 7º= 9 y 12 Términos Centrales el 7º =12 Me = 9+12 = 10.5 2 Me=12 30 Cálculo de la mediana en el caso continuo: Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de la siguiente forma: Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas. De donde la mediana vale: Me = 𝐿𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝑁 −𝑓𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 2 𝑓 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 (𝑐) c es la amplitud del intervalo Veámoslo por medio de un ejemplo. Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma: 31 Intervalo de clase Frecuencia Frecuencia acumulada 45 hasta 55 6 6 55 hasta 65 10 16 65 hasta 75 19 35 >25 75 hasta 85 11 46 85 hasta 95 4 50 N=50 Como el tamaño de la muestra es N=50, buscamos el intervalo en el que la Frecuencia acumulada es mayor que 50/2=25, que en este caso es el 3º y aplicamos la fórmula anterior. 𝐿𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 65 𝑓𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 16 𝑓𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 19 c = 75 – 65 = 10 Luego la Mediana será Me = 65 + 50 −16 2 19 (10) = 69.74 MODA MODA.- La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar para una variable cualitativa, pues no precisa la realización de ningún cálculo. 32 Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso. Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87 Dado que 81 es el dato que aparece con más frecuencia, éste es la moda. Cuando se desea hacer el cálculo de la moda para distribuciones cuantitativas continuas tendremos que: Apoyándonos en el gráfico podemos llegar a la determinación de una expresión para la Moda que es: Mo = 𝐿𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 + 𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 −𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 ( (𝑐) )−( ) 𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙− 𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙− 𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 Veamos su cálculo mediante un ejemplo, para ello usaremos los datos del apartado anterior 33 Intervalo de clase Frecuencia Frecuencia acumulada 45 hasta 55 6 6 55 hasta 65 10 16 65 hasta 75 19 35 75 hasta 85 11 46 85 hasta 95 4 50 N=50 𝐿𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 65 𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 19 𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 10 𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 11 c = 75 – 65 = 10 19−10 Mo = 65 + (19−10)−(19−11) (10) = 70.29 34 4 UNIDAD 4. Principales medidas de dispersión Rango Desviación media Varianza Desviación estándar 35 MEDIDAS DE DISPERSIÓN Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersión. RANGO Se define como la diferencia existente entre el valor mayor y el menor de la distribución. Lo notaremos como R. Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular. Rango.Dato mayor menos dato menor. DESVIACIÓN Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di . No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información. La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solución no es la adecuada ya que siempre el resultado da cero, pues las desviaciones positivas se contrarrestan con las negativas. 36 Para resolver este problema, tenemos dos caminos: Tomar el valor absoluto de las desviaciones. Desviación media Elevar al cuadrado las desviaciones. Varianza. DESVIACIÓN MEDIA Es la media de los valores absolutos de las desviaciones, y la denotaremos por d m. Ejemplo: Los pesos de una muestra de canastas con libros en una librería (en libras) son: 103, 97, 101, 106, 103 Encuentre el rango y la desviación media. Rango = 106 – 97 = 9 Para la desviación media el primer paso es encontrar la media: X X 510 102 n 5 La desviación media es: MD XX 103 102 ... 103 102 n 1 5 1 4 5 2.4 5 5 37 VARIANZA Es la media de los cuadrados de las desviaciones, y la denotaremos por también por o . Aunque también es posible calcularlo como: Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendrá en cm2. Ejemplo: Las edades de la familia González son: 2, 18, 34, 42 ¿Cuál es la varianza poblacional? X 96 24 n 4 ( X ) 2 2 242 ... 42 242 N 4 944 236 4 2 DESVIACIÓN TÍPICA Es la raíz cuadrada de la varianza, se denota por Sx o x. 38 Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Ejemplo: Calcule la desviación estándar o típica del ejemplo anterior: 2 236 15.36 La fórmula para la varianza muestral para datos agrupados es: (fX ) 2 fX n n 1 2 s2 donde f es la frecuencia de clase y X es la marca de clase. Ejemplo: Obtén la varianza y la desviación estándar de la siguiente tabla: Películas en Frecuencia cartelera (∑ 𝒇𝒙)𝟐 𝒏 Frecuencia Marca de f x 2 acumulada clase (x) 1–3 1 1 2 1(2)2=4 (1x2)=2 4–6 2 3 5 2(5)2=50 (2x5)=10 7–9 3 6 8 3(8)2=192 (3x8)=24 10 – 12 1 7 11 1(11)2=121 (1x11)=11 13 – 15 3 10 14 3(14)2=588 (3x14)=42 Total 10 955 (89)2/10=792.1 (fX ) 2 fX 955 792.1 2 n s 18.1 n 1 10 1 2 Varianza: 39 Desviación estándar: 𝑠 = √18.1 = 4.25 INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR Regla empírica: Se aplica solamente en una distribución de frecuencias simétrica, con forma de campana: Aproximadamente 68% de las observaciones estarán entre más una y menos una s desde la media; Aproximadamente 95% de las observaciones se encontrarán entre más dos y menos dos s desde la media; Prácticamente todas las observaciones se hallarán entre más tres y menos tres s a partir del valor medio. COEFICIENTE DE VARIACIÓN Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V. Ejemplo: Un estudio sobre los bonos pagados y los años de servicio de varios empleados se muestra en la siguiente tabla: 40 Bonos pagados Años de servicio Media $200.00 20 años Desviación estándar $40.00 2 años Coeficiente de variación CV 40 (100) 20% 200 41 CV 2 (100) 10% 20 5 UNIDAD 5. PRINCIPIOS DE PROBABILIDAD Introducción Probabilidad clásica de frecuencia relativa y subjetiva Reglas para el cálculo de probabilidades 42 PROBABILIDAD Introducción Muchos de los eventos que ocurren en la vida diaria no pueden ser predichos con exactitud desde antes por diversas razones, pues la mayoría de los hechos están influidos por factores externos. Además, existen aquellos sucesos que están directamente influidos por el azar, es decir, por procesos en los que no se está seguro de lo que va a ocurrir. Sin embargo, la probabilidad nos permite acercarnos a esos sucesos y estudiarlos, ponderando las posibilidades de su ocurrencia y proporcionando métodos para tales ponderaciones. Precisamente, algunos de esos métodos proporcionados por la probabilidad nos llevan a descubrir que algunos sucesos tienen una mayor o menor probabilidad de ocurrir que la ponderación asignada a través del sentido común. Nuestros sentidos, la información previa que poseemos, nuestras creencias o posturas, nuestras inclinaciones, son algunos de los factores que intervienen para no permitirnos hacer ponderaciones reales y sistemáticas. La probabilidad nos permitirá estudiar los eventos de una manera sistemática y más cercana a la realidad, retribuyéndonos con información más precisa y confiable y, por tanto, más útil para las disciplinas humanas. EVENTOS Cuando se realiza un experimento, que es cualquier proceso que produce un resultado o una observación, se van a obtener un conjunto de valores. A este conjunto de valores que puede tomar una variable se le denomina espacio muestral. Por ejemplo: Si se tiene un dado cualquiera, el espacio muestral (EM) es EM = {1,2,3,4,5,6}. 43 Si existen más de una variable, el espacio muestral está formado por las combinaciones de valores de cada una de las variables. Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si éste consta de un solo elemento entonces es un evento elemental. Como se puede uno imaginar, existen eventos que siempre, no importa el número de experimentos o su situación, ocurren, y en cambio existen otros que nunca ocurren. Los que siempre ocurren son los eventos seguros, y los que nunca son los eventos imposibles. Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta razón, se define como experimento aleatorio al proceso en el que no se pueden predecir con certeza la ocurrencia de sus eventos, con excepción del seguro o del imposible. Hay que hacer la observación que esta definición habla en términos generales y no específicamente sobre algún experimento en particular. A aquélla variable que está asociada a un experimento de este tipo se le denomina variable aleatoria. En cambio, a un experimento no aleatorio se le denomina experimento determinístico. DEFINICIÓN DE PROBABILIDAD A través de la historia se han desarrollado tres enfoques conceptuales diferentes para definir la probabilidad y determinar los valores de probabilidad: El enfoque clásico Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo tiempo), entonces la probabilidad de que ocurra A es: número de resultados asociados con el evento A P(A)= número total de resutlados posibles 44 El enfoque clásico de la probabilidad se basa en la suposición de que cada resultado sea igualmente posible. Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda aplicarse) calcular el valor de probabilidad antes de observar cualquier evento de muestra. Ejemplo: Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de sacar una piedra roja en un intento es: El enfoque de frecuencia relativa También llamado Enfoque Empírico, determina la probabilidad sobre la base de la proporción de veces que ocurre un evento favorable en un número de observaciones. En este enfoque no ese utiliza la suposición previa de aleatoriedad. Porque la determinación de los valores de probabilidad se basa en la observación y recopilación de datos. Ejemplo: Se ha observado que 9 de cada 50 vehículos que pasan por una esquina no tienen cinturón de seguridad. Si un vigilante de transito se para en esa misma esquina un día cualquiera ¿Cuál será la probabilidad de que detenga un vehículo sin cinturón de seguridad? La probabilidad es de 9/50=0.18 Tanto el enfoque clásico como el enfoque empírico conducen a valores objetivos de probabilidad, en el sentido de que los valores de probabilidad indican a largo plazo la tasa relativa de ocurrencia del evento. El enfoque subjetivo Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte de un individuo de que un evento ocurra, basado en toda la evidencia a su disposición. Bajo esta premisa se puede decir que este enfoque es adecuado cuando sólo hay una oportunidad de ocurrencia del evento. Es decir, que el evento ocurrirá o no ocurrirá esa sola vez. El valor de probabilidad bajo este enfoque es un juicio personal. 45 Concepto de Probabilidad Se define como cálculo de probabilidad al conjunto de reglas que permiten determinar si un fenómeno ha de producirse, fundando la suposición en el cálculo, las estadísticas o la teoría. EL VALOR DE LA PROBABILIDAD El valor más pequeño que puede tener la probabilidad de ocurrencia de un evento es igual a 0, el cual indica que el evento es imposible, y el valor mayor es 1, que indica que el evento ciertamente ocurrirá. EVENTOS MUTUAMENTE EXCLUYENTES Y EVENTOS NO EXCLUYENTES Dos o más eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir simultáneamente. Es decir, la ocurrencia de un evento impide automáticamente la ocurrencia del otro evento (o eventos). Ejemplo: Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a la vez, esto quiere decir que estos eventos son excluyentes. Dos o más eventos son no excluyentes, o conjuntos, cuando es posible que ocurran ambos. Esto no indica que necesariamente deban ocurrir estos eventos en forma simultánea. Ejemplo: Si consideramos en un juego de domino sacar al menos un blanco y un seis, estos eventos son no excluyentes porque puede ocurrir que salga el seis blanco. REGLAS DE LA ADICIÓN Las reglas de la Adición expresan que la probabilidad de ocurrencia de al menos dos sucesos A y B es igual a: P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente 46 P(A o B) = P(A) + P(B) – P(A y B) si A y B son no excluyentes Siendo: P(A) = probabilidad de ocurrencia del evento A P(B) = probabilidad de ocurrencia del evento B P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B Ejemplos: 1. Eventos mutuamente excluyentes: Una máquina automática tiene bolsas de plástico que contienen frijoles, brócoli y otras verduras. Aunque se procuró que todas las bolsas tuvieran el mismo peso, algunas tienen un peso ligeramente menor y otras un peso ligeramente mayor. Una revisión de 4 000 bolsas arrojó los siguientes resultados: PESO EVENTO Número de Probabilidad de paquetes ocurrencia Peso más bajo A 100 100/4000=0.025 Peso correcto B 3600 3600/4000=0.90 Peso más alto C 300 300/4000=0.075 4000 1.00 ¿Cuál es la probabilidad de que un paquete determinado tenga un peso ligeramente más bajo? P(A o C) = P(A) U P(C) = P(A) + P(C)=0.025+0.075=0.10 2. Eventos no excluyente: ¿Cuál es la probabilidad de que una carta escogida al azar de una baraja americana sea un rey o un corazón? 47 CARTA PROBABILIDAD EXPLICACIÓN DE OCURRENCIA Rey P(A)=4/52 Hay 4 reyes en una baraja de 52 cartas Corazón P(B)=13/52 Hay 13 corazones en una baraja de 52 cartas Rey de corazones P(A y B)=1/52 Hay 1 rey de corazones en una baraja de 52 cartas P(A o B) = P(A) + P(B) – P(A y B)= 4 52 + 13 52 − 1 52 = 16 52 = 0.3077 Un diagrama de Venn representa estos resultados: Corazones Reyes Ambos EVENTOS INDEPENDIENTES Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se regresa de nuevo a la población donde se obtuvo. Ejemplo: 48 Lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo lanzamiento. EVENTOS DEPENDIENTES Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (u otros). Cuando tenemos este caso, empleamos entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del evento A sí el evento B ya ocurrió. Se debe tener claro que A|B no es una fracción. P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A) Ejemplo: Un estudio de la lealtad hacia una compañía de sus ejecutivos. La pregunta que se les hizo fue, ¿si otra compañía le ofreciera un puesto igual ó ligeramente mejor al que tiene ahora, se quedaría en la compañía? Las repuestas de 200 ejecutivos se clasificaron de acuerdo con su tiempo de servicio en la compañía. ¿Cuál es la probabilidad de seleccionar un ejecutivo de la compañía que sea leal y que tenga más de 10 años de servicio? TIEMPO DE SERVICIO LEALTAD Menos de un año 1-5 años 6-10 años Más de 10 años Total Se quedaría 10 30 5 75 120 No se quedaría 25 15 10 30 80 200 P(A | B) = P(A y B) / P(B) o P(B | A) = P(A y B) / P(A)= 120 75 9000 ( )( ) = ( ) = 0.375 200 120 24000 REGLAS DE MULTIPLICACIÓN 49 Se relacionan con la determinación de la ocurrencia conjunta de dos o más eventos. Es decir la intersección entre los conjuntos de los posibles valores de A y los valores de B, esto quiere decir la probabilidad de que ocurran conjuntamente los eventos A y B es: P(A y B) = P(A B) = P(A) P(B) si A y B son independientes P(A y B) = P(A B) = P(A) P(B|A) si A y B son dependientes Ejemplos: 1. Eventos independientes: Se lanzaron dos monedas. ¿Cuál es la probabilidad de que las dos monedas caigan en sol? P(A y B) = P(A B) = P(A) P(B)= (1/2)(1/2)=0.25 2. Eventos dependientes: Suponga que hay diez rollos de película en una caja, se sabe que tres están defectuosos. Se toman dos rollos de la caja, uno después del otro. ¿Cuál es la probabilidad de que ambos sean defectuosos? P(A y B) = P(A B) = P(A) P(B|A)=(3/10)(2/9)=0.07 TEOREMA DE BAYES El Teorema de BAYES se apoya en el proceso inverso al que hemos visto en el Teorema de la Probabilidad Total: Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente). Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía buen tiempo?). La fórmula del Teorema de Bayes es: P(A1 )P(BIA1 ) P(A1 )P(BIA1 )+P(A2 )P(BIA2 ) P(A B)= 50 Vamos a explicar la fórmula con un ejemplo. El parte meteorológico ha anunciado tres posibilidades para el fin de semana: a) Que llueva: probabilidad del 50%. b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%. Según estos posibles estados meteorológicos, la posibilidad de que ocurra un accidente es la siguiente: a) Si llueve: probabilidad de accidente del 20%. b) Si nieva: probabilidad de accidente del 10% c) Si hay niebla: probabilidad de accidente del 5%. Resulta que efectivamente ocurre un accidente y como no estábamos en la ciudad no sabemos que tiempo hizo (llovió, nevó o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades: Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el 20%). Una vez que incorporamos la información de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori". Vamos a aplicar la fórmula: a) Probabilidad de que estuviera lloviendo: (0.5)(0.2) P(A B)= =0.714 (0.5)(0.2)+(0.3)(0.1)+(0.2)(0.05) La probabilidad de que efectivamente estuviera lloviendo el día del accidente (probabilidad a posteriori) es del 71,4%. b) Probabilidad de que estuviera nevando: P(A B)= (0.3)(0.1) (0.5)(0.2)+(0.3)(0.1)+(0.2)(0.05) 51 =0.214 La probabilidad de que estuviera nevando es del 21,4%. c) Probabilidad de que hubiera niebla: (0.2)(0.05) P(A B)= =0.071 (0.5)(0.2)+(0.3)(0.1)+(0.2)(0.05) La probabilidad de que hubiera niebla es del 7,1% Otro ejemplo. En una etapa de la producción de un artículo se aplica soldadura y para eso se usan tres diferentes robots. La probabilidad de que la soldadura sea defectuosa varía para cada uno de los tres, así como la proporción de artículos que cada uno procesa, de acuerdo a la siguiente tabla. ROBOT DEFECTUOSOS ART. PROCESADOS A 0.03 45% B 0.04 30% C 0.05 25% Tomamos al azar una pieza y resulta ser defectuosa, ¿calcula la probabilidad de que haya sido producida por el robot B? (0.3)(0.04) P(B D)= =0.316 (0.45)(0.03)+(0.3)(0.04)+(0.25)(0.05) ¿Qué robot tiene la mayor probabilidad de haber producido la pieza defectuosa? (0.45)(0.03) P(A D)= =0.355 (0.45)(0.03)+(0.3)(0.04)+(0.25)(0.05) (0.25)(0.05) P(C B)= =0.329 (0.45)(0.03)+(0.3)(0.04)+(0.25)(0.05) El robot con mayor probabilidad de haber producido la pieza defectuosa es el robot A. 52 DIAGRAMA DE ÁRBOL Supongamos que en el problema de los robots seleccionamos una pieza al azar y queremos calcular la probabilidad de que sea defectuosa. Para calcular la probabilidad de que la pieza elegida sea defectuosa, P (D), por la propiedad de la probabilidad total, P (D)=P(A) P (D A)+P (B) P (D B)+P(C) P (D C)= (0.45)(0.03)+ (0.30) (0.04)+ (0.25) (0.05)=0.038 Con un diagrama de árbol tenemos: A 0.03 D 0.097 N 0.45 0.04 D 0.30 B 0.25 C 0.96 N 0.05 D 0.95 N AXIOMAS DE LA PROBABILIDAD Recordemos primero que las frecuencias relativas de una distribución tenían las siguientes propiedades: Las frecuencias relativas son mayores o iguales que cero. La frecuencia relativa del espacio muestral es igual a la unidad. Si dos eventos son mutuamente excluyentes, es decir que no ocurren simultáneamente, entonces la frecuencia relativa de su unión es la suma de las frecuencias relativas de cada uno. 53 Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definición ya expuesta, es la frecuencia relativa cuando se aumenta el tamaño de la muestra, se tienen lo siguiente. Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E, entonces se satisfacen los axiomas de la probabilidad: 0 P(E) 1. P(S) = 1. Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces 54 6 UNIDAD 6. DISTRIBUCIONES DE PROBABILIDAD: DISCRETAS Concepto de distribución de probabilidad para variables discretas Media, varianza y desviación estándar de una distribución de probabilidad Análisis combinatorio 55 DISTRIBUCIONES DE PROBABILIDAD VARIABLES ALEATORIAS Se denominan variables porque cambian de valor y aleatorias porque su valor depende del azar, es impredecible. Las variables aleatorias pueden ser discretas y continuas. Variable discreta: Es aquella que sólo puede tomar valores enteros. Variable continua: Es aquella que puede tomar cualquier valor en algún intervalo. Cuando una de estas variables aleatorias toma diversos valores, la probabilidad asociada a cada uno de tales valores puede ser organizada como una distribución de probabilidad. Las distribuciones de probabilidad pueden representarse a través de una tabla, una gráfica o una fórmula, en donde a la regla de correspondencia se le denomina función de probabilidad. Consideraremos las distribuciones de probabilidad para variables discretas. Por ejemplo: Consideremos a la variable aleatoria X como la cantidad de águilas observadas cuando se lanzan dos volados. El espacio muestral es el conjunto {AA, AS, SA, SS} y se puede ver que la variable X puede tomar como valores 0, 1 y 2. Calculando las probabilidades tenemos: P (de no observar águilas) = P (SS) = P(X=0) = ¼ P (de observar una águila) = P (SA AS) = P (X=1) = 2/4 P (de observar dos águilas) = P (AA) = P(X=2) = ¼ Si ahora se organizan estos resultados con el siguiente formato 56 X P (X=x) 0 ¼ 1 ½ 2 ¼ Se podrá explicar por qué se usa el nombre "distribución de probabilidad". E incluso, con esta información se puede construir una gráfica de barras o un histograma como el que sigue: Las propiedades de las distribuciones de variables discretas son dos: 0 P(X=x) 1. P(X=x) = 1, o que es lo mismo: la suma de todas las probabilidades de los eventos posibles de una variable aleatoria es igual a la unidad. Hay que hacer notar que estas propiedades se enuncian suponiendo que conocemos el valor de la probabilidad, pero en la realidad esto no ocurre, es decir que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva a modelos teóricos que estiman los resultados, los principales son los que a continuación se presentan. 57 MODELOS DE DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS Uniforme: Es la distribución donde todos los eventos elementales tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la función P(X=x)=1/6 para valores de x=1, 2, 3, 4, 5,6. Binomial: Es la que maneja la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de éxito constante y con ensayos independientes. Geométrica: Es la distribución de la probabilidad de realizar cierto número de experimentos antes de obtener un éxito. Hipergeométrica: Es similar a la binomial, pero con un tamaño de muestra grande en relación al tamaño de la población. La función de Excel que proporciona sus valores es DISTR.HIPERGEOM De Poisson: Es la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar. MEDIA Y DESVIACIÓN ESTÁNDAR DE UNA DISTRIBUCIÓN PROBABILIDAD PARA VARIABLES DISCRETAS En una distribución de frecuencias para datos agrupados se calculaba la media utilizando la fórmula: También puede expresarse como: 58 DE Si consideramos que la definición de probabilidad de un evento P(X) es el cociente de la frecuencia entre el número total de eventos, la media de una distribución de probabilidad de una variable discreta es: Por ejemplo: Consideremos la variable X del ejemplo de águilas observadas en dos lanzamientos de monedas. Es decir, X tal que su distribución de probabilidad sea: X P (X=x) 0 ¼ 1 ½ 2 ¼ Entonces, para calcular su media m se realiza: Similarmente, la varianza se definió como: Haciendo un tratamiento análogo al anterior tenemos que para que, finalmente, la varianza de una distribución de probabilidad de una variable discreta sea: Consecuentemente, la desviación estándar de una distribución de probabilidad de una variable discreta es: 59 Por ejemplo: Considerando la misma distribución de probabilidad que en el ejemplo anterior, su desviación estándar se calcula: DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS Hasta el momento se han considerado las distribuciones de probabilidad para variables discretas, donde se podía asignar el valor que toma la función de probabilidad cuando la variable aleatoria tomaba un valor en concreto. Sin embargo, al considerar las variables continuas se encuentra uno el problema de que, lo más probable, los datos que se puedan recabar no sean completamente exactos, o dos o más de ellos no coincidan, por lo que se tienen que trabajar en intervalos y, en ese momento, modelar una función se convierte en un problema serio. Sin embargo, se pueden realizar aproximaciones y describir la probabilidad a través de modelos teóricos de probabilidad cuya gráfica es una línea continua, a diferencia de las variables discretas que le corresponde un histograma. ANÁLISIS COMBINATORIO En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situación dada se convierte en algo difícil de lograr o, simplemente, tedioso. El análisis combinatorio, o cálculo combinatorio, permite enumerar tales casos o sucesos y así obtener la probabilidad de eventos más complejos. En el caso de que existan más de un suceso a observar, habría que contar el número de veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo: 60 Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el número de formas en que ambos sucesos pueden presentarse en ese orden es de n1·n2. En otras palabras, basta multiplicar el número de formas en que se pueden presentar cada uno de los sucesos a observar. En el análisis combinatorio se definen las permutaciones, con o sin repetición, y las combinaciones. PERMUTACIONES (U ORDENACIONES) CON REPETICIÓN Las permutaciones son también conocidas como ordenaciones, y de hecho toman este nombre porque son ordenaciones de r objetos de n dados. Por ejemplo: Sea A = {a, b, c, d}, ¿cuántas "palabras" de dos letras se pueden obtener? Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r =2 y n =4. Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16. En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con repetición obtenidas son: ORnr = nORr = n r PERMUTACIONES (U ORDENACIONES) SIN REPETICIÓN En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n dados atendiendo a la situación de cada objeto en la ordenación. Su representación será Pnr ó nPr. En general, si se toman r objetos de un total de n, la cantidad de permutaciones Pnr = nPr = 61 Por ejemplo: Sea el mismo conjunto A = {a, b, c, d}, ¿cuántas ordenaciones sin repetición se pueden obtener? Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total. COMBINACIONES Es una selección de r objetos de n dados sin atender a la ordenación de los mismos. Es decir, es la obtención de subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con C n r, n C r ó . Por ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, ¿cuántos subconjuntos de 2 elementos cada uno se pueden obtener? Haciéndolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los subconjuntos. En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el número de combinaciones obtenidas son: C nr = nC r = o, que es lo mismo, C nr = nC r = En donde n =(n-1)(n-2)8n-3)… 1 Ejemplo: Calcular 5 =(5)(4)(3)(2)(1)=120 62 7 UNIDAD 7. DISTRIBUCIONES DE PROBABILIDAD Distribución Binomial Distribución de Poisson 63 Un modelo es una simplificación de la realidad. Un modelo probabilístico es un modelo matemático que describe el comportamiento de una variable aleatoria. Es una función que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una población en particular y que se denominan parámetros del modelo. En el proceso de modelación es necesario seguir los siguientes pasos: 1. Seleccionar el modelo más apropiado. 2. Ajustar el modelo (calcular el valor de sus parámetros). 3. Verificar el modelo. 4. Decidir su aceptación o volver al paso 1. Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de probabilidad, desarrollados para representar distintos tipos de variables y diferentes fenómenos aleatorios. Por lo tanto, el problema se reduce a elegir el modelo más apropiado para el caso en estudio. Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la población en estudio y calcular las cantidades necesarias como para evaluar los parámetros del modelo. LA DISTRIBUCIÓN BINOMIAL Esta distribución describe una variedad de procesos de interés para los administradores y describe datos discretos, no continuos, que son resultado de un experimento conocido como proceso de Bernoulli. Podemos describir el proceso de Bernoulli de la manera siguiente: 1. Cada intento tiene sólo dos resultados posibles. 2. La probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo. 3. Los intentos son estadísticamente independientes. Fórmula binomial: 64 P(x)=n C x (p)x (1-p)n-x Ejemplo: Cada día American Airlines viaja de Pittsburgh a Pensilvania. Supongamos que la probabilidad de que un vuelo se retrase es de 0.20. ¿Cuál es la probabilidad de que ninguno de los vuelos se retrase el día de hoy? ¿Cuál es la probabilidad de que uno de los vuelos se retrase el día de hoy? P=0.20 n =5 x se refiere a éxito, o sea x = 0 (ningún vuelo se atrase) P (0) = 5C0 (0.2)0 (1-0.20)5-0 = (1)(1)(0.3277)=0.3277 5! 5! = =1 5C0 = 0!(5−0)! 5! Nota: Recuerda que cualquier cantidad elevada a la cero es igual a la unidad. 0 =1 Para: P=0.20 n =5 x se refiere a éxito, o sea x = 1 (un vuelo se atrase) P (1) = 5 C1 (0.2)1 (1-0.20)5-1 = (5)(0.20)(0.4096)=0.4096 5! 5! = =5 5C 1= 1!(5−1)! 4! Distribución de probabilidad binomial para P=0.20 y n =5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 65 Generalizaciones: Cuando p es pequeña (0,1), la distribución binomial está sesgada hacia la derecha. Cuando p aumenta (0,3 por ejemplo), el sesgo es menos notable. Cuando p = 0,5, la distribución binomial es simétrica. Cuando p es mayor que 0,5, la distribución está sesgada hacia la izquierda. Las probabilidades para 0,3, por ejemplo, son las mismas para 0,7, excepto que los valores de p y q están invertidos. Esto es cierto para cualquier pareja de valores p y q complementarios. MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA LA DISTRIBUCIÓN BINOMIAL. La distribución binomial tiene un valor esperado o media y una desviación estándar. Valor esperado o media: Varianza: 2 = = n n CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE BERNOULLI. Necesitamos ser cuidadosos en el uso de la distribución binomial de la probabilidad y asegurar que se cumplen las tres condiciones necesarias, en particular las condiciones 2 y 3. La condición 2 requiere que la probabilidad del resultado de cualquier intento permanezca fija en el tiempo. La condición 3 requiere que los ensayos o intentos de un proceso de Bernoulli sean estadísticamente independientes, es decir, que el resultado de un intento no puede afectar de ningún modo el resultado de cualquier otro intento. 66 LA DISTRIBUCIÓN DE POISSON. La distribución de Poisson se utiliza para describir cierto tipo de procesos, entre los que se encuentran la distribución de llamadas telefónicas que llegan a un conmutador, la demanda (necesidades) de los pacientes que requieren servicio en una institución de salud, las llegadas de camiones a una caseta de cobro y el número de accidentes registrados en una cierta intersección de calles. Estos ejemplos tienen en común un elemento: pueden ser descritos mediante una variable aleatoria discreta que toma valores enteros (0, 1, 2...). CARACTERÍSTICAS DE LOS PROCESOS QUE PRODUCEN UNA DISTRIBUCIÓN DE PROBABILIDAD DE POISSON. 1. El promedio (la media) del número de eventos que se producen por hora, puede estimarse a partir de datos que se tengan disponibles. 2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno, encontraremos que las siguientes afirmaciones son verdaderas: La probabilidad de que exactamente un evento ocurra por segundo es muy pequeña y es constante para cada intervalo de un segundo. La probabilidad de que dos o más eventos ocurran en un intervalo de un segundo es tan pequeña que le podemos asignar un valor cero. El número de eventos que ocurren en un intervalo de un segundo es independiente del tiempo en que dicho intervalo se presente en la hora pico. El número de eventos en un intervalo de un segundo no depende del número de ocurrencias en cualquier otro intervalo de un segundo. CÁLCULO DE LA PROBABILIDAD DE POISSON. 67 La letra X por lo general representa a una variable discreta y puede tomar valores enteros. Utilizamos la letra X para representar a la variable aleatoria y la letra x para señalar un valor específico que esta variable pueda tomar. La probabilidad de tener exactamente x presentaciones en una distribución de Poisson se calcula con la fórmula: P(x) = μx e−μ x! es el número medio de ocurrencias(éxitos) durante un intervalo específico de tiempo. x es el número de ocurrencias (éxitos) e es la constante 2.71828… Ejemplo: Supongamos que Mexicana de Aviación es raro que pierda el equipaje. Algunos vuelos tienen una maleta perdida; en unos casos se pierden dos maletas y es muy raro que se pierdan tres o más. En una muestra aleatoria de 1000 vuelos se perdieron 300 maletas. La media aritmética de maletas pérdidas es de 0.3 (se encuentra dividiendo 300/1000). Si el número de maletas perdidas sigue una distribución de Poisson con =0.30. ¿Cuál es la probabilidad de no perder ninguna maleta? P (0)= μx e−μ x! = (0.3)0 (e−0.3) 0! = 0.7408 En el 74% de los vuelos no habrá maletas perdidas. En el siguiente cuadro se muestran las probabilidades para diferentes valores de “x”. X P(x) 0 0.7408 1 0.2222 2 0.0333 3 0.0033 4 0.0003 5 0.0000 68 LA DISTRIBUCIÓN DE POISSON COMO UNA APROXIMACIÓN A LA DISTRIBUCIÓN BINOMIAL. La distribución de Poisson puede ser una razonable aproximación a la binomial, pero sólo bajo ciertas condiciones. Tales condiciones se presentan cuando n es grande y p es pequeña, esto es, cuando el número de ensayos es grande y la probabilidad binomial de tener éxito es pequeña. La regla que utilizan con más frecuencia los estadísticos es que la distribución de Poisson es una buena aproximación de la distribución binomial cuando n es igual o mayor que 20 y p es igual o menor que 0,05. En los casos en que se cumplen estas condiciones, podemos sustituir la media de la distribución binomial (n) en lugar de la media de la distribución de Poisson (). El uso de una distribución para aproximar a otra es una práctica bastante común en probabilidad y estadística. La idea consiste en buscar situaciones en las que una distribución (como la de Poisson), cuyas probabilidades son relativamente fáciles de calcular, tiene valores que se encuentran razonablemente cercanos a las de otra distribución (como la binomial) cuyas probabilidades implican cálculos más complicados. RECOMENDACIONES PRÁCTICAS: Frente a un problema concreto, analice detenidamente todas sus características, y al elegir el modelo apropiado, verifique que se cumplan todos los supuestos del mismo. Habitúese a utilizar las tablas provistas por la bibliografía para calcular probabilidades. Ahorrará tiempo y evitará errores de cálculo. No olvide emplear la distribución de Poisson a la binomial en aquellos casos en que p es pequeño y n es grande. 69 Para calcular probabilidades acumuladas, del tipo P(X > x), P(X < x) o P(x < X < x), también existen valores tabulados en textos especializados. En el caso de variables aleatorias discretas, es importante diferenciar si la probabilidad deseada incluye o no el valor particular de la variable. Es decir, que P(X > x) no es lo mismo que P(X > x) y P (X < x) es distinto de P(X < x). 70 8. DISTRIBUCIÓN NORMAL Concepto de distribución continua de probabilidad Distribución normal Distribución normal estandarizada, cálculos de áreas bajo la curva 71 DISTRIBUCIÓN NORMAL LA DISTRIBUCIÓN NORMAL: DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA CONTINUA. La variable puede tomar cualquier valor que esté en un intervalo de valores dado, y la distribución de probabilidad es continua. Las razones básicas de la importancia de la distribución normal son: 1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. La distribución normal es una útil distribución de muestreo. 2. La distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas (pesos, alturas), resultados de procesos físicos (dimensiones y rendimientos) y muchas otras medidas de interés para los administradores. CARACTERÍSTICAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD. 1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de campana. 2. La media de una población distribuida normalmente cae en el centro de su curva normal. 3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor. 4. Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal. 72 La mayor parte de las poblaciones reales no se extienden de manera indefinida en ambas direcciones; pero en estas poblaciones, la distribución normal es una aproximación conveniente. No hay una sola distribución normal, sino una familia de curvas normales. Para definir una distribución normal de probabilidad necesitamos definir sólo dos parámetros: la media y la desviación estándar. La curva normal puede describir un gran número de poblaciones, diferenciadas solamente por la media, la desviación estándar o por ambas. ÁREAS BAJO LA CURVA NORMAL. No importa cuáles sean los valores de y para una distribución de probabilidad normal, el área bajo la curva es 1,00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente: 1. Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentran dentro de + 1 desviación estándar de la media. 73 2. Aproximadamente 95,5% de todos los valores de una población normalmente distribuida se encuentran dentro de + 2 desviaciones estándar de la media. 3. Aproximadamente 99,7% de todos los valores de una población normalmente distribuida se encuentran dentro de + 3 desviaciones estándar de la media. Las tablas estadísticas indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones estándar (más, menos) a partir de la media. No es posible ni necesario tener una tabla distinta para cada curva normal posible. En lugar de ello, podemos utilizar una distribución de probabilidad normal estándar para encontrar áreas bajo cualquier curva normal. Con esta tabla podemos determinar el área o la probabilidad de que la variable aleatoria distribuida normalmente esté dentro de ciertas distancias a partir de la media. Estas distancias están definidas en términos de desviaciones estándar. Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el mismo número de desviaciones estándar a partir de la media contendrán la misma fracción del área total bajo la curva para cualquier distribución de probabilidad normal. ÁREAS BAJO LA CURVA NORMAL. 74 El área total bajo la curva normal será de 1.00 por lo cual podemos considerar que las áreas bajo la curva son probabilidades. DEFECTOS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD. Los extremos de la distribución normal se acercan al eje horizontal, pero nunca llegan a tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequeña) de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos mucha precisión al ignorar valores tan alejados de la media. Pero a cambio de la conveniencia del uso de este modelo teórico, debemos aceptar el hecho de que puede asignar valores empíricos imposibles. DISTRIBUCIÓN DE PROBABILIDD NORMAL ESTÁNDAR Existe una familia de distribuciones normales. Cada una de las distribuciones puede tener una media distinta o una desviación estándar distinta. Por tanto, el número de distribuciones normales es ilimitado. Es posible utilizar un solo miembro de la familia de las distribuciones normales para todos los problemas en los que se aplica la distribución normal. La que tiene una media de cero y una desviación de uno y se le conoce como distribución 75 normal estándar. Todas las distribuciones pueden convertirse a distribuciones normal estándar restando la media de cada observación y dividendo entre la desviación estándar. Primero se convierte o estandariza, la distribución real a una distribución normal utilizando un valor z. En términos de una fórmula: 𝑥−𝜇 z= 𝜎 Ejemplo: Los ingresos semanales de los gerentes medios tienen una distribución aproximadamente normal con una media de 1000 dólares y una desviación estándar de 100 dólares ¿Cuál es el valor z para un ingreso x de 1100 dólares?¿Para uno de 900 dólares? 1100−1000 z= 100 900−1000 z= 100 =1 =-1 El valor de 1 indica que un ingreso semanal de $1100.00 para un gerente medio está una desviación estándar arriba de la media. El valor de -1 indica que un ingreso semanal de $900.00 para un gerente medio está una desviación estándar abajo de la media. LA DISTRIBUCIÓN NORMAL COMO UNA APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL. Aunque la distribución normal es continua, resulta interesante hacer notar que algunas veces puede utilizarse para aproximar a distribuciones discretas. La aproximación normal a la distribución binomial resulta muy conveniente, pues nos permite resolver el problema sin tener que consultar grandes tablas de la distribución binomial. Pero se necesita tener algo de cuidado al utilizar esta 76 aproximación, que es bastante buena, siempre que n y n( sean al menos de cinco. IDENTIFICACIÓN DEL MODELO APROPIADO. La selección depende, entre otros, de los siguientes factores: Un adecuado análisis del problema considerado: qué tipo de variable se estudia, qué fenómeno se desea modelar, etc. Los resultados de la descripción de los datos disponibles: forma de la distribución, propiedades de la variable. La disponibilidad y manejo de un buen número de modelos de probabilidad que permitan describir diferentes tipos de situaciones. Una vez identificado el modelo apropiado, hay que calcular sus parámetros, en base a las observaciones que se dispongan de la variable en estudio. Si planeamos utilizar una probabilidad para describir una situación, debemos escoger con cuidado la correcta. La distribución binomial se aplica cuando el número de ensayos está fijo antes de que empiece el experimento, y cada ensayo es independiente y puede tener sólo dos resultados mutuamente excluyentes. Al igual que la distribución binomial, se aplica cuando cada ensayo es independiente de los demás. Pero, aunque la probabilidad de Poisson se aproxima a cero después de los primeros valores, el número de valores posibles es infinito. No se conoce el límite de dos resultados mutuamente excluyentes. En ciertas condiciones, la distribución de Poisson se puede utilizar como aproximación de la binomial, pero no siempre es posible hacerlo. Todas las suposiciones que conforman la base de una distribución deben cumplirse, si la intención del uso de dicha distribución es producir resultados significativos. 77 9 UNIDAD 9. TEORÍA BÁSICA DEL MUESTREO Diferentes tipos de muestreo Etapas de un estudio por muestreo Distribuciones muestrales 78 TEORÍA BÁSICA DEL MUESTREO Actividad en la que se toman ciertas muestras de una población de elementos. El muestreo es importante porque a través de él podemos hacer análisis de diversas situaciones de una empresa o de algún campo de la sociedad. Un estadístico es una medida usada para describir alguna característica de una muestra, tal como una media aritmética, una mediana o una desviación estándar de una muestra. Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población. El proceso de estimación en inferencia estadística puede ser descrito como el proceso de estimar un parámetro a partir del estadístico correspondiente, tal como usar una media muestral Distribución en el muestreo: Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de la población. Una distribución del estadístico obtenido de las muestras es llamado la distribución en el muestreo del estadístico. Por ejemplo, si la muestra tiene 2 elementos y la población 3 elementos (A, B, C), es posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias muéstrales forman una distribución. La distribución de las medias es llamada la distribución de las medias muéstrales, o la distribución en el muestreo de la media. De la misma manera, la distribución de las proporciones (o 79 porcentajes) obtenida de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo de la proporción. Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación estándar de la población de todas las muestras posibles del mismo tamaño, es llamada el error estándar de la población. La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra. Error muestral o error de muestreo La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado que deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño es el error muestral, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población. MÉTODOS DE SELECCIÓN DE MUESTRAS. Una muestra debe ser representativa si va a ser usada para estimar las características de la población. Los métodos para seleccionar una muestra representativa son numerosos, dependiendo del tiempo, dinero y habilidad 80 disponibles para tomar una muestra y la naturaleza de los elementos individuales de la población. Los métodos de selección de muestras pueden ser clasificados de acuerdo a: El número de muestras tomadas de una población dada para un estudio y La manera usada en seleccionar los elementos incluidos en la muestra. Los métodos de muestreo basados en los dos tipos de clasificaciones son expuestos en seguida. MÉTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON EL NÚMERO DE MUESTRAS TOMADAS DE UNA POBLACIÓN. Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo. Estos son, muestreo simple, doble y múltiple. Muestreo simple Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser lo suficientemente grande para extraer una conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo. Muestreo doble Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja un resultado definitivo, la segunda muestra puede no necesitarse. Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, será necesaria la segunda muestra. Un plan típico de 81 muestreo doble puede ser obtenido de la Military Standard Sampling Procedures and Tables for Inspection by Attributes, publicada por el Departamento de Defensa y también usado por muchas industrias privadas. Al probar la calidad de un lote consistente de 3,000 unidades manufacturadas, cuando el número de defectos encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es considerado bueno y es aceptado; si el número de defectos es 9 o más, el lote es considerado pobre y es rechazado; si el número está entre 5 y 9, no puede llegarse a una decisión y una segunda muestra de 80 unidades es extraída del lote. Si el número de defectos en las dos muestras combinadas (incluyendo 80 + 80 = 160 unidades) es 12 o menos, el lote es aceptado si el número combinado es 13 o más, el lote es rechazado. Muestreo múltiple El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras. MÉTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON LAS MANERAS USADAS EN SELECCIONAR LOS ELEMENTOS DE UNA MUESTRA. Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes: a. Basados en el juicio de una persona. b. Selección aleatoria (al azar) Muestreo de juicio Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida dada. Una muestra de juicio es llamada una muestra probabilística, puesto que este método está basado en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para medir el error de muestreo, Las principales ventajas de 82 una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es bajo. Muestreo Aleatorio Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es también llamada una muestra probabilística. Son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados. Muestreo aleatorio simple Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para obtener una muestra aleatoria simple cada elemento en la población debe tener la misma probabilidad de ser seleccionado. El plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemático, estratificado y de conglomerados. Muestreo sistemático. Una muestra sistemática se obtiene cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población es, primero, dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la 83 población, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar. Muestreo Estratificado Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera es muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamaño del estrato en relación con la población. Muestreo de conglomerados. Para obtener una muestra de conglomerados, primero se divide la población en grupos que son convenientes para el muestreo. En seguida, se selecciona una porción de los grupos al azar o por un método sistemático. Finalmente, se toman todos los elementos o parte de ellos al azar o por un método sistemático. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria. Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir en otra área. No todas las áreas son muestreadas en un muestreo de áreas. La variación entre los elementos obtenidos de las áreas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la población entera es muestreada mediante muestreo aleatorio simple. Esta debilidad puede reducirse cuando se incrementa el tamaño de la muestra de área. El incremento del tamaño de la muestra puede fácilmente ser hecho en el área. Los entrevistadores no tienen que caminar demasiado lejos en una pequeña área 84 para entrevistar más familias. Por lo tanto, una muestra grande puede ser obtenida dentro de un corto período de tiempo y a bajo costo en un área determinada. Por otra parte, una muestra de conglomerados puede producir la misma precisión en la estimación que una muestra aleatoria simple, si la variación de los elementos individuales dentro de cada conglomerado es tan grande como la de la población. Muestreo aleatorio Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso de extracción es tal que garantiza a cada uno de los elementos de la población tengan la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo aleatorio. El muestreo aleatorio se puede plantear bajo dos puntos de vista: Sin reposición de los elementos; Con reposición. Muestreo aleatorio sin reposición Consideremos una población E formada por N elementos. Si observamos un elemento particular, e E en un muestreo aleatorio sin reposición se da la siguiente circunstancia: La probabilidad de que e sea elegido en primer lugar es 1/N Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de (N-1)/N), la probabilidad de que sea elegido en el segundo intento es de 1/(N-1). en el (i+1) ésimo intento, la población consta de N-i elementos, con lo cual si e no ha sido seleccionado previamente, la probabilidad de que lo sea en este momento es de 1/(N-i). Si consideramos una muestra de n N elementos, donde el orden en la elección de los mismos tiene importancia, la probabilidad de elección de una muestra cualquiera es 85 Lo que corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible entre las VN, n posibles n-uplas de N elementos de la población. Si el orden no interviene, la probabilidad de que una muestra sea elegida es la suma de las probabilidades de elegir una cualquiera de sus nuplas, tantas veces como permutaciones en el orden de sus elementos sea posible, es decir Muestreo aleatorio con reposición Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces. Si el 86 orden en la extracción de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es: Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior, repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir, Sea n1 el número de veces que se repite cierto elemento e1 en la muestra; Sea n2 el número de veces que se repite cierto elemento e2; Sea nk el número de veces que se repite cierto elemento ek, de modo que . Entonces la probabilidad de obtener la muestra es es decir, 87 El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que como hemos mencionado se caracteriza por que cada elemento de la población tiene la misma probabilidad de ser elegido, y las observaciones se realizan con reemplaza miento. De este modo, cada observación es realizada sobre la misma población (no disminuye con las extracciones sucesivas). Sea X una variable aleatoria definida sobre la población E, y f(x) su ley de probabilidad. En una muestra aleatoria simple, cada observación tiene la distribución de probabilidad de la población: Además todas las observaciones de la variable aleatoria son independientes, es decir TABLAS DE NÚMEROS ALEATORIOS: LOTERÍA NACIONAL Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones. Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de k=5 cifras (00000-99.999), una población de N=600 individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo que a cada 88 uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un número t, y tomamos como primer elemento de la muestra al elemento de la población: El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta obtener la muestra de 10 individuos. Las cantidades pueden ser consideradas como observaciones de una variable aaleatoria U, que sigue una distribución uniforme en el intervalo [0,1] MÉTODO DE MONTECARLO El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una variable aleatoria X, de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este método, el modo de elegir aleatoriamente un valor de X es siguiendo su ley de probabilidad: 1. Usando una tabla de números aleatorios se toma un valor u de una variable aleatoria 89 . 2. Si X es continua, tomar como observación de X, la cantidad x=F-1(u). En el caso en que X sea discreta se toma x como el percentil de X, es decir el valor más pequeño que verifica que . Este proceso se debe repetir n veces para obtener una muestra de tamaño n. Ejemplo Si queremos extraer n=10 muestras de una distribución N(0, 1) podemos recurrir a una tabla de números aleatorios de k=5cifras, en las que observamos las cantidades (por ejemplo) A partir de ellas podemos obtener una muestra de de la distribución normal: 90 usando una tabla Números aleatorios Muestra Muestra ti xi = F-1(ui) 76.293 0'76 0'71 31.776 0'32(=1-0'68) -0'47 50.803 0'51 0'03 71.153 0'71 0'55 20.271 0'20(=1-0'80) -0'84 33.717 0'34(=1-0'66) -0'41 17.979 0'18(=1-0'82) -0'92 52.125 0'52 0'05 41.330 0'41(=1-0'59) -0'23 95.141 0'95 1'65 Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la esperanza matemática de . Por otra parte, esto no implica que el valor medio de la muestra sea necesariamente . Sin embargo como sabemos por el teorema de Fisher que su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor medio estará muy próximo a 0, como se puede calcular: 91 Obsérvese que si el problema fuese el inverso, donde únicamente conociésemos las observaciones xi y que el mecanismo que generó esos datos hubiese sido una distribución normal de parámetros desconocidos, con obtenida hubiésemos tenido una buena aproximación del ``parámetro desconocido'' . Sobre esta cuestión volveremos más adelante al abordar el problema de la estimación puntual de parámetros. 92 10 UNIDAD 10. ESTIMACIÓN E INTERVALOS DE CONFIANZA Características Determinación del intervalo de confianza para la media, el total y la proporción Muestras grandes. Distribución normal Muestras pequeñas 93 ESTIMACIÓN E INTERVALOS DE CONFIANZA INTERVALO DE CONFIANZA. El tema a desarrollar es intervalo de Confianza y haciendo referencia a Richard I. Levin & David S. Rubin, en su libro de “Estadística para Administradores”, establecen el concepto de Intervalo de Confianza de la siguiente forma: Intervalo de valores que tiene designada una probabilidad que incluya el valor real del parámetro de población. Para entender mas claramente este concepto, es necesario comentar de inicio otros que al estar relacionados con el, facilitan su comprensión. Algunos de estos conceptos a revisar son: Estimación. Estimación Puntual. Estimación de intervalo. Nivel de confianza. Limites de confianza ESTIMACIÓN Aprecio y valor que se da y en que se tasa y considera algo. || 2. Der. La que se realiza en ciertos tributos para determinar el valor de la base imponible. Este es el concepto que podemos encontrar en un diccionario. Pero es además un concepto que en nuestra vida diaria aplicamos de forma recurrente. Todo el mundo hace estimaciones. Para cruzar una calle, y vemos venir un auto, estimamos la velocidad de este y la distancia que hay entre nosotros y el automóvil a fin de decidir si esperamos a cruzar o echaremos a correr para cruzar la calle. 94 Implícito esta en este ejemplo una de la razones para hacer estimaciones como administradores, jefes o lideres de equipo: Tomar decisiones en base a un cálculo, una estimación. Los administradores deben hacer estimaciones rápidas, el resultado de estas incide en la organización por medio de la decisión tomada a partir de la estimación. Se hacen estimaciones en: Una universidad para determinar el nivel de inscripciones año con año. En un buró de crédito, a fin de determinar si un cliente puede terminar de pagar su deuda en un determinado tiempo, a partir de sus hábitos de crédito previos, lo que vendría a ser el historial. Para fijar presupuestos, con base a información del pasado. En cada uno de estos casos se esta tratando de inferir, saber algo de una población a partir de una muestra, como tomadores de decisiones, nos veremos muchas veces forzados a tomar decisiones confiando en nuestro instinto en nuestros presentimientos, pero lo ideal cada uno en su posición, seria que estas decisiones estuvieran tomadas a partir de la disposición de información y aplicar conocimientos de estadística para desempeñarnos mejor. Concluimos de inicio para el Concepto de Estimación que las razones para su aplicación son las siguientes: 1. Con el fin de tomar decisiones racionales, para el beneficio de la organización. 2. Inferir algo, acerca a partir de la información de la muestra., a partir de métodos con precisión razonable, todo este proceso debe ser capaz de proveer de información para desempeñarnos de la mejor manera en la toma de decisiones. Existen dos tipos de estimación, en lo que se refiere a una población. Estimación puntual. Estimación de Intervalo. 95 Este último concepto nos ayudara a entender el concepto objetivo de nuestra exposición que es Intervalo de Confianza. ESTIMACIÓN PUNTUAL Una estimación puntual es un solo número que se utiliza para estimar un parámetro (dato) de población desconocido. Ejemplo: El jefe de una Universidad estaría haciendo una estimación puntual al afirmar: “Para el siguiente año escolar por nuestros datos actuales se indica que en la materia de Filosofía y letras tendremos 350 estudiantes”. La afirmación es similar a lanzar una moneda al aire: o es cierta o es falsa, solo tiene dos opciones. Por lo tanto una estimación puntual resulta a menudo insuficiente, debido a que solo tiene dos opciones: es correcta o esta equivocada. Además si se nos dice que el jefe de departamento esta equivocado en su estimación, se generarla la siguiente pregunta. ¿Que tan distante esta la estimación de la real? Es decir que estimación de error posee. No es lo mismo decir que la estimación esta errada por 10 estudiantes que por 90, la diferencia lo establece un concepto: CONFIABILIDAD. Ejemplo de Estimación Puntual: La media de la muestra es un estimador de la media de la población confiable, sobre todo cuando la muestra es lo suficientemente grande. Pero es una estimación puntual pues solo arroja un resultado. Para explicarlo, aun cuando ya es un tema visto, haremos revisión de la formula: X = ∑x n Donde: ∑x, es la sumatoria de todos los elementos de la muestra. Y n, es el numero de elementos. Observemos el ejemplo de una compañía de suministros clínicos que produce jeringas hipodérmicas desechables. Cada jeringa viene en una envoltura estéril que a su vez viene empacada en grandes cajas de cartón corrugado. Debido a la 96 forma en que empacan las jeringas en las cajas de cartón, están manejan una cantidad de contenido diferente, debido a que las jeringas se venden por pieza, la compañía necesita una estimación del número de pieza que hay por caja, para propósitos de facturación. Se tomo la muestra aleatoria de 35 cajas, y se registro el número de jeringas contenido en dicha muestra: 101 103 112 102 98 97 93 105 100 97 107 93 94 97 97 100 110 106 110 103 99 93 98 106 100 112 105 100 114 97 110 102 98 112 99 Utilizando la formula, tendremos: 3570/35=102 jeringas. Así pues al usar la media de la muestra, como nuestro estimador, la estimación puntual de la media es de 102 jeringas. La conclusión a la que llegaríamos con el anterior ejemplo seria: Así al usar la media de la muestra como un estimador, la estimación puntual de la jeringa hipodérmica desechable es de 102 jeringas por caja. El precio de fabricación es bastante bajo (alrededor de 25 centavos), de modo que tanto el comprador como el vendedor aceptarían esta estimación puntual como la base para hacer la facturación, y el fabricante puede ahorrarse tiempo y el gasto de contar cada una de las jeringas contenidas en las cajas. El propósito de tomar muestras es para conocer mas acerca de una población, ya sea, los estudiantes de ingreso al próximo ciclo escolar, o el total de un embarque de jeringas hipodérmicas, como en el ejemplo anterior, cuyo análisis partió de una muestra de 35 cajas. Para hacerlo, podemos basarnos en estimaciones puntuales, como lo es la media de la muestra, o con Estimaciones de intervalo, nuestro siguiente tema. 97 ESTIMACIÓN DE INTERVALO.Una estimación de Intervalo, describe un intervalo de valores dentro del cual es posible que este un parámetro de población. Dentro de sus características encontramos: Dentro de las estimaciones de Intervalo, se maneja un concepto adicional, que implica la incertidumbre que acompañara dicha estimación. Una afirmación acerca del intervalo dentro del cual es probable que este la media de población desconocida. Para proporcionar dicha afirmación, se necesita encontrar el error estándar de la media. Para explicarlo mejor nos apoyaremos en el siguiente ejemplo: Suponga que el director de investigaciones de mercado de una fábrica de refacciones automotrices necesita hacer una estimación de la vida promedio de las baterías para automóvil que su compañía produce. Se selecciona una muestra aleatoria de 200 baterías, se registro en nombre de los propietarios de los automóviles y su dirección, de la misma manera se entrevisto a estas personas con respecto a la duración de la batería de su automóvil. Después de realizar la aplicación de la formula de la media de la muestra, tenemos como resultado: 36 meses de vida promedio. Si se utiliza la estimación puntual de la media de la muestra como el mejor estimador de la media de la población µ se informaría que la vida media de las baterías de la empresa es de 36 meses. Pero supongamos que el director también conocer acerca de la incertidumbre que probablemente acompañara a la estimación, es decir una afirmación acerca del intervalo dentro de lo cual es posible que este la media de la población desconocida. Eso se determina calculando el error estándar de la media. Para esto se utiliza la formula de cálculo de error estándar de la media: 𝜎 𝜎𝑥 = √𝑛 Donde es la desviación estándar y n el número de observaciones. 98 Supongamos que previamente se hizo el cálculo de la desviación estándar de las 200 baterías, y se ha determinado que es de 10 meses. Utilizando dicho dato y la formula que indicamos en el recuadro anterior. Resultaría así: =0.707 meses Ahora se puede concluir que la estimación de la vida útil de un las baterías de la compañía es de 36 meses, y el error estándar que acompaña a dicha estimación es .707. En otras palabras, la vida útil real para todas las baterías puede estar en alguna parte de esta estimación de intervalo comprendida entre 35.293 y 36.707 meses. Nos hemos acercado ya entonces al concepto inicial de la exposición, Intervalo de confianza, a fin de entender Estimación de Intervalo, marcando su diferencia con Estimación Puntual. Recordemos el concepto de Richard I. Levin & David S. Rubin, en su libro de “Estadística para Administradores”, establecen el concepto de Intervalo de Confianza de la siguiente forma: Intervalo de valores que tiene designada una probabilidad que incluya el valor real del parámetro de población. Porque hacemos esto, para entender el concepto de Nivel de confianza de un Intervalo, esto es la probabilidad de que el verdadero parámetro de la estimación este dentro de la estimación de intervalo. Es decir apoyándonos en el ejemplo de las 200 baterías, cuantas de estas caerían dentro del intervalo en donde se encuentra la media de la muestra., con los limites que hemos establecidos con la formula de Error estándar de la media. NIVEL DE CONFIANZA.En la estadística la probabilidad que asociamos o relacionamos con una estimación de intervalo es conocida como Nivel de Confianza. Que tanta confianza tenemos que la estimación que hicimos de un intervalo, incluya la mayor parte de la muestra, es decir los casos analizados. Analicemos un caso práctico: Considere por ejemplo el caso de un cliente de una tienda de electrodomésticos que pregunta sobre el tiempo de espera para la entrega de una lavadora de ropa nueva. En la tabla se aprecia las preguntas que el cliente puede hacer y las 99 probables respuestas. Si se observa se puede ver que existe una relación directa entre el nivel de confianza y el intervalo de confianza de cualquier estimación. Pregunta del Respuesta del Nivel de Cliente Empleado. Confianza ¿Llegara la lavadora en un año? Tengo la certeza de Mayor a ello. 99% ¿Me entregaran la Estoy casi seguro lavadora dentro de de que llegara en un mes? un mes. ¿Me entregaran la lavadora en una semana? Al menos 95% Estoy bastante Alrededor seguro. de 80% ¿Me entregaran la No tengo la certeza Cerca de lavadora mañana? de poder hacerlo. ¿Llegara la Hay una mínima lavadora antes de posibilidad de que llegue a casa? poder lograrlo. 40% Cerca de 1% Intervalo de Confianza Implicado Un año. Un mes Una semana Un día Una hora. Se nota que cuando el intervalo de confianza es más amplio o extenso, como en el caso de la entrega que tarda un año, la estimación toma un valor muy poco real, a pesar de que el administrador le da un nivel de confianza de 99% a dicha estimación. A medida que el cliente estable un intervalo mas estrecho (el tiempo de entrega), el administrador de la tienda consiente un nivel de confianza mas bajo, ¿llegara la lavadora antes que llegue yo a casa?, la estimación de confianza tiene un nivel muy bajo (1%). Encontramos de esta forma el intervalo de confianza del anterior ejemplo: 100 N.C. Intervalo Mayor a 99% Un año. Al menos 95% Un mes LIMITES DE CONFIANZA.A menudo el intervalo de confianza se expresa en términos de errores estándar, más que con valores numéricos. De la siguiente forma. x ± 1.64 σ x en la que: x + 1.64 σ x = limite superior del intervalo. x - 1.64 σ x = limite inferior del intervalo. A estos límites se les conoce como limites de Confianza del intervalo de Confianza. (LIC) BIBLIOGRAFÍA - Larios Osorio, Víctor. Probabilidad. México, 1999. - Lind, Douglas A. Estadística aplicada a los negocios y la economía. México, Mc. Graw Gill, 2005 - Lind, Marchal, Mason. Estadística para administración y economía. México, Alfa omega, 2006 - Newbold, P. Estadística para los negocios y la Economía. México, Pearson, 2005 - Rodas, Olger. Teoría básica del Muestreo. México, 2003. - Stevenson, J. William Estadística para administración y economía. México, Alfa omega, 2006 101 - Universidad de Málaga. Muestreo Aleatorio. México, 2002. - Vega Trujillo, María del Pilar. Distribución de Frecuencias. México, 2005. - Zadu, Inés. Distribuciones de Probabilidad. México, 2004. 102