Estadística Inferencial 2.1. Estimación puntual de la media poblacional UNIDAD II. ESTIMACIÓN 2.1 Estimación puntual de la media poblacional Para estudiar este tema requerimos conocer algunas definiciones: Parámetro poblacional. Valor que representa una característica de la población. Si definiéramos la población como el conjunto de personas en un salón, un parámetro poblacional puede ser la edad, el peso o la estatura. Estimación. Proceso por el cual determinamos un valor aproximado para un parámetro poblacional. Siguiendo el caso del salón de clases, si queremos estimar la estatura promedio de los hombres, al preguntarle solo a 3 de ellos (para tomar una muestra que represente al salón) su estatura y promediarla, sería un proceso de estimación en sí mismo. No sería aplicable a un CENSO, si midiéramos a todas las personas del salón y determináramos la estatura promedio de la población; técnicamente seria estadística DESCRIPTIVA; no estaríamos estimando nada; estaríamos DETERMIANDO la estatura promedio de la población. Propiedades de estimadores puntuales. Las medidas nos sirven para conocer o inferir algunas propiedades de la población de estudio. Estas medidas pueden clasificarse en dos grandes tipos: Medidas de Tendencia Central. Las medidas de tendencia central se utilizan para indicar un valor que tiende a tipificar o a ser el más representativo de un conjunto de números. Las tres medidas de tendencia central que más comúnmente se emplean son: la media, la mediana y la moda. Medidas de dispersión. Las medidas de dispersión indican si los valores están relativamente cercanos uno del otro o si se encuentran dispersos. Las medidas de dispersión más comunes son: rango (amplitud), desviación media, varianza, desviación estándar y coeficiente de variación. Todas estas medidas el rango toman la media como punto de referencia. En cada caso un valor cero indica que no hay dispersión, mientras mayor sea el valor de estas medidas es mayor la dispersión. Dado que realizaremos distintos tipos de estimaciones, estaremos trabajando con conceptos de estadística inferencial. Las estimaciones que manejaremos serán para la media, varianza, diferencia de media y diferencia de varianzas. Elaboró: MC. Marcel Ruiz Martínez 1 Estadística Inferencial Estimadores más comunes (muestras grandes). Lo más importante para poder representar a una población mediante las medidas de tendencia central y de dispersión es asegurar que el proceso de muestreo haya sido de calidad; esto es, que se asegure el hecho de que los elementos de la muestra representan a la población. Si esto es importante para muestras grandes, para muestras pequeñas (menores a 30) es mucho más. Estimación puntual de las Medidas de tendencia central A continuación se indican dos medidas descriptivas comunes: media aritmética y mediana. Media aritmética. La media aritmética es lo que viene a la mente de la mayoría de las personas cuando se menciona la palabra promedio. La media se calcula al sumar los valores de un conjunto y al dividir el valor de su suma entre el número de valores del mismo. La media aritmética o promedio, se obtiene de la siguiente manera. n xi ∑ Media de la muestra: x = i =1 ; n N x ∑ i =1 i Media de la población: µ = N Mediana. La mediana representada por Md o P50, es el valor central de una serie cuando los valores se ordenan según su magnitud, y es aquel que divide a una serie de tal forma que 50% de los valores son menores o iguales que él, y el 50% de los valores son mayores o ~ iguales que él. El método para calcular el valor de la mediana x depende de sí el número de datos es par o impar, para cada caso: x (n ) + x (n +1) 2 x= 2 Impar: ~ x = x n Par: ~ +1 2 2 Elaboró: MC. Marcel Ruiz Martínez 2.1. Estimación puntual de la media poblacional Moda. La moda es el valor del conjunto de datos que mas se repite, en caso de que haya dos valores que mas se repitan, se dice que el conjunto de datos es bimodal; en caso de que haya mas de dos, se conoce como un conjunto multimodal. Ejemplo 1: Para las siguientes mediciones: Numero de Estatura muestra (metros) 1 1.7 2 1.67 3 1.7 4 1.8 5 1.69 Determine lo siguiente: a) Medidas de tendencia central: i) MEDIA ii) MEDIANA iii) MODA Estimación puntual de las Medidas de dispersión Rango. El rango nos da la visión entre que datos se encuentra nuestra muestra a analizar. El rango es simplemente la resta de la medida más alta menos la más baja; en ciertas ocasiones también se puede expresar en forma de intervalo, por motivos de presentación de los datos. Por ejemplo; si se realizan mediciones de la estatura para personas de 30 años de edad; el rango es la estatura más alta (2.5m por ejemplo) menos la mas baja (1.3 m por ejemplo); siendo de: Rango = 2.5m-1.3m = 1.2 m. 2 Estadística Inferencial Variación o varianza. Es el promedio del cuadrado de las desviaciones de cada dato respecto a la media. Se dispone de una variable para la población (σ2) y otra para la muestra (s2). N ( xi − µ )2 ∑ 2 i =1 Población: σ = N −1 n ( xi − x )2 ∑ 2 i =1 Muestra: s = ; n −1 Desviación estándar. Es la raíz cuadrada positiva de la varianza. Población: σ = σ 2 Muestra: s = s 2 Error estándar de la muestra o cota de error. Para las estimaciones de la media, se ocupa un valor de referencia llamado “cota de error” σ x la cual se calcula de la siguiente manera: σx = σ n Dado que no se conocen los valores poblacionales se aproxima con la ecuación: s sx = n Continuación del ejemplo 1: Determine lo siguiente: b) Medidas de dispersión: i) RANGO ii) DESVIACIÓN ESTÁNDAR DE UNA MUESTRA iii) DESVIACIÓN ESTÁNDAR POBLACIONAL iv) VARIANZA DE UNA MUESTRA iv) VARIANZA POBLACIONAL Para hacer este ejercicio usando el paquete EXCEL. Sigue esta liga: http://marcelrzm.comxa.com/EstadisticaInf/BasicoCalculoMedidas.xls Elaboró: MC. Marcel Ruiz Martínez 2.1. Estimación puntual de la media poblacional ACTIVIDAD 2.1. Garantía. Una empresa de pizzas está estudiando la posibilidad de colocar como publicidad que garantiza sus entregas de pizzas en menos de 30 minutos. Para determinar si es capaz de lograrlo realiza un muestreo de 40 entregas de pizzas. Núm. Tiempo de de entrega orden (min) Núm. Tiempo de de entrega orden (min) Núm. Tiempo de de entrega orden (min) Núm. Tiempo de de entrega orden (min) 1 25 11 23 21 28 31 27 2 15 12 23 22 25 32 20 3 30 13 27 23 26 33 25 4 31 14 29 24 20 34 15 5 30 15 12 25 15 35 12 6 20 16 21 26 32 36 21 7 22 17 20 27 31 37 31 8 12 18 30 28 13 38 21 9 26 19 27 29 32 39 31 10 32 20 28 30 30 40 27 Determine estimaciones poblacionales (para todos los tiempos de llegada) usando los parámetros de medidas de tenencia central y de dispersión indicadas: 1. Media 2. Mediana 3. Moda 4. Varianza para una muestra 5. Desviación estándar para una muestra Si lo desea pude descargar la tabla para facilitar los cálculos: http://marcelrzm.comxa.com/EstadisticaInf/TiemposEntregaPizzas.xls Elabore una PRÁCTICA DE EJERCICIOS de este trabajo (INDIVIDUAL), las rúbricas se indican en la liga siguiente: http://marcelrzm.comxa.com/Rubricas/Rubricas.htm Puede enviar el documento final por correo electrónico a las siguientes direcciones: [email protected]; [email protected]; [email protected] y [email protected] No olvide enviarse copia a sí mismo del correo que envía, si usa Outlook solicite confirmación de entrega y de lectura. 3