Universidad Católica del Trópico Seco Pbro. Francisco Luis Espinoza Pineda Facultad de Ciencias Agropecuarias Unidad I: Muestreo y cálculo muestral Contenido: 1.3 Cálculo de la muestra de poblaciones finitas e infinitas Unidad II: Diseños experimentales Contenidos 2.1 Conceptos Básicos de la Inferencia Estadística Unidad I: Muestreo y cálculo muestral Contenido: 1.3 Cálculo de la muestra de poblaciones finitas e infinitas Distribución normal: La distribución normal es una de las distribuciones de probabilidades de variables continuas, que sirve para la creación de modelos basados en fenómenos naturales, sociales e incluso psicológicos. La gráfica tiene forma de campana, también conocida como la Campana de Gauss, en alusión a su creador Carl Gauss. Glosario Error Maestral de estimación o standard: Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Estadístico: Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros. Muestra: Es un subconjunto de casos o individuos de una población estadística. Nivel de Confianza: Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro. La tabla siguiente da los valores de Za que corresponden a distintos niveles de confianza utilizados en la práctica. Nivel de 99.73% 99% confianza Za 98 96% 95.45% 95% 90% 80% 68.27% 50% 2.05 2.00 1.96 1.645 1.28 1.00 0.6745 % 3.00 2.58 2.33 Parámetro: Son las medidas o datos que se obtienen sobre la distribución de probabilidades de la población, tales como la media, la varianza, la proporción, etc. Población: También llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. Varianza Poblacional: Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos. Tamaño de la Muestra: DEFINICION El tamaño de la muestra es el número de elementos extraídos de una población, que obtiene información representativa, valida y confiable al mismo costo. A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: El tipo de muestreo El parámetro a estimar El error maestral admisible La varianza poblacional y El nivel de confianza. TAMAÑO DE LA MUESTRA PARA MEDIA Y PROPORCIÓN Existen diferentes factores que determinan la fórmula que se utilizará para saber el tamaño de la muestra, uno de ellos son la media y la proporción. Para estimar una proporción debemos conocer: Z = nivel de confianza, p = probabilidad de éxito, o proporción esperada q = probabilidad de fracaso 𝑞 = 1 − 𝑝 e = precisión (error máximo admisible en términos de proporción) 𝑧𝑎2 × 𝑝 × 𝑞 𝑛= 𝑒2 Para estimar la media, utilizamos los siguientes datos: Z = nivel de confianza σ2 : Varianza poblacional e = precisión (error máximo admisible en términos de proporción) 𝑧𝑎2 × 𝜎2 𝑛= 𝑒2 TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS E INFINITAS Los datos que utilizaremos son los siguientes: : Z correspondiente al nivel de confianza elegido : Varianza poblacional ℮: error máximo N: Población p: probabilidad de éxito, o proporción esperada q: probabilidad de fracaso POBLACIONES FINITAS: Se conoce el tamaño de la población de donde se obtendrá la muestra a estudiar. La población es representada por la letra N y se aplica de la siguiente manera. Para la media: 𝑁 ∗ 𝑍𝑎2 ∗ 𝜎 2 𝑛= (𝑁 − 1)𝑒 2 + 𝑍𝑎2 ∗ 𝜎 2 Para la proporción: 𝑁 ∗ 𝑍𝑎2 ∗ 𝑝 ∗ 𝑞 𝑛= (𝑁 − 1)𝑒 2 + 𝑍𝑎2 ∗ 𝑝 ∗ 𝑞 Donde: Za : Intervalo de confianza P: Proporción Verdadera e: error de muestreo aceptable N: Tamaño de la población POBLACIÓN INFINITA: Si por el contrario el tamaño de la población es desconocido o infinito usaremos otra alternativa. Para la media: 𝑍𝑎2 ∗ 𝜎 2 𝑛= 𝑒2 Para la proporción: 𝑍𝑎2 ∗ 𝑝 ∗ 𝑞 𝑛= 𝑒2 Ejemplos: 1. Se desea realizar una investigación para estimar el peso medio de terneros recién nacidos de madres con peso bajo. Se admite un error máximo de 50 grs, con una confianza del 95%. Si por estudios anteriores se sabe que la desviación típica del peso medio de tales recién nacidos es de 400 gr ¿Qué tamaño mínimo de la muestra se necesita en la investigación? Datos: e: 50 gramos α: 1.96 σ: 400 gramos 𝑛= 1.962 ∗ 400 = 545.86 50 2. La desviación típica de la altura de plantas de tomates antes del trasplante es de 8 cm. Calcular el tamaño mínimo de la muestra de plantas de tomate para que el error cometido al estimar la altura media sea inferior a 1 cm con un nivel de confianza del 90% Datos: e: 1 cm α: 1.645 σ: 8 cm 1.6452 ∗ 82 𝑛= = 173 12 3. Una agencia de mercadotecnia desea encuestar a los residentes de su municipio para conocer qué proporción de la población conoce cierto producto para control de malezas respecto de su efectividad. Que tamaño de la muestra se necesita si requiere de confianza de 95% un error máximo de estimación de 0.15. Datos: e: 0.15 α: 1.96 p: 0.5 q: 0.95 𝑛= 1.962 ∗0.5∗0.95 = 81 0.152 4. ¿Cuál es el promedio de horas semanales trabajadas en una finca en los registro de inspección?, si existe una población de 20000 trabajadores donde se sabe que su varianza es de 8.35. Trabajando con un nivel de confianza de 90% y estando dispuestos a admitir un error máximo de 0.20. ¿Cuál es el tamaño de la muestra? Datos: e: 0.20 α: 1.64 σ: 8.35 N: 20000 𝑛= 2 20000∗ 1.64 ∗ 8.352 = 67.01 (20000−1)0.22 +1.64 2 ∗8.352 ACTIVIDAD PRÁCTICA N° 1 Resuelva a) Un productor de semillas desea saber con un error de estimación del 5% el porcentaje de semillas que germinarán en la granja de su competidor. ¿Qué tamaño de muestra debe tomarse para obtener un nivel de confianza del 95% si se sabe que germinan el 50%. b) Una marca de nueces afirma que como máximo, el 6% de las nueces están vacías. De un lote de 300 nueces. ¿Qué tamaño muestral se necesitaría para estimar la proporción de nueces con un error menor del 1% con una confiabilidad del 95%. c) Se desea conocer las proporciones de artículos defectuosos en una población de 25000. Para un estudio con nivel de confianza del 95% y un error de 0.2, suponiendo que un estudio anterior produjo 18 artículos defectuosos de cada 100. ¿De qué tamaño debe ser la muestra? d) Para un trabajo de investigación de mercado en Nicaragua (población finita 10,000 habitantes) entre otras cosas, queremos saber cuántas personas viajarán a trabajar al extranjero con la decisión de radicar definitivamente en el país de destino. ¿Cuál debe ser el tamaño de la muestra para un nivel de confianza del 96% y un margen posible de error de 4%?. e) Se planea llevar a cabo una investigación para determinar la proporción de hogares que tiene refrigerador, por lo que es necesario calcular el tamaño de la muestra requerida con un nivel de confianza del 95% y una precisión del 5%. La investigación se llevará a cabo en una población de 1500 familias. f) Un grupo de estudiantes de la Facultad de Agropecuaria, realizará un estudio sobre las condiciones socioeconómicas de los 400 habitantes de la Laguna y desean determinar cuál será la cantidad de cuestionarios que tendrán que elaborar, si fijan un nivel de confianza del 95% y una precisión del 15%. Unidad II: Diseños experimentales Contenidos 2.1 Conceptos Básicos de la Inferencia Estadística INFERENCIA ESTADÍSTICA La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad. Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos: métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral que se utiliza como estimador de un parámetro. El conjunto de métodos estadísticos que permiten deducir (inferir) como se distribuye la población en estudio o las relaciones estocásticas entre varias variables de interés a partir de la información que proporciona una muestra”. Conceptos Básicos Población: es un conjunto homogéneo de individuos sobre los que se estudia una o varias características que son, de alguna forma, observables. Muestra: es un subconjunto de la población. El número de elementos de la muestra se denomina tamaño muestral. Muestreo aleatorio simple: es aquel en el que todos los individuos de la población tienen la misma probabilidad de ser elegidos. Muestra aleatoria simple, de una variable aleatoria X, con distribución F, de tamaño n, es un conjunto de n variables aleatorias X 1,X2,...,Xn, independientes e igualmente distribuidas con distribución F. Espacio muestral: es el conjunto de muestras posibles que pueden obtenerse al seleccionar una muestra aleatoria, de tamaño n, de una cierta población. Parámetro: es cualquier característica medible de la función de distribución de la variable en estudio (media, varianza,..). Estadístico: es una función de la muestra T . Por tanto, es una variable aleatoria que tiene una función de distribución que se denomina distribución en el muestreo de T. Los estadísticos independientes del parámetro a estimar se denominan estimadores. BIBLIOGRAFÍA http://es.slideshare.net/LuisAngelVanegas/tamao-de-la-muestra http://www.udc.gal/dep/mate/estadistica2/sec1_2.html http://issuu.com/byrong/docs/curso_de_muestreo_estadistico