1 Universidad de Costa Rica Prof. Carlo Magno Araya FUNDAMENTOS DE MUESTREO 1. Población. Conjunto de todos los elementos que comparten un grupo de características, y forman el universo para el propósito del problema de investigación de mercados. 2. Muestra. Subgrupo de los elementos de la población que se selecciona para participar en el estudio. 3. Elemento de estudio. Objeto que posee la información que busca el investigador y acerca del cual deben hacerse las inferencias. 4. Unidad de muestreo. Unidad básica que contiene los elementos de la población que se incluirá en la muestra. 5. Marco de la muestra. Representación de los elementos de la población que consiste en una lista o grupo de indicaciones para identificar la población de meta 6. Muestreo con reemplazo. Técnica de muestreo en la cual un elemento puede incluirse en la muestra más de una vez. 7. Muestreo sin reemplazo. Técnica de muestreo en la cual un elemento no puede incluirse en la muestra más de una vez. DETERMINACIÓN DEL TAMAÑO DE MUESTRA Procedimiento cuantitativas: 1. 2. 3. 4. 5. 6. complejo y comprende varias consideraciones cualitativas y FACTORES CUALITATIVOS La importancia de la decisión La naturaleza de la investigación El número de variables La naturaleza del análisis estadístico. El análisis multivariado requiere n grandes Los tamaños de muestras utilizados en estudios similares Limitaciones de recursos: dinero y tiempo y disponibilidad de personal. FACTORES CUANTITATIVOS 1. Nivel de confianza (1-α) 2. Nivel de precisión. Magnitud del error de muestreo. 3. Variabilidad de la población. La variabilidad puede conocerse de fuentes secundarias. o estimarse mediante la realización de un estudio piloto. Tamaño de población(N). No afecta en forma directa el tamaño de la muestra, excepto cuando el factor de corrección debe aplicarse. Ajuste del tamaño de la muestra: tasa de respuesta, tasa de incidencia, etc. Métodos para mejorar las tasas de respuestas: notificación previa, motivación a los entrevistados, incentivos, diseño y aplicación del cuestionario, seguimiento y otros facilitadores (llamadas). Universidad de Costa Rica 2 Prof. Carlo Magno Araya MUESTREO ALEATORIO SIMPLE(MAS) Cada elemento de la población tiene probabilidad de selección idéntica y conocida. Cada elemento se elige en forma independiente de los demás. La muestra se toma mediante un procedimiento aleatorio a partir del marco de muestreo. (1) Generar números aleatorios que determinan qué elementos incluir en la muestra, (2) o pueden generase con una rutina de computadora o una tabla de número aleatorios. VENTAJAS 1. Se comprende con facilidad 2. Los resultados de la muestra pueden proyectarse a la población 3. La mayor parte de los métodos de inferencia estadística suponen que los datos provienen de muestra seleccionada por medio del MAS. 1. 2. 3. 4. DESVENTAJAS Con frecuencia es difícil construir un marco que permita seleccionar la muestra. El MAS puede dar como resultado muestras muy grandes. Incrementado así el tiempo y costo de la recolección de datos. Puede dar como resultado menor precisión (errores estándar más grandes) que otros métodos de muestreo probabilístico. Puede dar como resultado muestras menos representativas de la población. Esto es más probable si el tamaño de la muestra es pequeño. MUESTREO SISTEMÁTICO 1. La muestra se elige mediante la selección de un punto de inicio aleatorio y la elección de cada k-ésimo elemento en sucesión, a partir del marco de la muestra. 2. El intervalo de muestra, k, se determina dividiendo el tamaño de la población entre el tamaño de la muestra. 3. Cada elemento tiene probabilidad de selección idéntica y conocida. 4. Si los elementos de la población están ordenados en forma no relacionada con las características de interés, el muestreo producirá resultados muy similares al MAS. 5. Cuando el orden de los elementos se relaciona con la característica de interés. El muestreo sistemático incrementa lo representativo de la muestra. Por ejemplo, las empresas ordenadas en forma progresiva en relación con las ventas anuales, un MS incluirá algunas empresas pequeñas, medianas y grandes. 6. Una muestra MAS puede no ser representativa por que contenga, por ejemplo sólo empresas pequeñas o una cantidad desproporcionada de éstas. Universidad de Costa Rica 3 Prof. Carlo Magno Araya 7. Si el orden de los elementos produce un patrón cíclico; el MS puede reducir lo representativo de la muestra. 8. El MS es menos costoso y más fácil que el MAS. 9. Puede utilizarse sin conocer la composición (elementos) del marco de la muestra. Por ejemplo, puede entrevistarse a cada k-ésima persona que salga de un supermercado, tienda, banco, institución, etc. 10. Si el marco del cual estamos tomando la muestra es verdaderamente aleatorio, una MS puede considerase como una muestra idéntica al MAS. 11. En resumen, el MS ofrece. VENTAJAS: (1) facilitar la selección de la muestra, (2) el costo, (3) la eliminación de la necesidad de un marco completo, (4) estratificación implícita de los marcos adecuadamente ordenados. DESVENTAJAS: (1) el problema de una posible periodicidad, (2) posibles problemas técnicos al calcular el intervalo de selección y el error estándar. MUESTREO ALEATORIO ESTRATIFICADO 1. Es un proceso en el que la población se divide en subpoblaciones o estratos mutuamente excluyentes y colectivamente exhaustivos. Los estratos son mutuamente excluyentes si los miembros de un estrato no pueden ser miembros de cualquier otro estrato. Los estratos son selectivamente exhaustivos si se utilizan todas las categorías posibles de una variable para definir los estratos. 2. Aun cuando el número de estratos que van a utilizarse es cuestión de juicio, la experiencia sugiere el uso de no más de seis. Con más de seis estratos, cualquier beneficio en la precisión se verá superado por el incremento en el costo de la estratificación y el muestreo. 3. Un objetivo importante del muestro estratificado es incrementar la precisión, sin aumentar el costo. Puede llevar a una disminución en el error estándar del estimador. 4. La variable que se utiliza para dividir la población en estratos se conoce como variable de estratificación. Esta debe estar estrechamente relacionada con las características de interés. Las variables que se utilizan para la estratificación incluyen características demográficas, el tamaño de la empresa, etc. 5. Los elementos en un estrato deben ser tan homogéneos como sea posible, pero los elementos de diferentes estratos heterogéneos. 6. Se selecciona una muestra aleatoria simple e independiente en cada uno de los estratos. Universidad de Costa Rica 4 Prof. Carlo Magno Araya 7. Se tienen tres diseño de muestreo estratificado posible que depende de la asignación de la muestra: (1) Muestreo estratificado proporcional. Los elementos de la muestra están distribuidos en estratos, en proporción al número de elementos de la población en los estratos. (2) Muestro estratificado con afijación igual. Tiene valor práctico sobre todo cuando las fronteras entre los estratos no se fijan rígidamente. Más aún, si los estratos son también “dominios” entonces el tener muestras iguales tiende a beneficiar sus estimaciones y comparaciones. Además de su simplicidad, la afijación igual suele ser eficiente. (3) Muestreo estratificado con afijación óptima. En general, (1) cuánto más grande sea el estrato, más grande será la muestra y (2) cuanto más grande sea la variabilidad dentro del estrato, más será la muestra. Generalmente para un tamaño de muestra con asignación Neyman, podemos reducir el error estándar global del estimado tomando más elementos de la muestra de los estratos con una variabilidad más alta. Un estrato con demasiada variabilidad requerirá un tamaño de muestra más grande para que produzca un estimador eficiente de la media. MUESTREO POR CONGLOMERADOS 1. La población de estudio se divide primero en subpoblaciones mutuamente excluyentes, llamados conglomerados, y después se selecciona una muestra de conglomerados con base en una técnica de muestreo probabilístico como el muestreo aleatorio simple. 2. Para cada conglomerado seleccionado, se incluyen todos los elementos en la muestra o se toma una muestra de elementos en forma probabilística. 3. Si todos los elementos en cada conglomerado seleccionado se incluyen en la muestra, el procedimiento se conoce como muestreo de conglomerados de una sola etapa. Si una muestra de los elementos se toma en forma probabilística de cada grupo seleccionado, el procedimiento es un muestreo de conglomerados de dos etapas. 4. El objetivo del muestreo por conglomerados es aumentar la eficiencia del muestreo al reducir los costos. Con frecuencia son mucho más baratas que otros procedimientos empleados para un determinado tamaño de muestra. 5. Los criterios para formar los conglomerados son opuestos a aquellos del muestreo estratificado. Los elementos de los conglomerados deben ser tan heterogéneos como sea posible, pero los elementos entre los conglomerados homogéneos. 6. De modo ideal, cada grupo debe ser una representación en pequeño de la población. 7. En el muestreo de conglomerados, se necesita un marco de muestra sólo para aquellos grupos que se seleccionaron para la muestra. 8. En ocasiones, pueden formarse conglomerados de igual tamaño al combinar grupos. 9. Para seleccionar los conglomerados se puede utilizar el muestreo probabilístico proporcional al tamaño(PPT). La probabilidad de elegir un conglomerado varía en forma directa con el tamaño del grupo y la probabilidad de seleccionar una unidad de estudio en un conglomerado varía en forma inversa al tamaño del grupo. Así, la probabilidad de Universidad de Costa Rica 5 Prof. Carlo Magno Araya cualquier unidad de muestra específica se incluya en la muestra se equilibran con las probabilidades desiguales de la segunda. 10. El muestreo de conglomerados tiene dos ventajas importantes: la viabilidad y el costo bajo. En muchas situaciones, los únicos marcos de muestra que están disponibles para la población meta son los conglomerados, no los elementos de la población. 11. Estas ventajas se deben ponderar en comparación con varias limitaciones. (1) El muestreo de grupo da como resultado muestras relativamente inexactas y es difícil firmar grupos heterogéneos. (2) Puede ser difícil calcular e interpretar las estadísticas con base en los conglomerados. 12. Cuando combinamos la eficiencia estadística del procedimiento de muestreo con su costo, nos referimos a esto como eficiencia total o global del procedimiento. A menudo el muestreo por conglomerados es el procedimiento de mayor eficiencia global. Es decir, logramos un error estándar más pequeño por cada colón gastado. MUESTREO POR ETAPAS(polietápico) Un diseño de muestreo puede tener el número de etapas que el investigador desee. Por ejemplo, la mayor parte de las muestras por áreas tiene más de una etapa. 1. Es mucho menos eficiente estadísticamente que el muestreo aleatorio simple. Un diseño de muestreo en dos etapas está sujeto dos errores muestrales. La selección de los conglomerados de la primera etapa es sólo un estimado de la población de conglomerados, es decir, ocurre error muestral. De esta forma la selección de los elementos dentro de un conglomerado es solo un estimado de la población de elementos dentro ese conglomerado. Por tanto una muestra de cinco etapas tendría cinco errores muestrales. 2. Las fórmulas para calcular las estadísticas son demasiados complejas. Los investigadores deben sensibles a este hecho y prepararse para consultar a un estadístico experto en muestreo para obtener el cálculo apropiado. 3. En la práctica los resultados obtenidos de la etapa final, con frecuencia, se tratan como si viniesen de un muestreo probabilístico directo de una lista de elementos finales. Es decir, las fórmulas que se utilizan son las mismas que se aplican en el muestreo aleatorio simple y en el muestreo estratificado. En efecto neto de realizar esto, es subestimar el error muestral que ha ocurrido. 4. Sin embargo, para las decisiones donde el riesgo de tal subestimación está explícitamente tolerado, no podemos mostrarnos muy críticos de este procedimiento más rápido. 5. Otros aspectos técnicos del muestreo por etapas, dicen que el error muestral disminuye cuando aumenta: (1) el tamaño de la muestra y (2) la homogeneidad de los elementos que están sometiéndose a muestreo. Universidad de Costa Rica 6 Prof. Carlo Magno Araya 6. La teoría estadística nos lleva a la conclusión de que debemos seleccionar un número grande de conglomerados en cada etapa y un número pequeño de elementos dentro de cada conglomerado para lograr la mejor eficiencia estadística. 7. Pero, ¿qué sucede con la eficiente total?. Esta tiene un papel que desempeñar. Cuántos más conglomerados seleccionemos, mayor será la lista de elementos que tenderemos que elaborar, mayor el trabajo de los entrevistadores y mayores complicaciones administrativas que tendremos que resolver. 8. Por estos factores aumentan el costo del estudio, por esta razón el diseño final de la muestra comprende un intercambio entre eficiencia estadística y costo. No hay una elección óptima disponible. 9. El investigador debe hacer este intercambio con base en los objetivos del estudio, la cantidad de dinero disponible y la magnitud de error aceptable. MUESTRA NO PROBABILÍSTICA: MUESTREO POR CUOTA 1. Es una alternativa al diseño totalmente probabilístico. Surge básicamente dentro realizan estudio de opinión y de mercado. 2. Nace fundamentalmente de la preocupación: (1) controlar el costo, (2) mejorar la precisión de resultados. 3. Por ello trata de lograr varios propósitos: (1) seguridad de obtener una muestra de un tamaño determinado, (2) reducir a un mínimo el tiempo para el trabajo de campo, (3) reducir el costo de recolección de los datos, (4) obtener una muestra que satisface controles de estructura (o composición) respecto a; sexo, edad, ocupación, nivel socioeconómico, etc. 4. Se propone las cuotas de acuerdo a las variables que mejor determinan la disponibilidad: sexo, edad y actividad económica. 5. Se trata de lograr los objetivos del estudio, siguiendo procedimientos estrictos en la selección de los encuestados establecido de previo, que deben seguirse sin cambios y que le dan al proceso una naturaleza muy cercana a la aleatoria. 6. Críticas al muestreo por cuota: (1) Da discrecionalidad al entrevistador en la selección de las personas a ser entrevistadas y, por ende, introduce el juicio(y posibles sesgos) en la selección de la muestra, (2) Utiliza un método de selección que da probabilidades desconocida y presumiblemente diferentes a los miembros de la población, (3) Por las razones anteriores, la muestra no es medible, no permite el cálculo de los errores de muestreo con base en los datos de la muestra, y no es posible hacer inferencias estadísticas a partir de ella. (4) Los errores de selección influyen mucho en los resultados.