Muestras para las evaluaciones en las Ciencias Sociales Dr. José Manuel Huerta, Septiembre de 2006 Muestras en la evaluación. La muestra es una herramienta muy poderosa en los estudios de investigación y de evaluación. Esta no se utiliza en los casos en que se pretende estudiar a todos los miembros de una población, lo que se conoce como universo. En los casos en que estudiamos a todos los miembros de la población de donde vamos a obtener la información, esto se conoce como censo. Sin embargo, para las poblaciones más grandes, es más eficiente realizar una muestra. Si esta se hace de forma representativa, es posible hacer inferencias a la población. En otras palabras, se infiere que las características de la muestra son las mismas que las de la población. Debemos clarificar que la naturaleza de los estudios cualitativos propicia mayor flexibilidad en el uso de las muestras. El paradigma de estos estudios se basa en sacrificar la estadística y la validez, en aras de obtener la mayor información posible de los participantes del estudio. Por lo tanto, estos estudios en términos generales se caracterizan por el uso de las muestras no representativas. No obstante, muchos de los científicos cualitativos consideran que la profundidad de los estudios que llevan a cabo, compensa la falta de representatividad de los participantes. No es mi intención resolver aquí esta vieja disputa entre ambos paradigmas. Mi opinión es que las técnicas cuantitativas y cualitativas se pueden complementar para el beneficio del estudio en cuestión. Muestras Los principios de muestras científicas han sido conocidos en los E.U. desde la década de los 50. Sin embargo, huelga decir que muchos de los principios de muestreo que quedaron bien establecidos desde los años 50 no se llevan a la práctica de manera rutinaria. Entre las razones que se citan para justificar la proliferación de muestras inadecuadas es la falta de accesibilidad de la población, como sería el caso de la población de personas que carecen de vivienda. Otras razones son la falta de recursos económicos, de personal calificado para llevar a cabo los estudios, y también, cómo no, a la falta de conocimientos en materia de muestreo. No habría ningún problema si se hicieran solamente estudios donde se utilice a la población total. . Sin embargo, en muchas ocasiones esto no es práctico ni económico, especialmente en poblaciones altas. En nuestros tiempos, en el caso de una encuesta telefónica, aquellos que no cuenten con el servicio, se descartarían desde un principio. Esto de por sí ya causa una limitación en lo concerniente a la representatividad de la muestra. De la misma manera podría ocurrir con los que no tengan acceso al Internet en los estudios en que se haga a través de ese medio. En cuanto a las encuestas por correo, una limitación podría ser la condición de analfabetismo de algunas personas, lo cual les impediría participar. Otra limitación podría ser la falta de conocimiento sobre el tópico en cuestión de algunos participantes de la muestra seleccionada. En muchos países en desarrollo, se hace particularmente difícil escoger una muestra representativa en muchos casos, debido a la falta de registros oficiales de grupos de individuos, como el caso de profesionales de la salud, por lo que las muestras en muchos casos tienden a ser no representativas. 1 Debemos clarificar que una muestra totalmente científica no debe incluir la estrategia de reemplazo. Es decir, la sustitución de un sujeto por otro, en caso de no poder localizarlo. No obstante, en la vida real, esto es una posibilidad real, debido a cambios de residencias de las personas, enfermedad, muertes u otras causas. En estos casos, se debe indicar que esto se llevó a cabo. Esto generaría una muestra accidental, lo cual se debe documentar. Existen numerosas razones para la no obtención de muestras representativas, algunas con posibilidad de control, y otras fuera del alcance del investigador para la selección de la muestra. La muestra constituye una herramienta muy poderosa para la obtención de una información válida, pero con la utilización de menos recursos y de tiempo. Ambos conceptos suelen ser factores críticos en los estudios de evaluación. En muchos casos, una muestra es lo más conveniente y sensato. De la misma manera que aquel paciente que va a hacerse una prueba de sangre en un laboratorio se le requiere una muestra de sangre y no toda su sangre. Esto último sería devastador para el paciente Igualmente un agricultor que desee conocer el estado del suelo de su finca, lo que procede es una muestra de suelo y no de todo su suelo. Esta muestra se obtiene de diferentes lugares de la finca, de manera que el resultado sea representativo de la misma. En la industria farmacéutica, las funciones del control de calidad incluye la revisión de una muestra de los productos, con el fin de detectar posibles errores en la elaboración de los mismos. Cuando se utilizan todas las personas de una población, se denomina censo. Una muestra representativa se obtiene cuando se les da a todos los miembros de la población las mismas oportunidades de ser incluídos en la muestra. De no ser así, entonces la muestra carece de representatividad A continuación se mencionan las muestras representativas y no representativas más comunes. A. Representativas 1. 2. 3. 4. B. Muestra simple al azar (aleatoria) Muestra al azar en varias etapas (clusters) Muestra estratificada (cuotas) Muestra sistemática No representativas 1. 2. 3. 4. Muestra accidental Muestra de conveniencia Muestra a propósito Muestra de bola de nieve 2 Muestras representativas representativas Muestra simple al azar (aleatoria). Esto sucede cuando se colocan todos los nombres de los participantes en un sombrero, se agita el mismo para que la distribución de los nombres en el sombrero corresponda al mero azar y se saca del mismo el número predeterminado a utilizarse en la muestra. El procedimiento anterior no es práctico, obviamente cuando la población es alta. También se puede utilizar una tabla de números aleatorios, las cuáles se encuentran en los textos de investigación social, evaluación de programas y de estadística. También la mayoría de los programas de estadística para la computadora personal contienen procedimientos para obtener muestras aleatorias. Las muestras al azar se dificultan mucho cuando no se dispone de un registro de todos los participantes. El porcentaje de respuestas se obtiene de la siguiente manera: Porcentaje de respuestas = Cuestionarios completados X 100 Número de la muestra En otras palabras, si contestan 50 de 100 personas, el porcentaje de respuestas es de 50%. Este porcentaje de respuestas en un estudio, generaría muchas suspicacias y dudas, ya que posiblemente el 50% que no contestó, podría tener una opinión totalmente distinta de los que contestaron. Se debe proveer en el estudio una serie de seguimientos para asegurar el mayor número de participación. Se recomienda un mínimo de tres seguimientos para los que no contestaron, para así obtener un porcentaje de respuestas de al menos 90% de la muestra. Existe otro procedimiento utilizado para estimar el porcentaje de la muestra. Este método es necesario utilizarlo cuando existen personas inelegibles en la muestra, y también cuando algunas personas incluídas en la muestra no se hayan podido localizar, a pesar de repetidos intentos. % de respuestas = Cuestionarios completados y devueltos X100 # muestra – (no elegibles + no localizables No se recomienda la sustitución de personas en la muestra cuando algunas no puedan ser localizadas. Esto invalidaría el aspecto científico del muestreo. En la encuesta por correo o por teléfono esto tiende a ser más grave debido a que no es lo mismo que conteste el esposo que la esposa o los hijos. En las encuestas personales que se llevan a cabo en las residencias, se presume que no debe haber mucha diferencia entre unas personas y sus vecinos, en relación a educación, ocupación, ingreso y otras características socio-económicas , aunque en realidad podría haberlas. Muestra al azar en varias etapas (“clusters”) En ciertas ocasiones, como en el caso de los estudiantes del departamento de educación, para obtener muestras de estudiantes, 3 primero se deberán obtener muestras de regiones educativas, distritos escolares o escuelas. Esto se debe a que los estudiantes están distribuídos en las escuelas o “clubsters”. Puede haber diferentes estrategias a utilizarse para una muestra en varias etapas, aún cuando el número final de la muestra y su porcentaje sea el mismo. Población total de estudiantes = 20,000 # escuelas = 40 Porcentaje de muestra deseado = 2,000 = 1/10 total de estudiantes a. b. c. d. Seleccionar todas las escuelas, recopilar las listas de todos los estudiantes y seleccionar 1/10 de los estudiantes en cada escuela. Seleccionar ½ de las escuelas, entonces seleccione 1/5 de todos los estudiantes en ellas. Seleccionar 1/5 de las escuelas, a continuación seleccione al azar ½ de todos los estudiantes en ellas. Seleccione 1/10 de las escuelas, y tome información de todos los estudiantes en ellas. En las cuatro estrategias mencionadas se obtuvo una muestra de 2,000 estudiantes, lo cual representó un porcentaje del 10% de la población total de 20,000 estudiantes. Sin embargo, las alternativas del fondo son más económicas, ya que se disminuye el número de escuelas y por consiguiente el costo de la toma de datos. Sin embargo, las alternativas de arriba son más precisas, ya que se aumenta el número de escuelas de donde se toman los datos. El siguiente ejemplo aplica cuando se desea obtener una muestra de unidades de vivienda en una ciudad: # de bloques = 400 # unidades de vivienda localizadas en los bloques= 20,000 muestra deseada= 2,000 unidades de vivienda = 1/10 total 1. 2. Seleccionar 80 bloques (1/5), entonces tomar ½ de unidades de los bloques. Seleccionar 40 bloques (1/10), entonces tomar todas las unidades de los bloques. Siguiendo con lo establecido en el ejemplo anterior de las escuelas, el utilizar más bloques hace a la muestra más precisa, pero al mismo tiempo es más costosa. Esto es precisamente lo que sucede con el caso 1 de los 80 bloques. En el caso de existir información sobre el número de las unidades de vivienda en cada bloque, podría ser conveniente su utilización. Para producir “clubsters” del mismo tamaño, el tamaño de las muestras debe ser proporcionar en este caso al número de las unidades de vivienda. 4 Muestra estratificada estratificada (cuotas) En ciertos casos existe evidencia para presuponer diferencias entre grupos de población, como es el caso de los géneros, preparación académica, nivel socio-económico, etc. En el caso de los estudios de agricultores el tamaño de la finca puede ser vital. En algunos estudios sociológicos que se llevan a cabo en Estados Unidos, se considera de gran relevancia el grupo racial o étnico al que pertenecen los participantes. En algunos casos es altamente deseable tomar muestras estratificadas, sobre todo cuando se cree que existen grandes probabilidades de que los grupos sean muy distintos entre sí en algunos aspectos del propósito del estudio. Por lo tanto, es normal que se pretenda que el porcentaje de la muestra de cada grupo sea un fiel reflejo del porcentaje existente de cada estrata en el universo. Muestra sistemática Este método es considerado por muchos investigadores como equivalente al de azar. De acuerdo al tamaño de la muestra, y contando con una lista de participantes, la cual podría ser un directorio telefónico, se toma al azar el número inicial del primer participante, y de ahí en adelante se seguirá “sistemáticamente” de la misma forma hasta llegar al número deseado de la muestra. Si en una población de 20,000 personas se decidiera obtener una muestra de 2000, es decir el 10% de la población, Se podría realizar el procedimiento que se describe: de contarse con una lista de la población, se pudiera establecer a priori que se va a sortear un número del 1 al 10, lo cual se puede sortear sin mucha dificultad. Si el número agraciado fuera el 7, entonces el primer miembro de la muestra lo sería el número 7 del listado. De ahí en adelante, de manera sistemáticas, los participantes serín incluídos en la muestra de 7 en 7. Muestras no representativas representativas Muestra accidental La muestra accidental tiene lugar cuando no existe un directorio de los participantes, y cuando se realizan las entrevistas en un lugar y hora determinado, lo cual discriminaría contra las personas que tienen horarios diferentes al de los encuestadores. Por ejemplo, si se pretende hacer un estudio de hábitos de consumo en un centro comercial, y un encuestador va al centro comercial en cuestión los viernes de 3-5 PM durante el mes de octubre a llevar a cabo encuestas con los consumidores. Esta metodología no cumpliría obviamente con los requisitos de una muestra representativa debido a que solamente participarían aquellas personas que por pura casualidad o mero azar o accidente se encuentran realizando las compras en ése momento, y fueron abordados por el encuestador Otro ejemplo es cuando a falta de un directorio que agrupe a todos los pescadores de orilla en la Isla, varios encuestadores van a unas zonas específicas de pesca los sábados de 4-6 PM con el propósito de conocer sus necesidades. En ambos casos, los hallazgos pueden proveer una información valiosa sobre los participantes y el propósito del estudio. Sin embargo, los hallazgos deben limitarse única y exclusivamente a los encuestados, sin pretender hacer generalizaciones a la población total. 5 Muestra de conveniencia Es muy parecido a la muestra accidental. Se refiere a la muestra que se obtiene de un grupo que está disponible para el estudio. Si un profesor desea comparar las reacciones de los estudiantes hacia dos diferentes libros de texto en las dos clases de ciencia que enseña , se puede decir que está utilizando una muestra de conveniencia. Otro ejemplo se podría dar en unas zonas agrícolas, donde los encuestadores llevan a cabo las encuestas en las fincas localizadas cerca de la carretera principal, y donde el acceso es más fácil y conveniente para los encuestadores. En el caso de las zonas urbanas, podría ser más conveniente llevarlas a cabo en las zonas residenciales de la clase media-alta, ignorando los residenciales públicos donde las personas son generalmente de ingresos más bajos. En ambos casos se estaría sacrificando la representativad por una pura conveniencia, ya que las poblaciones ignoradas tienden a tener unas variables muy distintas a las que participaron. Dichas diferencias podrían afectar grandemente los hallazgos, por lo que la representatividad se perdería por completo. Una situación similar sucedería si los participantes de un estudio son los que de manera voluntaria deciden participar porque el estudio les interesa grandemente, o quizás meramente por recibir los incentivos de participación. En este caso, la conveniencia es más del participante que del investigador. Muestra a propósito Se utiliza cuando el investigador conoce a la población, y decide en un estudio particular escoger a los participantes que según su criterio son los más capacitados para participar en el estudio, o incluso aquellas personas o grupos que según el investigador representan al grupo. Como ejemplo, un maestro de estudios sociales de octavo grado quiere determinar la manera en que sus estudiantes perciben la inclusión de eventos de actualidad como parte de la clase. Para obtener esto, considera que la muestra debe incluir a dos estudiantes cuya media aritmética representa el promedio de sus estudiantes, a los dos estudiantes de mejor promedio y a los dos de puntuación más baja. El maestro considera que muestras similares han reflejado con gran exactitud los puntos de vista de sus estudiantes en el pasado. Otro ejemplo podría ser cuando un investigador debe realizar una muestra que represente a los residentes de un país específico, considera que en encuestas anteriores, la muestra de una localidad ha reflejado las tendencias nacionales. Debido a esto, decide realizar una muestra de la localidad en cuestión en vez de realizarla a través del país. Muestra de bola de nieve. nieve. Este tipo de muestra es muy útil para localizar sujetos de investigación que sean difíciles de encontrar. Si lo que se pretende es encontrar adictos a la heroína que no se hayan sometido a tratamiento alguno ni tampoco haya sido arrestado, posiblemente el procedimiento de la bola de nieve sea lo indicado. En este caso, una vez que se conoce de un caso, se le debe convencer de un legítimo interés investigativo. Esto conlleva el garantizar la debida protección y anonimato de los participantes. Una vez se mencione la contribución esperada de los participantes y la manera en que pueden beneficiarse del estudio (haya o no haya 6 incentivos económicos), es muy probable que el primer contacto ayude a localizar a otras personas de condiciones similares. Tabla I. Guía de tamaño de la Muestra según la Población A continuación presentamos una tabla que puede servir de guía sobre el número aproximado de personas a incluirse en una muestra, según la población. Esto no representa una camisa de fuerza, ya que en esto influyen muchos factores, algunos de ellos fuera del control del investigador. En términos generales, la muestra está condicionada a los recursos disponibles para el estudio. En la tabla, (N) representa a la población, y (n) a la muestra. Por ejemplo, para una población de 220, se recomienda una muestra de 140. Al aumentar la muestra, se disminuye el porcentaje de error, que en este caso es de 5%. Pueden observar en la tabla, que el porcentaje de la muestra recomendado con respecto a la población disminuye según aumenta la población. Por lo tanto, es muy errado el supuesto de algunas personas que manifiestan que la muestra siempre debe constituir un 25% de la población. . Esto sería muy difi´cil de obtener en poblaciones altas, como el caso de los 250 millones que representan con aproximación la población de los Estados Unidos. 7 Tamaño de la Muestra El establecer conclusiones de una población, basado en las características de la muestra nunca es un procedimiento totalmente satisfactorio. Esto es debido a que los investigadores no pueden estar totalmente seguros de que la muestra describe perfectamente a la población. Si la muestra se toma al azar y el tamaño de la misma es suficientemente grande, las diferencias son pequeñas e insignificantes. Como ejemplo, una población de 100 estudiantes de octavo grado de una escuela determinada, una muestra de dos o tres jóvenes, probablemente es demasiado pequeña. En este caso, una nuestra de menos de 20-30 individuos sería demasiado pequeña. Según la tabla de Muestreo de Krecjcie y Morgan (1970), para las muestras relativamente pequeñas (menos de 100), es recomendable utilizar la población 8 completa, ya que así se elimina el error de nuestra. La muestra que ellos recomiendan para una población de 100, tal como pueden ver en la tabla, es de 80. De lo que se desprende aquí es que el investigador debe obtener una muestra tan amplia como sus recursos se lo permitan. Si nosotros tomamos diferentes muestras representativas de una misma población, es muy posible que los resultados estadísticos del estudio tengan cierta variabilidad, ya que probablemente se seleccionarán diferentes sujetos de la misma población. Esta variabilidad se conoce como error de muestra. Dicho error de muestra será menor según aumente el tamaño de la muestra, siempre y cuando esta muestra sea representativa. También debemos tener en cuenta que al aumentar el tamaño de la muestra, normalmente disminuye el porcentaje de cuestionarios completados. Esto significa, que el algunos casos, el aumentar la muestra, además de aumentar el costo del estudio y la energía utilizada en el mismo, podría disminuir la precisión del estudio. Debido a esto, prestigiosas compañías de investigación suelen obtener una muestra de unos 1,500 personas para inferir los hallazgos a toda la población de los Estados Unidos. Según la tabla de Krejcie y Morgan (1970), la cual es ampliamente utilizada, es muy común utilizar una muestra representativa de unas 384 personas para inferir los resultados a una población de 100,000 personas. Esto es un procedimiento muy eficiente para obtener los resultados, con un 95% de confiabilidad o un 5% de error. Otras Consideraciones sobre las Muestras. Muestras. Una de las primeras consideraciones que tiene un investigador es obtener el número de participantes en un estudio. Es muy común llevar a cabo proyectos pilotos. De ahí podemos obtener información sobre la pertinencia de las preguntas, aquellas que los participantes no contestan o mienten deliberadamente, y otros indicadores. Para los proyectos pilotos se utiliza una muestra pequeña, normalmente entre 20 y 100 personas. Basados en los resultados, procedimientos e instrumentos se modifican para el estudio final. En los estudios cualitativos, la naturaleza de las interacciones con la población y la profundidad del estudio, nos lleva a utilizar una muestra pequeña, la cual ordinariamente tampoco es representativa. No obstante, la profundidad del estudio puede paliar un tanto la limitada validez del mismo. Hoy en día es muy aceptada la combinación de estudios cuantitativos y cualitativos. En algunos casos, el tópico del estudio puede influir la muestra. Por ejemplo, si pretendemos documentar la incidencia de un raro evento, como es el caso de la incidencia de ataques al corazón entre los hombres entre 18-30 años. Si obtenemos una muestra y esperamos un año, probablemente no observemos ningún ataque al corazón. Sin embargo, sería errático concluir que no existen los ataques al corazón en esta población. En esta situación, si no disponemos de los recursos para obtener una 9 muestra mayor, no debemos realizar el estudio, ya que los resultados sería muy poco confiables. Es muy importante la consideración de la variabilidad en una población. En el caso de una población con poca variabilidad (homogénea), es posible el uso de muestras pequeñas. Si en una industria utilizamos una muestra de bolsas de papas fritas, esta es homogénea, ya que el manufacturero suele mantener una consistencia con respecto a su peso. El obtener una muestra de 50, nos daría con mucho menos esfuerzo la misma información que si obtenemos una de 1,000. No obstante, si la población tiene mucha variabilidad (heterogénea), entonces necesitamos muestras grandes. Supongamos que vamos a hacer un estudio sobre el nivel de literaria entre adultos de una zona metropolitana grande. En este caso, la variabilidad sería grande, ya que el nivel fluctuaría entre personas totalmente analfabetas hasta otros con un nivel de literaria excepcional. De este grupo diverso, si obtenemos una muestra de solamente 50 personas, probablemente no obtengamos una persona analfabeta. Si existen pequeñas diferencias en la población, debemos utilizar una muestra tan grande como nuestros recursos lo permitan. Esto podría suceder en el caso de obtener una percepción de preferencias de voto de cara a unas elecciones. Debemos recordar que en este caso, son meramente percepciones, y estas pueden variar rápidamente, especialmente si surge algún evento especial En términos generales, este tipo de encuesta es más preciso segu´n aumenta la proximidad de las elecciones, Conclusión. Espero que este artículo les haya ilustrado un poco sobre la importancia de las muestra y los diferentes procedimientos para obtenerlas. Tal como se mencionó, la muestra facilita grandemente la realización de estudios con base científica, sin contar con el presupuesto ni el tiempo requerido para la realización de un censo. En términos generales, un error de muestra de 5% justifica grandemente el uso de la muestra. población. 10