1 Muestras para las evaluaciones en las Ciencias Sociales

Anuncio
Muestras para las evaluaciones en las Ciencias Sociales
Dr. José Manuel Huerta, Septiembre de 2006
Muestras en la evaluación. La muestra es una herramienta muy poderosa en los
estudios de investigación y de evaluación. Esta no se utiliza en los casos en que se
pretende estudiar a todos los miembros de una población, lo que se conoce como
universo. En los casos en que estudiamos a todos los miembros de la población de
donde vamos a obtener la información, esto se conoce como censo. Sin embargo, para
las poblaciones más grandes, es más eficiente realizar una muestra. Si esta se hace de
forma representativa, es posible hacer inferencias a la población. En otras palabras, se
infiere que las características de la muestra son las mismas que las de la población.
Debemos clarificar que la naturaleza de los estudios cualitativos propicia mayor
flexibilidad en el uso de las muestras. El paradigma de estos estudios se basa en
sacrificar la estadística y la validez, en aras de obtener la mayor información posible de
los participantes del estudio. Por lo tanto, estos estudios en términos generales se
caracterizan por el uso de las muestras no representativas. No obstante, muchos de los
científicos cualitativos consideran que la profundidad de los estudios que llevan a cabo,
compensa la falta de representatividad de los participantes. No es mi intención resolver
aquí esta vieja disputa entre ambos paradigmas. Mi opinión es que las técnicas
cuantitativas y cualitativas se pueden complementar para el beneficio del estudio en
cuestión.
Muestras Los principios de muestras científicas han sido conocidos en los E.U. desde
la década de los 50. Sin embargo, huelga decir que muchos de los principios de
muestreo que quedaron bien establecidos desde los años 50 no se llevan a la práctica
de manera rutinaria. Entre las razones que se citan para justificar la proliferación de
muestras inadecuadas es la falta de accesibilidad de la población, como sería el caso de
la población de personas que carecen de vivienda. Otras razones son la falta de
recursos económicos, de personal calificado para llevar a cabo los estudios, y también,
cómo no, a la falta de conocimientos en materia de muestreo. No habría ningún problema
si se hicieran solamente estudios donde se utilice a la población total. . Sin embargo, en
muchas ocasiones esto no es práctico ni económico, especialmente en poblaciones
altas. En nuestros tiempos, en el caso de una encuesta telefónica, aquellos que no
cuenten con el servicio, se descartarían desde un principio. Esto de por sí ya causa una
limitación en lo concerniente a la representatividad de la muestra. De la misma manera
podría ocurrir con los que no tengan acceso al Internet en los estudios en que se haga a
través de ese medio. En cuanto a las encuestas por correo, una limitación podría ser la
condición de analfabetismo de algunas personas, lo cual les impediría participar. Otra
limitación podría ser la falta de conocimiento sobre el tópico en cuestión de algunos
participantes de la muestra seleccionada. En muchos países en desarrollo, se hace
particularmente difícil escoger una muestra representativa en muchos casos, debido a la
falta de registros oficiales de grupos de individuos, como el caso de profesionales de la
salud, por lo que las muestras en muchos casos tienden a ser no representativas.
1
Debemos clarificar que una muestra totalmente científica no debe incluir la estrategia de
reemplazo. Es decir, la sustitución de un sujeto por otro, en caso de no poder localizarlo.
No obstante, en la vida real, esto es una posibilidad real, debido a cambios de
residencias de las personas, enfermedad, muertes u otras causas. En estos casos, se
debe indicar que esto se llevó a cabo. Esto generaría una muestra accidental, lo cual se
debe documentar.
Existen numerosas razones para la no obtención de muestras representativas, algunas
con posibilidad de control, y otras fuera del alcance del investigador para la selección
de la muestra.
La muestra constituye una herramienta muy poderosa para la obtención de una
información válida, pero con la utilización de menos recursos y de tiempo. Ambos
conceptos suelen ser factores críticos en los estudios de evaluación. En muchos
casos, una muestra es lo más conveniente y sensato. De la misma manera que aquel
paciente que va a hacerse una prueba de sangre en un laboratorio se le requiere una
muestra de sangre y no toda su sangre. Esto último sería devastador para el paciente
Igualmente un agricultor que desee conocer el estado del suelo de su finca, lo que
procede es una muestra de suelo y no de todo su suelo. Esta muestra se obtiene de
diferentes lugares de la finca, de manera que el resultado sea representativo de la
misma. En la industria farmacéutica, las funciones del control de calidad incluye la
revisión de una muestra de los productos, con el fin de detectar posibles errores en la
elaboración de los mismos.
Cuando se utilizan todas las personas de una población, se denomina censo. Una
muestra representativa se obtiene cuando se les da a todos los miembros de la
población las mismas oportunidades de ser incluídos en la muestra. De no ser así,
entonces la muestra carece de representatividad A continuación se mencionan las
muestras representativas y no representativas más comunes.
A.
Representativas
1.
2.
3.
4.
B.
Muestra simple al azar (aleatoria)
Muestra al azar en varias etapas (clusters)
Muestra estratificada (cuotas)
Muestra sistemática
No representativas
1.
2.
3.
4.
Muestra accidental
Muestra de conveniencia
Muestra a propósito
Muestra de bola de nieve
2
Muestras representativas
representativas
Muestra simple al azar (aleatoria). Esto sucede cuando se colocan todos los
nombres de los participantes en un sombrero, se agita el mismo para que la
distribución de los nombres en el sombrero corresponda al mero azar y se saca del
mismo el número predeterminado a utilizarse en la muestra. El procedimiento anterior
no es práctico, obviamente cuando la población es alta. También se puede utilizar
una tabla de números aleatorios, las cuáles se encuentran en los textos de
investigación social, evaluación de programas y de estadística. También la mayoría
de los programas de estadística para la computadora personal contienen
procedimientos para obtener muestras aleatorias. Las muestras al azar se dificultan
mucho cuando no se dispone de un registro de todos los participantes.
El porcentaje de respuestas se obtiene de la siguiente manera:
Porcentaje de respuestas = Cuestionarios completados X 100
Número de la muestra
En otras palabras, si contestan 50 de 100 personas, el porcentaje de respuestas es de
50%. Este porcentaje de respuestas en un estudio, generaría muchas suspicacias y
dudas, ya que posiblemente el 50% que no contestó, podría tener una opinión totalmente
distinta de los que contestaron. Se debe proveer en el estudio una serie de
seguimientos para asegurar el mayor número de participación. Se recomienda un mínimo
de tres seguimientos para los que no contestaron, para así obtener un porcentaje de
respuestas de al menos 90% de la muestra.
Existe otro procedimiento utilizado para estimar el porcentaje de la muestra. Este
método es necesario utilizarlo cuando existen personas inelegibles en la muestra, y
también cuando algunas personas incluídas en la muestra no se hayan podido localizar,
a pesar de repetidos intentos.
% de respuestas = Cuestionarios completados y devueltos
X100
# muestra – (no elegibles + no localizables
No se recomienda la sustitución de personas en la muestra cuando algunas no puedan
ser localizadas. Esto invalidaría el aspecto científico del muestreo. En la encuesta por
correo o por teléfono esto tiende a ser más grave debido a que no es lo mismo que
conteste el esposo que la esposa o los hijos. En las encuestas personales que se llevan
a cabo en las residencias, se presume que no debe haber mucha diferencia entre unas
personas y sus vecinos, en relación a educación, ocupación, ingreso y otras
características socio-económicas , aunque en realidad podría haberlas.
Muestra al azar en varias etapas (“clusters”) En ciertas ocasiones, como en el caso de
los estudiantes del departamento de educación, para obtener muestras de estudiantes,
3
primero se deberán obtener muestras de regiones educativas, distritos escolares o
escuelas. Esto se debe a que los estudiantes están distribuídos en las escuelas o
“clubsters”. Puede haber diferentes estrategias a utilizarse para una muestra en varias
etapas, aún cuando el número final de la muestra y su porcentaje sea el mismo.
Población total de estudiantes = 20,000
# escuelas = 40
Porcentaje de muestra deseado = 2,000 = 1/10 total de estudiantes
a.
b.
c.
d.
Seleccionar todas las escuelas, recopilar las listas de todos los estudiantes y
seleccionar 1/10 de los estudiantes en cada escuela.
Seleccionar ½ de las escuelas, entonces seleccione 1/5 de todos los
estudiantes en ellas.
Seleccionar 1/5 de las escuelas, a continuación seleccione al azar ½ de todos
los estudiantes en ellas.
Seleccione 1/10 de las escuelas, y tome información de todos los estudiantes en
ellas.
En las cuatro estrategias mencionadas se obtuvo una muestra de 2,000 estudiantes,
lo cual representó un porcentaje del 10% de la población total de 20,000 estudiantes.
Sin embargo, las alternativas del fondo son más económicas, ya que se disminuye el
número de escuelas y por consiguiente el costo de la toma de datos. Sin embargo, las
alternativas de arriba son más precisas, ya que se aumenta el número de escuelas de
donde se toman los datos.
El siguiente ejemplo aplica cuando se desea obtener una muestra de unidades de
vivienda en una ciudad:
# de bloques = 400
# unidades de vivienda localizadas en los bloques= 20,000
muestra deseada= 2,000 unidades de vivienda = 1/10 total
1.
2.
Seleccionar 80 bloques (1/5), entonces tomar ½ de unidades de los bloques.
Seleccionar 40 bloques (1/10), entonces tomar todas las unidades de los
bloques.
Siguiendo con lo establecido en el ejemplo anterior de las escuelas, el utilizar más
bloques hace a la muestra más precisa, pero al mismo tiempo es más costosa. Esto es
precisamente lo que sucede con el caso 1 de los 80 bloques.
En el caso de existir información sobre el número de las unidades de vivienda en
cada bloque, podría ser conveniente su utilización. Para producir “clubsters” del mismo
tamaño, el tamaño de las muestras debe ser proporcionar en este caso al número de las
unidades de vivienda.
4
Muestra estratificada
estratificada (cuotas) En ciertos casos existe evidencia para presuponer
diferencias entre grupos de población, como es el caso de los géneros, preparación
académica, nivel socio-económico, etc. En el caso de los estudios de agricultores el
tamaño de la finca puede ser vital. En algunos estudios sociológicos que se llevan a
cabo en Estados Unidos, se considera de gran relevancia el grupo racial o étnico al
que pertenecen los participantes. En algunos casos es altamente deseable tomar
muestras estratificadas, sobre todo cuando se cree que existen grandes
probabilidades de que los grupos sean muy distintos entre sí en algunos aspectos
del propósito del estudio. Por lo tanto, es normal que se pretenda que el porcentaje
de la muestra de cada grupo sea un fiel reflejo del porcentaje existente de cada
estrata en el universo.
Muestra sistemática Este método es considerado por muchos investigadores como
equivalente al de azar. De acuerdo al tamaño de la muestra, y contando con una lista
de participantes, la cual podría ser un directorio telefónico, se toma al azar el número
inicial del primer participante, y de ahí en adelante se seguirá “sistemáticamente” de
la misma forma hasta llegar al número deseado de la muestra. Si en una población de
20,000 personas se decidiera obtener una muestra de 2000, es decir el 10% de
la población, Se podría realizar el procedimiento que se describe: de contarse con
una lista de la población, se pudiera establecer a priori que se va a sortear un
número del 1 al 10, lo cual se puede sortear sin mucha dificultad. Si el número
agraciado fuera el 7, entonces el primer miembro de la muestra lo sería el número 7
del listado. De ahí en adelante, de manera sistemáticas, los participantes serín
incluídos en la muestra de 7 en 7.
Muestras no representativas
representativas
Muestra accidental La muestra accidental tiene lugar cuando no existe un directorio
de los participantes, y cuando se realizan las entrevistas en un lugar y hora
determinado, lo cual discriminaría contra las personas que tienen horarios diferentes
al de los encuestadores. Por ejemplo, si se pretende hacer un estudio de hábitos de
consumo en un centro comercial, y un encuestador va al centro comercial en
cuestión los viernes de 3-5 PM durante el mes de octubre a llevar a cabo encuestas
con los consumidores. Esta metodología no cumpliría obviamente con los requisitos
de una muestra representativa debido a que solamente participarían aquellas
personas que por pura casualidad o mero azar o accidente se encuentran realizando
las compras en ése momento, y fueron abordados por el encuestador Otro ejemplo
es cuando a falta de un directorio que agrupe a todos los pescadores de orilla en la
Isla, varios encuestadores van a unas zonas específicas de pesca los sábados de
4-6 PM con el propósito de conocer sus necesidades. En ambos casos, los
hallazgos pueden proveer una información valiosa sobre los participantes y el
propósito del estudio. Sin embargo, los hallazgos deben limitarse única y
exclusivamente a los encuestados, sin pretender hacer generalizaciones a la
población total.
5
Muestra de conveniencia Es muy parecido a la muestra accidental. Se refiere a la
muestra que se obtiene de un grupo que está disponible para el estudio. Si un
profesor desea comparar las reacciones de los estudiantes hacia dos diferentes
libros de texto en las dos clases de ciencia que enseña , se puede decir que está
utilizando una muestra de conveniencia. Otro ejemplo se podría dar en unas zonas
agrícolas, donde los encuestadores llevan a cabo las encuestas en las fincas
localizadas cerca de la carretera principal, y donde el acceso es más fácil y
conveniente para los encuestadores. En el caso de las zonas urbanas, podría ser
más conveniente llevarlas a cabo en las zonas residenciales de la clase media-alta,
ignorando los residenciales públicos donde las personas son generalmente de
ingresos más bajos. En ambos casos se estaría sacrificando la representativad por
una pura conveniencia, ya que las poblaciones ignoradas tienden a tener unas
variables muy distintas a las que participaron. Dichas diferencias podrían afectar
grandemente los hallazgos, por lo que la representatividad se perdería por completo.
Una situación similar sucedería si los participantes de un estudio son los que de
manera voluntaria deciden participar porque el estudio les interesa grandemente, o
quizás meramente por recibir los incentivos de participación. En este caso, la
conveniencia es más del participante que del investigador.
Muestra a propósito Se utiliza cuando el investigador conoce a la población, y
decide en un estudio particular escoger a los participantes que según su criterio son
los más capacitados para participar en el estudio, o incluso aquellas personas o
grupos que según el investigador representan al grupo. Como ejemplo, un maestro de
estudios sociales de octavo grado quiere determinar la manera en que sus
estudiantes perciben la inclusión de eventos de actualidad como parte de la clase.
Para obtener esto, considera que la muestra debe incluir a dos estudiantes cuya
media aritmética representa el promedio de sus estudiantes, a los dos estudiantes
de mejor promedio y a los dos de puntuación más baja. El maestro considera que
muestras similares han reflejado con gran exactitud los puntos de vista de sus
estudiantes en el pasado.
Otro ejemplo podría ser cuando un investigador debe realizar una muestra que
represente a los residentes de un país específico, considera que en encuestas
anteriores, la muestra de una localidad ha reflejado las tendencias nacionales.
Debido a esto, decide realizar una muestra de la localidad en cuestión en vez de
realizarla a través del país.
Muestra de bola de nieve.
nieve. Este tipo de muestra es muy útil para localizar sujetos de
investigación que sean difíciles de encontrar. Si lo que se pretende es encontrar
adictos a la heroína que no se hayan sometido a tratamiento alguno ni tampoco haya
sido arrestado, posiblemente el procedimiento de la bola de nieve sea lo indicado. En
este caso, una vez que se conoce de un caso, se le debe convencer de un legítimo
interés investigativo. Esto conlleva el garantizar la debida protección y anonimato
de los participantes. Una vez se mencione la contribución esperada de los
participantes y la manera en que pueden beneficiarse del estudio (haya o no haya
6
incentivos económicos), es muy probable que el primer contacto ayude a localizar a
otras personas de condiciones similares.
Tabla I. Guía de tamaño de la Muestra según la Población
A continuación presentamos una tabla que puede servir de guía sobre el número
aproximado de personas a incluirse en una muestra, según la población. Esto no
representa una camisa de fuerza, ya que en esto influyen muchos factores, algunos de
ellos fuera del control del investigador. En términos generales, la muestra está
condicionada a los recursos disponibles para el estudio. En la tabla, (N) representa a la
población, y (n) a la muestra. Por ejemplo, para una población de 220, se recomienda
una muestra de 140. Al aumentar la muestra, se disminuye el porcentaje de error, que en
este caso es de 5%. Pueden observar en la tabla, que el porcentaje de la muestra
recomendado con respecto a la población disminuye según aumenta la población. Por
lo tanto, es muy errado el supuesto de algunas personas que manifiestan que la muestra
siempre debe constituir un 25% de la población. . Esto sería muy difi´cil de obtener en
poblaciones altas, como el caso de los 250 millones que representan con aproximación
la población de los Estados Unidos.
7
Tamaño de la Muestra
El establecer conclusiones de una población, basado en las características de la
muestra nunca es un procedimiento totalmente satisfactorio. Esto es debido a que los
investigadores no pueden estar totalmente seguros de que la muestra describe
perfectamente a la población. Si la muestra se toma al azar y el tamaño de la misma es
suficientemente grande, las diferencias son pequeñas e insignificantes.
Como ejemplo, una población de 100 estudiantes de octavo grado de una escuela
determinada, una muestra de dos o tres jóvenes, probablemente es demasiado pequeña.
En este caso, una nuestra de menos de 20-30 individuos sería demasiado pequeña.
Según la tabla de Muestreo de Krecjcie y Morgan (1970), para las muestras
relativamente pequeñas (menos de 100), es recomendable utilizar la población
8
completa, ya que así se elimina el error de nuestra. La muestra que ellos recomiendan
para una población de 100, tal como pueden ver en la tabla, es de 80. De lo que se
desprende aquí es que el investigador debe obtener una muestra tan amplia como sus
recursos se lo permitan.
Si nosotros tomamos diferentes muestras representativas de una misma población, es
muy posible que los resultados estadísticos del estudio tengan cierta variabilidad, ya
que probablemente se seleccionarán diferentes sujetos de la misma población. Esta
variabilidad se conoce como error de muestra. Dicho error de muestra será menor
según aumente el tamaño de la muestra, siempre y cuando esta muestra sea
representativa. También debemos tener en cuenta que al aumentar el tamaño de la
muestra, normalmente disminuye el porcentaje de cuestionarios completados. Esto
significa, que el algunos casos, el aumentar la muestra, además de aumentar el costo del
estudio y la energía utilizada en el mismo, podría disminuir la precisión del estudio.
Debido a esto, prestigiosas compañías de investigación suelen obtener una muestra de
unos 1,500 personas para inferir los hallazgos a toda la población de los Estados
Unidos.
Según la tabla de Krejcie y Morgan (1970), la cual es ampliamente utilizada, es muy
común utilizar una muestra representativa de unas 384 personas para inferir los
resultados a una población de 100,000 personas. Esto es un procedimiento muy
eficiente para obtener los resultados, con un 95% de confiabilidad o un 5% de error.
Otras Consideraciones sobre las Muestras.
Muestras.
Una de las primeras consideraciones que tiene un investigador es obtener el número de
participantes en un estudio. Es muy común llevar a cabo proyectos pilotos. De ahí
podemos obtener información sobre la pertinencia de las preguntas, aquellas que los
participantes no contestan o mienten deliberadamente, y otros indicadores. Para los
proyectos pilotos se utiliza una muestra pequeña, normalmente entre 20 y 100
personas. Basados en los resultados, procedimientos e instrumentos se modifican para
el estudio final.
En los estudios cualitativos, la naturaleza de las interacciones con la población y la
profundidad del estudio, nos lleva a utilizar una muestra pequeña, la cual ordinariamente
tampoco es representativa. No obstante, la profundidad del estudio puede paliar un
tanto la limitada validez del mismo. Hoy en día es muy aceptada la combinación de
estudios cuantitativos y cualitativos.
En algunos casos, el tópico del estudio puede influir la muestra. Por ejemplo, si
pretendemos documentar la incidencia de un raro evento, como es el caso de la
incidencia de ataques al corazón entre los hombres entre 18-30 años. Si obtenemos
una muestra y esperamos un año, probablemente no observemos ningún ataque al
corazón. Sin embargo, sería errático concluir que no existen los ataques al corazón en
esta población. En esta situación, si no disponemos de los recursos para obtener una
9
muestra mayor, no debemos realizar el estudio, ya que los resultados sería muy poco
confiables.
Es muy importante la consideración de la variabilidad en una población. En el caso de
una población con poca variabilidad (homogénea), es posible el uso de muestras
pequeñas. Si en una industria utilizamos una muestra de bolsas de papas fritas, esta es
homogénea, ya que el manufacturero suele mantener una consistencia con respecto a
su peso. El obtener una muestra de 50, nos daría con mucho menos esfuerzo la misma
información que si obtenemos una de 1,000. No obstante, si la población tiene mucha
variabilidad (heterogénea), entonces necesitamos muestras grandes. Supongamos que
vamos a hacer un estudio sobre el nivel de literaria entre adultos de una zona
metropolitana grande. En este caso, la variabilidad sería grande, ya que el nivel
fluctuaría entre personas totalmente analfabetas hasta otros con un nivel de literaria
excepcional. De este grupo diverso, si obtenemos una muestra de solamente 50
personas, probablemente no obtengamos una persona analfabeta.
Si existen pequeñas diferencias en la población, debemos utilizar una muestra tan
grande como nuestros recursos lo permitan. Esto podría suceder en el caso de obtener
una percepción de preferencias de voto de cara a unas elecciones. Debemos recordar
que en este caso, son meramente percepciones, y estas pueden variar rápidamente,
especialmente si surge algún evento especial En términos generales, este tipo de
encuesta es más preciso segu´n aumenta la proximidad de las elecciones,
Conclusión. Espero que este artículo les haya ilustrado un poco sobre la importancia de
las muestra y los diferentes procedimientos para obtenerlas. Tal como se mencionó, la
muestra facilita grandemente la realización de estudios con base científica, sin contar
con el presupuesto ni el tiempo requerido para la realización de un censo. En términos
generales, un error de muestra de 5% justifica grandemente el uso de la muestra.
población.
10
Descargar