Medición y construcción de índices Richard P. Curtis y Elton F. Jackson Este material se utiliza con fines exclusivamente didácticos ÍNDICE Manuel Mora y Araujo Introducción............................................................................................................................................... 7 Paul F. Lazarsfeld Una introducción conceptual al anausis de la estructura latente ............................................................... 29 Warren S. Torgerson La naturaleza de la medición ..................................................................................................................... 83 Paul F. Lazarsfeld y Allen H. Barton Algunas observaciones sobre el uso de índices ......................................................................................... 125 James S. Cóleman Propiedades-disposición y formación de índices....................................................................................... 141 Richard P. Curtis y Elton F. Jackson Indicadores múltiples en la investigación por encuesta............................................................................. 157 Gino Germani Clase social subjetiva e indicadores objetivos de estratificación .............................................................. 179 2 INDICADORES MÚLTIPLES EN LA INVESTIGACIÓN POR ENCUESTA Richard P. Curtis y Elton F. Jackson Título del original en inglés: "Multiple Indicators in Survey Research", artículo publicado en el American Journal of Sociology, vol. 68, 1963, pp. 193-204. Las preguntas acerca de la evidencia en la investigación social se contestan con referencia a los cánones generales de la ciencia. 1 Como en cualquier disciplina, sin embargo, en la sociología surgen problemas de evidencia, originados en su método especial de investigación. En lo que se refiere a la investigación por encuesta en particular, ésta plantea problemas difíciles en la aplicación de los "clásicos" cánones de evidencia, 2 por lo que el desarrollo de técnicas de análisis específicamente pensadas para las investigaciones sociales es sumamente deseable. Tales técnicas tienen vasta aplicabilidad, ya que los problemas de evidencia presentados por el método de encuesta son bastante típicos en toda investigación en ciencias sociales. Una aproximación a los problemas especiales de la investigación por encuesta es el uso de varios indicadores diferentes para representar un único concepto subyacente. 3 El presente trabajo sugiere, además del uso habitual, el uso combinado de indicadores múltiples, en el que el investigador observa asociaciones individuales entre cada indicador del concepto independiente y cada indicador del concepto dependiente. Si bien este procedimiento existe, por lo menos, desde el análisis de Durkheim de las estadísticas de suicidio, es raramente usado hoy, a pesar de sus importantes beneficios. Este trabajo bosqueja la ventaja específica de ese proceso y discute las maneras en que provee evidencia en combinación con otras técnicas de investigación por encuesta. Indicadores múltiples El uso de indicadores múltiples se requiere siempre que el investigador posee conceptos teóricos definitivos que desea relacionar entre sí, pero para los cuales le es imposible obtener o defender definiciones operacionales únicas, no ambiguas y directas. Conceptos tales como edad, sexo y tamaño grupal están muy cerca de las operaciones estandarizadas y sobre las que existe acuerdo, pero éste no es el caso cuando se estudian las relaciones entre variables tales como integración, moral, prejuicio, ajuste y otras. Esta situación, en la que la información detallada que es recogida por los entrevistadores no es en sí misma de importancia teórica, acontece con especial frecuencia en análisis secundarios de los datos de encuesta, desde el momento en que los datos originalmente recolectados reflejan por lo general de manera incompleta el interés teórico del analista. 4 Este trabajo estará dedicado a un problema típico de esa clase: el intento de poner a prueba una relación causal hipotetizada entre dos variables subyacentes. En un problema como éste, el estado de la evidencia es a menudo confundido por el uso inapropiado de un enfoque hipotético-deductivo. El estado de la evidencia es mucho más claro si los requisitos de este enfoque se cumplen muy rigurosamente o si se realiza un franco análisis ex post facto. Por esta razón propondremos, al sugerir el uso de indicadores múltiples, una serie muy rigurosa de puestas a prueba de las hipótesis. Si, como muy a menudo sucede, una de estas pruebas falla, entonces nos vemos llevados a un análisis ex post facto y el problema consiste en extraer la mayor cantidad de información posible de los datos. El objeto del uso individual de los indicadores múltiples es forzar la no aceptación de la hipótesis de investigación en la primera aproximación si algún eslabón de la cadena de razonamientos es inadecuado, y maximizar la información en el próximo análisis ex post facto. Estas metas se alcanzan, en parte, por el uso corriente de indicadores múltiples, que consiste en combinar indicadores en índices complejos y observar las asociaciones entre tales índices. La ventaja de tal análisis se basa, por supuesto, en el hecho de que los indicadores adicionales proveen mayor información. Entre otras cosas, tales índices pueden: 1) aumentar el número de categorías en una variable, permitiendo un análisis más detallado y preciso; 2) aumentar la variabilidad empírica de las medidas a ser relacionadas, 5 y/o 3) representar el concepto subyacente, aun cuando ninguno de los indicadores componentes así lo haga. 6 Sin embargo, sin sacrificar estos beneficios se pueden obtener ventajas adicionales postergando la combinación de indicadores en índices hasta después de que haya sido llevado a cabo el análisis de la pauta de asociaciones entre cada indicador del concepto independiente y cada indicador del concepto dependiente. Comparado con la práctica más frecuente de relacionar un índice 3 compuesto de la variable independiente con un índice de la variable dependiente, el requisito que cada asociación debe cumplir es particularmente riguroso, proveyendo diversas ciases de evidencias muy fuertes. Ventajas del uso individual de indicadores múltiples La hipótesis causal que relaciona dos variables conceptuales puede ser puesta a prueba relacionando cada indicador de la variable independiente con cada indicador de la variable dependiente. Consideremos un problema de la encuesta en el cual cada una de las variables independientes y dependientes será representada por tres indicadores. 7 Una única relación hipotetizada entre dos conceptos nos lleva así a nueve relaciones predichas entre indicadores, donde cada indicador independiente estará asociado con cada indicador dependiente. Para demostrar que esta técnica provee información útil, más que una simple proliferación confusa en la razón de nueve a uno, debemos aclarar la posición de los distintos indicadores frente a su concepto común. Cada indicador es: 1) una representación única de algún aspecto del concepto, 2) una correpresentación, junto con otros indicadores, del mismo concepto, 3) una variable que puede estar relacionada con otros indicadores del mismo concepto, totalmente aparte de su unión común con aquel concepto, y 4) una variable en sí misma, una parte de cuya variación no puede ser explicada ni por el concepto ni por otros indicadores del concepto. Estas características constituyen la base para la siguiente discusión acerca de las ventajas del uso individual de los indicadores múltiples. 1. Control de las terceras variables conocidas y desconocidas. Una posible explicación para cualquier hallazgo —que en lo posible nos gustaría rechazar— es que algún tercer factor conocido o desconocido está relacionado con ambos indicadores y produce una relación espuria entre ellos. En otras disciplinas científicas uno puede intentar manejar estos terceros factores manteniéndolos constantes o haciendo variar al azar su efecto por algún procedimiento como la asignación al azar de grupos de características distintas. Desafortunadamente, en muchas investigaciones sociales, y especialmente en la investigación por encuesta, la azarificación es imposible, y mantener constantes terceros factores, aun cuando sean conocidos, resulta a menudo impedido por el pequeño número de casos o bien por la carencia de datos sobre tales terceros factores. Una ventaja del uso individual de los indicadores múltiples es que ellos proveen alguna evidencia sobre lo espurio. En investigaciones que usan un único indicador de cada variable conceptual, cualquier factor no controlado relacionado con ambos indicadores podría producir una asociación espuria sin conocimiento del investigador. Sin embargo, la adición de un único indicador puede mejorar la situación. Supongamos que tanto Ii1 (el primer indicador de la variable independiente Vi) como Id (el primer indicador de la variable dependiente Vd) están relacionados con el tercer factor Z1, de tal manera que las relaciones I-I pueden ser espurias. Z, sin embargo, no puede ser controlado porque no hay datos al alcance. Se introduce entonces un indicador independiente extra Ii Como se dice más arriba, Ii diferirá de I2; en algunos aspectos, aun cuando ambos son representativos de la variable conceptual independiente. Ciertamente, para nuestro propósito actual, cuanto mayor la diferencia entre Ii1 e Ii2,s tanto mejor es, por que esto hace más probable que Ii2, no esté relacionada con Z1, aun cuando Ii lo esté. Si este es el caso, y si ambos 1i; están relacionados con Id, entonces los resultados no pueden interpretarse corno debidos a la influencia espuria de Z sola. Esto es cierto ya sea que el investigador conozca la existencia de Z o que no la conozca. En una situación de investigación en la cual se hayan empleado tres indicadores muy distintos para representar cada concepto y en la cual las nueve asociaciones Ii – Id fueron observadas todas tal como fueron predichas, sería difícil sostener que los hallazgos se produjeron en forma espuria. Varios de los terceros factores Z conocidos pueden dejar de ser considerados porque no se relacionan con todos los indicadores, y la posibilidad de algún Z desconocido que produce espuriamente los hallazgos se reduce en forma similar. Sería posible, por supuesto, interpretar cada asociación como espuria, debida a un tercer factor especial, pero en ese caso se requerirían nueve Z para explicar los hallazgos. Y esto no es muy práctico. Por ejemplo, en la investigación por encuesta, el efecto de respuesta ∗ —la inclinación de un respondente a contestar varias preguntas de la misma forma, debido a alguna característica de la situación de entrevista— es siempre un factor que puede producir asociaciones espurias. Este problema puede enfrentarse a través de la medida de cada concepto con indicadores basados en diferentes métodos, cambiando, de esta ∗ Response-set. (N. del T.) 4 manera, el carácter de la situación en la cual se produjo la respuesta. 8 La ocurrencia de todas las asociaciones, tal como fueron predichas, tiende a eliminar ese efecto de respuesta como una explicación. Por supuesto, un tercer factor único podría explicar la causa de todas las asociaciones observadas. Esto es más probable que suceda si algún tercer concepto subyacente está influyendo tanto al concepto independiente como a las variables dependientes. Los indicadores múltiples no proveen ayuda en esta situación. Pero el problema aquí es tanto conceptual como empírico: una preparación conceptual cuidadosa para la investigación debería identificar tales terceros factores de modo que ellos puedan ser directamente controlados. Finalmente, debería anotarse que el investigador pierde información sobre lo espurio si combina los indicadores de cada variable conceptual en un índice compuesto y simplemente relaciona estos dos índices. Por ejemplo, supongamos que cuatro de las nueve asociaciones se dan corno se predijo. Supongamos además que los indicadores involucrados en las cuatro asociaciones exitosas son todos consecuencias plausibles de algún tercer factor, Z, mientras que las otras cinco asociaciones incluyen, por lo menos, un indicador que podría no estar relacionado con Z. La interpretación ex post facto más fuertemente sugerida es que Vi y Vd no están, en verdad, relacionadas, pero que Z puede producir la aparición de una relación entre ellas. Ahora bien, si se han observado relaciones entre índices compuestos y no asociaciones individuales, podría haber aparecido una única asociación moderada, pero el investigador habría tenido menos probabilidad de reconocer esto corno un resultado espurio. Este uso de indicadores múltiples no alcanza el rigor de la azarificación, pero al disminuir la posibilidad de que ciertos terceros factores conocidos o desconocidos estén actuando para producir los efectos de resultados, cumple la misma clase de función en una medida que no sería posible alcanzar en la investigación por encuesta. De este modo, nuestra confianza en la relación conceptual hipotetizada se incrementa. Y si el estudio se convierte en un análisis ex post facto debido al fracaso de una o más pruebas, como en el ejemplo citado más arriba, el efecto de resultados puede ayudarnos a identificar las razones del fracaso. 2. Validación de los indicadores. Si se despoja al concepto "validez" de sus sobretonos metafísicos, éste se refiere, esencial-mente, al grado en el cual una variable subyacente y un indicador categorizan a las unidades estudiadas en la misma manera. Aunque no podemos salvar directamente la distancia entre concepto e indicador, esto es, observar directamente el grado de covariación entre las dos caracterizaciones, la empírica y la conceptual, algunos artificios han sido desarrollados para evaluar la validez. Conceptualmente, los indicadores son evaluados en términos de su "validez externa". Esto significa, esencialmente, preguntarse: "En términos del conocimiento presente, ¿X es un indicador lógico (o tal vez sensible) del concepto Y?". De no mayor importancia pero de gran interés por el momento, son los artificios empíricos: ¿cómo evalúa uno la validez de un indicador con datos? La respuesta depende de la naturaleza de la investigación. Algunos tipos de investigaciones sociológicas —análisis factorial, por ejemplo— apuntan a determinar inductivamente la naturaleza de una variable subyacente por medio del análisis de las asociaciones entre diferentes indicadores del mismo concepto. Pero esta técnica no es enteramente apropiada para la validación de los indicadores en las investigaciones del tipo de las que son más relevantes para este trabajo: investigaciones cuya meta es probar una relación hipotetizada entre conceptos previamente definidos. 9 Esto es así porque dos indicadores diferentes de un concepto no tienen necesariamente una relación lógica entre ellos, a menos que la validez de ambos sea muy alta. Como hemos visto, los indicadores son sólo una representación parcial de su concepto (por ejemplo, la covariación entre una variable subyacente y un indicador no es nunca perfecta), y los diferentes indicadores pueden así explicar diferentes partes de la variación en un concepta. 10 Dos indicadores igualmente válidos del mismo concepto pueden, por lo tanto, estar fuertemente relacionados entre sí (con lo cual uno de ellos resulta de poco valor práctico) o bien pueden estar totalmente no relacionados. Indicadores válidos pueden, incluso, estar inversamente relacionados entre sí aunque, por paradójico que parezca, ambos estén positivamente relacionados con el concepto. La satisfacción marital y la duración del matrimonio podrían ser ambos indicadores positivos de la estabilidad matrimonial, por ejemplo, aun cuando la satisfacción marital esté negativamente relacionada con la duración del matrimonio. Tales indicadores podrían ser pensados como alternativas funcionales o aspectos diferentes de la misma cosa, o formas mutuamente excluyentes del mismo fenómeno abstracto o general. Los indicadores que no están relacionados o están inversamente relacionados, son particularmente útiles como indicadores separados o partes de un índice compuesto. Para la investigación que comienza con conceptos bien definidos, la primera y más importante técnica empírica de validación es el uso de variables criterio. Del saber común o de la investigación .previa, conocemos ciertas cosas que deberían estar relacionadas con nuestro concepto, y si nuestro indicador no está 5 relacionado con ellas podemos rechazarlo v dejarlo de lado. Las variables criterio son particularmente útiles porque ayudan a separar la identificación de indicadores válidos de la prueba de la relación conceptual hipotetizada. Esto depende del grado en que los indicadores de Vi; puedan ser probados contra las variables criterio que están relacionadas con Vd y viceversa. Las variables criterio, no obstante, no determinan que un indicador dado debería ser absolutamente aceptado o rechazado como válido; sólo aumentan la probabilidad de la validez. Si una variable criterio fuera suficiente para establecer definitivamente la validez, la usaríamos en lugar de un indicador. No obstante, la evaluación por separado de la covariación entre indicadores específicos y los conceptos subyacentes que ellos representan es sólo parte de una cuestión más importante acerca de la validez, que consiste en el grado en que las asociaciones observadas representan correctamente la relación conceptual subyacente. Por supuesto, si los indicadores fueran perfectamente válidos, las asociaciones entre ellos deberían ser siempre representaciones exactas de la relación subyacente. Pero cualquier alejamiento de la validez perfecta del indicador puede producir asociaciones erróneas. Probando simultáneamente la validez de los indicadores y la relación hipotetizada, el uso de indicadores múltiples evalúa la validez, en su sentido más amplio. Los indicadores que no son perfectamente válidos (y rara vez lo son) solamente expresan una porción de la variación en la variable conceptual que representan. Similarmente, alguna variación en el indicador es independiente de la variable. Esto puede producir asociaciones equívocas (especialmente cuando se usan indicadores únicos) en, por lo menos, dos aspectos: a) El Ii; y el Id pueden categorizar correctamente diferentes partes de la muestra. La asociación observada puede reducir, acrecentar o aun trastrocar la verdadera relación causal, dependiendo esto de la manera en que cada uno ordena la parte que resta. Por ejemplo, supongamos que dos variables conceptuales están perfectamente relacionadas y que el indicador de cada variable es válido hasta el punto en que la mitad de la variación en el indicador es atribuible a, o covaría con, su variable conceptual. En el caso de escalas nominales este grado de validez debería ser expresado en términos de acuerdo: cada indicador categoriza, de manera correcta, la mitad de los individuos en la muestra, esto es, en el mismo sentido en que lo haría la variable conceptual. Ahora bien, si Ii categorizara correctamente la mitad de la muestra y distribuyera la segunda mitad al azar, y si Id categorizara correctamente la segunda mitad de la muestra y distribuyera al azar la primera mitad, probablemente debería resultar una asociación cero a pesar de la perfecta asociación entre las variables conceptuales. De manera similar, una relación conceptual de cero debería estar reflejada en una asociación al menos moderadamente alta del indicador. b) Los indicadores pueden categorizar correctamente la misma parte de la muestra, pero la manera en que ordenan conjuntamente las otras partes puede alterar, en forma marcada, las asociaciones totales observadas. Presumamos que nuestras dos variables conceptuales son completamente independientes entre sí y que, como antes, cada una es medida por un indicador, teniendo un cincuenta por ciento de acuerdo con su concepto. Si tanto Ii; e Id categorizan correctamente la primera mitad de la muestra, entonces no existirá relación en aquella mitad. Pero las clasificaciones Ii, e Id de la segunda mitad de la muestra pueden ser muy similares si estos dos indicadores están relacionados entre sí, debido a la variación específica de cada uno. De esta manera, se puede observar una asociación moderadamente fuerte entre Ii – Id, a pesar de la ausencia de cualquier relación entre los conceptos. Estos errores, por supuesto, llegan a ser menos probables a medida que se pone mayor cuidado en la selección de los indicadores. Pero aun cuando la covariación sea alta, puede haber representaciones falsas. Por ejemplo, dos indicadores pueden categorizar correctamente el setenta y cinco por ciento de la muestra. Si Ii, ordena correctamente los primeros tres cuartos de la muestra e Id los últimos tres cuartos, la mitad de la muestra está, entonces, correctamente ordenada por ambas y refleja así la verdadera relación. Los otros dos cuartos deberían estar, cada uno, correctamente ordenados por un indicador diferente. En esta situación, una perfecta relación entre Vi; - Vd podría producir una asociación media. Y si un indicador relativamente no válido se deslizara en el estudio, podría ocurrir una distorsión muy seria. Si se emplean indicadores únicos o índices compuestos de los conceptos, no hay manera de decidir si la asociación observada es de esta naturaleza específica o idiosincrática. Por otro lado, el uso individual de indicadores múltiples puede acrecentar nuestra confianza en que las asociaciones observadas representan exactamente la relación subyacente. 11 . Si, por ejemplo, se usan tres indicadores para representar a Vi y otros tres para representar a Vd, se hacen nueve predicciones y tienen lugar nueve pruebas. Estas nueve predicciones proceden de un sistema de siete proposiciones: tres afirman la validez de los indicadores independientes, tres establecen la validez de los indicadores dependientes y una afirma la relación hipotetizada entre Vi y Vd. Si las nueve asociaciones resultan como se predijeron, el 6 sistema entero de proposiciones recibe apoyo. La afirmación acerca de que uno o más de los seis indicadores no son válidos puede ser puesta en duda porque sería difícil concluir que un indicador dado no es una representación exacta de un concepto subyacente cuando se "comporta" como se espera en asociaciones con tres indicadores diferentes del concepto. Así resultan difíciles de explicar los hallazgos sobre la base de la covariación idiosincrática entre pares ele indicadores. Mientras que tal explicación es posible, cuanto más indicadores son involucrados, tanto más complicada debería ser tal explicación. Ciertamente, las siete proposiciones enumeradas arriba constituyen una explicación más económica. Si una o más de las asociaciones predichas falla, el uso individual de indicadores múltiples provee una riqueza de información detallada para guiar el análisis ex post facto que debe seguir. En nuestro ejemplo anterior, si las nueve asociaciones observadas están muy cerca de cero, la existencia de la relación llega a ser mucho más dudosa que la validez de los indicadores. 12 Por otro lado, la pauta de los hallazgos puede indicar de manera bastante clara que la relación hipotetizada existe aunque un indicador específico no sea válido. Si seis de las nueve asociaciones se observan tal como se predijeron y las tres asociaciones que fallan involucran un único 1i, probado frente a tres Id, a su vez la pauta sugiere que estas tres asociaciones son erróneas debido a la no validez del 1i, específico. Por otro lado, la pauta de un único fracaso sobre un total de nueve observados sugiere que alguna interacción idiosincrática entre estos dos indicadores ha producido una asociación que no refleja la verdadera relación subyacente. Si no fueron usados indicadores múltiples sino que sólo se ha elegido este par particular de indicadores para la investigación, la peculiaridad de los hallazgos puede haber pasado inadvertida y la asociación aceptada como una indicación exacta de la relación conceptual. Ni en el análisis hipotético-deductivo ni en el ex post facto descripto más arriba, los índices compuestos habrían dado tanta información como el uso individual de indicadores múltiples, simplemente porque lo que había sido acertado sería sólo una asociación "promedio". Puede objetarse, sin embargo, que se ha perdido una de las ventajas especiales de los índices discutidos anteriormente, dado que dos indicadores tomados juntos pueden ser una medida más válida de la variable subyacente que cada indicador usado separadamente. Esto puede ocurrir cuando su uso conjunto produce un efecto de interacción (en el sentido estadístico) que se corresponde con la variable subyacente. Por otro lado, este fin podría obtenerse mejor al observar, después del análisis original, las asociaciones entre pares de indicadores dentro de categorías formadas por uno o más indicadores. De esta manera, los efectos de interacción entre indicadores podrían ser observados en detalle, tanto para la variable independiente como para la variable dependiente. Este conocimiento podría, entonces, guiar la construcción de índices compuestos independientes y dependientes. Por este procedimiento podemos evitar un problema que surge con algunos de los índices compuestos: el investigador no descubre si hay efectos de interacción que están influyendo en la validez de su medición, o qué clase de ellos lo hacen. Cuadro 1 Pauta de resultado de pruebas con seis indicadores ("¿La asociación observada fue tal como se predijo?") Indicadores independientes Indicadores dependientes Id 1 Sí No No I i1 I i2 I i3 Id 2 No Sí Sí Id 3 No Sí Sí Es decir que los indicadores múltiples pueden proveer evidencia referida a la validez de un indicador y esta evidencia se agrega a la que es prevista cuando la investigación se hace con indicadores únicos o con indicadores combinados en índices únicos. El uso de varios indicadores puede asegurarle al investigador que está realmente estudiando relaciones conceptuales y no meramente la manera en que un par particular de indicado-res está asociado con otro. 3. Reforrnulación conceptual. Hemos señalado algunas pautas específicas de resultados que perecen requerir interpretaciones de espuriedad o invalidez. Aun cuando ocurran tales pautas, pero especialmente cuando se observan hallazgos de corte poco claros, el investigador debería considerar si se requiere una reformulación de sus conceptos. 7 Desafortunadamente, cuando se usan indicadores múltiples no hay una regla clara de decisión para indicar qué tipo particular de una interpretación ex post facto es más apropiada; pero, como Blalock lo ha sugerido, siempre que dos indicadores igualmente válidos de un mismo concepto producen diferentes resultados empíricos, el esquema conceptual bien podría estar equivocado. 13 Si la reformulación está en orden, los indicadores múltiples pueden proveer una información muy útil para guiar el trabajo. Por ejemplo, los hallazgos tal corno aparecen en el cuadro I parecerían indicar que las dos variables conceptuales que estamos estudiando tienen dos componentes muy diferentes, y que cada uno de los componentes independientes está relacionado con sólo uno de los componentes dependientes. Los indicadores múltiples pueden así llevar al investigador a fructíferas formas de dividir sus conceptos. También en la investigación multivariable se podría obtener información conducente a sugerir si dos variables deben ser combinadas o deben más bien ser consideradas como una sola. Los indicadores pueden también ser usados en la replicación de una relación bien establecida para mejorar la formulación de las variables conceptuales. Un buen ejemplo de esto es el estudio de Haer sobre la asociación entre cada uno de los cinco indicadores de estratificación social y los indicadores de muchas otras variables que se presume que están relacionadas con el status. 14 Haer pudo hacer ambas cosas: comparar la utilidad de los indicadores y obtener guías para la mejor conceptualización del status social. Como se ha anotado antes, el uso individual de indicadores múltiples se utiliza también en una tarea estrechamente cela donada con la reformulación conceptual: la construcción de indices compuestos. La observación del "desempeño" de muchos indicadores ayudará a seleccionarlos para un índice. La pauta de las asociaciones, considerada juntamente con la fuerza de las mismas, sugerirá los pesos correctos a asignar cuando se combinan los indicadores. En este sentido, la existencia de una relación entre conceptos subyacentes puede ser demostrada por el uso individual de indicadores múltiples y después descrita más precisa y exactamente por la asociación entre índices de las variables independientes y dependientes. Como una ventaja final del uso individual de indicadores múltiples, Blalock ha sugerido recientemente el uso de indicadores para juzgar la dirección del flujo causal entre dos o más variables conceptuales. Ha mostrado de qué manera suposiciones sobre la dirección de las relaciones causales entre variables y sus indicadores, junto con las observaciones de asociaciones de indicadores, pueden ser usadas para generar inferencias sobre la dirección de causación entre los conceptos y también para identificar las relaciones conceptuales que se producen espuriamente. 15 Indicadores múltiples u otras formas de evidencia Concluimos nuestra discusión acerca de los beneficios que resultan de la técnica de indicadores múltiples sugerida, considerando su lugar en otras formas de evidencia al alcance en la investigación por encuesta. Esencialmente, aumentamos nuestra confianza en la verdad de una hipótesis al destruir una explicación alternativa de nuestros hallazgos. Por supuesto, no hay como una prueba completa y final. El problema es extraer de los datos la máxima cantidad de evidencia que aportan a la relación y establecer exactamente la evidencia así obtenida. Cuanto menos plausibles resultan las explicaciones alternativas, tanto mayor es nuestra confianza en la verdad de nuestra relación conceptual hipotetizada. Los problemas peculiares acerca de la evidencia en el método de encuesta se originan en gran medida en el hecho de que los hallazgos de las encuestas están abiertos a muchas explicaciones alternativas que no son rechazadas fácilmente. En el cuadro 2 se presentan cinco explicaciones alternativas incómodas que a menudo se producen en la investigación por encuesta. Cuadro 2 Procedimientos en la investigación por encuesta para eliminar explicaciones distintas de las hipotetizadas Procedimientos Explicaciones alternativas de las asociaciones observadas Producidas espuriamente por terceros factores medidos Replicación independiente Replica interna∗ Control∗ Debidas a indicadores no válidos Debidas a indicadores no válidos Debidas a variación por azar Sí Producidas espuriamente por terceros factores desconocidos o no medidos Sí ……. …….. Sí Sí Sí ……… ……… ……….. Sí …….. …….. Sí ……. 8 Pruebas de significación estadística variables criterio Indicadores múltiples usados individualmente …….. ……… ………. ……... Sí ……….. ………. ………. Sí ……… Sí Sí Sí ……… ………. ∗ Los términos "control" y "replicación interna" se refieren ambos al examen de una asociación dentro de diferentes submuestras formadas por categorías de algunas terceras variables. Difieren en que el propósito de este procedimiento en el control es dejar de lado la posibilidad de que el tercer factor sea responsable de la asociación, mientras que en la replicación interna el propósito es ver cuán a menudo la asociación se repite en diferentes submuestras. Para determinar la probabilidad exacta de que tales asociaciones repetidas puedan ser producidas por casualidad, debe ser aplicada, por supuesto, una prueba estadística. El cuadro muestra qué procedimientos proveen evidencia para la refutación de las explicaciones alternativas: Los indicadores múltiples proveen evidencia acerca de tres tipos de explicaciones alternativas, ninguna de las cuales puede ser concluyentemente rechazada por otros principios de evidencia. Por esto, el valor del uso individual de los indicadores radica en la complementación con otros métodos, con lo que se fortalece la evidencia contra las explicaciones alternativas. De igual interés son las clases de evidencia que los indicadores múltiples no proveen. En primer lugar, resulta claro que la evidencia proporcionada por los indicadores múltiples no tiene el carácter definitivo de aquellas provistas por el control de terceros factores, por ejemplo, las pruebas de significación estadística. Aunque hemos intentado mostrar en este trabajo que nuestra confianza puede ser aumentada de muchas maneras específicas por el uso de indicadores múltiples, no es posible describir el grado exacto de este aumento. En segundo lugar, se debe anotar que los indicadores múltiples no proveen un conjunto de pruebas independientes de la relación hipotetizada, como lo hacen los dos tipos de replicaciones. A consecuencia de esto, no proveen pruebas de que las asociaciones se hayan producido por muestreo u otras fluctuaciones al azar. Si Vi, y Vd están cada una representadas por tres indicadores, se llevan a cabo nueve pruebas. Aun esto constituye sólo una prueba de la relación. Nueve pruebas positivas no proveen evidencia adicional de que la relación existe en el universo, sino solamente de que, en esta muestra, ha sido probada una vez en forma adecuada. Todavía son necesarias replicaciones y pruebas estadísticas. Resumiendo, este método tiene el poder de producir evidencias de cierto tipo, pero no exime al investigador de llevar a cabo operaciones para producir otras formas de evidencia. Ciertamente, los indicadores múltiples son más efectivos cuando se usan en conjunción con otros procedimientos. Por ejemplo, las asociaciones entre cada uno de los indicadores deberían ser examinadas bajo los controles de las terceras variables, y los hallazgos resultantes deberían ser probados por significación estadística. Conclusiones Este trabajo ha discutido el uso de los indicadores múltiples en la investigación por encuesta, en la que se estudia el efecto de una variable conceptual subyacente sobre otra. El método es lo suficientemente general, sin embargo, como para ser extendido con provecho a análisis que involucran más de dos variables y a métodos de la investigación social distintos al de la encuesta. Hemos sugerido que cada indicador de la variable independiente sea asociado con cada indicador de la dependiente, con el objeto de obtener datos con los cuales eliminar tres explicaciones alternativas de la hipotetizada y guiar a una reformulación de los conceptos, si los resultados así lo justifican. Se puede señalar un último punto. Hemos sugerido que ciertas pautas de los hallazgos con indicadores múltiples conducen, claramente, a ciertas interpretaciones. Otras pautas de asociación entre indicadores múltiples pueden no ser tan fáciles de interpretar. Algunas pueden conducir a una reconceptualización de las variables subyacentes, pero otras sólo pueden llevar a la confusión. Sin embargo, esto no debería ser visto como una desventaja del método. El uso individual de indicadores múltiples provee siempre más información que lo que lo hacen indicadores únicos o índices compuestos únicos, y cambiar este conocimiento adicional por hallazgos más fácilmente interpretables sería, en verdad, un mal negocio. 9 Notas 1 Los autores desean agradecer a Lee Bean, H. M. Blalock, Jr., Phillip E. Hammond y Stanley H. Udy, Jr., por sus críticas y consejos. 2 Para una discusión convincente de los problemas especiales de evidencia en la investigación sociológica no experimental, comparada con el experimento controlado, ver Samuel A. Stouffer, "Somme Observations on Study Design", American Journal of Sociology, IV, enero 1950, pp. 355-61. Más recientemente, el problema de la evidencia estadística ha sido enfatizado (ver Hanan C. Selvin, "A Critique of Tests of Significance in Survey Research", American Sociological Review, XXII, octubre 1957, pp. 519-27; Robert McGinnis, "Randomization and Inference in Sociological Research", American Sociological Review, XXIII, agosto 1958, pp. 408-14; y Leslie Kish,."Some Statistical Problems. in Research. Design", American Sociotogical Review, XXIV, junio 1959,pp. 328-38. 3 Algunos aspectos de este método, particularmente la creación y selección de indicadores, han sido discutidos recientemente por Paul F. Lazarsfeld (ver su "Problems in Methodology", en Robert K. Merton, L. Broom y Leonard S. Cottrell, Jr. (editores), Sociology Today: Problems and Prospects, Basic Books, Nueva York, 1959, esp. pp. 47-C T. (Reproducido parcialmente en: F. Korn y otros, Conceptos y variables en la investigación social, Nueva Visión, Buenos Aires, 1969.) 4 Una estrategia alternativa en análisis de encuesta es intentar construir una teoría social alrededor de los tipos de información que son directamente accesibles a través de les métodos de encuesta, asegurando así una conexión mayor y más confiable entre concepto y definición operacional, aun a costa del poder teórico y la sobriedad. El procedimiento de indicadores múltiples, por otro lado, representa un intento de alcanzar estos fines científicos, a pesar de posibles ligazones débiles entre conceptos y datos. 5 La proporción de la variación en una variable que puede ser explicada por alguna otra depende de la cantidad total de variación empíricamente presente. Desarrollando un índice, puede producirse una distribución con mayor variancia que la de cualquiera de los indicadores componentes. Puede también reducirse la variancia, pero algunas técnicas de construcción de índices han intentado prevenir esta situación 6 La manera en que esto puede ocurrir se discute más adelante. 7 Ocasionalmente, menos de nueve predicciones pueden ser justificadas. Si el indicador de la variable dependiente es concebido como una causa de aquella variable y el indicador de la variable independiente es pensado como un resultado de la misma, entonces los dos indicadores podrían no estar asociados, a pesar de la relación entre las variables conceptuales (ver Hubert M. Blalock, Jr., "Making Casual Inferences for Unmeasured Variables from Correlations among Indicators". 8 Pueden hacerse preguntas orientadas en forma diferente, como en Gerhard E. Lenski y John Legett, "Caste, Class and Deference in the Research Interview", American Journal of Sociology, LXV, marzo 1960, pp. 463-67; o pueden usarse métodos completamente diferentes, como en Leroy S. Burwen y Donald T. Campbell, "The Generality of Attitudes toward Authority and Nonauthority Figures", Journal of Abnormal and Social Psychology, LIV, enero 1957, pp. 24-31. 9 Lazarsfeld opina acerca de este punto en "Problems in Methodology", op. cit., pp. 60-67. 10 sin embargo, pueden requerirse muchos indicadores para representar completamente un concepto. Esto sugiere otro beneficio del uso de indicadores múltiples (individualmente o combinados). Si, con Louis Guttman, pensarnos cada concepto corno representado por un universo potencial de indicadores, cuanto más grande es nuestra muestra de este universo —por ejemplo, cuanto más indicadores de un concepto empleamos—, mayor es la probabilidad de que el concepto esté adecuadamente representado en el estudio. Esto presume, por supuesto, que el universo de indicadores es algo heterogéneo, por ejemplo que las covariaciones entre el concepto y los indicadores no son todas de la misma clase. 11 Sin embargo, se anotaría que esta técnica no produce ninguna evidencia de que la relación de la muestra representa correctamente la relación del universo 12 Para un ejemplo en el que este procedimiento fue usado con ventajas, ver Burwen y Campbell, op. cit., esp. pp. 29-30. 13 Social Statistics, McGraw-Hill Book Co., Nueva York, 1960, p. 11 [hay vers. cast.: Estadística Social, Fondo de Cultura Económica, México, 1965]. 14 John L. Haer, "Predictive Utility of Five Indices of Social Stratification", American Sociological Review, XXII, octubre 1957, pp. 541-46. 15 "Making Causal Inferences for Unmeasured Variables from Correlations among Indicators", op. cit. 10