Trabajo de Investigación Fin de Master RESPUESTA ALEATORIA Y TÉCNICAS DE PREGUNTAS INDIRECTAS Master Oficial en Estadística Aplicada Departamento de Estadística e Investigación Operativa Universidad de Granada Autora: Beatriz Cobo Rodríguez Tutora responsable: María del Mar Rueda García Curso 2012/2013. Convocatoria de Junio RESPUESTA ALEATORIA Y TÉCNICAS DE PREGUNTAS INDIRECTAS Trabajo de Investigación realizado por Beatriz Cobo Rodríguez y dirigido por María del Mar Rueda García para aspirar al Máster en Estadística Aplicada por la Universidad de Granada. Fdo. Beatriz Cobo Rodríguez Vº.Bº. Directora del trabajo fin de Máster Fdo. María del Mar Rueda García Departamento de Estadística e Investigación Operativa Universidad de Granada Curso 2012/2013 ÍNDICE Introducción…………………………………………………………………………….1 Capítulo 1: Técnicas de Respuesta Aleatoria en Diseños de Muestreo General..…5 Introducción……………………………………………………………….. 5 Modelo W………………………………………………………………….. 5 Modelo U………………………………………………………………….. 10 Modelo C…………………………………………………………………... 11 Modelo H………………………………………………………………….. 12 Modelo D………………………………………………………………….. 14 Modelo M (Técnica de respuesta aleatoria de Mangat y Singh)…………... 14 Modelo de pregunta no relacionada……………………………………….. 16 Técnica de respuesta aleatoria de Kuk…………………………………….. 18 Técnica de respuesta aleatoria de Christofides……………………………. 20 Esquema de respuesta forzada…………………………………………… 21 Esquema de Mangat………………………………….……………..……... 23 Esquema de Mangat, Singh, y Singh……………………………………… 25 Esquema de Singh y Joarder………………………………………………. 26 Esquema de Dalenius y Vitale…………………………………………….. 28 Esquema modificado por Pal de Takahasi y Sakasegawa ………………… 29 Técnica de respuesta aleatoria de Liu, Chow, y Mosley…………………... 30 Capítulo 2: Otras técnicas de Respuesta Aleatoria…………………………………33 Introducción……………………………………………………………….. 33 Sinha y Hedayat……………………………………………………...……. 33 R. Arnab……………………………………………………………..…….. 34 Nayak, Nayak y Adeshiyan, Christofides, y Quatember……………..…… 36 Guerriero y Sandri…………………………………………………………. 38 Padmawar y Vijayan…………………………………………………......... 38 Trabajos en respuesta aleatoria por N.S. Mangat, Ravindra Singh, Sarjinder Singh, Sat Gupta, y Bhisham Gupta………………………...…... 39 Sarjinder Singh, Stephen Horn, Ravindra Singh, y N.S. Mangat…………. 44 Sarjinder Singh, Stephen Horn, y Sadeq Chowdhury……………………... 44 Chang y Liang……………………………………………………………... 44 Kajal Dihidar………………………………………………………………. 45 Chang, Wang, y Huang y Huang…………………………………….……. 46 Kim y Elam y Kim y Warde………………………………………..……... 46 Kim, Tebbs, y An, Chua y Tsui: Sus trabajos………………………….….. 48 Carlos N. Bouza……………………………………………………...……. 49 Joe Kerkvliet……………………………………………………..…..……. 49 N.J. Scheers………………………………………………………………... 50 Umesh y Peterson……………………………………………………...…... 50 Chris Gjestvang y Sarjinder Singh……………………………………...…. 51 Landsheer, Heijden, y Gils……………………………………………..….. 51 Heijden y Gils…………………………………………………………..…. 52 Heiden, Gils, Bouts, y Hox……………………………………………..…. 52 Tracy y Mangat……………………………………………………………. 52 Sanghamitra Pal………………………………………………………...…. 53 Amitava Saha…………………………………………………………...…. 54 Strachan, King, y Sarjinder Singh……………………………………..…... 54 Sanghamitra Pal………………………………………………………….... 55 Ardo van den Hout y P.G.M. van der Heijden…………………………….. 55 D.E. Stem y R.K. Steinhorst………………………………………………. 56 Ravindra Singh, Sarjinder Singh, y N.S. Mangat…………………………. 56 D.R. Bellhouse…………………………………………………………….. 56 Yan, Zaizai y Nie, Zankan……………………………………………...…. 56 Capítulo 3: Aplicaciones de la técnica de Respuesta Aleatoria………………...…..59 Introducción…………………………………………………………….…. 59 Ejemplo de la Universidad Nacional de Callao…………………………… 59 Ejemplo de la Universidad de Granada………………………………...….. 64 Bibliografía…………………………………………………………………………….79 Referencias………………………………………………………….……... 79 Enlaces de interés……………………………………………………..…… 87 Respuesta aleatoria y técnicas de preguntas indirectas INTRODUCCIÓN Una encuesta es un procedimiento de investigación que se basa en interrogar a una muestra de individuos. Para que los resultados obtenidos sean creíbles es necesario, entre otros aspectos, que el modo de encuestación tenga suficiente calidad o validez, lo que exige asumir que las respuestas de los individuos son ciertas además de otros requisitos. Por lo tanto, en la búsqueda de respuestas seguras, los encuestadores se enfrentan a varias dificultades, las cuales son inherentes a toda persona encuestada: inclinaciones, tendencias, actitudes, formas de pensar y comportarnos, tiempo disponible, confianza y desconfianza, propensión a mantener la intimidad, etc. Debido a todo esto el problema típico que surge consiste en la deseabilidad social, la cual se define: como la tendencia de las personas encuestadas a responder en función de lo que es aceptable socialmente, por lo tanto existen: Características sensitivas: situaciones donde los entrevistados sienten dañada su intimidad al pedir que respondan un cuestionario. Preguntas sensitivas: sirven para captar las características sensitivas de los entrevistados, las cuales se tienen que manejar con cuidado debido a la no respuesta o la respuesta falseada, contestando lo socialmente deseable. En estudios de encuestas por muestreo el interés frecuentemente se centra en aspectos sensibles o confidenciales para las personas entrevistadas, tales como uso de drogas, evasión de impuestos, preferencias sexuales, honestidad en exámenes finales en estudiantes universitarios, opinión respecto a autoridades, etc. Por tal motivo, muchos entrevistados rehúsan a participar en la encuesta o proporcionan respuestas falsas o respuestas condicionadas, ocasionando que la precisión y confiabilidad de los estimadores se alteren de una manera importante. La técnica de Respuestas Aleatorizadas (RA) introducida por Warner es una posible solución para la protección del anonimato del entrevistado y es introducida para reducir el riesgo de evasión o no respuesta de preguntas sensitivas. Consiste en la utilización de un mecanismo aleatorio por medio del cual se selecciona una de dos preguntas complementarias: ¿pertenece al grupo con la característica A? o ¿pertenece al grupo que 1 Introducción no tiene la característica A?, donde A es la característica sensible de interés. El entrevistado contestará sí o no y el entrevistador no tiene la posibilidad de saber qué pregunta contestó el entrevistado, protegiendo así la confidencialidad del mismo. Supuestos de la técnica de Respuestas Aleatorizadas: Los eventos son independientes del valor de la variable verdadera. El número de personas entrevistadas debe ser grande (ley de los grandes números). Las personas entrevistadas entiendan perfectamente el procedimiento y lo sigan correctamente. Ventajas y desventajas de la técnica de Respuestas Aleatorizadas Ventajas: Aumenta la probabilidad de contestar la verdad respecto a una pregunta directa. Mayor índice de respuesta. Desventajas: Aumento en la complejidad de la pregunta. Dificultad en entender el método de aleatorización. Requiere de muestras de tamaños grandes. La estructura de este trabajo se forma a través de capítulos, donde se van presentando distintas técnicas de respuesta aleatoria, tanto introductorias como complementarias. En el capítulo 1 tratamos el modelo de Warner y algunas de sus modificaciones por parte de otros autores. Warner (1965) en su modelo pionero, para afrontar el problema de la recogida de datos fiables relativos a la información sensible dicotómica en una característica humana su complementario y , esencialmente recomienda acercarse a una persona para que sea muestreada en una comunidad, con una caja que contiene un cierto número de cartas indistinguibles, de las que una proporción resto marcadas ⁄ está marcada y el . A la persona elegida se le pide que extraiga una carta “aleatoria” y responda “Sí” a una “coincidencia” entre el tipo de carta y la característica real propia de la persona, o un “No” para una “no coincidencia”, antes de devolver la carta a la caja. 2 Respuesta aleatoria y técnicas de preguntas indirectas No importa cómo se elige una muestra, es posible obtener por cada persona etiquetada , , un valor , como 1 si tiene la característica , o 0 si la característica es , y un estimador insesgado , en lugar de , con una varianza en términos de , con respecto al experimento aleatorio involucrado en la recopilación de datos. Warner se restringió exclusivamente a las muestras elegidas por muestreo aleatorio simple con reemplazamiento, teniendo una respuesta aleatoria por el método anterior de forma independiente cada vez que se elige una persona al azar. Aquí consideramos brevemente el desarrollo actual con variaciones en los procedimientos de estimación, teniendo en cuenta las unidades que son distintas, utilizando sólo una respuesta aleatoria de la persona o todas las respuestas aleatorias por separado, generadas cada vez que la persona aparece en la muestra, manteniendo el número total de extracciones en la muestra intacto o, al número de extracciones se le permite continuar hasta un número predeterminado de unidades distintas que aparezcan en la muestra. Este ejercicio teórico está motivado porque en el contexto de las encuestas de respuesta directa, Basu (1958), Pathak (1962), Des Raj and Khamis (1958), Lanke (1975a), Chikkagoudar (1966), Asok (1980) entre otros, desarrollaron teorías detalladas de estimación con estos tres aspectos del muestreo aleatorio simple con reemplazamiento. Nuestro interés colectivo es acerca de cómo estos se modifican con respuesta directa al ser reemplazados por respuesta aleatoria. La teoría de estimación desarrollada por los seguidores de Warner se limitó sólo a la situación del muestreo aleatorio simple con reemplazamiento. Más importante aún, los medios sencillos para las transformaciones adecuadas de todas las respuestas aleatorias generadas, no importa cuántas veces la misma persona da la respuesta aleatoria independientemente en cada aparición en la muestra, constituyeron la base de la estimación de la proporción de personas que tienen un atributo sensible. El único requisito en la estimación es la probabilidad de inclusión positiva de cada individuo y también de cada par de miembros distintos de la comunidad. En este capítulo, se expone cómo esto puede logarse por varias técnicas de respuesta aleatoria desarrolladas hasta la fecha. 3 Introducción En el capítulo 2 se abordan otras técnicas de respuesta aleatoria. La investigación sobre la teoría y las técnicas de respuesta aleatoria como se discute hasta ahora a través de la bibliografía publicada se centra principalmente en (1) la recomendación de estimadores más precisos para una proporción de la población mediante el desarrollo de mecanismos de recolección de datos más claros, (2) evaluar el grado de protección de la privacidad ofrecida por los procedimientos respectivos, para cada uno de los encuestados elegidos por muestreo aleatorio simple con reemplazamiento, y (3) cubrir la estimación de la “media o total” de una variable de interés a través del esquema de muestreo general además, posiblemente de maneras óptimas. Se reserva para el capítulo 3 la aplicación de la técnica de respuesta aleatoria viendo varios ejemplos. Ambos son aplicaciones a datos reales, realizados a alumnos universitarios por parte de su Universidad. El primero de ellos fue realizado en la Universidad Nacional del Callao, en el que se compararon los resultados de la respuesta directa frente a la respuesta aleatoria mediante una encuesta en la que las preguntas serían las mismas para ambos métodos. El segundo, es una aplicación que hemos realizado en la Universidad de Granada, mostrando uno de los métodos de respuesta aleatoria explicados posteriormente, modelo U, desarrollado de forma manual obteniendo todas las fórmulas necesarias, e implementado en R para concluir los resultados. 4 Respuesta aleatoria y técnicas de preguntas indirectas CAPÍTULO 1: TÉCNICAS DE RESPUESTA ALEATORIA EN DISEÑOS DE MUESTREO GENERAL Introducción Cada persona en una comunidad dada se supone que tiene una característica de interés, digamos, o su complementario , que puede o no puede ser de interés. Por ejemplo, uno puede ser evasor de impuestos, una característica ser un honesto pagador de impuestos teniendo que vale la pena ocultar o puede , una característica que no es necesario ser ocultada. Una vez más, una persona puede ser desleal o leal a su jefe que es un gerente general del cuerpo corporativo. Cualquiera de las dos características valdría la pena mantenerlas en secreto. Puede ser de utilidad social para formar una idea precisa sobre el porcentaje, en una determinada comunidad, de personas que pueden tener una característica socialmente rechazada, por ejemplo, . Temiendo que pudiera ser poco ético para los investigadores sociales preguntar directamente a una persona sobre si tiene o no la tiene, y también pensar que una respuesta verdadera o cualquier respuesta de entre todas, no pudiera ser obtenida mediante preguntas directas sobre , apareció durante mucho tiempo una necesidad social de dar con un truco adecuado para enfrentar con éxito esta situación. En 1965, Warner proporcionó la técnica de respuesta aleatoria, publicada en el Journal of American Statistical Association. Esta técnica (RA) ha propiciado que se generen una serie de enfoques, entre los que destacan los siguientes modelos: Modelo W (Warner, 1965) Este método de respuesta aleatorizada fue desarrollado por Stanley Warner en 1965. Él mostró que es posible estimar la proporción sin que el encuestado revele su postura personal respecto a la pregunta. El objetivo es alentar a las personas para que den respuestas veraces conservando completamente la confidencialidad de sus respuestas. El método consiste en clasificar a las personas en los grupos persona estará en uno de los grupos, características de interés (grupo o . Sea y , respectivamente. Cada la proporción de personas con ciertas ). El objetivo es estimar sin preguntar a cada 5 Técnicas de respuesta aleatoria en diseños de muestreo general persona directamente si pertenece o no al grupo . A continuación se presenta el procedimiento propuesto por Warner: Se construye un mazo de cartas, pero una fracción de ellas , se marca con la letra (grupo ) y la fracción restante, , con las letras faltantes del abecedario (grupo ). Se selecciona una muestra aleatoria simple o estratificada de individuos con reemplazo de tamaño , de la población ( ). A cada individuo que va a responder se le enseña el mazo de cartas para que vea que las cartas están marcadas con las letras del abecedario. En seguida se baraja adecuadamente el mazo de cartas y se le pide al individuo que seleccione una carta, pero que no nos diga con que letra está marcada. A continuación se le explica que se le va a hacer una pregunta y que la responda con “sí” o “no”, pero resaltando que ponga mucha atención a la pregunta. Responda a la pregunta ¿Tienes la característica sensitiva?, si la carta que obtuvo está marcada con la letra , por el contrario responda a la pregunta ¿No tienes la característica sensitiva?, si obtuvo cualquier otra letra del abecedario. Se tiene que hacer énfasis en que debe de responder con la verdad a las preguntas y que solamente tiene que responder una de ellas dependiendo de la letra que obtuvo, es decir, si la carta que obtuvo está marcada con la letra debe responder con la verdad a la pregunta delicada y esta sería su única respuesta, lo mismo que si le toco cualquier otra letra del abecedario debe de responder con la verdad a la segunda pregunta y esta sería la única respuesta. La carta elegida por un individuo tiene que ser reemplazada antes de entrevistar a la siguiente persona. Este procedimiento se aplica a todos los Con las individuos. respuestas de “sí” y “no” se hacen las estimaciones correspondientes con los estimadores propuestos. Es importante resaltar que el mecanismo de aleatorización puede ser una baraja, un dado, una moneda, una urna, etc., pero se debe tener claro cuál es su equivalente a la región y su respectiva probabilidad. Por ello, es importante recordar que el experimentador puede elegir arbitrariamente la fracción pero no debe ser igual a ⁄ . Tampoco se debe usar 6 de cartas marcadas con , porque el entrevistado se Respuesta aleatoria y técnicas de preguntas indirectas daría cuenta que se le está preguntando si pertenece o no al grupo quiere responder. Un valor de ⁄ , o sea, lo que no es usualmente adecuado. Este método requiere generalmente un tamaño de muestra muy grande para obtener una varianza del estimador razonablemente pequeña. Se necesita un tamaño de muestra grande debido a que cada respuesta origina poca información sobre la proporción poblacional, . Definimos la variable de interés como si la persona i-ésima tiene la característica si la persona i-ésima tiene la característica ⁄ El objetivo es estimar adecuadamente la proporción Definimos una variable que toma valores teniendo . si la respuesta aleatoria de Warner produce una coincidencia entre el tipo de carta y persona i-ésima y ∑ , es decir, la característica de la en otro caso. Genéricamente escribimos , para la esperanza y la varianza con respecto a Warner. Para la técnica de Respuesta Aleatorizada de Warner, se deduce que que conduce a y Además, puesto que y ( ) y por lo tanto Aquí son variables independientes en todo , con . Warner dio su teoría de la técnica de respuesta aleatorizada sólo con respecto a la selección de individuos mediante muestreo aleatorio simple con reemplazamiento. También, cada vez que una persona pasa a ser seleccionada, una respuesta aleatoria es recogida independientemente a petición de la persona y un estimador insesgado para se obtiene a partir de todas estas respuestas aleatorias. 7 Técnicas de respuesta aleatoria en diseños de muestreo general Por lo que tiene la esperanza y ∑ ̅ tiene la esperanza ∑ ̅ ̅ También, ̅ Escribiendo como los operadores genéricos de esperanza y varianza para cualquier diseño de muestreo y tenemos ̅ ̅ ∑ ̅ en este caso y ( ̅ ) ̅ Escribiendo ∑ y puesto que , Warner consiguió ̅ Escribiendo ∑ 8 ̅ Respuesta aleatoria y técnicas de preguntas indirectas resulta que ̅ . Warner, sin embargo, observó que ∑ es un estimador insesgado para una distribución binomial sigue con porque en el caso de muestreo aleatorio simple con reemplazamiento, es la probabilidad de que una persona, cada vez que hace una extracción, pueda responder verdaderamente “sí” a la aplicación de la técnica de respuesta aleatoria de Warner. Notando ∑ como el número total de observaciones de respuestas afirmativas en extracciones por muestreo aleatorio simple con reemplazameinto y ̂ Warner (1965) calculó ̂ ̂ ̅ . Se puede comprobar fácilmente que como un estimador insesgado de . Generalización a un diseño muestral general De esta población probabilidad , una muestra de personas etiquetadas es seleccionada con una de acuerdo a una probabilidad de diseño probabilidad de inclusión de individuos es ∑ ∑ es y . Para esta , la y para un par distinto de . Restringimos los diseños para que . Por lo tanto, estimaremos ∑ por [∑ ] [∑ ∑ ] Entonces, sabiendo que ∑ 9 Técnicas de respuesta aleatoria en diseños de muestreo general y que la varianza de Horvitz y Thompson es ∑∑( ) ( ) ∑ siendo ∑ ∑ tenemos ∑ ∑( )( ) ∑ ( ) ∑ ∑ siendo y ̂ ∑ ∑( ) ∑ siendo { Modelo U (Greenberg et al., 1969) En esta técnica se ampliaron y perfeccionaron las investigaciones realizadas por Warner acerca de aleatorizar las respuestas de los encuestados. Al igual que el modelo W tiene un mecanismo aleatorio que selecciona una de dos preguntas, pero mientras una pregunta corresponde al aspecto sensible, la segunda pregunta no tiene nada que ver, es sobre algún otro aspecto inocuo, es decir, reemplazamos la pregunta sensitiva complementaria por una inocua, que va a producir una respuesta afirmativa con probabilidad conocida. La pregunta sensitiva vuelve a tener probabilidad , y la inocua . Si la probabilidad conocida de producir una respuesta afirmativa a la pregunta inocua es encontramos que en general { 10 , Respuesta aleatoria y técnicas de preguntas indirectas siendo y Por lo que Por lo tanto, estimamos ∑ por ∑ [∑ ∑ ] y ∑ ∑( )( ) ∑ ∑ ∑ ∑( )( ) ∑ ∑ ∑( )( ) ∑ ∑ ∑ La comparación de los modelos W y U se ha hecho en el marco de poblaciones infinitas (Moors, 1971), resultando el modelo U más eficiente que el W. Modelo C Una forma de mejorar la precisión de un estimador es introducir información auxiliar correlacionada con la variable de interés. A diferencia del modelo U, que considera la introducción de una variable inocua no relacionada con la variable sensitiva modelo C la variable inocua está correlacionada con , en el , pero no afecta a la sensibilidad del individuo, manteniéndose así la confidencialidad del entrevistado. 11 Técnicas de respuesta aleatoria en diseños de muestreo general En este nuevo enfoque se aprovecha la información contenida en la correlación de la variable sensible con la variable inocua para tener una mejor estimación en términos de sesgo y varianza, bajo un esquema de muestreo en poblaciones finitas. El procedimiento de muestreo es exactamente como en el modelo U. Encontramos siendo y Por lo tanto, estimamos ∑ por ∑ [∑ ∑ La varianza del estimador decrece al aumentar la correlación de ] con . Modelo H (Horvitz et al., 1967) El modelo H es una alternativa al esquema de Warner que permite una mayor protección del anonimato del entrevistado sin utilizar la pregunta complementaria. Consiste en que cada elemento de la muestra selecciona aleatoriamente una de tres proposiciones: (1) la sensitiva, (2) una instrucción que dice sí y (3) una instrucción que dice no, con probabilidades y Para el modelo H se imponen las siguientes restricciones: Se tiene { 12 . Respuesta aleatoria y técnicas de preguntas indirectas donde siendo y Por lo que Por lo tanto, estimamos por ∑ ∑ [∑ ∑ ] y ∑ ∑( )( ) ∑ ∑ ∑ ∑( )( ) ∑ ∑ ∑ 13 Técnicas de respuesta aleatoria en diseños de muestreo general Modelo D (Devore, 1977) Esta propuesta es análoga al modelo U, con una diferencia básica, la pertenencia al grupo inocuo se establece con probabilidad uno. Para este modelo tenemos { donde siendo y Por lo que Por lo tanto, estimamos por ∑ ∑ [∑ ∑ ] y ∑ ∑( )( ) ∑ ∑ ∑ ∑( )( ) ∑ ∑ ∑( )( ) ∑ ∑ ∑ Modelo M (Técnica de respuesta aleatoria de Mangat y Singh) (Mangat y Singh, 1990) Esta técnica de respuesta aleatorizada es una ligera modificación de la técnica de Warner en el siguiente sentido. 14 Respuesta aleatoria y técnicas de preguntas indirectas En el modelo M propuesto por Mangat y Singh (1990) el mecanismo aleatorio proporciona respuestas independientes con dos componentes aleatorias. A una persona de la muestra, , se le presentan dos cajas. Se le pide a la persona que coja aleatoriamente una carta de una serie de cartas marcadas o en proporción : Si coge la carta marcada con , la persona debe informar el valor verdadero , que como siempre es 1 si está marcada con . Si la carta está marcada con contiene cartas marcadas con y 0 si está marcada con la persona coge una carta de la segunda caja que y ⁄ en proporciones : . La respuesta aleatoria de la persona será entonces: si el tipo de carta coincide con la característica verdadera o . si no hay ninguna coincidencia. La actual operación no debe ser compartida con el investigador que sólo observa los números. La respuesta aleatoria de puede denotarse como . Entonces, si la primera caja da una carta con si la primera caja da una carta con Entonces, Así que, Por lo tanto, tiene Sabiendo que: Entonces, Ahora, ( ) 15 Técnicas de respuesta aleatoria en diseños de muestreo general Así que, Si , se reduce a Por lo tanto, estimamos ∑ por ∑ [∑ ∑ ] y ∑ ∑( )( ) ∑ ∑ ∑ ∑( )( ) ∑ ∑ Modelo de pregunta no relacionada Horvitz et al. (1967) seguido por Greenberg et al. (1969) recomendaron una alternativa a la técnica de respuesta aleatoria de Warner (1965). Sugieren que al igual que atributo , el puede ser también estimado. Así, la gente puede sentirse incómoda al darnos su característica y , aunque aleatoricemos el procedimiento sin revelar al investigador el resultado realmente observado en la técnica de respuesta aleatoria. Junto con el atributo sensitivo a investigar , generalizan uno no relacionado . Así, mientras utilizan para denotar la marca , otra variable en lugar de su complementario 16 . se introduce para denotar la marca Respuesta aleatoria y técnicas de preguntas indirectas Así si está marcada con si está marcada con y si está marcada con si está marcada con El objetivo es estimar ∑ El modelo se emplea de la siguiente manera: Llenamos dos cajas con un gran número de cartas similares, excepto que en la primera caja una proporción complementaria proporciones son de ellas está marcada con está marcada con y , siendo y la proporción , mientras que en la segunda caja estas distinto de . Elegimos una sola muestra y todas las personas de ella extraen una carta al azar de la primera caja y repiten esto de forma independiente con la segunda caja y en el primer caso dan la respuesta aleatoria como si el tipo de carta coincide con la característica de la persona o si esta no coincide y en el segundo caso dan la respuesta aleatoria como si hay coincidencia si no hay coincidencia Resulta que y dándonos que conduce a tal que 17 Técnicas de respuesta aleatoria en diseños de muestreo general ya que obtenemos ( ) Del mismo modo, La estimación insesgada de es simple como se muestra a continuación: ̂ puede ser tomado como un estimador insesgado de Así que Por lo tanto, la estimación de ∑ . por ∑ ∑ ∑ es un asunto tan sencillo como en el caso del Modelo de Warner. Y su varianza ∑ ∑( )( ) ∑ ∑ ∑ ∑( )( ) ∑ ∑ Técnica de respuesta aleatoria de Kuk Una persona de la muestra se acerca con dos cajas con cartas teniendo como proporciones y , respectivamente ( ) que son de color rojo, las cartas restantes no son rojas. Una persona de la muestra coge 18 cartas con Respuesta aleatoria y técnicas de preguntas indirectas reemplazamiento e informa el número sacado de cartas que son rojas, sin revelar al investigador qué caja utiliza para extraer las cartas. Entendiendo que si la persona tiene una , utilizamos la primera caja, y si la persona tiene , elegimos la segunda. Para la persona i-ésima de la muestra, la respuesta aleatoria es cartas rojas extraídas reemplazamiento. Ya que la , que es el número de de los ensayos independientes realizados con si está marcada con y si está marcada con tiene “distribución binomial”, y y A continuación escribimos ( ) que tiene y ( ) es decir, escribiendo Entonces, es un estimador insesgado de porque 19 Técnicas de respuesta aleatoria en diseños de muestreo general Por lo tanto, estimamos por ( ∑ ) ∑ [ ∑ ∑ ] Y su varianza ∑ ∑( )( ∑ ) ( ) ∑ ∑( )( ∑ ) [ ∑ ∑ ∑ ] Técnica de respuesta aleatoria de Christofides Una persona de la muestra se acerca con una caja de cartas de común forma, tamaño, peso, color, altura, anchura y espesor, pero con marcas diferentes ∑ en proporciones con una petición para extraer aleatoriamente una de estas cartas. La respuesta aleatoria a informar es atributo de la persona es o si es , si el . Por supuesto el atributo real es ocultado al investigador y la marca actual de la carta pasa a ser . Por lo tanto, podemos representar la respuesta aleatoria disponible de la persona i-ésima como Ya que ∑ y ∑ 20 Respuesta aleatoria y técnicas de preguntas indirectas Resulta que y ∑ Tomemos Entonces, y ∑ Por lo tanto, estimamos ∑ por ∑ [∑ ∑ ] Y su varianza ∑ ∑ ∑( )( ∑ ∑( ) )( ∑ ) ∑ ∑ ∑ ∑ Esquema de respuesta forzada Para una persona etiquetada atributo sensitivo en , es el número 1 si tiene el o el número 0 si la persona tiene el atributo complementario, . Para estimar ∑ la técnica de respuesta forzada se aplica de la siguiente manera, sin importar cómo selecciona, la persona etiquetada se acerca a una caja que contiene un gran número de cartas marcadas con “sí”, “no” y “verdadera” en proporciones respectivamente y , . Se solicita a la persona extraer una carta 21 Técnicas de respuesta aleatoria en diseños de muestreo general después de agitar la caja exhaustivamente y no dejar que el investigador conozca el tipo de carta robada, y se le pide que informe sí o no, si el tipo de carta está marcada con “sí” o “no”, o realmente como sí o no si la carta robada está marcada “verdadera” y, si la persona tiene o , respectivamente. Por lo tanto, la respuesta aleatoria de marcada: si responde “sí” si responde “no” Entonces tenemos el siguiente resultado: | | | | Así, ( ) Entonces, vamos a definir Entonces, Por lo tanto, Por consiguiente, { Por lo tanto, estimamos ∑ 22 por ∑ [∑ ∑ ] está Respuesta aleatoria y técnicas de preguntas indirectas Y su varianza ∑ ∑( )( ∑ ) ∑ ∑ ∑( )( ∑ ) ∑ ∑ Esquema de Mangat Mangat (1992), aplica fundamentalmente la misma modificación en el modelo de pregunta no relacionada de Horvitz et al. (1967) y Greenberg et al. (1969) como la aplicada al modelo de Warner por Mangat y Singh (1990). Por simplicidad, él consideraba la situación en la que la proporción de personas característica inocua que tienen una es conocida. Su técnica de respuesta aleatoria impone una persona seleccionada para extraer aleatoriamente una carta de una caja con una proporción de cartas marcadas y el resto marcadas . La instrucción para la persona es decir “sí” si la persona extrae una carta marcada con característica . Si extrae una carta marcada con segunda caja con cartas marcadas o y tiene la , la persona es instruida a usar la en proporciones e informar “sí” o “no”, si el tipo de carta coincide o no coincide con la característica real. La caja y el tipo de carta utilizada no debe ser conocida. Pero la respuesta debe ser verdadera. Por simplicidad, reemplazamiento en asumimos el muestreo aleatorio simple con extracciones. Ya que dos cajas son necesarias para este dispositivo de respuesta aleatoria, Mangat (1992) lo llama técnica de respuesta aleatoria en “dos etapas”. Con persona tenga , respectivamente, como la probabilidad de que una y responda “sí”, él observa El plan aquí es extender esta técnica de respuesta aleatoria de Mangat (1992) para cubrir el caso en que usemos un muestreo general y , la proporción de personas que teniendo 23 Técnicas de respuesta aleatoria en diseños de muestreo general la característica inocua sea desconocida. Entonces el dispositivo necesitaría tres cajas, la primera es exactamente como antes, la segunda es la misma que antes pero con sustituida por y la tercera caja contiene una proporción de cartas marcadas pero y el resto marcadas . La instrucción para el encuestado muestreado etiquetado es como antes, para decir la verdad primero utilizo “la primera caja y si es necesario también la segunda caja” y después independientemente da una segunda respuesta verdadera usando igualmente “la primera caja y si es necesario, la tercera caja.” Dejar si tiene o no, si tiene o no, si (respuesta aleatoria) es “sí”/”no” para el primer ensayo, si (respuesta aleatoria) es “sí”/”no” para el segundo ensayo si es ejecutado por la i-ésima persona de la muestra. Entonces, que conduce a y ya que es igual a ̂ es un estimador insesgado para y por lo tanto Por lo tanto, estimamos ∑ por ∑ ∑ ∑ 24 . Respuesta aleatoria y técnicas de preguntas indirectas Y su varianza ∑ ∑( )( ) ∑ ∑ Esquema de Mangat, Singh, y Singh Mangat et al. (1992) dio un nuevo dispositivo de respuesta aleatoria como una modificación del modelo básico URL (modelo de pregunta no relacionada) pero de conocida, de manera similar al “Esquema de Mangat” (1992). nuevo suponiendo A una persona etiquetada de la muestra, se le ofrece una caja y responde “sí” si la persona tiene . Pero si la persona tiene caja con una proporción entonces la persona extrae una carta de la de cartas marcadas la persona extrae una carta marcada y el resto marcadas ; si dice “sí” otra vez si la persona realmente tiene ; en cualquier otro caso debe contestar “no”; la ejecución real de esta técnica debe estar oculta. Ellos consideraban exclusivamente el muestreo aleatorio simple con reemplazamiento para muestrear a la gente. Por consiguiente, Consideramos una extensión de esta técnica de respuesta aleatoria para cubrir el caso de un esquema de muestreo general y uno con una situación natural con un valor desconocido de , siendo la proporción de personas que tienen la característica inocua . Para una persona etiquetada que se elija, siguiendo un esquema general de muestreo, la instrucción es decir “sí” si la persona tiene , y si no, coger aleatoriamente una carta de una caja que contiene una proporción y el resto marcadas realmente tiene de cartas marcadas y decir “sí” si una carta marcada B es robada y si la persona ; de lo contrario, la respuesta será “no”. Sin embargo, todo este ejercicio se repetirá de forma independiente con el único cambio que la proporción de cartas marcadas es y . Como antes, dejando si está marcado , si está marcado , si surge una respuesta “sí” en el primer ensayo, 0 en otro caso; si “sí”/”no” es la respuesta aleatoria en el segundo 25 Técnicas de respuesta aleatoria en diseños de muestreo general Entonces, que conduce a y por lo tanto ̂ es un estimador insesgado para Por lo tanto, estimamos ∑ . por ∑ ∑ ∑ Y su varianza ∑ ∑( )( ) ∑ ∑ Esquema de Singh y Joarder Singh y Joarder (1997) dieron una técnica de respuesta aleatoria y mostraron que si la respuesta aleatoria se observa a partir una muestra con muestreo aleatorio simple con reemplazamiento en que un estimador para extracciones, entonces su estimador de tiene menos varianza de Warner (1965). Su técnica de respuesta aleatoria es la siguiente: Un encuestado teniendo responde como en la técnica de respuesta aleatoria de Warner pero uno que tiene pospone la respuesta a una segunda ejecución de la técnica de respuesta aleatoria de Warner, a menos que la primera induzca una 26 Respuesta aleatoria y técnicas de preguntas indirectas respuesta “sí”. Por supuesto, un paquete de cartas que contienen una proporción marcadas y el resto marcadas se van a utilizar sin divulgar nada sobre este comportamiento real de la técnica de respuesta aleatoria para el entrevistador, como de costumbre. Naturalmente, para algún encuestado elegido en un muestreo aleatorio simple con reemplazamiento, Así, eligiendo , tal que , se puede estimar utilizando el número total de respuestas “sí” en un muestreo aleatorio simple con reemplazamiento en extracciones. Obtener la varianza del estimador de y un estimador insesgado de la varianza tampoco es un problema. Pero la varianza implica , el elemento desconocido. Por lo tanto, no nos interesa aquí el estudio de las consecuencias de la identificación de distintas personas de la muestra y la examinación de las consecuencias de las respuestas simples o múltiples de cada uno de ellos. En su lugar, tenemos en cuenta el examen de la técnica de respuesta aleatoria de Singh y Joarder (1997) cuando el muestreo es de una población finita con probabilidades desiguales generales. Notando si tiene y si “sí” es la respuesta aleatoria de la i-ésima persona, tenemos Entonces, para tomando el denominador distinto de cero, tenemos obteniéndose ̂ estimador insesgado de . Ya que como un estimador insesgado para y como un estimador insesgado de problema si se emplea un esquema de muestreo coherente, con . Obtener como un no es un gran . 27 Técnicas de respuesta aleatoria en diseños de muestreo general Por lo tanto, estimamos ∑ por ∑ ∑ ∑ Y su varianza ∑ ∑( )( ) ∑ ∑ Esquema de Dalenius y Vitale Dalenius y Vitale (1974) han dado una técnica de respuesta aleatoria que realmente se refiere a una variable sensible cuantitativa cuyos valores se agrupan en un número de clases disjuntas, de modo que una respuesta solicitada a una persona de la muestra hace referencia a una de estas clases, en la que el encuestado está situado, en términos del valor de la persona interesada sobre la variable de interés. La principal diferencia de su técnica de respuesta aleatoria con los ya discutidos anteriormente es que cada persona etiquetada da una respuesta “sí” o “no” a la respuesta aleatoria (respuesta de la i-ésima persona) que no varía con , sino que sigue siendo una constante para cada , en . La estimación, sin embargo, se realiza fácilmente tanto con muestreo aleatorio simple con reemplazamiento como con un esquema general de muestreo de forma muy simple. Por lo tanto, vale la pena examinar la extensión del muestreo aleatorio simple con reemplazamiento con respuestas simples o múltiples, de las distintas personas muestreadas por muestreo aleatorio simple con reemplazamiento. De acuerdo a su técnica de respuesta aleatoria, a una persona de la muestra se le asigna un disco en el que segmentos iguales están marcados por y se le instruye para hacer girar un “puntero” en el disco y para responder “sí” si el “puntero” se detiene en un segmento marcado “menor o igual” a la marca que representa la clase a la que pertenece la persona, en términos de la variable sensitiva de nuestro interés; de lo contrario la respuesta aleatoria es “no”. Escribiendo si la i-ésima persona responde “sí” si la respuesta es “no”, 28 Respuesta aleatoria y técnicas de preguntas indirectas entonces, ∑ siendo la frecuencia relativa, tal que ∑ con la frecuencia desconocida de la j-ésima clase y ∑ Así que, es un estimador insesgado de para todo en una muestra. También, ( Así, ) ( ) no puede ser fácilmente un estimador insesgado. Sin embargo, Dalenius y Vitale (1974) trataron solo el caso del muestreo aleatorio simple con reemplazamiento con extracciones. Así, escribiendo respuestas “sí” en la muestra, ̂ estimador insesgado de estimador insesgado de como la proporción de , por lo tanto ̂ ̂ y ̂ y por lo tanto ̂ es insesgadamente estimado por ̂ ̂ ̂( ̂) Esquema modificado por Pal de Takahasi y Sakasegawa El esquema de Takahasi y Sakasegawa (1977) implica una asignación al azar implícita más que una técnica de respuesta aleatoria. Aquí también el problema consiste en estimar insesgadamente , la proporción que tiene . Una persona de la muestra hace 29 Técnicas de respuesta aleatoria en diseños de muestreo general una elección silenciosa de su prioridad entre los colores, por ejemplo, violeta, azul y verde. Para la estimación de , elegimos tres muestras independientes, . Una persona de la muestra responde a la aplicación del esquema. Técnica de respuesta aleatoria de Liu, Chow, y Mosley Liu et al. (1975) consideraron una población dividida en proporciones disjuntas con ∑ dando grupos Una persona se inclina para ocultar a los demás si pertenece a alguno de estos grupos. no solapados. Por lo tanto, es aconsejable aplicar la técnica de respuesta aleatoria tomando cuentas de ∑ colores diferentes, una por cada uno de estos grupos: cuentas son puestas en un recipiente transparente de cuello largo y tapón de corcho. Cuando el recipiente está lleno de cuentas, se cierra mediante el tapón y el recipiente se pone al revés, de modo que las cuentas no se caigan sino que se apoyen en su cuenta adyacente o sobre el tapón. El cuello del recipiente que está marcado de permite a uno observar la cantidad de las cuentas de cada color. A la persona de la muestra se le pide que agitara el recipiente, le diera la vuelta, y diera la respuesta aleatoria como el número en el cuello, que corresponde a la cuenta del color del grupo de la persona, que es el que está en la parte más inferior de entre todas las cuentas del grupo de la persona. Según Chaudhuri (2002): ( )( )( ) é é . Entonces, ∑ 30 Respuesta aleatoria y técnicas de preguntas indirectas Liu et al. (1975) toman un muestreo aleatorio simple con reemplazamiento en extracciones y estiman insesgadamente mediante la proporción de muestra observada en . Chaudhuri y Mukerjee (1988) han ilustrado cómo invirtiendo ̂ las estimaciones ̂ para ∑ ̂ pueden ser resueltas por el método de los momentos. 31 Técnicas de respuesta aleatoria en diseños de muestreo general 32 Respuesta aleatoria y técnicas de preguntas indirectas CAPÍTULO 2: OTRAS TÉCNICAS DE RESPUESTA ALEATORIA Introducción Sinha y Hedayat (1991) presentaron sus ideas en su libro. Sarjinder Singh (1996), en su libro, así como en numerosos trabajos de investigación, principalmente colaborando con Mangat Singh, Late Ravindra Singh, Late Tracy, Joarder, Horn, Gjestvang y otros, ampliamente trataron la literatura de respuesta aleatoria. Raghunath Arnab, Tapan Nayak, Kim y Warde, y un buen número de otros colaboradores productivos merecen la atención al darnos un crecimiento sustancial en el tema de respuesta aleatorizada. Una descripción resumida más una valoración crítica se expone a continuación. Sinha y Hedayat Haciéndose eco de la voz de muchos otros trabajadores en el área de respuesta aleatoria (RR), Sinha y Hedayat (1991, p.310) también indican que la recopilación de datos sobre temas sensibles “requiere técnicas especiales de ‘muestreo’ que garanticen un alto grado de confidencialidad a los entrevistados”. Lo que necesitamos especialmente es una alternativa “técnica de la encuesta”, pero no una nueva “técnica de muestreo”. Este error se teme que haya estado en la raíz de la práctica tradicional al unir los mecanismos de la respuesta aleatoria sólo con esquemas de muestreo aleatorio simple con reemplazamiento (SRSWR) manteniendo así la literatura de respuesta aleatoria a un nivel rudimentario lejos de la bien desarrollada teoría de encuestas con muestreo de respuesta directa (DR) a un nivel superior de carácter científico durante demasiado tiempo. El crecimiento resultante de la teoría de respuesta aleatoria intransferiblemente ligada al muestreo aleatorio simple con reemplazamiento dictó una gran sencillez emanando del hecho de que “toda persona elegida al azar tiene la probabilidad única de tener el atributo señalado , es decir, igual a , la proporción desconocida de tener este toda la comunidad”. En la estimación de esta en y también en la definición de una medida apropiada del riesgo, mostrando un atributo auténtico a través de la verdadera respuesta aleatoria, esto permitió a la teoría de la respuesta aleatoria un manejo sencillo. 33 Otras técnicas de respuesta aleatoria Sinha y Hedayat (1991) consideraron una población de persona teniendo un valor complementario ,y personas con la i-ésima , que es 1 ó 0, según tiene o su como la proporción desconocida con valor 1 para cada uno en la comunidad. También se supone que cualquier persona teniendo no tiene tendencia a reprimir esta verdad, si así se solicita. En su capítulo “Método 1: Procedimiento de pregunta relacionada” Shina y Hedayat definen si tiene si tiene y proceden a estimar ∑ a su manera, sin ninguna referencia a Warner (1965). Asimismo, desarrolló el “Método 2: Procedimiento de pregunta no relacionada” y más técnicas que se ocupan de la estimación respecto a los atributos de interés y son bastante diferentes de la mayoría de las técnicas de respuesta aleatoria tratadas en otro lugar. Sus avances, sin embargo, proceden inicialmente sin relación con ningún diseño de muestreo específico. La literatura sobre respuesta aleatoria es incompleta sin la incorporación de Sinha y Hedayat (1991). Pero hay una sección en su libro, que trata de las variables cuantitativas sensibles, es muy interesante y no puede dejar de llamar la atención a la época de duras polémicas entre encuestas celebradas por los expertos de muestreo Hartley y Rao (1968, 1971a,b) por un lado, o Godambe (1970) por el otro. Un lector curioso puede echar un vistazo a una versión resumida en Chaudhuri y Vos (1988). Sinha y Hedayat (1991) asumen “que una encuesta estadística tiene un conjunto de valores distintos disponibles y éstos están destinados a cubrir el conjunto de valores objeto de estudio”. Pareció extraño que estos autores no se opusieran a la teoría desarrollada por Adhikary et al. (1984), Chaudhuri (1987), Sengupta y Kundu (1989). A cualquiera que sea consciente de la “polémica entre Hartley y Rao contra Godambe” le resultaría difícil conciliar el material de Sinha y Hedayat (1991). R. Arnab Arnab (1995a) presentó algunas modificaciones en las obras anteriores de Adhikary et al. (1984), Chaudhuri (1987,1992), entre otros mencionados pero no frente a los de Sengupta y Kundu (1989). Su intención era proporcionar una estimación óptima para 34 Respuesta aleatoria y técnicas de preguntas indirectas una población finita completamente bajo encuestas de respuesta aleatoria. Para estimar ∑ , permitió un dispositivo de respuesta aleatoria general produciendo adecuadamente transformaciones de respuestas aleatorias como independiente a través de los individuos reales sensibles de manera teniendo valores de tal manera que ( escribiendo como de costumbre ) como operadores de la esperanza, la varianza y la covarianza con respecto al dispositivo de aleatorización adoptado y función conocida de es una . Debido a la naturaleza general de , el modelo previsto en el enfoque de Arnab (1995a) es más amplio que los estudiados por Eriksson (1973), Godambe (1980), Chaudhuri y Adhikary (1981), Adhikary et al. (1984), Chaudhuri (1987,1992), por lo que se reduce a formas específicas; sus mecanismos de respuesta aleatoria también están claramente especificados, pero los dejó sin especificar en Arnab (1995) en la medida en que el modelo antes citado se mantuvo sostenible. Arnab (1990) ofrece argumentos para asegurar que conmuta con , el operador esperanza con respecto al diseño . Arnab (1996) proporciona una teoría unificada para la estimación de la proporción de una comunidad teniendo un atributo de interés que cubre cualquier diseño de muestreo, clases amplias de estimadores insesgados y clases generales de mecanismos de respuesta aleatoria, ofreciendo estimadores insesgados de varianza también. Arnab (1996) restringió su estudio a estimadores insesgados lineales homogéneos para . Arnab (1996) fue motivado a publicar este trabajo para mejorar los estudios realizados por Franklin (1989b) y Singh y Singh (1993), que restringieron sus procedimientos sólo al muestreo aleatorio simple con reemplazamiento. Arnab (1998) obtiene una condición de optimalidad para la estrategia de respuesta aleatoria. También demostró que la misma estrategia óptima de respuesta aleatoria puede conseguirse modificando la técnica de respuesta aleatoria de Chaudhuri para variables cuantitativas con un esfuerzo pequeño, incluso sin recurrir al enfoque de Sinha y Hedayat (1991). 35 Otras técnicas de respuesta aleatoria Estos resultados son aún más generalizados por Arnab (2001) que usando el mecanismo de respuesta aleatoria modificó como anteriormente en Eriksson (1973) y Chaudhuri (1987) pero postulando los cuatro modelos de super-población y usando ciertos resultados de los datos de respuesta directa dados por Chaudhuri y Stenger (1992). Una de las deficiencias en las estrategias de muestreo óptimo relatados por Arnab es que no se da una idea acerca de cómo estimar las medidas adecuadas de errores de los estimadores correspondientes. Arnab (2004) consideró prácticamente el mismo procedimiento opcional de respuesta aleatoria como los tratados por Chaudhuri y Mukerjee (1985,1988) para muestreo aleatorio simple con reemplazamiento y de Chaudhuri y Saha (2005). Nayak, Nayak y Adeshiyan, Christofides, y Quatember El trabajo de Nayak (1994) es muy importante en la literatura de respuesta aleatoria porque a pesar de que restringe su estudio a la selección de los posibles encuestados sólo por el método de muestreo aleatorio simple con reemplazamiento y para la estimación de la proporción teniendo una característica de interés en una población dicotómica, él sólo busca un procedimiento adecuado de estimación sobre la aplicación del criterio doble de amplia base, así, (1) la privacidad del encuestado debe ser protegida de forma racional y (2) sujeto a este objetivo, un estimador eficiente con una medida controlada de precisión debe ser buscado. Éstos están cubiertos por el modelo pionero de respuesta aleatoria de Warner (1965) y el modelo de Simmons, como lo describe Greenberg et al. (1969), con la probabilidad de que una persona de la muestra puede tener una característica inocua con , conocida y sinceramente anunciar si o o o no relacionada sea asumido por el usuario. El motivo de Nayak (1994) es el desarrollo de una teoría unificada para las encuestas de respuesta aleatoria. Nayak también observa contrariamente a la creencia popular, que la eficiencia y la protección de la privacidad no se mueven necesariamente en direcciones opuestas. Como guía observó que el modelo de Warner (1965) es inadmisible y también lo es el modelo de Simmons con una conocida menos que conocida a . Más audazmente un enfoque provocativo de la técnica de respuesta aleatoria, para estimar la proporción 36 de personas que tienen el atributo sensible en una población Respuesta aleatoria y técnicas de preguntas indirectas dicotómica de respuestas binarias o policotómicas de personas seleccionadas con probabilidades desiguales, se ha tratado de manera unificada por Nayak y Adeshiyan (2009). Nayak (1994) adoptó una medida de protección de privacidad diferente con un concepto de probabilidad Bayesiano a posteriori, para una persona que tiene con una probabilidad desconocida a priori, combinada con una respuesta aleatoria producida y atendida por una persona de la muestra. Se limitó a la selección de los encuestados sólo por el esquema de muestreo aleatorio con reemplazamiento. Aunque la población planteada es dicotómica, a la respuesta aleatoria utilizada para estimar se le permite ser binaria o politómica. Nayak y Adeshiyan (2009) minuciosamente elaboraron una teoría unificada para demostrar que, dado un estimador basado en una respuesta aleatoria politómica equivalente en términos de estimadores igualmente eficientes, basándonos en la alternativa binaria, los procedimientos basados en respuesta aleatoria están disponibles manteniendo las medidas de protección de privacidad. Nayak y Adeshiyan (2009) también cubrieron la respuesta aleatoria derivada de las muestras elegidas con probabilidades desiguales de selección y las variables sensibles tanto cualitativas como cuantitativas. Desafortunadamente, tanto Nayak (1994) como Nayak y Adeshiyan (2009) hasta ahora han permanecido en silencio acerca de cómo modificar las reglas para obtener las probabilidades posteriores necesarias en la determinación de las medidas de protección, cuando cubren características cualitativas con muestreo aleatorio simple con reemplazamiento, muestreo sustituido por cualquier otro método de muestreo y cubriendo las características de interés que son cuantitativas. Rechazaron la afirmación de Christofides (2003) ante su alternativa propuesta para el mecanismo de respuesta aleatoria, de que permitiendo respuestas politómicas podría irles mejor que el de modelo de Warner, con una gama más amplia de elección de los parámetros de la técnica de respuesta aleatoria, mostrando errores en los cálculos numéricos de este último. Christofides (2010) se opuso de forma firme citando contraejemplos en la dirección opuesta. Quatember (2009) mientras tanto ascendió con una poderosa oposición al muestreo aleatorio simple con reemplazamiento basado en la técnica de respuesta aleatoria de Christofides, destacando sus carencias numéricas. 37 Otras técnicas de respuesta aleatoria Guerriero y Sandri Guerriero y Sandri (2007) también son dos conocidos partidarios de que dos procedimientos de respuesta aleatoria deben ser comparados sólo bajo el doble criterio de (1) la estimación eficiente, en términos de estimadores adecuados de las características sensibles de las respuestas aleatorias y (2) el nivel de protección ofrecido por ellos de las intimidades de los encuestados. Su único parámetro objetivo demandado en la estimación es la proporción de población finita de personas, es decir , en una comunidad que tiene una característica sensitiva . Su objetivo es también tratar una respuesta aleatoria binaria para una población dicotómica. Definen | con como respuesta “Sí / No” de las “probabilidades de diseño”, como de costumbre. Se toman medidas de protección de privacidad (PP) siguiendo el método tradicional como en Lanke (1975b, 1976) y Leysieffer y Warner (1976), y consideran el estimador ̂ para basado en la respuesta aleatoria del muestreo aleatorio simple con reemplazamiento en extracciones. Examinan las actuaciones relativas o los procedimientos de respuesta aleatoria con respecto a la eficiencia de un solo estimador y separadamente de nuevo en términos de eficiencia con protección de privacidad. Padmawar y Vijayan Padmawar y Vijayan (2000) calificaron el enfoque de respuesta aleatoria cubriendo una población finita como un enfoque tradicional y presentaron una oposición, brevemente resumida a continuación. Consideran como el valor de una variable de estudio para la unidad en , supuesto que es uno de interés, descrito como una “señal” y obtienen una respuesta aleatoria como una mezcla de una señal y un “ruido”. Este valor de ruido es generado a partir de una distribución conocida con media y varianza para , ambas conocidas como constantes para cada en . La respuesta aleatoria de es para en una muestra elegida mediante un diseño adecuado . Aquí no hay ninguna restricción sobre la naturaleza de en relación con el valor de . En la llamada respuesta aleatoria tradicional se establece que siguiendo a Eriksson (1973), Godambe (1980), Chaudhuri et al. (1981), Chaudhuri (1987, 1992), Sengupta y Kundu (1989) y también es explorada por Arnab, 38 debe tener un rango que coincida con el de , por Respuesta aleatoria y técnicas de preguntas indirectas ejemplo, sobre todo, si , lo mismo debe cumplirse para , y despertaría sospechas del encuestado en caso contrario. Pero, sorprendentemente, Padmawar y Vijayan (2000) descartaron firmemente tal restricción. Su afirmación es una certeza total de los encuestados de que la “privacidad está protegida, sin duda” a pesar de la respuesta aleatoria como un estimador insesgado para ∑ para todo en . El objetivo es obtener . La configuración del modelo de superpoblación también es considerada por Padmawar y Vijayan (2000) estableciendo un par de resultados de optimalidad en su configuración de respuesta aleatoria. Trabajos en respuesta aleatoria por N.S. Mangat, Ravindra Singh, Sarjinder Singh, Sat Gupta, y Bhisham Gupta Los colaboradores antes mencionados de la teoría y la práctica de respuesta aleatoria, excepto Sarjinder Singh, se limitan solamente al “muestreo de probabilidades iguales”. Mangat y Singh (1991) consideran la estimación de la proporción sensible en un muestreo aleatorio simple sin reemplazamiento (SRSWOR) en extracciones y no de un muestro aleatorio simple con reemplazamiento. Este ejercicio se llevó a cabo con anterioridad por Kim y Flueck (1978) como informaron Chaudhuri y Mukerjee (1988). Creemos que estas actividades pueden ser explicadas en referencia a los trabajos de Chaudhuri (2001a). Los puntos cruciales son (1) un mecanismo de respuesta aleatoria para producir datos sin importar cómo una persona se elige en la muestra y (2) la probabilidad de que una persona tenga un atributo sensible extracción la persona es seleccionada, es igual a , sin importar en que sólo en muestreo aleatorio simple con reemplazamiento. La comparación de las diferentes respuestas aleatorias basadas en estimadores para se hace difícil e inapropiada cuando los datos de respuesta aleatoria se recogen de muestras probabilísticas desiguales. Si hacemos caso a la recomendación de Nayak (1994), (1) eficiencia en al estimación y (2) el nivel de privacidad está protegido por una técnica de respuesta aleatoria simultáneamente sometida a una opinión sensata, por lo que surgirán consideraciones interesantes. Mangat y Singh (1990) añadieron una elaboración algebraica para permitir la posibilidad de una falta parcial de veracidad en el informe del encuestado. Tal situación también fue visualizada por Greenberg et al. (1969) en el contexto del 39 Otras técnicas de respuesta aleatoria esquema básico de Warner (1965) como fue discutido por Chaudhuri y Mukerjee (1988). Mangat et al. (1992) presentaron la versión revisada de la técnica de respuesta aleatoria de Simmons descrita por Greenberg et al. (1969), con una proporción conocida en la comunidad, teniendo una característica inocua no relacionada con . Estimadores insesgados para son comparados en cuanto a sus varianzas, sin consideraciones de su nivel de “protección de privacidad”. Mangat (1994) dio una simplificación para Mangat y Singh (1990) y comparó las varianzas de los estimadores insesgados de Warner (1965) para basados en estos dos mecanismos de , mediante un cálculo algebraico sencillo, porque el muestreo aleatorio simple con reemplazamiento en extracciones se tomó como el esquema común de muestreo para recoger la respuesta aleatoria por la respectiva técnica de respuesta aleatoria. El mecanismo de Mangat (1994) es pedir al encuestado que diga “Sí” si tiene la tiene, y si no , para informar verazmente en tal caso, garantizado por el mecanismo de respuesta aleatoria de Warner. La sencilla comparación de la eficiencia es entonces informada, cubriéndola en relación a los competidores de Warner (1965) y Mangat y Singh en 1990. Qué sucede en caso de “menos del 100 por cien de informes verdaderos”, es también discutido por Mangat (1994). Como ya se ha mencionado brevemente, Mangat el al. (1995) consideraron procedimientos de estimación opuestos frente al tratamiento de Warner, señalando la respuesta aleatoria de los distintos encuestados en un muestreo aleatorio simple con reemplazamiento en extracciones, permitiendo sólo una respuesta aleatoria por cada mecanismo de Warner. Mangat et al. (1993) comienzan con el hallazgo de Moors (1971) y producen mejores resultados, también revisan su técnica de respuesta aleatoria. Una alternativa adicional de la técnica de respuesta aleatoria también se trata en Singh et al. (2000) permitiendo un sólo muestreo aleatorio simple sin reemplazamiento dividido aleatoriamente en dos submuestras mutuamente excluyentes, una de ellas emplea la técnica de respuesta aleatoria de Greenberg et al., y la otra una técnica de respuesta directa incluyendo sólo . 40 Respuesta aleatoria y técnicas de preguntas indirectas La generalización de Singh (2002) de la técnica de respuesta aleatoria de Warner (1965) y Kuk (1990) llamada por él, técnica de “modelo de respuesta aleatoria estocástica” está bastante discutida exhaustivamente. Mangat y Singh (1994) por primera vez presentaron una modificación a la técnica de respuesta aleatoria de Warner (1965) permitiendo al encuestado ya sea (1) dar una respuesta directa o (2) una respuesta aleatoria por la técnica de respuesta aleatoria de Warner, teniendo un atributo sensible o su complementario , mediante una respuesta “Sí” o “No”, sin revelar la opción (1) o (2) que se utiliza. La proporción de respuestas “Sí” así recibida desde un muestreo aleatorio simple en extracciones, se toma como un estimador requerido para , la proporción desconocida de personas que tienen en la comunidad de personas. Este estimador se valora como una fracción propia, mientras que el estimador de Warner para puede tomar un valor fuera del intervalo cerrado [0,1]. Estos autores suponen que cada encuestado, sin importar en que extracción la persona es seleccionada, tiene una probabilidad desconocida pero común de dar la respuesta directa si se les da una opción, ya sea para dar una respuesta directa o una respuesta aleatoria por el método de Warner. Probablemente, suponen que en la comunidad hay una proporción desconocida respuesta directa sobre si tiene o de gente dispuesta a dar la . Estos autores calculan el sesgo de su estimador propuesto para , el que resulta sesgado. También trabajan desarrollando el error cuadrático medio de , teniendo en cuenta que el error cuadrático medio disminuye con para todos los , y también encontrando las magnitudes relativas de este error cuadrático medio y la varianza del estimador de Warner, presentando valores tabulados de la eficiencia relativa de los dos para diferentes . Gupta et al. (2002) comenzaron con la técnica de respuesta aleatoria mixta para datos cuantitativos de Eichhorn y Hayre (1983) y lo modificaron para una mejor estimación de la media poblacional, permitiendo la opción para respuesta directa. Obviamente esta respuesta aleatoria opcional como la de Mangat y Singh (1994) es totalmente diferente de la de Chaudhuri et al. (1985,1988, y 2005). Arnab (2004) comienza con una frase inapropiada “Gupta, et al. (2002) propusieron una técnica de respuesta aleatoria opcional (ORR) basada en el muestreo aleatorio simple con reemplazamiento, usando una suposición poco realista de que la probabilidad de 41 Otras técnicas de respuesta aleatoria proporcionar la respuesta verdadera/aleatorizada para todos los individuos de una población, es la misma”. En una comunidad dada allí, legítimamente puede existir una sección con una proporción desconocida de personas dispuestas a dar una verdadera respuesta a petición, mientras que el resto puede estar de acuerdo para responder llevando a cabo un mecanismo de aleatorización explicado a la persona. En la frase siguiente, Arnab (2004) expresa “En este documento una alternativa a la respuesta aleatoria opcional se ha propuesto para un diseño de muestreo arbitrario”. Arnab (2004) mostró el procedimiento anterior de respuesta aleatoria opcional presentado por él como más eficiente en términos de la varianza que los correspondientes procedimientos de respuesta aleatoria, permitiendo sin opción dar a conocer los auténticos valores de la variable aleatoria por los encuestados. Pal (2008) proporciona una pista sobre el uso del mecanismo de respuesta aleatoria mixto de Eichhorn y Hayre (1983) en la estimación del total y la varianza del “estimador total”, cuando una muestra es seleccionada por cualquier diseño de muestreo con probabilidades desiguales. El autor además ofrece una versión de respuesta aleatoria opcional completamente nueva de esta estrategia en particular como un nuevo trabajo fundamental. Pal (2008) ilustró aplicaciones con estrategias específicas, demostrando numéricamente que los procedimientos de respuesta aleatoria opcional alcanzan varianzas reducidas en comparación con los correspondientes procedimientos de respuesta aleatoria obligatoria (CRR). Singh y Joarder (1999) tienen un “modelo de ensayos repetidos desconocidos” para mejorar el modelo de Warner (1965). Aquí Warner (1965) es el punto de partida, en un muestreo aleatorio simple con reemplazamiento en extracciones, para una persona de la muestra repetiremos el ensayo si en la primera prueba el mecanismo de respuesta aleatoria no produce una “coincidencia” con su característica propia , y sin dar a conocer esto al investigador, repetiremos el mecanismo de respuesta aleatoria de Warner para dar su verdadero estado , de acuerdo con el resultado del mecanismo de respuesta aleatoria después de la segunda repetición. Singh y Joarder (1997) han demostrado que su estimador tiene una varianza menor que la dada por Warner (1965) y han presentado un cuadro mostrando una comparación numérica entre los dos, con una apreciable ventaja a su favor. 42 Respuesta aleatoria y técnicas de preguntas indirectas Para la respuesta aleatoria repetida del diseño, tenemos los trabajos de Franklin (1989a,b) y Singh y Singh (1992, 1993) para datos de muestreo aleatorio simple con reemplazamiento y la generalización de Pal (2002) para muestras probabilísticas desiguales. Estos trabajos de Franklin (1989a,b) han sido modificados por Singh y Singh (1992). Singh y Singh (1993), de hecho, modificaron el trabajo de Singh y Singh (1992). Pal (2002), en la tesis no publicada, amplió estas obras de Franklin (1989a,b) y Singh y Singh (1992, 1993) para obtener los resultados correspondientes a los esquemas de muestreo probabilístico desiguales generales, incluso sin reemplazamientos, rompiendo las cadenas del muestreo aleatorio simple con reemplazamiento en extracciones, sin perturbar el replicado de respuesta aleatoria derivado de cada persona de la muestra, sin importar cómo ha sido seleccionada. La tesis de Pal reproduce el enfoque de Chaudhuri (2001). Accidentalmente, tampoco Franklin (1989a,b) ni Singh y Singh (1992, 1993) mencionaron nada sobre la estimación de las varianzas de los respectivos estimadores para dados. Pero siguiendo el enfoque de Chaudhuri (2001) era una cuestión simple para Pal (2002) presentar habituales estimadores de varianza para estimadores revisados por los autores, para . Bhargava y Singh (1999, 2003) compararon la eficiencia de la técnica de respuesta aleatoria bajo protección de privacidad común. Dieron las varianzas de los estimadores insesgados para , la proporción de tener el atributo sensible personas, ya sea con o su complementario en una comunidad de , también dado por la técnica de respuesta aleatoria por Warner (1965), Mangat y Singh (1990) y Mangat (1994) bajo dos circunstancias. Las tres técnicas de respuesta aleatoria se aplican a individuos elegidos por muestreo aleatorio simple con reemplazamiento en extracciones. Bhargava et al. (1999) emplean el concepto de “protección de privacidad” siguiendo la prescripción de Lanke (1976). La técnica de respuesta aleatoria de Mangat (1994) logra un nivel de eficiencia más alto que la de Warner (1965) si ambos están obligados a estar en igualdad en la protección de privacidad del encuestado. Bhargava et al. siguen la recomendación dada por Leysieffer y Warner (1976) en la protección de la privacidad del encuestado. 43 Otras técnicas de respuesta aleatoria La técnica de respuesta aleatoria de Mangat (1994) da una varianza menor que la técnica de respuesta aleatoria de Warner (1965) si están obligados a alcanzar el mismo nivel de protección de privacidad de acuerdo con la recomendación de Leysieffer y Warner (1976). Sarjinder Singh, Stephen Horn, Ravindra Singh, y N.S. Mangat Singh et al. (2003) modificaron el modelo de respuesta no relacionada de Horvitz et al. (1967) (modelo UY) de Simmons, con la proporción conocida tienen la característica inocua no relacionada con , como describió Greenberg et al. (1969), al permitir cartas de tres tipos con proporción blanco ( reemplazamiento en de personas que de , de y que están en ). El encuestado en un muestreo aleatorio simple con extracciones dice “Sí”, si la característica del encuestado coincide con el tipo de carta extraído o , pero de lo contrario dice “No”. Tienen ciertas conclusiones junto con comentarios sobre las presentaciones relativas de su estimador modificado frente al dado por Greenberg et al. (1969). Sarjinder Singh, Stephen Horn, y Sadeq Chowdhury Estos autores abordan el doble problema de la estimación, (1) la proporción de personas con una característica de interés, y simultáneamente, (2) la media desconocida de una variable directamente relacionada con la característica de interés. Para ello necesitan dos muestreos aleatorios simples con reemplazamiento en y extracciones, empleando dos mecanismos de respuesta aleatoria de manera independiente. Los autores dieron un planteamiento de respuesta aleatoria alternativo para el mismo doble problema anterior, para ponerlo en condiciones de hacer comparaciones con el mecanismo de Warner. Chang y Liang En este trabajo, Chang y Liang (1996) aplicaron las modificaciones de Mangat y Singh (1990) en el modelo de respuesta inocua no relacionado de Simmons, descrito por 44 Respuesta aleatoria y técnicas de preguntas indirectas Horvitz et al. (1967) y Greenberg et al. (1969), en lugar del mecanismo de respuesta aleatoria original de Warner en sí. Como la mayoría de los colaboradores de la técnica de respuesta aleatoria, estos dos también se restringen sólo al muestreo aleatorio simple con reemplazamiento. Permitiendo sólo una característica , que no está relacionada con el atributo sensible con proporción desconocida proporción conocida en una comunidad, pero es inocua en sí con una , es decir, en la misma comunidad donde sólo un muestreo aleatorio simple con reemplazamiento en extracciones está previsto. La modificación de Mangat y Singh (1990) se ha descrito anteriormente. En el presente trabajo de Chang y Liang esto es revisado reemplazando el mecanismo de Warner (1965) por el de Horvitz et al. (1967) y Greenberg et al. (1969). Chang y Liang (1996) también han ampliado su estudio para cubrir situaciones permitiendo respuestas parcialmente falsas a las preguntas de la técnica de respuesta aleatoria. Kajal Dihidar Dihidar (2010a) aplicó la técnica de Mangat y Singh (1990) al modelo de respuesta no relacionada de Greenberg et al. (1969) cuando es desconocido. El autor consideró la respuesta directa contra la respuesta aleatoria de un muestreo aleatorio simple con reemplazamiento en extracciones, pero siguiendo el enfoque de Chaudhuri (2001) necesitaba dos respuestas independientes “Sí”/”No” de cada persona de la muestra. Una ventaja en la presentación es que era posible dar una condición concreta para la reducción de la estimación de la varianza, a consecuencia de una elección apropiada de la probabilidad, mediante la aplicación del método de Mangat el al. (1990). Dihidar (2010a) empleó además “técnicas de estimación de disminución” para una mejora adicional en la estimación de , utilizando una suposición previa sobre su posible valor, como seguimiento a la teoría básica de Thompson (1968), para ello persiguió anteriormente el contexto de la respuesta aleatoria de Singh et al. (2007). Los estimadores de la varianza son proporcionados por Dihidar (2010a). Dihidar (2010b) además aplicó la técnica de modificación de Mangat y Singh (1990) al “modelo del ensayo repetido desconocido” de Singh y Joarder (1997) discutido anteriormente y también en el “modelo de respuesta forzada” de Boruch (1972) como también discutido por Chaudhuri y Mukerjee (1988) en el contexto de los “Atributos” y 45 Otras técnicas de respuesta aleatoria además incluye características cuantitativas también. Finalmente, el autor permite que la muestra sea elegida por un muestreo general de probabilidades desiguales. Naturalmente la simulación basada en ejemplos numéricos se presenta para mostrar las ventajas, en su caso, a través de la técnica de Mangat y Singh (1990) aplicada en las correspondientes técnicas clásicas de respuesta aleatoria en las que se aplica. Las ventajas son proclamadas, por si acaso los coeficientes estimados de variación muestran tendencias a disminuir en la implementación de medidas correctivas de Mangat y Singh (1990). Chang, Wang, y Huang y Huang El mecanismo de respuesta aleatoria de Chang et al. (2004) necesita dos muestreos aleatorios simples con reemplazamiento independientes en y extracciones, . Una persona de la muestra debe decir “Sí” si la persona tiene el atributo sensible con una probabilidad desconocida y si la persona tiene el complementario , debe decir “Sí”, significando que la persona tiene y decir “No”, es decir, la persona tiene está en la j-ésima muestra Compararon el estimador de con una probabilidad asignada con probabilidad , si la persona . de Mangat (1994) con éste en términos del respectivo error cuadrático medio (MSE) y presentaron los resultados numéricos sobre sus interpretaciones relativas. Huang (2004) considera una población dicotómica, con una proporción desconocida teniendo un atributo de interés , y un muestreo aleatorio simple con reemplazamiento en extracciones, y suponiendo que la persona que tiene con una probabilidad , mientras que los que tienen está de acuerdo para decirlo están dispuestos a decir la verdad si se lo pedimos. Tras calcular las varianzas se ha demostrado que esta varianza es menor que la varianza del estimador insesgado de Warner para . Kim y Elam y Kim y Warde Ya hemos discutido cómo Mangat et al. (1997) seguido por Singh et al. (2000) presentaron sus modificaciones sobre la protección en la técnica de respuesta aleatoria 46 Respuesta aleatoria y técnicas de preguntas indirectas de Moors (1971). Los esfuerzos de Kim y Warde (2004a) están orientados hacia esa dirección. Ellos, como se observa con la mayoría de los investigadores en el campo de la técnica de respuesta aleatoria, restringieron su estudio al muestreo aleatorio simple en extracciones. Cada encuestado está obligado a contestar con la verdad “Sí” o “No” acerca de tener un atributo inocuo directamente. Aquellos que responden “Sí” deben aplicar un mecanismo de respuesta aleatoria honestamente el atributo verdadero sobre el atributo sensible o . En , una persona informa o el negativo de él, con una probabilidad con probabilidad y . Cualquier información “No” sobre la pregunta directa sobre se pide responder de acuerdo a un segundo mecanismo de respuesta aleatoria una persona informa verazmente sobre si tiene probabilidad y sobre . En con probabilidad siempre sólo “Sí” o “No”. En lugar de con , la respuesta aleatoria es como en la respuesta directa, dejar a y ser los números muestreados de respuestas “Sí” y “No”. Esto es descrito por Kim y Warde (2004a) en el modelo de “respuesta aleatoria mixta”. Ellos observan acertadamente que (1) (y por lo tanto también) es una variable aleatoria y que (2) un valor alto del número de encuestados que optan por debería resultar, por el bien de la eficiencia en la estimación. Ellos juiciosamente dirigieron las cuestiones pertinentes en vista de (1) y (2). Mantuvieron el nivel de protección al alcance del modelo de Warner y Simmons a la par de Lanke (1976). Esto forma una base para la comparación entre el modelo de respuesta aleatoria mixta y el modelo de Moors analizado por Greenberg et al. (1971). Detallados hallazgos empíricos han sido tabulados con respecto a este tipo de comparaciones de eficiencia; la estimación de la varianza no es tomada por Kim y Warde (2004a). Kim y Warde (2004b) fueron inspirados por las obras de Hong et al. (1994), quién extendió la técnica de respuesta aleatoria de Warner (1965), considerando muestreo aleatorio simple estratificado. Este último se limita a la asignación de la muestra proporcional a los estratos. Pero Kim y Warde (2004b) consideraron no sólo la técnica de respuesta aleatoria de Warner (1965) sino también el modelo de técnica de respuesta aleatoria que nos ha dado Mangat y Singh (1990) y también la técnica de respuesta aleatoria de Mangat (1994), tratando el muestreo aleatorio simple estratificado con reemplazamiento (Str. SRSWR), con las fórmulas de asignación óptima de Neyman. A base de álgebra compleja, Kim y Warde (2004b) han demostrado claramente las 47 Otras técnicas de respuesta aleatoria ventajas que se derivan del muestreo estratificado sobre el no estratificado, con respecto a las tres técnicas de respuesta aleatoria. Kim y Warde (2004a) ilustran aún más la eficacia del muestreo aleatorio simple estratificado con reemplazamiento con la regla de muestreo de asignación óptima sobre muestreo aleatorio simple no estratificado con reemplazamiento, cuando se emplea junto con su técnica de respuesta aleatoria mixta. En ambas de estas obras sus resultados algebraicos se complementarán con los resultados numéricos a través de simulaciones. Kim y Elam (2005) cubren más de estos muestreos aleatorios simples estratificados con reemplazamiento, usando estas cuatro técnicas de respuesta aleatoria, con la cobertura adicional de no sólo respuestas aleatorias verdaderas sino también respuestas aleatoria no tan verdaderas, que parecen instintos humanos más naturales. Kim, Tebbs, y An, Chua y Tsui: Sus trabajos El punto de partida del desarrollo de Kim et al. (2006) es la modificación de Mangat (1994) de la técnica de respuesta aleatoria de Warner (1965). Kim et al. (2006) propusieron un estimador Bayesiano para . Hicieron detallados estudios empíricos con los cálculos numéricos. Además extendieron los estudios de muestreo estratificado de manera habitual. Chua y Tsui (2000) nos han dado una nueva técnica de respuesta aleatoria, pretendiendo inducir una sensación de privacidad estando protegido el encuestado inherentemente, a petición de dar a conocer la verdad sobre los hechos que tienen un atributo de interés , en un muestreo aleatorio simple con reemplazamiento elegido en extracciones. Su esquema de respuesta aleatoria se aplica en dos etapas con respecto a cada persona de la muestra. En la primera etapa, a cada persona de la muestra se le pide que elija aleatoriamente un número por muestreo aleatorio simple sin reemplazamiento, con respecto a las personas seleccionadas por muestreo aleatorio simple con reemplazamiento en extracciones, de un conjunto dado de números enteros . Sin divulgar el número, es decir la segunda etapa, se pide extraer aleatoriamente si tiene o de una distribución diferente , si tiene orden creciente. Tanto varianzas conocidas. 48 y , extraído al investigador, en valores de cualquier distribución , , y comunicar el valor k-ésimo en , están completamente especificadas con medias y Respuesta aleatoria y técnicas de preguntas indirectas Citaron varias formas especiales de y , junto con las discusiones, detallando los niveles de eficiencia alcanzados numéricamente en diferentes situaciones. Carlos N. Bouza Bouza (2009) tiene una contribución única a la literatura de respuesta aleatoria, para registrar la labor del conjunto clasificado de muestreo (RSS), rivalizando con el muestreo aleatorio simple con reemplazamiento, dando una estimación útil a través de datos de respuesta aleatoria cuantitativos para una población finita media de valores, relacionando al valor real de la característica de interés. Considera la técnica de respuesta aleatoria en una variable sensible cuantitativa descrita por Chaudhuri y Stenger (1992). De acuerdo con ello, para una población finita tamaño conocido , el problema es estimar interés de la variable real ∑ para de , siendo el valor de para la persona etiquetada en . Para estimar , Bouza (2009) se basa en una muestra de personas siguiendo el método del conjunto clasificado de muestreo de McIntyre (1952), además desarrollado y revisado por Chen, Bai y Sinha (2004) entre otros. Joe Kerkvliet Este es un seguimiento del tratamiento de los modelos logit presentados en Maddala (1983). El uso señalado de la cocaína por estudiantes universitarios en relación al rendimiento académico y las características socio-económicas es la cuestión que se debate por Kerkvliet (1994). Él considera la técnica de respuesta aleatoria de “respuesta forzada” de Boruch (1972), Maddala (1983), y Chaudhuri y Mukerjee (1988). Como de costumbre, no tiene ninguna relación para cualquier esquema de muestreo excepto muestreo aleatorio simple con reemplazamiento. Su preocupación principal es examinar las magnitudes de , que son las probabilidades que se fijan para los encuestados que dicen “Sí” o “No” independientemente de tener o , así que puede ser asignado como la probabilidad con que cada uno puede verdaderamente decir “Sí” o “No” correspondiendo a los rasgos reales, siendo el sensible o su negación . El rasgo sensible tratado por Kerkvliet (1994) es el consumo de cocaína por estudiantes de la universidad. El rendimiento académico y los hábitos personales son factores 49 Otras técnicas de respuesta aleatoria endógenos deterministas. Las magnitudes de se determinan mediante la suma de los últimos cuatro dígitos del número de Seguridad Social del estudiante, tratados como una variable aleatoria. Kerkvliet postula el “modelo de regresión logística”. N.J. Scheers Este trabajo predominantemente habla de la filosofía de la técnica de respuesta aleatoria, como una herramienta adecuada para proteger al encuestado contra el riesgo de revelar características incriminatorias, como denuncias de deudas por impuestos, estafas, uso de drogas y por lo tanto reducir la tendencia a decir mentiras o reprimir verdades, y hace referencia a estudios de validación sobre datos de respuesta aleatoria contra datos de respuesta directa. La mayor parte del material cubierto en este trabajo ya fue revisado por Chaudhuri y Mukerjee (1988). Sólo el modelo de regresión logística por ejemplo, cubierto por Kerkvliet y Scheers y Dayton (1988) no fue discutido por Chaudhuri y Mukerjee (1988). Un descuido evidente en el presente trabajo es el uso del multiplicador en los estimadores de la varianza en todas partes, aunque a la vista de los tamaños de muestra muy grandes en los ejemplos, esta deficiencia teórica apenas afecta a los resultados empíricos. Umesh y Peterson Este aborda asuntos filosóficos cuestionando la inherente utilidad del enfoque de respuesta aleatoria. El éxito de la técnica de respuesta aleatoria depende de la tasa de respuestas verdaderas a las preguntas sobre las características personales de interés social de forma aleatoria, en lugar de por preguntas directas. Si la respuesta directa estuviera auténticamente disponible en abundancia, la respuesta aleatoria sería de poco valor, produciendo estimaciones menos eficientes con varianzas infladas. Todavía se emplea la técnica de respuesta aleatoria creyendo que infunde confianza en los encuestados de que su secreto está protegido, induciendo sin restricciones confidencias verdaderas con posibilidades moderadas de declaración. La pregunta incuestionable es si el sesgo de la respuesta es realmente eliminado o reducido sustancialmente. Estos aspectos se discuten brevemente en este artículo, que es una valoración crítica de los desarrollos estadísticos, cuestiones de validación y aplicaciones propias de la técnica de 50 Respuesta aleatoria y técnicas de preguntas indirectas respuesta aleatoria en la práctica, a través del recuento del crecimiento emergente en nuevos métodos, en formas de mejoras sucesivas respecto a las técnicas anteriores. Como se trata de un artículo de revisión la mayor parte de su material se trata ya en Fox y Tracy (1986) y Chaudhuri y Mukerjee (1988). Chris Gjestvang y Sarjinder Singh Dice ser una mejora sobre la técnica de respuesta aleatoria de Himmelfarb y Edgell (1980) y de Eichhorn y Hayre (1983). Se utilizan dos variables de aleatorización en lugar de una como en el anterior y genera una respuesta aleatoria mediante combinación de las dos con probabilidades asignadas previamente. Ellos además narran cómo la respuesta aleatoria óptima también puede ser tener cabida. Sin embargo, el muestreo aleatorio simple con reemplazamiento es el único método de muestreo que constituye la base de este trabajo. Landsheer, Heijden, y Gils Este es un informe crucial sobre cómo una técnica de respuesta aleatoria puede usarse como una técnica capaz de extraer información fiable sobre cuestiones delicadas. Éste analiza ilustrativamente cómo con respecto a la participación de fraude a la seguridad social, incluso los infractores pueden ser inducidos a dar respuestas verdaderas, confiando en que la respuesta aleatoria puede permitir ocultar los secretos con los riesgos mitigados de la revelación. Ellos ilustran aplicaciones de la técnica de respuesta forzada (cf. Fox y Tracy, 1986) y la técnica de respuesta aleatoria de Kuk (1990), para mostrar cómo la capacidad de un investigador inculcando la comprensión de una técnica de respuesta aleatoria en un encuestado, da la confianza suficiente de que la privacidad del encuestado se mantendrá a pesar de una revelación verdadera a fuerza de una técnica de respuesta aleatoria. Genera la aceptación de la teoría de respuesta aleatoria en la comunidad en general de los científicos y los profesionales de este trabajo, además de que su bibliografía puede convertirse en una publicación de referencia. 51 Otras técnicas de respuesta aleatoria Heijden y Gils Este ejercicio es similar al de Kerkvliet (1990), comentado anteriormente, ilustrando cómo el modelo de respuesta forzado (cf. Fox y Tracy, 1986) o el modelo de Kuk (1990) para la generalización de datos por la aleatorización de características sensitivas, pueden ser utilizados estimando parámetros acerca de tales características, utilizando por fuerza modelos de regresión logística, ahora con observaciones de covarianza también. Like Kerkvliet (1990) y estos autores también se refieren a trabajos anteriores por Maddala (1983) y Scheers y Dayton (1988). Como de costumbre también se restringen sólo al muestreo aleatorio simple con reemplazamiento. Heiden, Gils, Bouts, y Hox Citando un problema práctico de relevancia social, es decir, contando los beneficiarios de las prestaciones de asistencia social que ejercen estafas fraudulentas, este artículo presenta las utilidades relativas de los cuatro procedimientos de impugnación, concretamente (1) entrevista directa cara a cara, (2) auto entrevistas con ayuda de ordenador (CASI) y (3,4) dos técnicas de respuesta aleatoria, es decir, procedimiento de respuesta forzada (cf. Fox y Tracy 1986) y procedimiento de Kuk (1990). El estudio de validación y ajuste de modelos de regresión logística en la introducción de dos o tres variables explicativas en caso de estudios de respuesta aleatoria, constituyen componentes esenciales de este capítulo, lo que evita el análisis estadístico riguroso. Tracy y Mangat Esta es una revisión de lo que siguió desde 1984 hasta que los hallazgos en el campo de la respuesta aleatoria estaban cubiertos por Chaudhuri y Mukerjee (1988). Ahsanullah y Eichhorn (1988) añadieron al trabajo de Eichhorn y Hayre (1983) la utilización de la variable codificada multiplicativa. Singh y Kathuria (1992) modificaron el enfoque de Simmons introduciendo dos características inocuas. También se refirieron al uso del muestreo con probabilidad proporcional al tamaño (PPS) de Chaudhuri y Adhikary (1990) y su seguimiento por Bansal et al. (1994) en el tratamiento de las encuestas de varios caracteres utilizando la respuesta aleatoria. También mencionan a Tracy y Mukhopadhyay (1994), utilizando el muestreo ordenado y el momento de Arnab (1990) que conmutaba en el diseño, y el modelo de 52 Respuesta aleatoria y técnicas de preguntas indirectas funcionamiento de la esperanza realizado más general que el previsto por Chaudhuri y Adhikary (1990). También corroboran la observación de Arnab (1994) de que un “estimador de varianza no negativo en una encuesta de respuesta directa, produce uno para la que se deriva de ella por una encuesta de respuesta aleatoria, aunque lo contrario no está garantizado”. Tracy y Mangat (1996) también mencionan las obras de Little (1993), Ibrahim (1990), y Bourke y Moran (1998) que aplicaron el modelo basado en la teoría de verosimilitud, la técnica del algoritmo de la maximización de la esperanza y el método de imputación múltiple, para abordar temas sensibles que utilizan distribuciones predictivas. También mencionan el caso de evaluar si el encuestado está mintiendo, y luego estudian la estimación de la respuesta aleatoria como la trató Krishnamoorthy y Raghavarao (1993) y Lakshmi y Raghavarao (1992). También se refirieron al teléfono basado en respuesta aleatoria de Warner (1986), y la maximización de la esperanza basada en el método de máxima verosimilitud de Bourke (1990). Además cubrieron el enfoque de Ljungqvist (1993) para el riesgo del encuestado como continuación de las obras de Lanke y Flinger et al. (1977). También se refieren a los estudios empíricos de respuesta aleatoria por Danermark y Swensson (1987) y por Duffy y Waterton (1988), sobre el fumar hachís o marihuana y también el estudio del uso de la cocaína por Kerkvliet (1994), como hemos mencionado antes. Sanghamitra Pal Esto combina una técnica de respuesta aleatoria con la técnica de recuento de elementos (ICT), permitiendo la opción de que el encuestado vaya para, o bien la técnica de respuesta aleatoria o la técnica de recuento de elementos, sin revelar al entrevistador la opción elegida. La técnica de recuento de elementos se aplica en la toma de dos muestras independientes y de inclusión positivas y siguiendo el mismo diseño de muestreo para y para con probabilidades en . En contraste con esta técnica de recuento de elementos, la técnica de respuesta aleatoria fue la recomendada por Pal (2007). 53 Otras técnicas de respuesta aleatoria Amitava Saha La técnica de respuesta aleatoria de Dalenius y Vitale (1974), basada en resultados obtenidos de muestreo aleatorio simple con reemplazamiento, fue ampliada por Chaudhuri (2002). Saha (2003) aplicó el enfoque del procedimiento respuesta aleatoria opcional (ORR) de Chaudhuri y Mukerjee (1985, 1988) de la división de una muestra dada en dos partes: una da las respuestas directas y la otra las respuestas aleatorias, a fin de mejorar la eficiencia en la estimación a través de Rao-Blackwellization. Saha (2003) explicó numéricamente con datos ficticios cómo Dalenius y Vitale (1974) a base de datos de respuesta directa contra respuesta aleatoria, mediante respuesta aleatoria opcional, muestra una mejora sobre el enfoque de respuesta aleatoria obligatoria (CRR) para muestreo aleatorio simple con reemplazamiento y de manera más destacada para muestreo aleatorio simple sin reemplazamiento y aun así más para Rao-Hartley-Cochran (1962) basado en datos muestrales. Strachan, King, y Sarjinder Singh Consideran que la estimación para el modelo de regresión cuando las observaciones sobre el vector de las variables dependientes no están disponibles directamente, como en el caso de situaciones de interés, sino que las variables están “codificadas”, ya sea en forma aditiva, de Himmelfarb y Edgel (1980) o en forma de producto, tratado por Eichhorn y Hayne (1989), se utilizan como transformadores con distribuciones conocidas con parámetros conocidos. Sarjinder Singh et al. (1996) proporcionan materiales básicos para la inicialización de los acontecimientos relevantes. Consideran el método de los momentos (MM), máxima verosimilitud (MLE), y los métodos de estimación Bayesiana. Necesitan la aplicación del algoritmo de maximización de la esperanza (EM), y la técnica de Cadenas de Markov Monte Carlo (MCMC), que implican los entrevistadores de Gibbs y algoritmos de Metropolis-Hastings (MHA), recurriendo a los complicados procedimientos de cálculo Bayesiano, desarrollado por los trabajos de Gelfand y Smith (1990), Tanner (1993), y Smith y Robert (1993). 54 Respuesta aleatoria y técnicas de preguntas indirectas Sanghamitra Pal La técnica de respuesta aleatoria de Takahasi y Sakasegawa (1977), teniendo como base el muestreo aleatorio simple con reemplazamiento en Chaudhuri y Mukerjee (1988) y extendido por Pal (2007), cubrió a los esquemas generales de muestreo que se han descrito en “Esquema modificado de Takahasi y Sakasegawa por Pal (2007)”. En un trabajo posterior, Pal (2009) ha ampliado aún más el trabajo para incluir la cobertura de respuesta aleatorizada opcional única a esta técnica de respuesta aleatorizada implícita (IRR) de Takahasi et al. (1983), siguiendo los enfoques paralelos de Chaudhuri y Saha (2005), Chaudhuri y Dihidar (2009), y Pal (2009) respectivamente, cuando el encuestado (1) da abiertamente la verdad sobre si tiene o y (2) como alternativa, o bien opta por una respuesta directa o determina una respuesta aleatorizada implícita, sin divulgar la opción realmente ejercida. En este contexto, Pal obtiene un estimador insesgado para junto con un estimador de varianza insesgado esencialmente, a lo largo de la dirección seguida por Chaudhuri y Dihidar (2009). Ardo van den Hout y P.G.M. van der Heijden Estos autores reconocen la respuesta aleatoria estableciéndola como un caso particular de “control de divulgación estadística y clasificación errónea”. Por ejemplo, para la técnica de Warner (1965) basada en muestreo aleatorio simple con reemplazamiento, cuenta con la estructura: Señalan que cuando se aplica el método de los momentos para estimar estimadores no pueden ser viables para ciertos mecanismos de , los . Pero el método de máxima verosimilitud no es sensible a esta posibilidad, la estimación exige un estudio del “problema de límites” si un valor estimado se sitúa en el “límite” del “espacio de parámetros”. Asimismo, reconocen la necesidad de la aplicación del algoritmo de maximización de la esperanza cuando la solución de la ecuación de verosimilitud (LE) resulta difícil de conseguir. 55 Otras técnicas de respuesta aleatoria D.E. Stem y R.K. Steinhorst Estos autores describen cómo la respuesta aleatoria puede ser útil generada por un cuestionario auto-administrativo y enviado por correo o por métodos de entrevistas telefónicas. Métodos prácticos detallados se dan con resultados ilustrados. Ravindra Singh, Sarjinder Singh, y N.S. Mangat Estos autores formularon una teoría detallada para la técnica de encuesta por correo para obtener datos sobre las características de interés. El álgebra es muy interesante, ya que implica muestreo aleatorio simple sin reemplazamiento en lugar de muestreo aleatorio simple con reemplazamiento, y también la estratificación de los encuestados en los posibles encuestados en el primer intento y el conjunto dicotómico complementario de las personas. También se refieren a obras similares anteriores de Singh et al. (1993). D.R. Bellhouse Bellhouse aborda el problema de estimar el coeficiente de correlación en una población finita entre dos variables, ambas consideradas de interés. Consideró apropiado no exponer claramente por qué es así; supone tres técnicas de respuesta aleatoria específicas concretamente, (1) técnica de respuesta no relacionada de Greenberg et al. (1969), (2) codificador aditivo de Pollock y Bek (1976) y (3) su codificador multiplicativo para garantizar el anonimato en la respuesta verdadera. Lo más importante es que él consideró diseños de muestreo probabilístico generales ilustrando en particular, muestreo aleatorio simple sin reemplazamiento en extracciones. Yan, Zaizai y Nie, Zankan Notemos las dos definiciones conceptuales de abajo como las citadas de Yan y Nie (2004). Todo el desarrollo se limita sólo al muestreo aleatorio simple con reemplazamiento en extracciones. Definición Para el diseño de respuesta aleatoria con respuestas “Sí” (Y) – “No” (N), sólo | es el nivel de protección. 56 | | | Respuesta aleatoria y técnicas de preguntas indirectas Definición Un diseño es mejor que un diseño si y (̂ ) (̂ ) Las definiciones de Nayak (1994) son diferentes. Yan y Nie (2004) insisten en comparar dos procedimientos de respuesta aleatoria sólo a través de las definiciones anteriores. 57 Otras técnicas de respuesta aleatoria 58 Respuesta aleatoria y técnicas de preguntas indirectas CAPÍTULO 3: APLICACIONES DE LA TÉCNICA DE RESPUESTA ALEATORIA Introducción Llegados a este punto, vamos a ejemplificar un par de aplicaciones realizadas con datos reales en dos Universidades, Ejemplo de la Universidad Nacional del Callao Presentamos la metodología que se siguió para aplicar el cuestionario de preguntas a través de encuesta directa. De igual manera, se presenta una breve descripción del proceso diseñado para la aplicación de las preguntas del método de respuesta aleatoria. La encuesta se aplicó a una muestra representativa de la población de estudiantes de la facultad de Ciencias Económicas de la Universidad Nacional del Callao. Diseño de la encuesta Con la finalidad de comprobar la eficacia del método de respuesta aleatoria, incluimos también una encuesta directa para poder comparar los resultados. Las preguntas en ambas encuestas, serán las mismas; sin embargo para el método de respuesta aleatorizada, será necesario tener una serie de preguntas no sensibles, con probabilidades conocidas. Formato de Encuesta Directa Tiene como finalidad la medición de 5 variables categóricas. Las 5 preguntas miden variables cualitativas y tienen como única opción de respuesta SI o NO. 59 Aplicaciones de la técnica de Respuesta Aleatoria Encuesta anónima Marca con un X tu respuesta Sexo Femenino Masculino 1.¿Sueles consumir alimentos o bebidas en la sala de cómputo? SÍ NO 2.¿Alguna vez has consumido drogas alucinógenas? SÍ NO 3.¿Algunas veces has copiado en los exámenes? SÍ NO 4.¿Has consumido bebidas alcohólicas, cerca a la Universidad? SÍ NO 5.¿En este ciclo, has faltado a clase sin motivo justificable? SÍ NO Este cuestionario será aplicado a la muestra de estudiantes hombres y mujeres, de la forma convencional o directa. Formato de Encuesta con la técnica de Respuesta Aleatorizada Para la técnica de respuesta aleatoria, se aplica el método U, para lo cual es necesario un cuestionario adicional con las siguientes características: Las preguntas no deben de ser sensibles. No deben estar relacionadas con el tema de la pregunta “sensible”. Para cada una de las preguntas que miden variables cualitativas, las respuestas deben tener una probabilidad conocida. 60 Respuesta aleatoria y técnicas de preguntas indirectas Encuesta anónima Marcar con un X su respuesta Sexo Femenino Juego 1 ¿Sueles consumir alimentos o bebidas en la sala de cómputo? ¿Naciste en el mes de julio? SÍ NO SÍ NO ROJO ¿Alguna vez has consumido drogas alucinógenas (marihuana, PBC, etc.)? ¿Tu DNI termina en número 2? NEGRO ROJO ¿Algunas veces has copiado en los exámenes? ¿Naciste en el mes de diciembre? SÍ NO ¿Has consumido bebidas alcohólicas, cerca a la Universidad? ¿Naciste en el mes de enero? SÍ NO ¿En este ciclo, has faltado a clase sin motivo justificable? ¿Tu DNI termina en número 5? SÍ NO NEGRO ROJO Juego 2 Juego 3 Juego 4 NEGRO NEGRO ROJO Juego 5 Masculino NEGRO ROJO Para la estimación de resultados, será necesario tomar en cuenta las probabilidades del cuestionario de preguntas no sensibles: # 1 2 3 4 5 Pregunta ¿Naciste en el mes de julio? ¿Tu DNI termina en número 2? ¿Naciste en el mes de diciembre? ¿Naciste en el mes de enero? ¿Tu DNI termina en número 5? Probabilidad de respuesta 1/12 1/10 1/12 1/12 1/10 Diseño de muestra para Encuesta Directa Para la encuesta directa, se diseñó una muestra aleatoria con un error máximo de 4.7% y una confiabilidad de 95%. Determinamos el tamaño muestral, obteniendo que el cuestionario de preguntas se aplicará a una muestra de 340 estudiantes. 61 Aplicaciones de la técnica de Respuesta Aleatoria Diseño de muestra para Encuesta con la técnica de Respuesta Aleatorizada Para determinar el tamaño de la muestra, se usó el método de muestreo aleatorio simple para la estimación de proporciones, con un error no mayor de 4.2% a efectos de tener un tamaño de muestra mayor que en el caso de la encuesta directa y con una confiabilidad del 95%, resultando un tamaño de 404 estudiantes. Descripción de la técnica de Encuesta Directa Consta de preguntas directas hechas por un entrevistador. Los cuestionarios fueron contestados por escrito marcando la respuesta de las preguntas categóricas con un aspa por el propio encuestado y posteriormente depositados en un sobre para darles mayor confidencialidad. Descripción de la técnica de Encuesta de Respuesta Aleatoria Con la finalidad de darle más confianza al encuestado, se les entregó una cartilla de instrucciones: Paso 1: Baraja las cartas que te van a entregar Paso 2: Selecciona una carta al azar y no se la muestres a NADIE Paso 3: La pregunta que contestarás en cada juego, dependerá del COLOR de la carta que obtengas: Si es color negro, contesta a la pregunta NEGRO Si es color rojo, contesta a la pregunta ROJO Este procedimiento lo repetirás para cada juego El encuestado únicamente tuvo que poner en la hoja de preguntas un aspa en la respuesta que elegía y después de haber terminado de llenar los espacios con las respuestas, se depositaba la ficha de la encuesta en una bolsa. En el desarrollo de la técnica de respuesta aleatorizada es necesario utilizar un proceso aleatorio que nos ayude a aleatorizar las respuestas. El procedimiento que se eligió es un grupo de 6 cartas de una baraja inglesa, con 4 cartas negras y 2 rojas y que va a dar lugar a un juego fácil de ejecutar. La anterior forma de distribución nos permite conocer fácilmente la probabilidad de que cualquier carta sea escogida al azar. Las preguntas sensibles están precedidas de la palabra Negro, y las no sensibles de la palabra Rojo. Cuando se aplica la encuesta a cada estudiante de la muestra, 62 Respuesta aleatoria y técnicas de preguntas indirectas se le entrega el grupo de cartas, para que lo revuelva como se hace usualmente. Después se le pide que elija una carta al azar. Si la carta que elije es de color negro, las preguntas que tendrá que contestar serán las sensibles. Por otra parte si la carta que elije es de color rojo, las preguntas que tendrá que contestar serán las no sensibles. De esta forma conocemos la probabilidad de que nos conteste a las preguntas sensibles, que es 4/6, y como consecuencia, la probabilidad de que nos conteste las preguntas no sensibles es de 2/6. Con esto garantizamos que la probabilidad del cuestionario del cual nos interesa conocer las respuestas, tiene más probabilidad de ser contestado. Resultados Los resultados que se obtuvieron después de la aplicación de las encuestas son sumamente importantes, ya que a partir de éstos podemos hacer inferencias, comparaciones y contrastes. Comparación y contraste de ambas técnicas Uno de los objetivos de este trabajo es comprobar la eficacia de la técnica de respuesta aleatorizada, por medio de la comparación y el contraste de las estimaciones obtenidas con el método de encuesta directa contra los de la aleatorizada. Preguntas sensibles 1.¿Sueles consumir alimentos o bebidas en la sala de cómputo? 2.¿Alguna vez has consumido drogas alucinógenas? 3.¿Algunas veces has copiado en los exámenes? 4.¿Has consumido bebidas alcohólicas, cerca a la Universidad? 5.¿En este ciclo, has faltado a clase sin motivo justificable? Proporción Encuesta directa Proporción Respuesta aleatorizada Varianza Encuesta directa Varianza Respuesta aleatorizada 0.32058824 0.52052 0.0006406 0.000129404 0.08235294 0.227826 0.0002222 0.000083361 0.78235294 0.819767 0.0005008 0.000134604 0.53529412 0.616575 0.0007316 0.000135904 0.62352941 0.685932 0.0006904 0.000137820 63 Aplicaciones de la técnica de Respuesta Aleatoria Podemos notar que no son muy grandes las diferencias en cuanto a los valores que tienen las proporciones de las preguntas 3 y 5, que son las referentes a copiar en los exámenes y faltar a clases injustificadamente. También se aprecia fácilmente la diferencia entre las proporciones resultantes de ambas técnicas, ya que las obtenidas por medio de encuesta directa, son más pequeñas que las obtenidas por medio de respuestas aleatorizadas. Esto se traduce en que con la primera técnica, la población encuestada no acepta su participación en ciertas acciones, etiquetadas y rechazadas por la sociedad en general. Es importante mencionar que el método de respuesta aleatoria proporciona estimaciones con errores típicos pequeños, por lo que si bien no puede afirmarse que los resultados obtenidos resulten 100% verdaderos, son muy cercanos a la realidad. Ejemplo de la Universidad de Granada Presentamos una breve descripción del proceso que hemos diseñado para la aplicación de las preguntas del método de respuesta aleatoria, mediante el modelo U. La encuesta la aplicamos a una muestra representativa de la población de estudiantes de la Universidad de Granada. El muestreo se hizo mediante muestreo por conglomerados. Diseño de la encuesta Formato de Encuesta con el modelo U Para esta técnica de respuesta aleatoria, se aplica el método U, para lo cual es necesario un cuestionario adicional con las siguientes características: Las preguntas no deben de ser sensibles. No deben estar relacionadas con el tema de la pregunta “sensible”. Para cada una de las preguntas que miden variables cualitativas, las respuestas deben tener una probabilidad conocida. 64 Respuesta aleatoria y técnicas de preguntas indirectas Encuesta anónima Marcar con un X su respuesta Sexo Femenino Masculino Titulación Curso 1º 2º 3º 4º 5º CARA CRUZ ¿Has copiado alguna vez en un examen? ¿Naciste el mes de julio? SÍ NO CARA CRUZ ¿Te has peleado con algún profesor? ¿Tu DNI termina en número 2? SÍ NO CARA CRUZ ¿Has sufrido acoso? ¿Naciste del 1 al 20 del mes? SÍ NO CARA CRUZ ¿Has acosado alguna vez a alguien? ¿Tu DNI termina en número 5? SÍ NO ¿Has consumido drogas en las instalaciones de la universidad? ¿Naciste del 15 al 25 del mes? SÍ NO ¿Has mantenido relaciones sexuales en las instalaciones de la universidad? ¿Naciste el mes de abril? SÍ NO CARA CRUZ CARA CRUZ Para la estimación de resultados, será necesario tomar en cuenta las probabilidades del cuestionario de preguntas no sensibles: # 1 2 3 4 5 6 Pregunta ¿Naciste el mes de julio? ¿Tu DNI termina en número 2? ¿Naciste del 1 al 20 del mes? ¿Tu DNI termina en número 5? ¿Naciste del 15 al 25 del mes? ¿Naciste el mes de abril? Probabilidad de respuesta 1/12 1/10 20/30 1/10 10/30 1/12 65 Aplicaciones de la técnica de Respuesta Aleatoria Descripción de la técnica del modelo U Con la finalidad de darle más confianza al encuestado, se les entregó una cartilla de instrucciones: Paso 1: Lanza una moneda y no le muestres a NADIE el lado obtenido Paso 2: La pregunta que contestarás en cada juego, dependerá de que obtengas CARA o CRUZ: Si es cara, contesta a la pregunta CARA Si es cruz, contesta a la pregunta CRUZ Este procedimiento lo repetirás para cada juego El encuestado únicamente tuvo que poner en la hoja de preguntas un aspa en la respuesta que elegía y después de haber terminado de llenar los espacios con las respuestas, se depositaba la ficha de la encuesta en una bolsa. En el desarrollo de la técnica de respuesta aleatorizada es necesario utilizar un proceso aleatorio que nos ayude a aleatorizar las respuestas. El procedimiento que se eligió es lanzar una moneda, un lado cara y otro cruz, que va a dar lugar a un juego fácil de ejecutar. La anterior forma de distribución nos permite conocer fácilmente la probabilidad de que cualquier lado sea escogido al azar. Las preguntas sensibles están precedidas de la palabra Cara, y las no sensibles de la palabra Cruz. Cuando se aplica la encuesta a cada estudiante de la muestra, se le entrega la moneda. Después se le pide que la lance al azar. Si el lado que obtiene es de cara, las preguntas que tendrá que contestar serán las sensibles. Por otra parte si el lado que obtiene es cruz, las preguntas que tendrá que contestar serán las no sensibles. De esta forma conocemos la probabilidad de que nos conteste a las preguntas sensibles, que es 1/2, y como consecuencia, la probabilidad de que nos conteste las preguntas no sensibles es de 1/2. Con esto garantizamos la total aleatoriedad de respuesta. Resultados Los resultados que se obtuvieron después de la aplicación de la encuesta son sumamente importantes, ya que a partir de éstos podemos hacer inferencias, comparaciones y contrastes. 66 Respuesta aleatoria y técnicas de preguntas indirectas Estimación por medio del modelo U Para la estimación de las proporciones para las variables cualitativas en la Técnica de Respuesta Aleatoria, se realizaron los siguientes pasos: Por medio del programa SPSS, podemos saber fácil y rápidamente el número de estudiantes de la muestra que hay en cada titulación, en cada curso y por sexos y los que respondieron afirmativamente a cada una de las preguntas. Titulación titulacion Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado lic.matematicas 10 3,2 3,2 3,2 grado.matematicas 50 15,8 15,8 18,9 grado.ing.quimica 10 3,2 3,2 22,1 grado.farmacia 65 20,5 20,5 42,6 lade 34 10,7 10,7 53,3 6 1,9 1,9 55,2 grado.primaria 61 19,2 19,2 74,4 grado.turismo 72 22,7 22,7 97,2 derecho-lade 1 ,3 ,3 97,5 dip.turismo 1 ,3 ,3 97,8 NS NC 7 2,2 2,2 100,0 317 100,0 100,0 grado.infantil Total La muestra consta de 317 alumnos. Licenciados en Matemáticas son 10, Graduados en Matemáticas 50, Graduados en Ingeniería Química 10, Graduados en Farmacia 65, Licenciados en Administración y Dirección de Empresas 34, Graduados en Infantil 6, Graduados en Primaria 61, Graduados en Turismo 72, Licenciados en Derecho y Administración y Dirección de Empresas 1, Diplomados en Turismo 1, y no sabe, no contesta 7. 67 Aplicaciones de la técnica de Respuesta Aleatoria Curso curso Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado primero 211 66,6 66,6 66,6 segundo 19 6,0 6,0 72,6 tercero 24 7,6 7,6 80,1 cuarto 23 7,3 7,3 87,4 quinto 22 6,9 6,9 94,3 NS NC 18 5,7 5,7 100,0 317 100,0 100,0 Total La muestra consta de 317 alumnos. De primero son 211, de segundo 19, de tercero 24, de cuarto 23, de quinto 22, y no sabe, no contesta 18. 68 Respuesta aleatoria y técnicas de preguntas indirectas Sexo sexo Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado mujer 194 61,2 61,2 61,2 hombre 108 34,1 34,1 95,3 NS NC 15 4,7 4,7 100,0 317 100,0 100,0 Total La muestra consta de 317 alumnos. Mujeres son 194, hombres 108 y no sabe, no contesta 15. 69 Aplicaciones de la técnica de Respuesta Aleatoria Pregunta 1:¿Has copiado alguna vez en un examen? / ¿Naciste el mes de julio? Pregunta1 Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado si 152 47,9 47,9 47,9 no 164 51,7 51,7 99,7 1 ,3 ,3 100,0 317 100,0 100,0 NS NC Total Se observa que el 47.9% de los estudiantes contestaron afirmativamente a la pregunta frente al 51.7% que contestaron negativamente. Pregunta 2:¿Te has peleado con algún profesor? / ¿Tu DNI termina en número 2? Pregunta2 Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado si 66 20,8 20,8 20,8 no 250 78,9 78,9 99,7 1 ,3 ,3 100,0 317 100,0 100,0 NS NC Total Se observa que el 20.8% de los estudiantes contestaron afirmativamente a la pregunta frente al 78.9% que contestaron negativamente. 70 Respuesta aleatoria y técnicas de preguntas indirectas Pregunta 3:¿Has sufrido acoso? / ¿Naciste del 1 al 20 del mes? Pregunta3 Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado si 135 42,6 42,6 42,6 no 181 57,1 57,1 99,7 1 ,3 ,3 100,0 317 100,0 100,0 NS NC Total Se observa que el 42.6% de los estudiantes contestaron afirmativamente a la pregunta frente al 57.1% que contestaron negativamente. 71 Aplicaciones de la técnica de Respuesta Aleatoria Pregunta 4:¿Has acosado alguna vez a alguien? / ¿Tu DNI termina en número 5? Pregunta4 Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado si 34 10,7 10,7 10,7 no 281 88,6 88,6 99,4 2 ,6 ,6 100,0 317 100,0 100,0 NS NC Total Se observa que el 10.7% de los estudiantes contestaron afirmativamente a la pregunta frente al 88.6% que contestaron negativamente. Pregunta 5:¿Has consumido drogas en las instalaciones de la universidad? / ¿Naciste del 15 al 25 del mes? Pregunta5 Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado si 70 22,1 22,1 22,1 no 246 77,6 77,6 99,7 1 ,3 ,3 100,0 317 100,0 100,0 NS NC Total Se observa que el 22.1% de los estudiantes contestaron afirmativamente a la pregunta frente al 77.6% que contestaron negativamente. 72 Respuesta aleatoria y técnicas de preguntas indirectas Pregunta 6:¿Has mantenido relaciones sexuales en las instalaciones de la universidad? / ¿Naciste el mes de abril? Pregunta6 Frecuencia Válidos Porcentaje Porcentaje Porcentaje válido acumulado si 21 6,6 6,6 6,6 no 295 93,1 93,1 99,7 1 ,3 ,3 100,0 317 100,0 100,0 NS NC Total Se observa que el 6.6% de los estudiantes contestaron afirmativamente a la pregunta frente al 93.1% que contestaron negativamente. 73 Aplicaciones de la técnica de Respuesta Aleatoria Se asignaron los datos conocidos de las probabilidades de las preguntas no sensibles, así como los datos obtenidos del programa para cada una de las preguntas sensibles como se presentan en la tabla 1. Tamaño de la muestra = 317 estudiantes, Tamaño de la población = 53376 Probabilidad de la Número de Respuestas sí p 1-p característica no pregunta en la muestra sensitiva 152 0.5 1-0.5=0.5 1/12=0.0833 1 66 0.5 0.5 1/10=0.1 2 135 0.5 0.5 20/30=0.6666 3 34 0.5 0.5 0.1 4 70 0.5 0.5 10/30=0.3333 5 21 0.5 0.5 0.0833 6 Tabla1. Datos obtenidos de la encuesta y probabilidades conocidas El cálculo de la proporción y la estimación de la característica sensible se presenta en la Tabla 2, para la muestra total utilizando la fórmula explicada en el modelo U. (Todos los cálculos los he programado con R) ⁄ ⁄ Estimación de la Proporción característica sensible 0.47949527 0.87565720 1 0.20820189 0.31640379 2 0.42586751 0.18506835 3 0.10725552 0.11451104 4 0.22082019 0.10830705 5 0.06624606 0.04915878 6 Tabla 2. Estimación de las proporciones Número de pregunta Al tener las proporciones estimadas a partir de la muestra, se procede a calcular las varianzas de los estimadores de las preguntas sensibles, las cuales se presentan en la Tabla 3. 74 Respuesta aleatoria y técnicas de preguntas indirectas Número de Varianza pregunta 4.687036e-05 1 1.915936e-05 2 2.613577e-05 3 9.324953e-06 4 1.58719e-05 5 5.578476e-06 6 Tabla 3. Varianzas definitivas Comentario Teniendo en cuenta las preguntas sensibles Pregunta 1:¿Has copiado alguna vez en un examen? Pregunta 2:¿Te has peleado con algún profesor? Pregunta 3:¿Has sufrido acoso? Pregunta 4:¿Has acosado alguna vez a alguien? Pregunta 5:¿Has consumido drogas en las instalaciones de la universidad? Pregunta 6:¿Has mantenido relaciones sexuales en las instalaciones de la universidad? y a la vista de las tablas vemos que las proporciones, las cuales indican la probabilidad de contestar afirmativamente a la pregunta, sin tener en cuenta si es sensible o no, de algunas preguntas son relativamente bajas, lo que nos dice que esas preguntas son consideradas por los encuestados mucho más sensibles que las demás, como por ejemplo las preguntas 6 y 4. Pero también es importante mencionar que en las preguntas 1 y 3 se tienen proporciones altas, lo cual significa que esas preguntas que se consideraban sensibles, en realidad para los estudiantes no lo son tanto. En cuanto a la estimación de la característica sensible, ésta nos indica la probabilidad de contestar afirmativamente ante una pregunta sensible. Vemos como por ejemplo en la pregunta 1 la probabilidad de responder Sí aumenta casi al doble, también aumenta en las preguntas 2 y 4, pero en menor medida, mientras que en las preguntas 3 y 5 se reduce casi a la mitad. La probabilidad de la pregunta 6 apenas varía. Como podemos ver las varianzas de todas las preguntas son muy pequeñas, por lo que la estimación de la característica sensible es bastante precisa. 75 Aplicaciones de la técnica de Respuesta Aleatoria Si en lugar de hacerlo con el total de la población, estratifico mediante la variable sexo, los resultados serían: Estrato: Mujer Tamaño de la muestra = 194 estudiantes; Tamaño de la población = 30644 Probabilidad Estimación de Número Respuestas de la la de sí en la p 1-p Proporción característica característica pregunta muestra no sensitiva sensible 91 0.5 1-0.5=0.5 1/12=0.0833 0.46907216 0.85481100 1 40 0.5 0.5 1/10=0.1 0.20618557 0.31237113 2 81 0.5 0.5 20/30=0.6666 0.41752577 0.16838488 3 13 0.5 0.5 0.1 0.06701031 0.03402062 4 44 0.5 0.5 10/30=0.3333 0.22680412 0.12027491 5 10 0.5 0.5 0.0833 0.05154639 0.01975945 6 Varianza 7.982517e-05 3.302979e-05 4.534204e-05 9.413053e-06 2.829673e-05 7.158287e-06 Estrato: Hombre Tamaño de la muestra = 108 estudiantes; Tamaño de la población = 22732 Probabilidad Estimación de Número Respuestas de la la de sí en la p 1-p Proporción Varianza característica característica pregunta muestra no sensitiva sensible 52 0.5 1-0.5=0.5 1/12=0.0833 0.48148148 0.87962963 0.0001105202 1 23 0.5 0.5 1/10=0.1 0.21296296 0.32592593 4.607634e-05 2 49 0.5 0.5 20/30=0.6666 0.45370370 0.24074074 6.21846e-05 3 15 0.5 0.5 0.1 0.13888889 0.17777778 2.913172e-05 4 21 0.5 0.5 10/30=0.3333 0.19444444 0.05555556 3.340046e-05 5 8 0.5 0.5 0.0833 0.07407407 0.06481481 1.493517e-05 6 Comentario Volvemos a recordar las preguntas sensibles Pregunta 1:¿Has copiado alguna vez en un examen? Pregunta 2:¿Te has peleado con algún profesor? Pregunta 3:¿Has sufrido acoso? Pregunta 4:¿Has acosado alguna vez a alguien? Pregunta 5:¿Has consumido drogas en las instalaciones de la universidad? Pregunta 6:¿Has mantenido relaciones sexuales en las instalaciones de la universidad? Las preguntas más sensibles siguen siendo la 6 y la 4, pero esta vez al estratificar por sexos, vemos que para las mujeres son más sensibles que para los hombres. Las preguntas 1 y 3 vuelven a tener las proporciones más altas, siendo mayores en los hombres. 76 Respuesta aleatoria y técnicas de preguntas indirectas En general las proporciones de todas las preguntas, excepto la 5, son mayores en los hombres, siendo especialmente notable en la pregunta 4. En cuanto a la estimación de la característica sensible las preguntas 1 y 2 tienen valores semejantes en ambos sexos, sin embargo en las preguntas 3,4 y 6 la probabilidad de contestar afirmativamente en los hombres es superior a la de las mujeres, siendo en la pregunta 4 un aumento muy notable, es decir, para las mujeres es mucho más sensible que para los hombres, y en la pregunta 5 la probabilidad en las mujeres es más del doble que en los hombres, con lo cual, esta pregunta es más sensible para los hombres. Como podemos ver las varianzas de todas las preguntas son muy pequeñas en ambos sexos, por lo que la estimación de la característica sensible es bastante precisa. 77 Aplicaciones de la técnica de Respuesta Aleatoria 78 Respuesta aleatoria y técnicas de preguntas indirectas BIBLIOGRAFÍA Referencias Adhikary, A.K., Chaudhuri, A., and Vijayan, K. 1984. Optimum sampling strategies for RR trials. Int. Stat. Rev. 52, 115-125. Ahsanullah, M. and Eichhorn, B.H. 1988. On estimation of response from scrambled quantitative data. Pak, J. Statist. 4A, 83-91. Arnab, R. 1990. On commutativity of design and model expectations in randomized response surveys. Comm. Stat. Theo. Math. 19, 3751-3757. Arnab, R. 1994. Non-negative variance estimator in randomized response surveys. Comm. Stat. Theo. Math. 23, 1743-1752. Arnab, R. 1995a. On admissibility and optimality of sampling strategies in randomized response surveys. Sankhya, Ser B. 37(3), 385-390. Arnab, R. 1995b. Optimal estimation of a finite population total under randomized response surveys. Statistics 27(1), 175-180. Arnab, R. 1996. Randomized response trials: a unified approach for qualitative data. Comm. Stat. Theo. Math. 25(6), 1173-1183. Arnab, R. 1998. Randomized response surveys: Optimum estimation of a finite population total. Statistical Papers 39(4), 405-408. Arnab, R. 2001. Optimum sampling strategies under randomized surveys. Stat. Papers 54, 159-177. Arnab, R. 2004. Optional randomized response techniques for complex designs. Biom. J. 46, 114-124. Asok, C. 1980. A note on the comparison between simple mean and mean based on distinct units in sampling with replacement. Am. Statist. 34, 158. Bansal, M.L., Singh, S., and Singh, R. 1994. Multi-character survey using randomized response technique. Comm. Statist. – Theory Methods 23(6), 1705-1715. Basu, D. 1958. On sampling with and without replacement. Sankhya 20, 287-294. Bellhouse, D.R. 1995. Estimation of correlation in randomized response. Survey Methodology 21(1), 13-19. Bhargava, M. and Singh, R. 1999. On the relative efficiency of certain randomized response strategies. JISAS 52(2), 245-253. Boruch, R.F. 1972. Relations among statistical methods for assuring confidentiality of social research data. Soc. Sci. Rec. 1, 403-414. 79 Bibliografía Bourke, P.D. 1990. Estimating a distribution for each category of a sensitive variate. Comm. Stat. Theo. Math. 19, 3233-3241. Bouza, C.N. 2009. Ranked set sampling and randomized response procedures for estimating the mean of a sensitive quantitative character. Metrika, DOI. 10. 1007 / s00 / 84 – 008 – 0191 – 6, 267-277. Chang, H.J. and Liang, D.H. 1996. A two-stage unrelated randomized response procedure. Aust. J. Stat. 33(1), 43-51. Chang, H. J., Wang, C. L., and Huang, K. C. 2004. On estimating the proportion of a qualitative sensitive character using randomized response sampling. Quality and Qauntity 38, 675-680. Chaudhuri, A. 1987. Randomize response surveys of finite populations: A unified approach with quantitative data. J. Stat. Plan. Inf. 15, 157-165. Chaudhuri A. 1992. Randomized Response: Estimating mean square errors of linear estimators and finding optimal unbiased strategies. Metrika 39, 341-357. Chaudhuri, A. 2001a. Using randomized response from a complex survey to estimate a sensitive proportion in a dichotomous finite population. J. Stat. Plan. Inf. 94, 37-42. Chaudhuri, A. 2001b. Estimating sensitive proportions from unequal probability samples using randomized responses. Pak. J. Stat. 17(3), 259-270. Chaudhuri, A. 2002. Estimating sensitive proportions from randomized responses in unequal probability sampling. CSAB 52, 315-322. Chaudhuri, A. and Adhikary, A.K. 1981. On sampling strategies with RR trials and their properties and relative efficiencies. Tech. Ref. ASC / 81 / 5, Indian Statistical Institute, Calcutta. Chaudhuri, A. and Adhikary, A.K. 1990. Variance estimation with randomized response. Comm. Statist. Theory Meth. 19(3), 1119-1126. Chaudhuri, A. and Dihidar, K. 2009. Estimating means of stigmatizing qualitative and quantitative variables from discretionary responses randomized or direct. Sankhya B 71, 123-136. Chaudhuri, A. and Mukerjee, R. 1985. Optionally randomized responses techniques CSAB 34, 225-229. Chaudhuri, A. and Mukerjee, R. 1988. Randomized Responses: Theory and Techniques. Marcel Dekker, New York, NY. 80 Respuesta aleatoria y técnicas de preguntas indirectas Chaudhuri, A. and Saha, A. 2005a. On relative efficiencies of optional versus compulsory randomization i responses: A simulation-based numerical study covering three RR schemes. Pak. J. Stat. 21(1), 87-98. Chaudhuri, A. and Saha, A. 2005b. Optional versus compulsory randomized response techniques in complex surveys. J. Stat. Plan. Inf. 135, 516-527. Chaudhuri, A. and Stenger, H. 1992. Theory and Methods of Survey Sampling. Marcel Dekker, Inc. NY. Chaudhuri, A. and Stenger, H. 2005. Survey Sampling: Theory and Methods (2nd Edn). New York, NY: Chapman & Hall. Chaudhuri, A and Vos, J.W.E. 1988. Unified theory and strategies of survey sampling. North Holland, Amsterdam. Chen, Z., Bai, Z., and Sinha, B.K. 2004. Ranked set sampling: theory and applications. Lecture Notes in Stat # 176. Springer, NY. Chikkagoudar, M.S. 1966. A note on inverse sampling with equal probabilities. Sankhya A 28, 93-96. Christofides, T.C. 2003. A generalized randomized response technique. Metrika 57, 195-200. Christofides, T.C. 2010. Comments on a method of comparison of randomized response technique. J. Stat. Plan. Inf. 140, 574-575. Chua, T.C. and Tsui, A.K. 2000. Procuring honest responses indirectly. J. Stat. Plan. Inf. 90, 107-116. Dalenius, T. and Vitale, R.A. 1974. A New RR Design for Estimating the Mean of a Distribution. Technical Report 78. Brown University, Providence, RI. Des, R. and Khamis, S.H. 1958. Some remarks on sampling with replacement. AMS 39, 550-557. Devore, J.L. 1977. A note on the randomized response technique. Communications in Statistics Theory and Methods 6: 1525-1529. Dihidar, K. 2010a. On shrinkage estimation procedure combining direct and randomized responses in unrelated question model. J. Ind. Soc. Agri. Stat. 63(3), 2009 283-286; (also online at www.isas.org.in). Dihidar, K. 2010b. Modifying classical randomized response techniques with provision for true response. Cal. Stat. Assoc. Bull. (in press). 81 Bibliografía Duffy, J.C. and Waterton, J.J. 1988. Randomized response vs. direct questioning: Estimating the prevalence of alcohol related problems in a field survey. Aust. J. Stat. 30, 1-14. Eichhorn, B.H. and Hayre, L.S. 1983. Scrambled randomized response methods for obtaining sensitive quantitative data. J. Statist. Plan. Inf. 7, 307-316. Eriksson, S.C. 1973. A new model for RR. Int. Stat. Rev. 41, 101-113. Flinger, M.A., Policello, G.E and Sing, J. 1977. A comparison of two RR survey methods with consideration for the level of respondent protection. Commun. Statist. Theory Methods 6, 1511-1524. Fox, J.A. and Tracy, P.E. 1986. Randomized Response: A Method for Sensitive Surveys. London: Sage. Franklin, L.A. 1989a. Randomized response sampling from dichotomous population with continuous randomization. Surv. Methodol. 15(2), 225-235. Franklin, L.A. 1989b. A comparison of estimators for randomized response sampling with continuous distributions from dichotomous population. Commun. Statist. Theory Method 18(2), 489-505. Gelfand, A.E., and Smith, A.F.M. 1990. Sampling-based approaches to calculating marginal densities. JASA 85, 398-409. Godambe, V.P. 1970. Foundations of survey sampling. Amer. Stat. 24, 33-38. Godambe, V.P. 1980. Estimation in RR trials. Int. Statist. Rev. 48, 29-32. Greenberg, B.G., Abul-Ela, A.-L., Simmons, W.R., and Horvitz, D.G. 1969. The unrelated question RR model: Theoretical framework. JASA 64, 520-539. Greenberg, B.G., Kuebler, R.R., Abernathy, J. R. and Horvitz, D.G. 1971. Application of the randomized response technique in obtaining quantitative data. JASA 66, 243-250. Guerriero, M. and Sandri, M.F. 2007. A note on the comparison of some randomized response procedures. J. Stat. Plan. Inf. 137, 2184-2190. Gupta, S., Gupta, B., and Singh, S. 2002. Estimation of sensitivity level of personal interview survey questions. J. Stat. Plan. Inf. 100, 239-247. Hartley, H.O. and Rao, J.N.K. 1968. A new estimation theory for sample surveys. Biometrika 55, 547-557. Hartley, H.O. and Rao, J.N.K. 1971a. Foundations of surveys sampling (a Don Quixote tragedy). Amer. Stat. 25, 21-27. 82 Respuesta aleatoria y técnicas de preguntas indirectas Hartley, H.O. and Rao, J.N.K. 1971b. Some comments on labels: A rejoinder to a section of Godambe’s paper, ‘A reply to my critics’. Sankhya, Ser. C 37, 163-170. Himmelfarb, S. and Edgell, S.E. 1980. Additive constant model: A randomized response technique for eliminating evasiveness to quantitative response questions. J. Psychol. Bull. 87, 525-530. Horvitz, D.G., Shah, B.V., and Simmons, W.R. 1967. The unrelated question RR model. Proc. Social Statist. Sec. ASA, 65-72. Huang, K.C. 2004. A survey technique for estimating the proportion and sensitivity in a dichotomous finite population. Stat. Neerlandice. 58, 75-82. Ibrahim, J.G. 1990. Incomplete data in generalized linear models. J. Amer. Stat. Assoc. 85, 765-769. Kerkvliet, J. 1994. Estimating a logit model with randomized data: The case of cocaine use. Aust. J. Stat. 36(1), 9-20. Kim, J.M. and Elam, M.E. 2005. A two-stage stratified Warner’s randomized response model using optimal allocation. Metrika 61, 1-7. Kim, J. and Warde, W.D. 2004a. A stratified Warner’s randomized response model. J. Stat. Plan. Inf. 120(1-2), 155-165. Kim, J. and Warde, W.D. 2004b. A mixed randomized response model. J. Stat. Plan. Inf. 120, 155-165. Kim, J. M., Tebbs, J., and An, S.W. 2006. Extensions of Mangat’s randomized response model. J. Stat. Plan. Inf. 136(4), 1154-1567. Krishnamoorthy, K. and Raghavarao, D. 1993. Untruthful answering in repeated randomized response procedures. Can. J. Stat. 21, 233-236. Kuk, A.Y.C. 1990. Asking sensitive questions indirectly. Biometrika 77(2), 436-438. Lakshmi, D.V. and Raghavarao, D. 1992. A test for detecting untruthful answering in randomized response procedures. J. Stat. Plan. Inf. 31, 387-390. Landsheer, J.A., Heijden, P.V.D., and Gils, G.V. 1999. Trust and understanding, two psychological aspect of randomized response. Quality Quantity 33, 1-12. Lanke, J. 1975a. Some contribution to the theory of survey sampling. PhD Thesis, University of Lund, Lund, Sweden. Lanke, J. 1975b. On the choice of unrelated question in Simmons’ version of RR. JASA 70, 80-83. Lanke, J. 1976. On the degree of protection in randomized interviews. Int. Stat. Rev. 44, 197-203. 83 Bibliografía Leysieffer, R.W. and Warner, S.L. 1976. Respondent jeopardy and optimal design in RR models. JASA 71, 649-656. Liu, P.T., Chow, L.P., and Mosley, W.H. 1975. Use of RR technique with a new randomizing device. JASA 70, 329-332. Ljungqvist, L. 1993. A unified approach to measures of privacy in randomized response models: a utilitarian perspective. JASA 88, 97-103. Maddala, G.S. 1983. Limited Dependent and Qualitative Variables in Econometrics. Cambridge University Press, New York. Mangat, N.S. 1992. Two stage randomized response sampling procedure using unrelated question. JISAS 44(1), 82-88. Mangat, N.S. 1994. An improved randomized response strategy. JRSS, Ser. B 56(1), 93-95. Mangat, N.S. and Singh, R. 1990. An alternative randomized response procedure. Biometrika 77(2), 439-442. Mangat, N. S. and Singh, R. 1991. An alternative approach to randomized response survey. Statistica 51(3), 327-332. Mangat, N.S., and Singh, S. 1994. Optional randomized response model. JISAS 32, 7175. Mangat, N.S., Singh, R., and Singh, S. 1992. An improved unrelated question randomized response strategies. CSAB 42, 227-281. Mangat, N.S., Singh, R., Singh, S., and Singh, B. 1993. On Moors’ randomized response model. Biom. J. 35, 727-32. Mangat, N.S., Singh, R., Singh, S., Bellhouse, D.R., and Kashani, H.B. 1995. On efficiency of estimator using distinct respondents in randomized response survey. Surv. Methodol. 21, 21-23. McIntire, G.A. 1952. A method of unbiased selection sampling using ranked sets. Aust. J. Agri. Res. 3, 385-390. Moors, J.J.A. 1971. Optimization of the unrelated question RR model. JASA 66, 627629. Nayak, T.K. 1994. On randomized response surveys for estimating a proportion. Comm. Statist. Theory Method, 23(3), 3303-3321. Nayak, T.K. and Adeshiyan, S.A. 2009. A unified framework for analysis and comparison of randomized response survey of binary characteristics. J. Stat. Plan. Inf. 139, 2757-2766. 84 Respuesta aleatoria y técnicas de preguntas indirectas Padmawar, V.R. and Vijayan, K. 2000. Randomized response revisited. J. Stat. Plan. Inf. 90, 293-304. Pal, S. 2002. Contributions to emerging techniques in survey sampling. Unpublished Ph. D. thesis, Indian Statistical Institute, Kolkata, India. Pal, S. 2007a. Extending Takahashi-Sakasegawa’s indirect response technique to cover sensitive surveys in unequal probability sampling. CSAB 59, 265-276. Pal, S. 2007b. Estimation the proportion of people bearing a sensitive issue with an option to item count lists and randomized response. Statist. Trans. 8(2), 301-310. Pal, S. 2008. Unbiasedly estimating the total of a stigmatizing variable from a complex survey on permitting options for direct or randomized response. Metrika 49, 157-164. Pal, S. 2009. Extending Takahasi-Sakasegawa’s indirect response technique to cover sensitive surveys in unequal probability sampling permitting direct answers. Unpublished. Pathak, P.K. 1962. On simple random sampling with replacement. Sankhya A 24, 287302. Pollock, K.H. and Bek, Y. 1976. A comparison of three RR models for quantitative data. JASA 71, 884-886. Quatember, A. 2009. To copy with nonresponse and untruthful answering. Different questioning designs for different variables. In Proceedings of the NTTS 2009 – Conferences on New Techniques and Technologies for Statistics, www.ntts2009.eu. Rao, J.N.K., Hartley, H.O., and Cochran, W.G. (RHC). 1962. On the simple procedure of unequal probability sampling without replacement. JRSS B 24, 482-491. Saha, A. 2003. On efficacies of Dalenius-Vitale technique with compulsory versus optional randomized responses from complex surveys. CSAB 21(2). Scheers, N.J. 1992. A review of randomized response techniques in measurement and evaluation in counseling and development, Meas. Eval. Couns. Dev. 25, 27-41. Scheers, N.J. and Dayton, C.M. 1988. Covariate randomized response models. JASA 83, 969-974. Sengupta, S. and Kundy, D. 1989. Estimation of finite population mean in randomized response surveys. J. Stat. Plan. Inf. 23, 117-125. Singh, R., Mangat, N.S., and Singh, S. 1993. A mail survey design for sensitive character without using randomization device. Commun. Statist. Theory Method 22(9), 2661-2668. 85 Bibliografía Singh, R., Singh, S., and Mangat, N.S. 2001. Mail survey design for sensitive quantitative variable. Unpublished. Singh, S. and Joarder, A.H. 1997. Unknown repeated trials in randomized response sampling. JISAS 50, 70-74. Singh, S. and Singh, R. 1992. Improved Franklin’s model for randomized response sampling. J. Ind. Stat. Assoc. 30, 109-122. Singh, S. and Singh, R. 1993. Generalized Franklin’s model for randomized response sampling. Commun. Statist. Theory Method 22, 741-755. Singh, S., Horn, S., and Chowdhuri, S. 1998. Estimation of stigmatized characteristics of a hidden gang in finite population. Aust. N.Z. J. Stat. 4, 291-297. Singh, S., Horn, S., Singh, R., and Mangat, N.S. 2003. On the use of modified randomization device for estimating the prevalence of a sensitive attribute. Stat. in Transition 6(4), 515-522. Singh, S., Joarder, A.H., and King, M.L. 1996. Regression analysis using scrambled responses. Aust, J. Stat. 38(2), 201-211. Singh, S., Singh, R., and Mangat, N. S. 2000. Some alternative strategies to Moor’s model. JASA 66, 627-629. Sinha, B.K. and Hedayat, A.S. 1991. Randomized response: a data-gathering tool for sensitive characteristics. In: Design and Inference finite Population Sampling. Eds. Hedayat, A.S. and Sinha, B.K., New York, NY: John Wiley & Sons, Chapter 11, 310340. Smith, A.F.M., and Robert, G.O. 1993. Bayesian complication via the Gibbs sampler and related Markov chain Monte Carlo method (with discussion). JRSS B 55, 3-23, 53102. Stem, Jr., D.E. and Steinhorst, R.K. 1984. Telephone interview and mail questionnaire application of the randomized response model. JASA 79, 555-564. Strachan, R., King, M., and Singh, S. 1998. Likelihood-based estimation of the regression model with scrambled responses. Aust. NZ. J. Stat. 40(3), 279-290. Takahasi, K. and Sakasegawa, H. 1977. An RR technique without use of any randomizing device. Ann. Inst. Stat. Math 29,1-8. Tanner, M.A. 1993. Tools for Statistical Inference: Methods for the Exploration of Posterior Distributions and Likelihood Functions. 2nd Edn. New York, NY: SpringerVerlag. 86 Respuesta aleatoria y técnicas de preguntas indirectas Tracy, D. and Mangat, N.S. 1996. Some development in randomized response sampling during the last decades: A follow up of a review by Chaudhuri and Mukherjee. JASS 4(2/3), 147-158. Tracy, D.S. and Mukhopadhyay, P. 1994. On UMVU-estimation under randomized response models. Statistics 25, 173-175. Umesh, U.N. and Peterson, R.A. 1991. A critical evaluation of the randomized response method. Soc. Meth. Res. 20(1), 104-138. Van der Hout, A. and Van der Heijden, P.G.M., 2002. Randomized response, statistical disclosure control and misclassification: A review. ISR 30(2), 269-288. Warner, S.L. 1965. RR: A survey technique for eliminating evasive answer bias. JASA 60, 63-69. Yan, Z. and Nie, Z. 2004. A fair comparison of the randomized response strategies. Unpublished. Enlaces de interés http://rev-inv-ope.univ-paris1.fr/files/31310/31310-07.pdf http://redalyc.uaemex.mx/pdf/302/30211234006.pdf http://www.udc.es/dep/mate/biometria2003/Archivos/ps44.pdf http://www.aloj.us.es/vmanzano/pdf/academia/respuestaaleatorizada.pdf http://es.scribd.com/doc/55958638/105/El-muestreo-basado-en-el-metodo-de-respuestaaleatorizada http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investi gacion/IF_JULIO_2012/IF_POMALAYA%20VERASTEGUI_FCE.pdf http://www.eio.uva.es/~tapia/erroresnomuestreo11-12.pdf http://www.dartmouth.edu/~chance/teaching_aids/RResponse/RResponse.html http://rev-inv-ope.univ-paris1.fr/files/31310/31310-06.pdf 87