ta aleatoria y técnicas de preguntas indirectas

Anuncio
Trabajo de Investigación Fin de Master
RESPUESTA ALEATORIA Y
TÉCNICAS DE PREGUNTAS
INDIRECTAS
Master Oficial en Estadística Aplicada
Departamento de Estadística e Investigación Operativa
Universidad de Granada
Autora: Beatriz Cobo Rodríguez
Tutora responsable: María del Mar Rueda García
Curso 2012/2013. Convocatoria de Junio
RESPUESTA ALEATORIA Y
TÉCNICAS DE PREGUNTAS
INDIRECTAS
Trabajo de Investigación realizado por Beatriz Cobo Rodríguez y dirigido por María del
Mar Rueda García para aspirar al Máster en Estadística Aplicada por la Universidad de
Granada.
Fdo. Beatriz Cobo Rodríguez
Vº.Bº. Directora del trabajo fin de Máster
Fdo. María del Mar Rueda García
Departamento de Estadística e Investigación Operativa
Universidad de Granada
Curso 2012/2013
ÍNDICE
Introducción…………………………………………………………………………….1
Capítulo 1: Técnicas de Respuesta Aleatoria en Diseños de Muestreo General..…5
Introducción………………………………………………………………..
5
Modelo W…………………………………………………………………..
5
Modelo U…………………………………………………………………..
10
Modelo C…………………………………………………………………... 11
Modelo H…………………………………………………………………..
12
Modelo D…………………………………………………………………..
14
Modelo M (Técnica de respuesta aleatoria de Mangat y Singh)…………... 14
Modelo de pregunta no relacionada………………………………………..
16
Técnica de respuesta aleatoria de Kuk……………………………………..
18
Técnica de respuesta aleatoria de Christofides…………………………….
20
Esquema de respuesta forzada……………………………………………
21
Esquema de Mangat………………………………….……………..……...
23
Esquema de Mangat, Singh, y Singh………………………………………
25
Esquema de Singh y Joarder……………………………………………….
26
Esquema de Dalenius y Vitale……………………………………………..
28
Esquema modificado por Pal de Takahasi y Sakasegawa ………………… 29
Técnica de respuesta aleatoria de Liu, Chow, y Mosley…………………...
30
Capítulo 2: Otras técnicas de Respuesta Aleatoria…………………………………33
Introducción………………………………………………………………..
33
Sinha y Hedayat……………………………………………………...…….
33
R. Arnab……………………………………………………………..……..
34
Nayak, Nayak y Adeshiyan, Christofides, y Quatember……………..……
36
Guerriero y Sandri…………………………………………………………. 38
Padmawar y Vijayan………………………………………………….........
38
Trabajos en respuesta aleatoria por N.S. Mangat, Ravindra Singh,
Sarjinder Singh, Sat Gupta, y Bhisham Gupta………………………...…... 39
Sarjinder Singh, Stephen Horn, Ravindra Singh, y N.S. Mangat………….
44
Sarjinder Singh, Stephen Horn, y Sadeq Chowdhury……………………...
44
Chang y Liang……………………………………………………………...
44
Kajal Dihidar……………………………………………………………….
45
Chang, Wang, y Huang y Huang…………………………………….…….
46
Kim y Elam y Kim y Warde………………………………………..……...
46
Kim, Tebbs, y An, Chua y Tsui: Sus trabajos………………………….…..
48
Carlos N. Bouza……………………………………………………...…….
49
Joe Kerkvliet……………………………………………………..…..…….
49
N.J. Scheers………………………………………………………………...
50
Umesh y Peterson……………………………………………………...…... 50
Chris Gjestvang y Sarjinder Singh……………………………………...….
51
Landsheer, Heijden, y Gils……………………………………………..….. 51
Heijden y Gils…………………………………………………………..….
52
Heiden, Gils, Bouts, y Hox……………………………………………..….
52
Tracy y Mangat…………………………………………………………….
52
Sanghamitra Pal………………………………………………………...….
53
Amitava Saha…………………………………………………………...….
54
Strachan, King, y Sarjinder Singh……………………………………..…... 54
Sanghamitra Pal…………………………………………………………....
55
Ardo van den Hout y P.G.M. van der Heijden…………………………….. 55
D.E. Stem y R.K. Steinhorst……………………………………………….
56
Ravindra Singh, Sarjinder Singh, y N.S. Mangat………………………….
56
D.R. Bellhouse……………………………………………………………..
56
Yan, Zaizai y Nie, Zankan……………………………………………...….
56
Capítulo 3: Aplicaciones de la técnica de Respuesta Aleatoria………………...…..59
Introducción…………………………………………………………….….
59
Ejemplo de la Universidad Nacional de Callao……………………………
59
Ejemplo de la Universidad de Granada………………………………...….. 64
Bibliografía…………………………………………………………………………….79
Referencias………………………………………………………….……...
79
Enlaces de interés……………………………………………………..……
87
Respuesta aleatoria y técnicas de preguntas indirectas
INTRODUCCIÓN
Una encuesta es un procedimiento de investigación que se basa en interrogar a una
muestra de individuos. Para que los resultados obtenidos sean creíbles es necesario,
entre otros aspectos, que el modo de encuestación tenga suficiente calidad o validez, lo
que exige asumir que las respuestas de los individuos son ciertas además de otros
requisitos.
Por lo tanto, en la búsqueda de respuestas seguras, los encuestadores se enfrentan a
varias dificultades, las cuales son inherentes a toda persona encuestada: inclinaciones,
tendencias, actitudes, formas de pensar y comportarnos, tiempo disponible, confianza y
desconfianza, propensión a mantener la intimidad, etc. Debido a todo esto el problema
típico que surge consiste en la deseabilidad social, la cual se define: como la tendencia
de las personas encuestadas a responder en función de lo que es aceptable socialmente,
por lo tanto existen:

Características sensitivas: situaciones donde los entrevistados sienten dañada su
intimidad al pedir que respondan un cuestionario.

Preguntas sensitivas: sirven para captar las características sensitivas de los
entrevistados, las cuales se tienen que manejar con cuidado debido a la no
respuesta o la respuesta falseada, contestando lo socialmente deseable.
En estudios de encuestas por muestreo el interés frecuentemente se centra en aspectos
sensibles o confidenciales para las personas entrevistadas, tales como uso de drogas,
evasión de impuestos, preferencias sexuales, honestidad en exámenes finales en
estudiantes universitarios, opinión respecto a autoridades, etc. Por tal motivo, muchos
entrevistados rehúsan a participar en la encuesta o proporcionan respuestas falsas o
respuestas condicionadas, ocasionando que la precisión y confiabilidad de los
estimadores se alteren de una manera importante.
La técnica de Respuestas Aleatorizadas (RA) introducida por Warner es una posible
solución para la protección del anonimato del entrevistado y es introducida para reducir
el riesgo de evasión o no respuesta de preguntas sensitivas. Consiste en la utilización de
un mecanismo aleatorio por medio del cual se selecciona una de dos preguntas
complementarias: ¿pertenece al grupo con la característica A? o ¿pertenece al grupo que
1
Introducción
no tiene la característica A?, donde A es la característica sensible de interés. El
entrevistado contestará sí o no y el entrevistador no tiene la posibilidad de saber qué
pregunta contestó el entrevistado, protegiendo así la confidencialidad del mismo.
Supuestos de la técnica de Respuestas Aleatorizadas:

Los eventos son independientes del valor de la variable verdadera.

El número de personas entrevistadas debe ser grande (ley de los grandes
números).

Las personas entrevistadas entiendan perfectamente el procedimiento y lo sigan
correctamente.
Ventajas y desventajas de la técnica de Respuestas Aleatorizadas
Ventajas:

Aumenta la probabilidad de contestar la verdad respecto a una pregunta directa.

Mayor índice de respuesta.
Desventajas:

Aumento en la complejidad de la pregunta.

Dificultad en entender el método de aleatorización.

Requiere de muestras de tamaños grandes.
La estructura de este trabajo se forma a través de capítulos, donde se van presentando
distintas técnicas de respuesta aleatoria, tanto introductorias como complementarias.
En el capítulo 1 tratamos el modelo de Warner y algunas de sus modificaciones por
parte de otros autores.
Warner (1965) en su modelo pionero, para afrontar el problema de la recogida de datos
fiables relativos a la información sensible dicotómica en una característica humana
su complementario
y
, esencialmente recomienda acercarse a una persona para que sea
muestreada en una comunidad, con una caja que contiene un cierto número de cartas
indistinguibles, de las que una proporción
resto marcadas
⁄
está marcada
y el
. A la persona elegida se le pide que extraiga una carta “aleatoria” y
responda “Sí” a una “coincidencia” entre el tipo de carta y la característica real propia
de la persona, o un “No” para una “no coincidencia”, antes de devolver la carta a la caja.
2
Respuesta aleatoria y técnicas de preguntas indirectas
No importa cómo se elige una muestra, es posible obtener por cada persona etiquetada ,
, un valor
, como 1 si tiene la característica , o 0 si la característica es
, y un estimador insesgado
, en lugar de
, con una varianza en términos de , con
respecto al experimento aleatorio involucrado en la recopilación de datos. Warner se
restringió exclusivamente a las muestras elegidas por muestreo aleatorio simple con
reemplazamiento, teniendo una respuesta aleatoria por el método anterior de forma
independiente cada vez que se elige una persona al azar. Aquí consideramos brevemente
el desarrollo actual con variaciones en los procedimientos de estimación, teniendo en
cuenta las unidades que son distintas, utilizando sólo una respuesta aleatoria de la
persona o todas las respuestas aleatorias por separado, generadas cada vez que la
persona aparece en la muestra, manteniendo el número total de extracciones en la
muestra intacto o, al número de extracciones se le permite continuar hasta un número
predeterminado de unidades distintas que aparezcan en la muestra.
Este ejercicio teórico está motivado porque en el contexto de las encuestas de respuesta
directa, Basu (1958), Pathak (1962), Des Raj and Khamis (1958), Lanke (1975a),
Chikkagoudar (1966), Asok (1980) entre otros, desarrollaron teorías detalladas de
estimación con estos tres aspectos del muestreo aleatorio simple con reemplazamiento.
Nuestro interés colectivo es acerca de cómo estos se modifican con respuesta directa al
ser reemplazados por respuesta aleatoria.
La teoría de estimación desarrollada por los seguidores de Warner se limitó sólo a la
situación del muestreo aleatorio simple con reemplazamiento. Más importante aún, los
medios sencillos para las transformaciones adecuadas de todas las respuestas aleatorias
generadas, no importa cuántas veces la misma persona da la respuesta aleatoria
independientemente en cada aparición en la muestra, constituyeron la base de la
estimación de la proporción de personas que tienen un atributo sensible. El único
requisito en la estimación es la probabilidad de inclusión positiva de cada individuo y
también de cada par de miembros distintos de la comunidad. En este capítulo, se expone
cómo esto puede logarse por varias técnicas de respuesta aleatoria desarrolladas hasta la
fecha.
3
Introducción
En el capítulo 2 se abordan otras técnicas de respuesta aleatoria.
La investigación sobre la teoría y las técnicas de respuesta aleatoria como se discute
hasta ahora a través de la bibliografía publicada se centra principalmente en (1) la
recomendación de estimadores más precisos para una proporción de la población
mediante el desarrollo de mecanismos de recolección de datos más claros, (2) evaluar el
grado de protección de la privacidad ofrecida por los procedimientos respectivos, para
cada uno de los encuestados elegidos por muestreo aleatorio simple con
reemplazamiento, y (3) cubrir la estimación de la “media o total” de una variable de
interés a través del esquema de muestreo general además, posiblemente de maneras
óptimas.
Se reserva para el capítulo 3 la aplicación de la técnica de respuesta aleatoria viendo
varios ejemplos. Ambos son aplicaciones a datos reales, realizados a alumnos
universitarios por parte de su Universidad.
El primero de ellos fue realizado en la Universidad Nacional del Callao, en el que se
compararon los resultados de la respuesta directa frente a la respuesta aleatoria mediante
una encuesta en la que las preguntas serían las mismas para ambos métodos.
El segundo, es una aplicación que hemos realizado en la Universidad de Granada,
mostrando uno de los métodos de respuesta aleatoria explicados posteriormente, modelo
U, desarrollado de forma manual obteniendo todas las fórmulas necesarias, e
implementado en R para concluir los resultados.
4
Respuesta aleatoria y técnicas de preguntas indirectas
CAPÍTULO 1:
TÉCNICAS DE RESPUESTA ALEATORIA EN
DISEÑOS DE MUESTREO GENERAL
Introducción
Cada persona en una comunidad dada se supone que tiene una característica de interés,
digamos,
o su complementario
, que puede o no puede ser de interés. Por ejemplo,
uno puede ser evasor de impuestos, una característica
ser un honesto pagador de impuestos teniendo
que vale la pena ocultar o puede
, una característica que no es necesario
ser ocultada. Una vez más, una persona puede ser desleal o leal a su jefe que es un
gerente general del cuerpo corporativo. Cualquiera de las dos características valdría la
pena mantenerlas en secreto. Puede ser de utilidad social para formar una idea precisa
sobre el porcentaje, en una determinada comunidad, de personas que pueden tener una
característica socialmente rechazada, por ejemplo,
. Temiendo que pudiera ser poco
ético para los investigadores sociales preguntar directamente a una persona sobre si
tiene
o no la tiene, y también pensar que una respuesta verdadera o cualquier
respuesta de entre todas, no pudiera ser obtenida mediante preguntas directas sobre
,
apareció durante mucho tiempo una necesidad social de dar con un truco adecuado para
enfrentar con éxito esta situación. En 1965, Warner proporcionó la técnica de respuesta
aleatoria, publicada en el Journal of American Statistical Association.
Esta técnica (RA) ha propiciado que se generen una serie de enfoques, entre los que
destacan los siguientes modelos:
Modelo W (Warner, 1965)
Este método de respuesta aleatorizada fue desarrollado por Stanley Warner en 1965. Él
mostró que es posible estimar la proporción sin que el encuestado revele su postura
personal respecto a la pregunta. El objetivo es alentar a las personas para que den
respuestas veraces conservando completamente la confidencialidad de sus respuestas. El
método consiste en clasificar a las personas en los grupos
persona estará en uno de los grupos,
características de interés (grupo
o . Sea
y , respectivamente. Cada
la proporción de personas con ciertas
). El objetivo es estimar
sin preguntar a cada
5
Técnicas de respuesta aleatoria en diseños de muestreo general
persona directamente si pertenece o no al grupo
. A continuación se presenta el
procedimiento propuesto por Warner:

Se construye un mazo de cartas, pero una fracción de ellas , se marca con la
letra
(grupo
) y la fracción restante,
, con las letras faltantes del
abecedario (grupo ).

Se selecciona una muestra aleatoria simple o estratificada de individuos con
reemplazo de tamaño , de la población ( ).

A cada individuo que va a responder se le enseña el mazo de cartas para que vea
que las cartas están marcadas con las letras del abecedario.

En seguida se baraja adecuadamente el mazo de cartas y se le pide al individuo
que seleccione una carta, pero que no nos diga con que letra está marcada.

A continuación se le explica que se le va a hacer una pregunta y que la responda
con “sí” o “no”, pero resaltando que ponga mucha atención a la pregunta.

Responda a la pregunta ¿Tienes la característica sensitiva?, si la carta que
obtuvo está marcada con la letra , por el contrario responda a la pregunta ¿No
tienes la característica sensitiva?, si obtuvo cualquier otra letra del abecedario.

Se tiene que hacer énfasis en que debe de responder con la verdad a las
preguntas y que solamente tiene que responder una de ellas dependiendo de la
letra que obtuvo, es decir, si la carta que obtuvo está marcada con la letra
debe
responder con la verdad a la pregunta delicada y esta sería su única respuesta, lo
mismo que si le toco cualquier otra letra del abecedario debe de responder con la
verdad a la segunda pregunta y esta sería la única respuesta.

La carta elegida por un individuo tiene que ser reemplazada antes de entrevistar
a la siguiente persona.

Este procedimiento se aplica a todos los

Con las
individuos.
respuestas de “sí” y “no” se hacen las estimaciones correspondientes
con los estimadores propuestos.
Es importante resaltar que el mecanismo de aleatorización puede ser una baraja, un
dado, una moneda, una urna, etc., pero se debe tener claro cuál es su equivalente a la
región
y su respectiva probabilidad. Por ello, es importante recordar que el
experimentador puede elegir arbitrariamente la fracción
pero no debe ser igual a ⁄ . Tampoco se debe usar
6
de cartas marcadas con
,
porque el entrevistado se
Respuesta aleatoria y técnicas de preguntas indirectas
daría cuenta que se le está preguntando si pertenece o no al grupo
quiere responder. Un valor de
⁄
, o sea, lo que no
es usualmente adecuado. Este método requiere
generalmente un tamaño de muestra muy grande para obtener una varianza del
estimador razonablemente pequeña. Se necesita un tamaño de muestra grande debido a
que cada respuesta origina poca información sobre la proporción poblacional, .
Definimos la variable de interés como
si la persona i-ésima tiene la característica
si la persona i-ésima tiene la característica
⁄
El objetivo es estimar adecuadamente la proporción
Definimos una variable que toma valores
teniendo .
si la respuesta aleatoria de Warner
produce una coincidencia entre el tipo de carta y
persona i-ésima y
∑
, es decir, la característica de la
en otro caso.
Genéricamente escribimos
, para la esperanza y la varianza con respecto a
Warner. Para la técnica de Respuesta Aleatorizada de Warner, se deduce que
que conduce a
y
Además, puesto que
y
(
)
y por lo tanto
Aquí
son variables independientes en todo , con
.
Warner dio su teoría de la técnica de respuesta aleatorizada sólo con respecto a la
selección de individuos mediante muestreo aleatorio simple con reemplazamiento.
También, cada vez que una persona pasa a ser seleccionada, una respuesta aleatoria es
recogida independientemente a petición de la persona y un estimador insesgado para
se obtiene a partir de todas estas respuestas aleatorias.
7
Técnicas de respuesta aleatoria en diseños de muestreo general
Por lo que
tiene la esperanza
y
∑
̅
tiene la esperanza
∑
̅
̅
También,
̅
Escribiendo
como los operadores genéricos de esperanza y varianza para
cualquier diseño de muestreo
y
tenemos
̅
̅
∑
̅
en este caso y
(
̅
)
̅
Escribiendo
∑
y puesto que
, Warner consiguió
̅
Escribiendo
∑
8
̅
Respuesta aleatoria y técnicas de preguntas indirectas
resulta que
̅ . Warner, sin embargo, observó que ∑
es un estimador insesgado para
una distribución binomial
sigue
con
porque en el caso de muestreo aleatorio simple con reemplazamiento,
es la
probabilidad de que una persona, cada vez que hace una extracción, pueda responder
verdaderamente “sí” a la aplicación de la técnica de respuesta aleatoria de Warner.
Notando
∑
como el número total de observaciones de respuestas afirmativas en
extracciones por
muestreo aleatorio simple con reemplazameinto y
̂
Warner (1965) calculó
̂
̂
̅ . Se puede comprobar fácilmente que
como un estimador insesgado de
.
Generalización a un diseño muestral general
De esta población
probabilidad
, una muestra
de personas etiquetadas es seleccionada con una
de acuerdo a una probabilidad de diseño
probabilidad de inclusión de
individuos
es
∑
∑
es
y
. Para esta
, la
y para un par distinto de
. Restringimos los diseños para que
.
Por lo tanto, estimaremos
∑
por
[∑
]
[∑
∑
]
Entonces, sabiendo que
∑
9
Técnicas de respuesta aleatoria en diseños de muestreo general
y que la varianza de Horvitz y Thompson es
∑∑(
) (
)
∑
siendo
∑
∑
tenemos
∑ ∑(
)(
)
∑
(
)
∑
∑
siendo
y
̂
∑ ∑(
)
∑
siendo
{
Modelo U (Greenberg et al., 1969)
En esta técnica se ampliaron y perfeccionaron las investigaciones realizadas por Warner
acerca de aleatorizar las respuestas de los encuestados.
Al igual que el modelo W tiene un mecanismo aleatorio que selecciona una de dos
preguntas, pero mientras una pregunta corresponde al aspecto sensible, la segunda
pregunta no tiene nada que ver, es sobre algún otro aspecto inocuo, es decir,
reemplazamos la pregunta sensitiva complementaria por una inocua, que va a producir
una respuesta afirmativa con probabilidad conocida.
La pregunta sensitiva vuelve a tener probabilidad
, y la inocua
. Si la
probabilidad conocida de producir una respuesta afirmativa a la pregunta inocua es
encontramos que en general
{
10
,
Respuesta aleatoria y técnicas de preguntas indirectas
siendo
y
Por lo que
Por lo tanto, estimamos
∑
por
∑
[∑
∑
]
y
∑ ∑(
)(
)
∑
∑
∑ ∑(
)(
)
∑
∑ ∑(
)(
)
∑
∑
∑
La comparación de los modelos W y U se ha hecho en el marco de poblaciones infinitas
(Moors, 1971), resultando el modelo U más eficiente que el W.
Modelo C
Una forma de mejorar la precisión de un estimador es introducir información auxiliar
correlacionada con la variable de interés. A diferencia del modelo U, que considera la
introducción de una variable inocua no relacionada con la variable sensitiva
modelo C la variable inocua
está correlacionada con
, en el
, pero no afecta a la
sensibilidad del individuo, manteniéndose así la confidencialidad del entrevistado.
11
Técnicas de respuesta aleatoria en diseños de muestreo general
En este nuevo enfoque se aprovecha la información contenida en la correlación de la
variable sensible con la variable inocua para tener una mejor estimación en términos de
sesgo y varianza, bajo un esquema de muestreo en poblaciones finitas.
El procedimiento de muestreo es exactamente como en el modelo U.
Encontramos
siendo
y
Por lo tanto, estimamos
∑
por
∑
[∑
∑
La varianza del estimador decrece al aumentar la correlación de
]
con .
Modelo H (Horvitz et al., 1967)
El modelo H es una alternativa al esquema de Warner que permite una mayor
protección del anonimato del entrevistado sin utilizar la pregunta complementaria.
Consiste en que cada elemento de la muestra selecciona aleatoriamente una de tres
proposiciones: (1) la sensitiva, (2) una instrucción que dice sí y (3) una instrucción que
dice no, con probabilidades
y
Para el modelo H se imponen las siguientes restricciones:
Se tiene
{
12
.
Respuesta aleatoria y técnicas de preguntas indirectas
donde
siendo
y
Por lo que
Por lo tanto, estimamos
por
∑
∑
[∑
∑
]
y
∑ ∑(
)(
)
∑
∑
∑ ∑(
)(
)
∑
∑
∑
13
Técnicas de respuesta aleatoria en diseños de muestreo general
Modelo D (Devore, 1977)
Esta propuesta es análoga al modelo U, con una diferencia básica, la pertenencia al
grupo inocuo
se establece con probabilidad uno. Para este modelo tenemos
{
donde
siendo
y
Por lo que
Por lo tanto, estimamos
por
∑
∑
[∑
∑
]
y
∑ ∑(
)(
)
∑
∑
∑ ∑(
)(
)
∑
∑ ∑(
)(
)
∑
∑
∑
Modelo M (Técnica de respuesta aleatoria de Mangat y Singh) (Mangat y Singh,
1990)
Esta técnica de respuesta aleatorizada es una ligera modificación de la técnica de
Warner en el siguiente sentido.
14
Respuesta aleatoria y técnicas de preguntas indirectas
En el modelo M propuesto por Mangat y Singh (1990) el mecanismo aleatorio
proporciona
respuestas independientes con dos componentes aleatorias.
A una persona de la muestra, , se le presentan dos cajas. Se le pide a la persona que
coja aleatoriamente una carta de una serie de cartas marcadas
o
en proporción :
Si coge la carta marcada con , la persona debe informar el valor
verdadero
, que como siempre es 1 si está marcada con
. Si la carta está marcada con
contiene cartas marcadas con
y 0 si está marcada con
la persona coge una carta de la segunda caja que
y
⁄
en proporciones :
.
La respuesta aleatoria de la persona será entonces:
si el tipo de carta coincide con la característica verdadera
o
.
si no hay ninguna coincidencia.
La actual operación no debe ser compartida con el investigador que sólo observa los
números. La respuesta aleatoria de puede denotarse como
. Entonces,
si la primera caja da una carta con
si la primera caja da una carta con
Entonces,
Así que,
Por lo tanto,
tiene
Sabiendo que:
Entonces,
Ahora,
(
)
15
Técnicas de respuesta aleatoria en diseños de muestreo general
Así que,
Si
,
se reduce a
Por lo tanto, estimamos
∑
por
∑
[∑
∑
]
y
∑ ∑(
)(
)
∑
∑
∑ ∑(
)(
)
∑
∑
Modelo de pregunta no relacionada
Horvitz et al. (1967) seguido por Greenberg et al. (1969) recomendaron una alternativa
a la técnica de respuesta aleatoria de Warner (1965). Sugieren que al igual que
atributo
, el
puede ser también estimado. Así, la gente puede sentirse incómoda al darnos
su característica
y
, aunque aleatoricemos el procedimiento sin revelar al
investigador el resultado realmente observado en la técnica de respuesta aleatoria. Junto
con el atributo sensitivo a investigar , generalizan uno no relacionado . Así, mientras
utilizan
para denotar la marca , otra variable
en lugar de su complementario
16
.
se introduce para denotar la marca
Respuesta aleatoria y técnicas de preguntas indirectas
Así
si está marcada con
si está marcada con
y
si está marcada con
si está marcada con
El objetivo es estimar
∑
El modelo se emplea de la siguiente manera:
Llenamos dos cajas con un gran número de cartas similares, excepto que en la primera
caja una proporción
complementaria
proporciones son
de ellas está marcada con
está marcada con
y
, siendo
y la proporción
, mientras que en la segunda caja estas
distinto de
.
Elegimos una sola muestra y todas las personas de ella extraen una carta al azar de la
primera caja y repiten esto de forma independiente con la segunda caja y en el primer
caso dan la respuesta aleatoria como
si el tipo de carta coincide con la característica de la persona
o
si esta no coincide
y en el segundo caso dan la respuesta aleatoria como
si hay coincidencia
si no hay coincidencia
Resulta que
y
dándonos
que conduce a
tal que
17
Técnicas de respuesta aleatoria en diseños de muestreo general
ya que
obtenemos
(
)
Del mismo modo,
La estimación insesgada de
es simple como se muestra a continuación:
̂ puede ser tomado como un estimador insesgado de
Así que
Por lo tanto, la estimación de
∑
.
por
∑
∑
∑
es un asunto tan sencillo como en el caso del Modelo de Warner.
Y su varianza
∑ ∑(
)(
)
∑
∑
∑ ∑(
)(
)
∑
∑
Técnica de respuesta aleatoria de Kuk
Una persona
de la muestra se acerca con dos cajas con cartas teniendo como
proporciones
y
, respectivamente (
) que son de color rojo, las
cartas restantes no son rojas. Una persona de la muestra coge
18
cartas con
Respuesta aleatoria y técnicas de preguntas indirectas
reemplazamiento e informa el número sacado de cartas
que son rojas, sin revelar al
investigador qué caja utiliza para extraer las cartas. Entendiendo que si la persona
tiene una , utilizamos la primera caja, y si la persona tiene
, elegimos la segunda.
Para la persona i-ésima de la muestra, la respuesta aleatoria es
cartas rojas extraídas
reemplazamiento. Ya que
la
, que es el número de
de los ensayos independientes realizados con
si está marcada con
y
si está marcada con
tiene “distribución binomial”, y
y
A continuación escribimos
(
)
que tiene
y
( )
es decir,
escribiendo
Entonces,
es un estimador insesgado de
porque
19
Técnicas de respuesta aleatoria en diseños de muestreo general
Por lo tanto, estimamos
por
(
∑
)
∑
[ ∑
∑
]
Y su varianza
∑ ∑(
)(
∑
)
(
)
∑ ∑(
)(
∑
)
[
∑
∑
∑
]
Técnica de respuesta aleatoria de Christofides
Una persona de la muestra se acerca con una caja de
cartas de común forma,
tamaño, peso, color, altura, anchura y espesor, pero con marcas diferentes
∑
en proporciones
con una petición para
extraer aleatoriamente una de estas cartas. La respuesta aleatoria a informar es
atributo de la persona es
o
si es
, si el
. Por supuesto el atributo real es
ocultado al investigador y la marca actual de la carta pasa a ser
.
Por lo tanto, podemos representar la respuesta aleatoria disponible de la persona i-ésima
como
Ya que
∑
y
∑
20
Respuesta aleatoria y técnicas de preguntas indirectas
Resulta que
y
∑
Tomemos
Entonces,
y
∑
Por lo tanto, estimamos
∑
por
∑
[∑
∑
]
Y su varianza
∑
∑ ∑(
)(
∑ ∑(
)
)(
∑
)
∑
∑
∑
∑
Esquema de respuesta forzada
Para una persona etiquetada
atributo sensitivo
en
,
es el número 1 si
tiene el
o el número 0 si la persona tiene el atributo complementario,
.
Para estimar
∑
la técnica de respuesta forzada se aplica de la siguiente manera, sin importar cómo
selecciona, la persona etiquetada se acerca a una caja que contiene un gran número de
cartas marcadas con “sí”, “no” y “verdadera” en proporciones
respectivamente
y
,
. Se solicita a la persona extraer una carta
21
Técnicas de respuesta aleatoria en diseños de muestreo general
después de agitar la caja exhaustivamente y no dejar que el investigador conozca el tipo
de carta robada, y se le pide que informe sí o no, si el tipo de carta está marcada con “sí”
o “no”, o realmente como sí o no si la carta robada está marcada “verdadera” y, si la
persona tiene
o
, respectivamente. Por lo tanto, la respuesta aleatoria de
marcada:
si responde “sí”
si responde “no”
Entonces tenemos el siguiente resultado:
|
|
|
|
Así,
(
)
Entonces, vamos a definir
Entonces,
Por lo tanto,
Por consiguiente,
{
Por lo tanto, estimamos
∑
22
por
∑
[∑
∑
]
está
Respuesta aleatoria y técnicas de preguntas indirectas
Y su varianza
∑ ∑(
)(
∑
)
∑
∑ ∑(
)(
∑
)
∑
∑
Esquema de Mangat
Mangat (1992), aplica fundamentalmente la misma modificación en el modelo de
pregunta no relacionada de Horvitz et al. (1967) y Greenberg et al. (1969) como la
aplicada al modelo de Warner por Mangat y Singh (1990). Por simplicidad, él
consideraba la situación en la que la proporción de personas
característica inocua
que tienen una
es conocida. Su técnica de respuesta aleatoria impone una
persona seleccionada para extraer aleatoriamente una carta de una caja con una
proporción
de cartas marcadas
y el resto marcadas
. La instrucción
para la persona es decir “sí” si la persona extrae una carta marcada con
característica
. Si extrae una carta marcada con
segunda caja con cartas marcadas
o
y tiene la
, la persona es instruida a usar la
en proporciones
e
informar “sí” o “no”, si el tipo de carta coincide o no coincide con la característica real.
La caja y el tipo de carta utilizada no debe ser conocida. Pero la respuesta debe ser
verdadera.
Por
simplicidad,
reemplazamiento en
asumimos
el
muestreo
aleatorio
simple
con
extracciones. Ya que dos cajas son necesarias para este
dispositivo de respuesta aleatoria, Mangat (1992) lo llama técnica de respuesta aleatoria
en “dos etapas”. Con
persona tenga
, respectivamente, como la probabilidad de que una
y responda “sí”, él observa
El plan aquí es extender esta técnica de respuesta aleatoria de Mangat (1992) para cubrir
el caso en que usemos un muestreo general y
, la proporción de personas que teniendo
23
Técnicas de respuesta aleatoria en diseños de muestreo general
la característica inocua
sea desconocida. Entonces el dispositivo necesitaría tres cajas,
la primera es exactamente como antes, la segunda es la misma que antes pero con
sustituida por
y la tercera caja contiene una proporción
de cartas marcadas
pero
y el resto marcadas . La instrucción para el encuestado
muestreado etiquetado es como antes, para decir la verdad primero utilizo “la primera
caja y si es necesario también la segunda caja” y después independientemente da una
segunda respuesta verdadera usando igualmente “la primera caja y si es necesario, la
tercera caja.”
Dejar
si tiene
o no,
si tiene
o no,
si
(respuesta aleatoria) es “sí”/”no” para el primer ensayo,
si
(respuesta aleatoria) es “sí”/”no” para el segundo ensayo si es ejecutado
por la i-ésima persona de la muestra.
Entonces,
que conduce a
y ya que
es igual a
̂ es un estimador insesgado para
y por lo tanto
Por lo tanto, estimamos
∑
por
∑
∑
∑
24
.
Respuesta aleatoria y técnicas de preguntas indirectas
Y su varianza
∑ ∑(
)(
)
∑
∑
Esquema de Mangat, Singh, y Singh
Mangat et al. (1992) dio un nuevo dispositivo de respuesta aleatoria como una
modificación del modelo básico URL (modelo de pregunta no relacionada) pero de
conocida, de manera similar al “Esquema de Mangat” (1992).
nuevo suponiendo
A una persona etiquetada
de la muestra, se le ofrece una caja y responde “sí” si la
persona tiene . Pero si la persona tiene
caja con una proporción
entonces la persona extrae una carta de la
de cartas marcadas
la persona extrae una carta marcada
y el resto marcadas ; si
dice “sí” otra vez si la persona realmente tiene ;
en cualquier otro caso debe contestar “no”; la ejecución real de esta técnica debe estar
oculta.
Ellos consideraban exclusivamente el muestreo aleatorio simple con reemplazamiento
para muestrear a la gente. Por consiguiente,
Consideramos una extensión de esta técnica de respuesta aleatoria para cubrir el caso de
un esquema de muestreo general y uno con una situación natural con un valor
desconocido de
, siendo la proporción de personas que tienen la característica inocua
. Para una persona etiquetada
que se elija, siguiendo un esquema general de
muestreo, la instrucción es decir “sí” si la persona tiene , y si no, coger aleatoriamente
una carta de una caja que contiene una proporción
y el resto marcadas
realmente tiene
de cartas marcadas
y decir “sí” si una carta marcada B es robada y si la persona
; de lo contrario, la respuesta será “no”. Sin embargo, todo este
ejercicio se repetirá de forma independiente con el único cambio que la proporción de
cartas marcadas
es
y
. Como antes, dejando
si está marcado
,
si está marcado
,
si surge una respuesta “sí” en el primer ensayo, 0 en otro caso;
si “sí”/”no” es la respuesta aleatoria en el segundo
25
Técnicas de respuesta aleatoria en diseños de muestreo general
Entonces,
que conduce a
y por lo tanto
̂
es un estimador insesgado para
Por lo tanto, estimamos
∑
.
por
∑
∑
∑
Y su varianza
∑ ∑(
)(
)
∑
∑
Esquema de Singh y Joarder
Singh y Joarder (1997) dieron una técnica de respuesta aleatoria y mostraron que si la
respuesta aleatoria se observa a partir una muestra con muestreo aleatorio simple con
reemplazamiento en
que un estimador para
extracciones, entonces su estimador de
tiene menos varianza
de Warner (1965). Su técnica de respuesta aleatoria es la
siguiente: Un encuestado teniendo
responde como en la técnica de respuesta
aleatoria de Warner pero uno que tiene
pospone la respuesta a una segunda ejecución
de la técnica de respuesta aleatoria de Warner, a menos que la primera induzca una
26
Respuesta aleatoria y técnicas de preguntas indirectas
respuesta “sí”. Por supuesto, un paquete de cartas que contienen una proporción
marcadas
y el resto marcadas
se van a utilizar sin divulgar nada
sobre este comportamiento real de la técnica de respuesta aleatoria para el entrevistador,
como de costumbre. Naturalmente, para algún encuestado elegido en un muestreo
aleatorio simple con reemplazamiento,
Así, eligiendo
, tal que
, se puede estimar
utilizando
el número total de respuestas “sí” en un muestreo aleatorio simple con reemplazamiento
en
extracciones. Obtener la varianza del estimador de
y un estimador insesgado de
la varianza tampoco es un problema. Pero la varianza implica
, el elemento
desconocido. Por lo tanto, no nos interesa aquí el estudio de las consecuencias de la
identificación de distintas personas de la muestra y la examinación de las consecuencias
de las respuestas simples o múltiples de cada uno de ellos.
En su lugar, tenemos en cuenta el examen de la técnica de respuesta aleatoria de Singh y
Joarder (1997) cuando el muestreo es de una población finita con probabilidades
desiguales generales.
Notando
si tiene
y
si “sí” es la respuesta aleatoria de la i-ésima
persona, tenemos
Entonces, para
tomando el denominador distinto de cero, tenemos
obteniéndose ̂
estimador insesgado de
. Ya que
como un estimador insesgado para
y
como un estimador insesgado de
problema si se emplea un esquema de muestreo coherente, con
. Obtener
como un
no es un gran
.
27
Técnicas de respuesta aleatoria en diseños de muestreo general
Por lo tanto, estimamos
∑
por
∑
∑
∑
Y su varianza
∑ ∑(
)(
)
∑
∑
Esquema de Dalenius y Vitale
Dalenius y Vitale (1974) han dado una técnica de respuesta aleatoria que realmente se
refiere a una variable sensible cuantitativa cuyos valores se agrupan en un número de
clases disjuntas, de modo que una respuesta solicitada a una persona de la muestra hace
referencia a una de estas clases, en la que el encuestado está situado, en términos del
valor de la persona interesada sobre la variable de interés. La principal diferencia de su
técnica de respuesta aleatoria con los ya discutidos anteriormente es que cada persona
etiquetada da una respuesta “sí” o “no” a la respuesta aleatoria (respuesta de la i-ésima
persona) que no varía con , sino que sigue siendo una constante para cada , en . La
estimación, sin embargo, se realiza fácilmente tanto con muestreo aleatorio simple con
reemplazamiento como con un esquema general de muestreo de forma muy simple. Por
lo tanto, vale la pena examinar la extensión del muestreo aleatorio simple con
reemplazamiento con respuestas simples o múltiples, de las distintas personas
muestreadas por muestreo aleatorio simple con reemplazamiento.
De acuerdo a su técnica de respuesta aleatoria, a una persona de la muestra se le asigna
un disco en el que
segmentos iguales están marcados por
y se le instruye
para hacer girar un “puntero” en el disco y para responder “sí” si el “puntero” se detiene
en un segmento marcado “menor o igual” a la marca que representa la clase a la que
pertenece la persona, en términos de la variable sensitiva de nuestro interés; de lo
contrario la respuesta aleatoria es “no”. Escribiendo
si la i-ésima persona responde “sí”
si la respuesta es “no”,
28
Respuesta aleatoria y técnicas de preguntas indirectas
entonces,
∑
siendo
la frecuencia relativa, tal que
∑
con
la frecuencia desconocida de la j-ésima clase y
∑
Así que,
es un estimador insesgado de
para todo en una muestra.
También,
(
Así,
)
(
)
no puede ser fácilmente un estimador insesgado. Sin embargo,
Dalenius y Vitale (1974) trataron solo el caso del muestreo aleatorio simple con
reemplazamiento con
extracciones. Así, escribiendo
respuestas “sí” en la muestra, ̂ estimador insesgado de
estimador insesgado de
como la proporción de
, por lo tanto
̂
̂
y
̂
y por lo tanto
̂ es insesgadamente estimado por
̂
̂
̂(
̂)
Esquema modificado por Pal de Takahasi y Sakasegawa
El esquema de Takahasi y Sakasegawa (1977) implica una asignación al azar implícita
más que una técnica de respuesta aleatoria. Aquí también el problema consiste en
estimar insesgadamente , la proporción que tiene
. Una persona de la muestra hace
29
Técnicas de respuesta aleatoria en diseños de muestreo general
una elección silenciosa de su prioridad entre los colores, por ejemplo, violeta, azul y
verde. Para la estimación de , elegimos tres muestras independientes,
. Una
persona de la muestra responde a la aplicación del esquema.
Técnica de respuesta aleatoria de Liu, Chow, y Mosley
Liu et al. (1975) consideraron una población dividida en
proporciones disjuntas
con ∑
dando
grupos
Una persona se inclina para ocultar a los demás si pertenece a alguno de estos
grupos.
no solapados.
Por lo tanto, es aconsejable aplicar la técnica de respuesta aleatoria tomando
cuentas de
∑
colores diferentes, una por cada uno de estos grupos:
cuentas son puestas en un recipiente transparente de cuello largo y tapón
de corcho. Cuando el recipiente está lleno de cuentas, se cierra mediante el tapón y el
recipiente se pone al revés, de modo que las cuentas no se caigan sino que se apoyen en
su cuenta adyacente o sobre el tapón. El cuello del recipiente que está marcado de
permite a uno observar la cantidad de las cuentas de cada color.
A la persona de la muestra se le pide que agitara el recipiente, le diera la vuelta, y diera
la respuesta aleatoria como el número en el cuello, que corresponde a la cuenta del color
del grupo de la persona, que es el que está en la parte más inferior de entre todas las
cuentas del grupo de la persona.
Según Chaudhuri (2002):
(
)(
)(
)
é
é .
Entonces,
∑
30
Respuesta aleatoria y técnicas de preguntas indirectas
Liu et al. (1975) toman un muestreo aleatorio simple con reemplazamiento en
extracciones y estiman insesgadamente mediante
la proporción de muestra
observada en .
Chaudhuri y Mukerjee (1988) han ilustrado cómo invirtiendo
̂
las estimaciones ̂ para
∑
̂
pueden ser resueltas por el método de los momentos.
31
Técnicas de respuesta aleatoria en diseños de muestreo general
32
Respuesta aleatoria y técnicas de preguntas indirectas
CAPÍTULO 2:
OTRAS
TÉCNICAS
DE
RESPUESTA
ALEATORIA
Introducción
Sinha y Hedayat (1991) presentaron sus ideas en su libro. Sarjinder Singh (1996), en su
libro, así como en numerosos trabajos de investigación, principalmente colaborando con
Mangat Singh, Late Ravindra Singh, Late Tracy, Joarder, Horn, Gjestvang y otros,
ampliamente trataron la literatura de respuesta aleatoria. Raghunath Arnab, Tapan
Nayak, Kim y Warde, y un buen número de otros colaboradores productivos merecen la
atención al darnos un crecimiento sustancial en el tema de respuesta aleatorizada. Una
descripción resumida más una valoración crítica se expone a continuación.
Sinha y Hedayat
Haciéndose eco de la voz de muchos otros trabajadores en el área de respuesta aleatoria
(RR), Sinha y Hedayat (1991, p.310) también indican que la recopilación de datos sobre
temas sensibles “requiere técnicas especiales de ‘muestreo’ que garanticen un alto grado
de confidencialidad a los entrevistados”. Lo que necesitamos especialmente es una
alternativa “técnica de la encuesta”, pero no una nueva “técnica de muestreo”. Este error
se teme que haya estado en la raíz de la práctica tradicional al unir los mecanismos de la
respuesta
aleatoria
sólo con esquemas de
muestreo aleatorio simple con
reemplazamiento (SRSWR) manteniendo así la literatura de respuesta aleatoria a un
nivel rudimentario lejos de la bien desarrollada teoría de encuestas con muestreo de
respuesta directa (DR) a un nivel superior de carácter científico durante demasiado
tiempo.
El crecimiento resultante de la teoría de respuesta aleatoria intransferiblemente ligada al
muestreo aleatorio simple con reemplazamiento dictó una gran sencillez emanando del
hecho de que “toda persona elegida al azar tiene la probabilidad única de tener el
atributo señalado
, es decir, igual a , la proporción desconocida de tener este
toda la comunidad”. En la estimación de esta
en
y también en la definición de una
medida apropiada del riesgo, mostrando un atributo auténtico a través de la verdadera
respuesta aleatoria, esto permitió a la teoría de la respuesta aleatoria un manejo sencillo.
33
Otras técnicas de respuesta aleatoria
Sinha y Hedayat (1991) consideraron una población de
persona teniendo un valor
complementario
,y
personas con la i-ésima
, que es 1 ó 0, según tiene
o su
como la proporción desconocida con valor 1 para cada uno en
la comunidad. También se supone que cualquier persona teniendo
no tiene tendencia
a reprimir esta verdad, si así se solicita.
En su capítulo “Método 1: Procedimiento de pregunta relacionada” Shina y Hedayat
definen
si tiene
si tiene
y proceden a estimar
∑
a su manera, sin ninguna referencia a Warner (1965).
Asimismo, desarrolló el “Método 2: Procedimiento de pregunta no relacionada” y más
técnicas que se ocupan de la estimación respecto a los atributos de interés y son bastante
diferentes de la mayoría de las técnicas de respuesta aleatoria tratadas en otro lugar. Sus
avances, sin embargo, proceden inicialmente sin relación con ningún diseño de
muestreo específico. La literatura sobre respuesta aleatoria es incompleta sin la
incorporación de Sinha y Hedayat (1991). Pero hay una sección en su libro, que trata de
las variables cuantitativas sensibles, es muy interesante y no puede dejar de llamar la
atención a la época de duras polémicas entre encuestas celebradas por los expertos de
muestreo Hartley y Rao (1968, 1971a,b) por un lado, o Godambe (1970) por el otro. Un
lector curioso puede echar un vistazo a una versión resumida en Chaudhuri y Vos
(1988). Sinha y Hedayat (1991) asumen “que una encuesta estadística tiene un conjunto
de
valores distintos disponibles
y éstos están destinados a cubrir el
conjunto de valores objeto de estudio”. Pareció extraño que estos autores no se
opusieran a la teoría desarrollada por Adhikary et al. (1984), Chaudhuri (1987),
Sengupta y Kundu (1989). A cualquiera que sea consciente de la “polémica entre
Hartley y Rao contra Godambe” le resultaría difícil conciliar el material de Sinha y
Hedayat (1991).
R. Arnab
Arnab (1995a) presentó algunas modificaciones en las obras anteriores de Adhikary et
al. (1984), Chaudhuri (1987,1992), entre otros mencionados pero no frente a los de
Sengupta y Kundu (1989). Su intención era proporcionar una estimación óptima para
34
Respuesta aleatoria y técnicas de preguntas indirectas
una población finita completamente bajo encuestas de respuesta aleatoria. Para estimar
∑
, permitió un dispositivo de respuesta aleatoria general produciendo
adecuadamente transformaciones de respuestas aleatorias como
independiente a través de los individuos
reales sensibles
de manera
teniendo valores
de tal manera que
(
escribiendo como de costumbre
)
como operadores de la esperanza, la varianza
y la covarianza con respecto al dispositivo de aleatorización adoptado y
función conocida de
es una
.
Debido a la naturaleza general de
, el modelo previsto en el enfoque de Arnab
(1995a) es más amplio que los estudiados por Eriksson (1973), Godambe (1980),
Chaudhuri y Adhikary (1981), Adhikary et al. (1984), Chaudhuri (1987,1992), por lo
que
se reduce a formas específicas; sus mecanismos de respuesta aleatoria también
están claramente especificados, pero los dejó sin especificar en Arnab (1995) en la
medida en que el modelo antes citado se mantuvo sostenible.
Arnab (1990) ofrece argumentos para asegurar que
conmuta con
, el operador
esperanza con respecto al diseño .
Arnab (1996) proporciona una teoría unificada para la estimación de la proporción de
una comunidad teniendo un atributo de interés que cubre cualquier diseño de muestreo,
clases amplias de estimadores insesgados y clases generales de mecanismos de
respuesta aleatoria, ofreciendo estimadores insesgados de varianza también.
Arnab (1996) restringió su estudio a estimadores insesgados lineales homogéneos para
.
Arnab (1996) fue motivado a publicar este trabajo para mejorar los estudios realizados
por Franklin (1989b) y Singh y Singh (1993), que restringieron sus procedimientos sólo
al muestreo aleatorio simple con reemplazamiento.
Arnab (1998) obtiene una condición de optimalidad para la estrategia de respuesta
aleatoria. También demostró que la misma estrategia óptima de respuesta aleatoria
puede conseguirse modificando la técnica de respuesta aleatoria de Chaudhuri para
variables cuantitativas con un esfuerzo pequeño, incluso sin recurrir al enfoque de Sinha
y Hedayat (1991).
35
Otras técnicas de respuesta aleatoria
Estos resultados son aún más generalizados por Arnab (2001) que usando el mecanismo
de respuesta aleatoria modificó como anteriormente en Eriksson (1973) y Chaudhuri
(1987) pero postulando los cuatro modelos de super-población y usando ciertos
resultados de los datos de respuesta directa dados por Chaudhuri y Stenger (1992).
Una de las deficiencias en las estrategias de muestreo óptimo relatados por Arnab es que
no se da una idea acerca de cómo estimar las medidas adecuadas de errores de los
estimadores correspondientes.
Arnab (2004) consideró prácticamente el mismo procedimiento opcional de respuesta
aleatoria como los tratados por Chaudhuri y Mukerjee (1985,1988) para muestreo
aleatorio simple con reemplazamiento y de Chaudhuri y Saha (2005).
Nayak, Nayak y Adeshiyan, Christofides, y Quatember
El trabajo de Nayak (1994) es muy importante en la literatura de respuesta aleatoria
porque a pesar de que restringe su estudio a la selección de los posibles encuestados
sólo por el método de muestreo aleatorio simple con reemplazamiento y para la
estimación de la proporción
teniendo una característica de interés
en una población
dicotómica, él sólo busca un procedimiento adecuado de estimación sobre la aplicación
del criterio doble de amplia base, así, (1) la privacidad del encuestado debe ser
protegida de forma racional y (2) sujeto a este objetivo, un estimador eficiente con una
medida controlada de precisión debe ser buscado.
Éstos están cubiertos por el modelo pionero de respuesta aleatoria de Warner (1965) y el
modelo de Simmons, como lo describe Greenberg et al. (1969), con la probabilidad de
que una persona de la muestra puede tener una característica inocua
con , conocida y sinceramente anunciar si
o
o
o
no relacionada
sea asumido por el usuario.
El motivo de Nayak (1994) es el desarrollo de una teoría unificada para las encuestas de
respuesta aleatoria.
Nayak también observa contrariamente a la creencia popular, que la eficiencia y la
protección de la privacidad no se mueven necesariamente en direcciones opuestas.
Como guía observó que el modelo de Warner (1965) es inadmisible y también lo es el
modelo de Simmons con una conocida
menos que
conocida a
.
Más audazmente un enfoque provocativo de la técnica de respuesta aleatoria, para
estimar la proporción
36
de personas que tienen el atributo sensible
en una población
Respuesta aleatoria y técnicas de preguntas indirectas
dicotómica de respuestas binarias o policotómicas de personas seleccionadas con
probabilidades desiguales, se ha tratado de manera unificada por Nayak y Adeshiyan
(2009).
Nayak (1994) adoptó una medida de protección de privacidad diferente con un concepto
de probabilidad Bayesiano a posteriori, para una persona que tiene
con una
probabilidad desconocida a priori, combinada con una respuesta aleatoria producida y
atendida por una persona de la muestra. Se limitó a la selección de los encuestados sólo
por el esquema de muestreo aleatorio con reemplazamiento.
Aunque la población planteada es dicotómica, a la respuesta aleatoria utilizada para
estimar
se le permite ser binaria o politómica. Nayak y Adeshiyan (2009)
minuciosamente elaboraron una teoría unificada para demostrar que, dado un estimador
basado en una respuesta aleatoria politómica equivalente en términos de estimadores
igualmente eficientes, basándonos en la alternativa binaria, los procedimientos basados
en respuesta aleatoria están disponibles manteniendo las medidas de protección de
privacidad.
Nayak y Adeshiyan (2009) también cubrieron la respuesta aleatoria derivada de las
muestras elegidas con probabilidades desiguales de selección y las variables sensibles
tanto cualitativas como cuantitativas.
Desafortunadamente, tanto Nayak (1994) como Nayak y Adeshiyan (2009) hasta ahora
han permanecido en silencio acerca de cómo modificar las reglas para obtener las
probabilidades posteriores necesarias en la determinación de las medidas de protección,
cuando cubren características cualitativas con muestreo aleatorio simple con
reemplazamiento, muestreo sustituido por cualquier otro método de muestreo y
cubriendo las características de interés que son cuantitativas.
Rechazaron la afirmación de Christofides (2003) ante su alternativa propuesta para el
mecanismo de respuesta aleatoria, de que permitiendo respuestas politómicas podría
irles mejor que el de modelo de Warner, con una gama más amplia de elección de los
parámetros de la técnica de respuesta aleatoria, mostrando errores en los cálculos
numéricos de este último. Christofides (2010) se opuso de forma firme citando
contraejemplos en la dirección opuesta.
Quatember (2009) mientras tanto ascendió con una poderosa oposición al muestreo
aleatorio simple con reemplazamiento basado en la técnica de respuesta aleatoria de
Christofides, destacando sus carencias numéricas.
37
Otras técnicas de respuesta aleatoria
Guerriero y Sandri
Guerriero y Sandri (2007) también son dos conocidos partidarios de que dos
procedimientos de respuesta aleatoria deben ser comparados sólo bajo el doble criterio
de (1) la estimación eficiente, en términos de estimadores adecuados de las
características sensibles de las respuestas aleatorias y (2) el nivel de protección ofrecido
por ellos de las intimidades de los encuestados. Su único parámetro objetivo demandado
en la estimación es la proporción de población finita de personas, es decir , en una
comunidad que tiene una característica sensitiva
. Su objetivo es también tratar una
respuesta aleatoria binaria para una población dicotómica. Definen
|
con
como
respuesta “Sí / No” de las “probabilidades de diseño”, como de costumbre. Se toman
medidas de protección de privacidad (PP) siguiendo el método tradicional como en
Lanke (1975b, 1976) y Leysieffer y Warner (1976), y consideran el estimador ̂ para
basado en la respuesta aleatoria del muestreo aleatorio simple con reemplazamiento en
extracciones. Examinan las actuaciones relativas o los procedimientos de respuesta
aleatoria con respecto a la eficiencia de un solo estimador y separadamente de nuevo en
términos de eficiencia con protección de privacidad.
Padmawar y Vijayan
Padmawar y Vijayan (2000) calificaron el enfoque de respuesta aleatoria cubriendo una
población finita
como un enfoque tradicional y presentaron una
oposición, brevemente resumida a continuación.
Consideran
como el valor de una variable de estudio
para la unidad
en
,
supuesto que es uno de interés, descrito como una “señal” y obtienen una respuesta
aleatoria como una mezcla de una señal y un “ruido”. Este valor de ruido es
generado a partir de una distribución conocida con media
y varianza
para
, ambas
conocidas como constantes para cada en . La respuesta aleatoria de es
para
en una muestra
elegida mediante un diseño adecuado . Aquí no hay ninguna
restricción sobre la naturaleza de
en relación con el valor de
. En la llamada
respuesta aleatoria tradicional se establece que siguiendo a Eriksson (1973), Godambe
(1980), Chaudhuri et al. (1981), Chaudhuri (1987, 1992), Sengupta y Kundu (1989) y
también es explorada por Arnab,
38
debe tener un rango que coincida con el de
, por
Respuesta aleatoria y técnicas de preguntas indirectas
ejemplo, sobre todo, si
, lo mismo debe cumplirse para
, y
despertaría sospechas del encuestado en caso contrario. Pero, sorprendentemente,
Padmawar y Vijayan (2000) descartaron firmemente tal restricción. Su afirmación es
una certeza total de los encuestados de que la “privacidad está protegida, sin duda” a
pesar de la respuesta aleatoria como
un estimador insesgado para
∑
para todo en . El objetivo es obtener
.
La configuración del modelo de superpoblación también es considerada por Padmawar
y Vijayan (2000) estableciendo un par de resultados de optimalidad en su configuración
de respuesta aleatoria.
Trabajos en respuesta aleatoria por N.S. Mangat, Ravindra Singh, Sarjinder
Singh, Sat Gupta, y Bhisham Gupta
Los colaboradores antes mencionados de la teoría y la práctica de respuesta aleatoria,
excepto Sarjinder Singh, se limitan solamente al “muestreo de probabilidades iguales”.
Mangat y Singh (1991) consideran la estimación de la proporción sensible
en un muestreo aleatorio simple sin reemplazamiento (SRSWOR) en
extracciones
y no de un muestro aleatorio simple con reemplazamiento. Este ejercicio se llevó a cabo
con anterioridad por Kim y Flueck (1978) como informaron Chaudhuri y Mukerjee
(1988). Creemos que estas actividades pueden ser explicadas en referencia a los trabajos
de Chaudhuri (2001a). Los puntos cruciales son (1) un mecanismo de respuesta
aleatoria para producir datos sin importar cómo una persona se elige en la muestra y (2)
la probabilidad de que una persona tenga un atributo sensible
extracción la persona es seleccionada, es igual a
, sin importar en que
sólo en muestreo aleatorio simple
con reemplazamiento. La comparación de las diferentes respuestas aleatorias basadas en
estimadores para
se hace difícil e inapropiada cuando los datos de respuesta aleatoria
se recogen de muestras probabilísticas desiguales.
Si hacemos caso a la recomendación de Nayak (1994), (1) eficiencia en al estimación y
(2) el nivel de privacidad está protegido por una técnica de respuesta aleatoria
simultáneamente sometida a una opinión sensata, por lo que surgirán consideraciones
interesantes. Mangat y Singh (1990) añadieron una elaboración algebraica para permitir
la posibilidad de una falta parcial de veracidad en el informe del encuestado. Tal
situación también fue visualizada por Greenberg et al. (1969) en el contexto del
39
Otras técnicas de respuesta aleatoria
esquema básico de Warner (1965) como fue discutido por Chaudhuri y Mukerjee
(1988). Mangat et al. (1992) presentaron la versión revisada de la técnica de respuesta
aleatoria de Simmons descrita por Greenberg et al. (1969), con una proporción conocida
en la comunidad, teniendo una característica inocua
no relacionada
con .
Estimadores insesgados para
son comparados en cuanto a sus varianzas, sin
consideraciones de su nivel de “protección de privacidad”.
Mangat (1994) dio una simplificación para Mangat y Singh (1990) y comparó las
varianzas de los estimadores insesgados de
Warner (1965) para
basados en estos dos mecanismos de
, mediante un cálculo algebraico sencillo, porque el muestreo
aleatorio simple con reemplazamiento en
extracciones se tomó como el esquema
común de muestreo para recoger la respuesta aleatoria por la respectiva técnica de
respuesta aleatoria.
El mecanismo de Mangat (1994) es pedir al encuestado que diga “Sí” si tiene
la tiene,
y si no
, para informar verazmente en tal caso, garantizado por el mecanismo de
respuesta aleatoria de Warner.
La sencilla comparación de la eficiencia es entonces informada, cubriéndola en relación
a los competidores de Warner (1965) y Mangat y Singh en 1990. Qué sucede en caso de
“menos del 100 por cien de informes verdaderos”, es también discutido por Mangat
(1994).
Como ya se ha mencionado brevemente, Mangat el al. (1995) consideraron
procedimientos de estimación opuestos frente al tratamiento de Warner, señalando la
respuesta aleatoria de los distintos encuestados en un muestreo aleatorio simple con
reemplazamiento en
extracciones, permitiendo sólo una respuesta aleatoria por cada
mecanismo de Warner.
Mangat et al. (1993) comienzan con el hallazgo de Moors (1971) y producen mejores
resultados, también revisan su técnica de respuesta aleatoria.
Una alternativa adicional de la técnica de respuesta aleatoria también se trata en Singh
et al. (2000) permitiendo un sólo muestreo aleatorio simple sin reemplazamiento
dividido aleatoriamente en dos submuestras mutuamente excluyentes, una de ellas
emplea la técnica de respuesta aleatoria de Greenberg et al., y la otra una técnica de
respuesta directa incluyendo sólo .
40
Respuesta aleatoria y técnicas de preguntas indirectas
La generalización de Singh (2002) de la técnica de respuesta aleatoria de Warner (1965)
y Kuk (1990) llamada por él, técnica de “modelo de respuesta aleatoria estocástica” está
bastante discutida exhaustivamente.
Mangat y Singh (1994) por primera vez presentaron una modificación a la técnica de
respuesta aleatoria de Warner (1965) permitiendo al encuestado ya sea (1) dar una
respuesta directa o (2) una respuesta aleatoria por la técnica de respuesta aleatoria de
Warner, teniendo un atributo sensible
o su complementario
, mediante una
respuesta “Sí” o “No”, sin revelar la opción (1) o (2) que se utiliza. La proporción de
respuestas “Sí” así recibida desde un muestreo aleatorio simple en
extracciones, se
toma como un estimador requerido para , la proporción desconocida de personas que
tienen
en la comunidad de
personas.
Este estimador se valora como una fracción propia, mientras que el estimador de
Warner para
puede tomar un valor fuera del intervalo cerrado [0,1].
Estos autores suponen que cada encuestado, sin importar en que extracción la persona es
seleccionada, tiene una probabilidad desconocida pero común
de dar la
respuesta directa si se les da una opción, ya sea para dar una respuesta directa o una
respuesta aleatoria por el método de Warner. Probablemente, suponen que en la
comunidad hay una proporción desconocida
respuesta directa sobre si tiene
o
de gente dispuesta a dar la
.
Estos autores calculan el sesgo de su estimador propuesto para , el que resulta sesgado.
También trabajan desarrollando el error cuadrático medio de , teniendo en cuenta que
el error cuadrático medio disminuye con
para todos los
, y también
encontrando las magnitudes relativas de este error cuadrático medio y la varianza del
estimador de Warner, presentando valores tabulados de la eficiencia relativa de los dos
para diferentes
.
Gupta et al. (2002) comenzaron con la técnica de respuesta aleatoria mixta para datos
cuantitativos de Eichhorn y Hayre (1983) y lo modificaron para una mejor estimación
de la media poblacional, permitiendo la opción para respuesta directa.
Obviamente esta respuesta aleatoria opcional como la de Mangat y Singh (1994) es
totalmente diferente de la de Chaudhuri et al. (1985,1988, y 2005).
Arnab (2004) comienza con una frase inapropiada “Gupta, et al. (2002) propusieron una
técnica de respuesta aleatoria opcional (ORR) basada en el muestreo aleatorio simple
con reemplazamiento, usando una suposición poco realista de que la probabilidad de
41
Otras técnicas de respuesta aleatoria
proporcionar la respuesta verdadera/aleatorizada para todos los individuos de una
población, es la misma”. En una comunidad dada allí, legítimamente puede existir una
sección con una proporción desconocida
de personas dispuestas a dar
una verdadera respuesta a petición, mientras que el resto puede estar de acuerdo para
responder llevando a cabo un mecanismo de aleatorización explicado a la persona. En la
frase siguiente, Arnab (2004) expresa “En este documento una alternativa a la respuesta
aleatoria opcional se ha propuesto para un diseño de muestreo arbitrario”.
Arnab (2004) mostró el procedimiento anterior de respuesta aleatoria opcional
presentado por él como más eficiente en términos de la varianza que los
correspondientes procedimientos de respuesta aleatoria, permitiendo sin opción dar a
conocer los auténticos valores de la variable aleatoria por los encuestados.
Pal (2008) proporciona una pista sobre el uso del mecanismo de respuesta aleatoria
mixto de Eichhorn y Hayre (1983) en la estimación del total y la varianza del
“estimador total”, cuando una muestra
es seleccionada por cualquier diseño de
muestreo con probabilidades desiguales. El autor además ofrece una versión de
respuesta aleatoria opcional completamente nueva de esta estrategia en particular como
un nuevo trabajo fundamental.
Pal (2008) ilustró aplicaciones con estrategias específicas, demostrando numéricamente
que los procedimientos de respuesta aleatoria opcional alcanzan varianzas reducidas en
comparación con los correspondientes procedimientos de respuesta aleatoria obligatoria
(CRR).
Singh y Joarder (1999) tienen un “modelo de ensayos repetidos desconocidos” para
mejorar el modelo de Warner (1965). Aquí Warner (1965) es el punto de partida, en un
muestreo aleatorio simple con reemplazamiento en
extracciones, para una persona de
la muestra repetiremos el ensayo si en la primera prueba el mecanismo de respuesta
aleatoria no produce una “coincidencia” con su característica propia
, y sin dar a
conocer esto al investigador, repetiremos el mecanismo de respuesta aleatoria de
Warner para dar su verdadero estado
, de acuerdo con el resultado del mecanismo
de respuesta aleatoria después de la segunda repetición.
Singh y Joarder (1997) han demostrado que su estimador tiene una varianza menor que
la dada por Warner (1965) y han presentado un cuadro mostrando una comparación
numérica entre los dos, con una apreciable ventaja a su favor.
42
Respuesta aleatoria y técnicas de preguntas indirectas
Para la respuesta aleatoria repetida del diseño, tenemos los trabajos de Franklin
(1989a,b) y Singh y Singh (1992, 1993) para datos de muestreo aleatorio simple con
reemplazamiento y la generalización de Pal (2002) para muestras probabilísticas
desiguales.
Estos trabajos de Franklin (1989a,b) han sido modificados por Singh y Singh (1992).
Singh y Singh (1993), de hecho, modificaron el trabajo de Singh y Singh (1992).
Pal (2002), en la tesis no publicada, amplió estas obras de Franklin (1989a,b) y Singh y
Singh (1992, 1993) para obtener los resultados correspondientes a los esquemas de
muestreo probabilístico desiguales generales, incluso sin reemplazamientos, rompiendo
las cadenas del muestreo aleatorio simple con reemplazamiento en
extracciones, sin
perturbar el replicado de respuesta aleatoria derivado de cada persona de la muestra, sin
importar cómo ha sido seleccionada. La tesis de Pal reproduce el enfoque de Chaudhuri
(2001).
Accidentalmente, tampoco Franklin (1989a,b) ni Singh y Singh (1992, 1993)
mencionaron nada sobre la estimación de las varianzas de los respectivos estimadores
para
dados. Pero siguiendo el enfoque de Chaudhuri (2001) era una cuestión simple
para Pal (2002) presentar habituales estimadores de varianza para estimadores revisados
por los autores, para .
Bhargava y Singh (1999, 2003) compararon la eficiencia de la técnica de respuesta
aleatoria bajo protección de privacidad común. Dieron las varianzas de los estimadores
insesgados para , la proporción de tener el atributo sensible
personas, ya sea con
o su complementario
en una comunidad de
, también dado por la técnica de
respuesta aleatoria por Warner (1965), Mangat y Singh (1990) y Mangat (1994) bajo
dos circunstancias.
Las tres técnicas de respuesta aleatoria se aplican a individuos elegidos por muestreo
aleatorio simple con reemplazamiento en
extracciones.
Bhargava et al. (1999) emplean el concepto de “protección de privacidad” siguiendo la
prescripción de Lanke (1976).
La técnica de respuesta aleatoria de Mangat (1994) logra un nivel de eficiencia más alto
que la de Warner (1965) si ambos están obligados a estar en igualdad en la protección
de privacidad del encuestado.
Bhargava et al. siguen la recomendación dada por Leysieffer y Warner (1976) en la
protección de la privacidad del encuestado.
43
Otras técnicas de respuesta aleatoria
La técnica de respuesta aleatoria de Mangat (1994) da una varianza menor que la
técnica de respuesta aleatoria de Warner (1965) si están obligados a alcanzar el mismo
nivel de protección de privacidad de acuerdo con la recomendación de Leysieffer y
Warner (1976).
Sarjinder Singh, Stephen Horn, Ravindra Singh, y N.S. Mangat
Singh et al. (2003) modificaron el modelo de respuesta no relacionada de Horvitz et al.
(1967) (modelo UY) de Simmons, con la proporción conocida
tienen la característica inocua
no relacionada con , como describió Greenberg et al.
(1969), al permitir cartas de tres tipos con proporción
blanco (
reemplazamiento en
de personas que
de ,
de
y
que están en
). El encuestado en un muestreo aleatorio simple con
extracciones dice “Sí”, si la característica del encuestado
coincide con el tipo de carta extraído
o , pero de lo contrario dice “No”.
Tienen ciertas conclusiones junto con comentarios sobre las presentaciones relativas de
su estimador modificado frente al dado por Greenberg et al. (1969).
Sarjinder Singh, Stephen Horn, y Sadeq Chowdhury
Estos autores abordan el doble problema de la estimación, (1) la proporción de personas
con una característica de interés,
y simultáneamente, (2) la media desconocida de
una variable directamente relacionada con la característica de interés. Para ello
necesitan dos muestreos aleatorios simples con reemplazamiento en
y
extracciones, empleando dos mecanismos de respuesta aleatoria de manera
independiente.
Los autores dieron un planteamiento de respuesta aleatoria alternativo para el mismo
doble problema anterior, para ponerlo en condiciones de hacer comparaciones con el
mecanismo de Warner.
Chang y Liang
En este trabajo, Chang y Liang (1996) aplicaron las modificaciones de Mangat y Singh
(1990) en el modelo de respuesta inocua no relacionado de Simmons, descrito por
44
Respuesta aleatoria y técnicas de preguntas indirectas
Horvitz et al. (1967) y Greenberg et al. (1969), en lugar del mecanismo de respuesta
aleatoria original de Warner en sí.
Como la mayoría de los colaboradores de la técnica de respuesta aleatoria, estos dos
también se restringen sólo al muestreo aleatorio simple con reemplazamiento.
Permitiendo sólo una característica , que no está relacionada con el atributo sensible
con proporción desconocida
proporción conocida
en una comunidad, pero es inocua en sí con una
, es decir, en la misma comunidad donde sólo un muestreo
aleatorio simple con reemplazamiento en
extracciones está previsto.
La modificación de Mangat y Singh (1990) se ha descrito anteriormente. En el presente
trabajo de Chang y Liang esto es revisado reemplazando el mecanismo de Warner
(1965) por el de Horvitz et al. (1967) y Greenberg et al. (1969).
Chang y Liang (1996) también han ampliado su estudio para cubrir situaciones
permitiendo respuestas parcialmente falsas a las preguntas de la técnica de respuesta
aleatoria.
Kajal Dihidar
Dihidar (2010a) aplicó la técnica de Mangat y Singh (1990) al modelo de respuesta no
relacionada de Greenberg et al. (1969) cuando
es desconocido. El autor consideró la
respuesta directa contra la respuesta aleatoria de un muestreo aleatorio simple con
reemplazamiento en
extracciones, pero siguiendo el enfoque de Chaudhuri (2001)
necesitaba dos respuestas independientes “Sí”/”No” de cada persona de la muestra.
Una ventaja en la presentación es que era posible dar una condición concreta para la
reducción de la estimación de la varianza, a consecuencia de una elección apropiada de
la probabilidad, mediante la aplicación del método de Mangat el al. (1990). Dihidar
(2010a) empleó además “técnicas de estimación de disminución” para una mejora
adicional en la estimación de , utilizando una suposición previa sobre su posible valor,
como seguimiento a la teoría básica de Thompson (1968), para ello persiguió
anteriormente el contexto de la respuesta aleatoria de Singh et al. (2007). Los
estimadores de la varianza son proporcionados por Dihidar (2010a).
Dihidar (2010b) además aplicó la técnica de modificación de Mangat y Singh (1990) al
“modelo del ensayo repetido desconocido” de Singh y Joarder (1997) discutido
anteriormente y también en el “modelo de respuesta forzada” de Boruch (1972) como
también discutido por Chaudhuri y Mukerjee (1988) en el contexto de los “Atributos” y
45
Otras técnicas de respuesta aleatoria
además incluye características cuantitativas también. Finalmente, el autor permite que la
muestra sea elegida por un muestreo general de probabilidades desiguales.
Naturalmente la simulación basada en ejemplos numéricos se presenta para mostrar las
ventajas, en su caso, a través de la técnica de Mangat y Singh (1990) aplicada en las
correspondientes técnicas clásicas de respuesta aleatoria en las que se aplica. Las
ventajas son proclamadas, por si acaso los coeficientes estimados de variación muestran
tendencias a disminuir en la implementación de medidas correctivas de Mangat y Singh
(1990).
Chang, Wang, y Huang y Huang
El mecanismo de respuesta aleatoria de Chang et al. (2004) necesita dos muestreos
aleatorios simples con reemplazamiento independientes en
y
extracciones,
. Una persona de la muestra debe decir “Sí” si la persona tiene el atributo
sensible
con una probabilidad desconocida
y si la persona tiene el complementario
, debe decir “Sí”, significando que la persona tiene
y decir “No”, es decir, la persona tiene
está en la j-ésima muestra
Compararon el estimador de
con una probabilidad asignada
con probabilidad
, si la persona
.
de Mangat (1994) con éste en términos del respectivo
error cuadrático medio (MSE) y presentaron los resultados numéricos sobre sus
interpretaciones relativas.
Huang (2004) considera una población dicotómica, con una proporción desconocida
teniendo un atributo de interés , y un muestreo aleatorio simple con reemplazamiento
en
extracciones, y suponiendo que la persona que tiene
con una probabilidad
, mientras que los que tienen
está de acuerdo para decirlo
están dispuestos a decir la
verdad si se lo pedimos.
Tras calcular las varianzas se ha demostrado que esta varianza es menor que la varianza
del estimador insesgado de Warner para .
Kim y Elam y Kim y Warde
Ya hemos discutido cómo Mangat et al. (1997) seguido por Singh et al. (2000)
presentaron sus modificaciones sobre la protección en la técnica de respuesta aleatoria
46
Respuesta aleatoria y técnicas de preguntas indirectas
de Moors (1971). Los esfuerzos de Kim y Warde (2004a) están orientados hacia esa
dirección.
Ellos, como se observa con la mayoría de los investigadores en el campo de la técnica
de respuesta aleatoria, restringieron su estudio al muestreo aleatorio simple en
extracciones. Cada encuestado está obligado a contestar con la verdad “Sí” o “No”
acerca de tener un atributo inocuo
directamente. Aquellos que responden “Sí” deben
aplicar un mecanismo de respuesta aleatoria
honestamente el atributo verdadero
sobre el atributo sensible
o
. En
, una persona informa
o el negativo de él, con una probabilidad
con probabilidad
y
. Cualquier información “No”
sobre la pregunta directa sobre
se pide responder de acuerdo a un segundo mecanismo
de respuesta aleatoria
una persona informa verazmente sobre si tiene
probabilidad
y sobre
. En
con probabilidad
siempre sólo “Sí” o “No”. En lugar de
con
, la respuesta aleatoria es como
en la respuesta directa, dejar a
y
ser los números muestreados de respuestas “Sí” y “No”.
Esto es descrito por Kim y Warde (2004a) en el modelo de “respuesta aleatoria mixta”.
Ellos observan acertadamente que (1)
(y por lo tanto
también) es una variable
aleatoria y que (2) un valor alto del número de encuestados que optan por
debería
resultar, por el bien de la eficiencia en la estimación. Ellos juiciosamente dirigieron las
cuestiones pertinentes en vista de (1) y (2). Mantuvieron el nivel de protección al
alcance del modelo de Warner y Simmons a la par de Lanke (1976).
Esto forma una base para la comparación entre el modelo de respuesta aleatoria mixta y
el modelo de Moors analizado por Greenberg et al. (1971). Detallados hallazgos
empíricos han sido tabulados con respecto a este tipo de comparaciones de eficiencia; la
estimación de la varianza no es tomada por Kim y Warde (2004a).
Kim y Warde (2004b) fueron inspirados por las obras de Hong et al. (1994), quién
extendió la técnica de respuesta aleatoria de Warner (1965), considerando muestreo
aleatorio simple estratificado. Este último se limita a la asignación de la muestra
proporcional a los estratos. Pero Kim y Warde (2004b) consideraron no sólo la técnica
de respuesta aleatoria de Warner (1965) sino también el modelo de técnica de respuesta
aleatoria que nos ha dado Mangat y Singh (1990) y también la técnica de respuesta
aleatoria de Mangat (1994), tratando el muestreo aleatorio simple estratificado con
reemplazamiento (Str. SRSWR), con las fórmulas de asignación óptima de Neyman. A
base de álgebra compleja, Kim y Warde (2004b) han demostrado claramente las
47
Otras técnicas de respuesta aleatoria
ventajas que se derivan del muestreo estratificado sobre el no estratificado, con respecto
a las tres técnicas de respuesta aleatoria. Kim y Warde (2004a) ilustran aún más la
eficacia del muestreo aleatorio simple estratificado con reemplazamiento con la regla de
muestreo de asignación óptima sobre muestreo aleatorio simple no estratificado con
reemplazamiento, cuando se emplea junto con su técnica de respuesta aleatoria mixta.
En ambas de estas obras sus resultados algebraicos se complementarán con los
resultados numéricos a través de simulaciones. Kim y Elam (2005) cubren más de estos
muestreos aleatorios simples estratificados con reemplazamiento, usando estas cuatro
técnicas de respuesta aleatoria, con la cobertura adicional de no sólo respuestas
aleatorias verdaderas sino también respuestas aleatoria no tan verdaderas, que parecen
instintos humanos más naturales.
Kim, Tebbs, y An, Chua y Tsui: Sus trabajos
El punto de partida del desarrollo de Kim et al. (2006) es la modificación de Mangat
(1994) de la técnica de respuesta aleatoria de Warner (1965).
Kim et al. (2006) propusieron un estimador Bayesiano para
. Hicieron detallados
estudios empíricos con los cálculos numéricos. Además extendieron los estudios de
muestreo estratificado de manera habitual.
Chua y Tsui (2000) nos han dado una nueva técnica de respuesta aleatoria, pretendiendo
inducir una sensación de privacidad estando protegido el encuestado inherentemente, a
petición de dar a conocer la verdad sobre los hechos que tienen un atributo de interés ,
en un muestreo aleatorio simple con reemplazamiento elegido en
extracciones. Su
esquema de respuesta aleatoria se aplica en dos etapas con respecto a cada persona de la
muestra. En la primera etapa, a cada persona de la muestra se le pide que elija
aleatoriamente un número por muestreo aleatorio simple sin reemplazamiento, con
respecto a las personas seleccionadas por muestreo aleatorio simple con
reemplazamiento en
extracciones, de un conjunto dado de números enteros
. Sin divulgar el número, es decir
la segunda etapa, se pide extraer aleatoriamente
si tiene
o de una distribución diferente , si tiene
orden creciente. Tanto
varianzas conocidas.
48
y
, extraído al investigador, en
valores de cualquier distribución ,
, y comunicar el valor k-ésimo en
, están completamente especificadas con medias y
Respuesta aleatoria y técnicas de preguntas indirectas
Citaron varias formas especiales de
y
, junto con las discusiones, detallando los
niveles de eficiencia alcanzados numéricamente en diferentes situaciones.
Carlos N. Bouza
Bouza (2009) tiene una contribución única a la literatura de respuesta aleatoria, para
registrar la labor del conjunto clasificado de muestreo (RSS), rivalizando con el
muestreo aleatorio simple con reemplazamiento, dando una estimación útil a través de
datos de respuesta aleatoria cuantitativos para una población finita media de valores,
relacionando al valor real de la característica de interés. Considera la técnica de
respuesta aleatoria en una variable sensible cuantitativa descrita por Chaudhuri y
Stenger (1992). De acuerdo con ello, para una población finita
tamaño conocido
, el problema es estimar
interés de la variable real
∑
para
de
, siendo el valor de
para la persona etiquetada en .
Para estimar , Bouza (2009) se basa en una muestra de personas siguiendo el método
del conjunto clasificado de muestreo de McIntyre (1952), además desarrollado y
revisado por Chen, Bai y Sinha (2004) entre otros.
Joe Kerkvliet
Este es un seguimiento del tratamiento de los modelos logit presentados en Maddala
(1983). El uso señalado de la cocaína por estudiantes universitarios en relación al
rendimiento académico y las características socio-económicas es la cuestión que se
debate por Kerkvliet (1994). Él considera la técnica de respuesta aleatoria de “respuesta
forzada” de Boruch (1972), Maddala (1983), y Chaudhuri y Mukerjee (1988). Como de
costumbre, no tiene ninguna relación para cualquier esquema de muestreo excepto
muestreo aleatorio simple con reemplazamiento. Su preocupación principal es examinar
las magnitudes de
, que son las probabilidades que se fijan para los encuestados
que dicen “Sí” o “No” independientemente de tener
o
, así que
puede ser asignado como la probabilidad con que cada uno puede verdaderamente decir
“Sí” o “No” correspondiendo a los rasgos reales, siendo el sensible
o su negación
.
El rasgo sensible tratado por Kerkvliet (1994) es el consumo de cocaína por estudiantes
de la universidad. El rendimiento académico y los hábitos personales son factores
49
Otras técnicas de respuesta aleatoria
endógenos deterministas. Las magnitudes de
se determinan mediante la suma de
los últimos cuatro dígitos del número de Seguridad Social del estudiante, tratados como
una variable aleatoria.
Kerkvliet postula el “modelo de regresión logística”.
N.J. Scheers
Este trabajo predominantemente habla de la filosofía de la técnica de respuesta
aleatoria, como una herramienta adecuada para proteger al encuestado contra el riesgo
de revelar características incriminatorias, como denuncias de deudas por impuestos,
estafas, uso de drogas y por lo tanto reducir la tendencia a decir mentiras o reprimir
verdades, y hace referencia a estudios de validación sobre datos de respuesta aleatoria
contra datos de respuesta directa. La mayor parte del material cubierto en este trabajo ya
fue revisado por Chaudhuri y Mukerjee (1988). Sólo el modelo de regresión logística
por ejemplo, cubierto por Kerkvliet y Scheers y Dayton (1988) no fue discutido por
Chaudhuri y Mukerjee (1988). Un descuido evidente en el presente trabajo es el uso del
multiplicador en los estimadores de la varianza en todas partes, aunque a la vista de los
tamaños de muestra muy grandes en los ejemplos, esta deficiencia teórica apenas afecta
a los resultados empíricos.
Umesh y Peterson
Este aborda asuntos filosóficos cuestionando la inherente utilidad del enfoque de
respuesta aleatoria. El éxito de la técnica de respuesta aleatoria depende de la tasa de
respuestas verdaderas a las preguntas sobre las características personales de interés
social de forma aleatoria, en lugar de por preguntas directas. Si la respuesta directa
estuviera auténticamente disponible en abundancia, la respuesta aleatoria sería de poco
valor, produciendo estimaciones menos eficientes con varianzas infladas. Todavía se
emplea la técnica de respuesta aleatoria creyendo que infunde confianza en los
encuestados de que su secreto está protegido, induciendo sin restricciones confidencias
verdaderas con posibilidades moderadas de declaración. La pregunta incuestionable es
si el sesgo de la respuesta es realmente eliminado o reducido sustancialmente. Estos
aspectos se discuten brevemente en este artículo, que es una valoración crítica de los
desarrollos estadísticos, cuestiones de validación y aplicaciones propias de la técnica de
50
Respuesta aleatoria y técnicas de preguntas indirectas
respuesta aleatoria en la práctica, a través del recuento del crecimiento emergente en
nuevos métodos, en formas de mejoras sucesivas respecto a las técnicas anteriores.
Como se trata de un artículo de revisión la mayor parte de su material se trata ya en Fox
y Tracy (1986) y Chaudhuri y Mukerjee (1988).
Chris Gjestvang y Sarjinder Singh
Dice ser una mejora sobre la técnica de respuesta aleatoria de Himmelfarb y Edgell
(1980) y de Eichhorn y Hayre (1983). Se utilizan dos variables de aleatorización en
lugar de una como en el anterior y genera una respuesta aleatoria mediante combinación
de las dos con probabilidades asignadas previamente. Ellos además narran cómo la
respuesta aleatoria óptima también puede ser tener cabida. Sin embargo, el muestreo
aleatorio simple con reemplazamiento es el único método de muestreo que constituye la
base de este trabajo.
Landsheer, Heijden, y Gils
Este es un informe crucial sobre cómo una técnica de respuesta aleatoria puede usarse
como una técnica capaz de extraer información fiable sobre cuestiones delicadas. Éste
analiza ilustrativamente cómo con respecto a la participación de fraude a la seguridad
social, incluso los infractores pueden ser inducidos a dar respuestas verdaderas,
confiando en que la respuesta aleatoria puede permitir ocultar los secretos con los
riesgos mitigados de la revelación. Ellos ilustran aplicaciones de la técnica de respuesta
forzada (cf. Fox y Tracy, 1986) y la técnica de respuesta aleatoria de Kuk (1990), para
mostrar cómo la capacidad de un investigador inculcando la comprensión de una técnica
de respuesta aleatoria en un encuestado, da la confianza suficiente de que la privacidad
del encuestado se mantendrá a pesar de una revelación verdadera a fuerza de una técnica
de respuesta aleatoria. Genera la aceptación de la teoría de respuesta aleatoria en la
comunidad en general de los científicos y los profesionales de este trabajo, además de
que su bibliografía puede convertirse en una publicación de referencia.
51
Otras técnicas de respuesta aleatoria
Heijden y Gils
Este ejercicio es similar al de Kerkvliet (1990), comentado anteriormente, ilustrando
cómo el modelo de respuesta forzado (cf. Fox y Tracy, 1986) o el modelo de Kuk
(1990) para la generalización de datos por la aleatorización de características sensitivas,
pueden ser utilizados estimando parámetros acerca de tales características, utilizando
por fuerza modelos de regresión logística, ahora con observaciones de covarianza
también. Like Kerkvliet (1990) y estos autores también se refieren a trabajos anteriores
por Maddala (1983) y Scheers y Dayton (1988). Como de costumbre también se
restringen sólo al muestreo aleatorio simple con reemplazamiento.
Heiden, Gils, Bouts, y Hox
Citando un problema práctico de relevancia social, es decir, contando los beneficiarios
de las prestaciones de asistencia social que ejercen estafas fraudulentas, este artículo
presenta las utilidades relativas de los cuatro procedimientos de impugnación,
concretamente (1) entrevista directa cara a cara, (2) auto entrevistas con ayuda de
ordenador (CASI) y (3,4) dos técnicas de respuesta aleatoria, es decir, procedimiento de
respuesta forzada (cf. Fox y Tracy 1986) y procedimiento de Kuk (1990). El estudio de
validación y ajuste de modelos de regresión logística en la introducción de dos o tres
variables explicativas en caso de estudios de respuesta aleatoria, constituyen
componentes esenciales de este capítulo, lo que evita el análisis estadístico riguroso.
Tracy y Mangat
Esta es una revisión de lo que siguió desde 1984 hasta que los hallazgos en el campo de
la respuesta aleatoria estaban cubiertos por Chaudhuri y Mukerjee (1988).
Ahsanullah y Eichhorn (1988) añadieron al trabajo de Eichhorn y Hayre (1983) la
utilización de la variable codificada multiplicativa. Singh y Kathuria (1992)
modificaron el enfoque de Simmons introduciendo dos características inocuas. También
se refirieron al uso del muestreo con probabilidad proporcional al tamaño (PPS) de
Chaudhuri y Adhikary (1990) y su seguimiento por Bansal et al. (1994) en el
tratamiento de las encuestas de varios caracteres utilizando la respuesta aleatoria.
También mencionan a Tracy y Mukhopadhyay (1994), utilizando el muestreo ordenado
y el momento de Arnab (1990) que conmutaba en el diseño, y el modelo de
52
Respuesta aleatoria y técnicas de preguntas indirectas
funcionamiento de la esperanza realizado más general que el previsto por Chaudhuri y
Adhikary (1990). También corroboran la observación de Arnab (1994) de que un
“estimador de varianza no negativo en una encuesta de respuesta directa, produce uno
para la que se deriva de ella por una encuesta de respuesta aleatoria, aunque lo contrario
no está garantizado”.
Tracy y Mangat (1996) también mencionan las obras de Little (1993), Ibrahim (1990), y
Bourke y Moran (1998) que aplicaron el modelo basado en la teoría de verosimilitud, la
técnica del algoritmo de la maximización de la esperanza y el método de imputación
múltiple, para abordar temas sensibles que utilizan distribuciones predictivas. También
mencionan el caso de evaluar si el encuestado está mintiendo, y luego estudian la
estimación de la respuesta aleatoria como la trató Krishnamoorthy y Raghavarao (1993)
y Lakshmi y Raghavarao (1992). También se refirieron al teléfono basado en respuesta
aleatoria de Warner (1986), y la maximización de la esperanza basada en el método de
máxima verosimilitud de Bourke (1990). Además cubrieron el enfoque de Ljungqvist
(1993) para el riesgo del encuestado como continuación de las obras de Lanke y Flinger
et al. (1977). También se refieren a los estudios empíricos de respuesta aleatoria por
Danermark y Swensson (1987) y por Duffy y Waterton (1988), sobre el fumar hachís o
marihuana y también el estudio del uso de la cocaína por Kerkvliet (1994), como hemos
mencionado antes.
Sanghamitra Pal
Esto combina una técnica de respuesta aleatoria con la técnica de recuento de elementos
(ICT), permitiendo la opción de que el encuestado vaya para, o bien la técnica de
respuesta aleatoria o la técnica de recuento de elementos, sin revelar al entrevistador la
opción elegida.
La técnica de recuento de elementos se aplica en la toma de dos muestras
independientes
y
de inclusión positivas
y siguiendo el mismo diseño de muestreo
para y
para
con probabilidades
en .
En contraste con esta técnica de recuento de elementos, la técnica de respuesta aleatoria
fue la recomendada por Pal (2007).
53
Otras técnicas de respuesta aleatoria
Amitava Saha
La técnica de respuesta aleatoria de Dalenius y Vitale (1974), basada en resultados
obtenidos de muestreo aleatorio simple con reemplazamiento, fue ampliada por
Chaudhuri (2002). Saha (2003) aplicó el enfoque del procedimiento respuesta aleatoria
opcional (ORR) de Chaudhuri y Mukerjee (1985, 1988) de la división de una muestra
dada en dos partes: una da las respuestas directas y la otra las respuestas aleatorias, a fin
de mejorar la eficiencia en la estimación a través de Rao-Blackwellization. Saha (2003)
explicó numéricamente con datos ficticios cómo Dalenius y Vitale (1974) a base de
datos de respuesta directa contra respuesta aleatoria, mediante respuesta aleatoria
opcional, muestra una mejora sobre el enfoque de respuesta aleatoria obligatoria (CRR)
para muestreo aleatorio simple con reemplazamiento y de manera más destacada para
muestreo aleatorio simple sin reemplazamiento y aun así más para Rao-Hartley-Cochran
(1962) basado en datos muestrales.
Strachan, King, y Sarjinder Singh
Consideran que la estimación para el modelo de regresión
cuando las observaciones sobre el vector
de las variables dependientes no están
disponibles directamente, como en el caso de situaciones de interés, sino que las
variables están “codificadas”, ya sea en forma aditiva, de Himmelfarb y Edgel (1980) o
en forma de producto, tratado por Eichhorn y Hayne (1989), se utilizan como
transformadores con distribuciones conocidas con parámetros conocidos. Sarjinder
Singh et al. (1996) proporcionan materiales básicos para la inicialización de los
acontecimientos relevantes. Consideran el método de los momentos (MM), máxima
verosimilitud (MLE), y los métodos de estimación Bayesiana. Necesitan la aplicación
del algoritmo de maximización de la esperanza (EM), y la técnica de Cadenas de
Markov Monte Carlo (MCMC), que implican los entrevistadores de Gibbs y algoritmos
de Metropolis-Hastings (MHA), recurriendo a los complicados procedimientos de
cálculo Bayesiano, desarrollado por los trabajos de Gelfand y Smith (1990), Tanner
(1993), y Smith y Robert (1993).
54
Respuesta aleatoria y técnicas de preguntas indirectas
Sanghamitra Pal
La técnica de respuesta aleatoria de Takahasi y Sakasegawa (1977), teniendo como base
el muestreo aleatorio simple con reemplazamiento en Chaudhuri y Mukerjee (1988) y
extendido por Pal (2007), cubrió a los esquemas generales de muestreo que se han
descrito en “Esquema modificado de Takahasi y Sakasegawa por Pal (2007)”. En un
trabajo posterior, Pal (2009) ha ampliado aún más el trabajo para incluir la cobertura de
respuesta aleatorizada opcional única a esta técnica de respuesta aleatorizada implícita
(IRR) de Takahasi et al. (1983), siguiendo los enfoques paralelos de Chaudhuri y Saha
(2005), Chaudhuri y Dihidar (2009), y Pal (2009) respectivamente, cuando el
encuestado (1) da abiertamente la verdad sobre si tiene
o
y (2) como alternativa, o
bien opta por una respuesta directa o determina una respuesta aleatorizada implícita, sin
divulgar la opción realmente ejercida.
En este contexto, Pal obtiene un estimador insesgado para
junto con un estimador de
varianza insesgado esencialmente, a lo largo de la dirección seguida por Chaudhuri y
Dihidar (2009).
Ardo van den Hout y P.G.M. van der Heijden
Estos autores reconocen la respuesta aleatoria estableciéndola como un caso particular
de “control de divulgación estadística y clasificación errónea”.
Por ejemplo, para la técnica de Warner (1965) basada en muestreo aleatorio simple con
reemplazamiento, cuenta con la estructura:
Señalan que cuando se aplica el método de los momentos para estimar
estimadores no pueden ser viables para ciertos mecanismos de
, los
. Pero el método de
máxima verosimilitud no es sensible a esta posibilidad, la estimación exige un estudio
del “problema de límites” si un valor estimado se sitúa en el “límite” del “espacio de
parámetros”. Asimismo, reconocen la necesidad de la aplicación del algoritmo de
maximización de la esperanza cuando la solución de la ecuación de verosimilitud (LE)
resulta difícil de conseguir.
55
Otras técnicas de respuesta aleatoria
D.E. Stem y R.K. Steinhorst
Estos autores describen cómo la respuesta aleatoria puede ser útil generada por un
cuestionario auto-administrativo y enviado por correo o por métodos de entrevistas
telefónicas. Métodos prácticos detallados se dan con resultados ilustrados.
Ravindra Singh, Sarjinder Singh, y N.S. Mangat
Estos autores formularon una teoría detallada para la técnica de encuesta por correo para
obtener datos sobre las características de interés. El álgebra es muy interesante, ya que
implica muestreo aleatorio simple sin reemplazamiento en lugar de muestreo aleatorio
simple con reemplazamiento, y también la estratificación de los encuestados en los
posibles encuestados en el primer intento y el conjunto dicotómico complementario de
las personas. También se refieren a obras similares anteriores de Singh et al. (1993).
D.R. Bellhouse
Bellhouse aborda el problema de estimar el coeficiente de correlación en una población
finita entre dos variables, ambas consideradas de interés. Consideró apropiado no
exponer claramente por qué es así; supone tres técnicas de respuesta aleatoria
específicas concretamente, (1) técnica de respuesta no relacionada de Greenberg et al.
(1969), (2) codificador aditivo de Pollock y Bek (1976) y (3) su codificador
multiplicativo para garantizar el anonimato en la respuesta verdadera. Lo más
importante es que él consideró diseños de muestreo probabilístico generales ilustrando
en particular, muestreo aleatorio simple sin reemplazamiento en
extracciones.
Yan, Zaizai y Nie, Zankan
Notemos las dos definiciones conceptuales de abajo como las citadas de Yan y Nie
(2004). Todo el desarrollo se limita sólo al muestreo aleatorio simple con
reemplazamiento en
extracciones.
Definición
Para el diseño de respuesta aleatoria con respuestas “Sí” (Y) – “No” (N), sólo
|
es el nivel de protección.
56
|
|
|
Respuesta aleatoria y técnicas de preguntas indirectas
Definición
Un diseño
es mejor que un diseño
si
y
(̂ )
(̂ )
Las definiciones de Nayak (1994) son diferentes.
Yan y Nie (2004) insisten en comparar dos procedimientos de respuesta aleatoria sólo a
través de las definiciones anteriores.
57
Otras técnicas de respuesta aleatoria
58
Respuesta aleatoria y técnicas de preguntas indirectas
CAPÍTULO 3:
APLICACIONES
DE
LA
TÉCNICA
DE
RESPUESTA ALEATORIA
Introducción
Llegados a este punto, vamos a ejemplificar un par de aplicaciones realizadas con datos
reales en dos Universidades,
Ejemplo de la Universidad Nacional del Callao
Presentamos la metodología que se siguió para aplicar el cuestionario de preguntas a
través de encuesta directa. De igual manera, se presenta una breve descripción del
proceso diseñado para la aplicación de las preguntas del método de respuesta aleatoria.
La encuesta se aplicó a una muestra representativa de la población de estudiantes de la
facultad de Ciencias Económicas de la Universidad Nacional del Callao.
Diseño de la encuesta
Con la finalidad de comprobar la eficacia del método de respuesta aleatoria, incluimos
también una encuesta directa para poder comparar los resultados. Las preguntas en
ambas encuestas, serán las mismas; sin embargo para el método de respuesta
aleatorizada, será necesario tener una serie de preguntas no sensibles, con
probabilidades conocidas.
Formato de Encuesta Directa
Tiene como finalidad la medición de 5 variables categóricas. Las 5 preguntas
miden variables cualitativas y tienen como única opción de respuesta SI o NO.
59
Aplicaciones de la técnica de Respuesta Aleatoria
Encuesta anónima
Marca con un X tu respuesta
Sexo
Femenino
Masculino
1.¿Sueles consumir alimentos o bebidas en la sala de cómputo?
SÍ
NO
2.¿Alguna vez has consumido drogas alucinógenas?
SÍ
NO
3.¿Algunas veces has copiado en los exámenes?
SÍ
NO
4.¿Has consumido bebidas alcohólicas, cerca a la Universidad?
SÍ
NO
5.¿En este ciclo, has faltado a clase sin motivo justificable?
SÍ
NO
Este cuestionario será aplicado a la muestra de estudiantes hombres y mujeres,
de la forma convencional o directa.
Formato de Encuesta con la técnica de Respuesta Aleatorizada
Para la técnica de respuesta aleatoria, se aplica el método U, para lo cual es
necesario un cuestionario adicional con las siguientes características:

Las preguntas no deben de ser sensibles.

No deben estar relacionadas con el tema de la pregunta “sensible”.

Para cada una de las preguntas que miden variables cualitativas, las
respuestas deben tener una probabilidad conocida.
60
Respuesta aleatoria y técnicas de preguntas indirectas
Encuesta anónima
Marcar con un X su respuesta
Sexo
Femenino
Juego 1
¿Sueles consumir alimentos o bebidas en la sala de
cómputo?
¿Naciste en el mes de julio?
SÍ
NO
SÍ
NO
ROJO
¿Alguna vez has consumido drogas alucinógenas
(marihuana, PBC, etc.)?
¿Tu DNI termina en número 2?
NEGRO
ROJO
¿Algunas veces has copiado en los exámenes?
¿Naciste en el mes de diciembre?
SÍ
NO
¿Has consumido bebidas alcohólicas, cerca a la
Universidad?
¿Naciste en el mes de enero?
SÍ
NO
¿En este ciclo, has faltado a clase sin motivo
justificable?
¿Tu DNI termina en número 5?
SÍ
NO
NEGRO
ROJO
Juego 2
Juego 3
Juego 4
NEGRO
NEGRO
ROJO
Juego 5
Masculino
NEGRO
ROJO
Para la estimación de resultados, será necesario tomar en cuenta las
probabilidades del cuestionario de preguntas no sensibles:
#
1
2
3
4
5
Pregunta
¿Naciste en el mes de julio?
¿Tu DNI termina en número 2?
¿Naciste en el mes de diciembre?
¿Naciste en el mes de enero?
¿Tu DNI termina en número 5?
Probabilidad de respuesta
1/12
1/10
1/12
1/12
1/10
Diseño de muestra para Encuesta Directa
Para la encuesta directa, se diseñó una muestra aleatoria con un error máximo de
4.7% y una confiabilidad de 95%.
Determinamos el tamaño muestral, obteniendo que el cuestionario de preguntas
se aplicará a una muestra de 340 estudiantes.
61
Aplicaciones de la técnica de Respuesta Aleatoria
Diseño de muestra para Encuesta con la técnica de Respuesta Aleatorizada
Para determinar el tamaño de la muestra, se usó el método de muestreo aleatorio
simple para la estimación de proporciones, con un error no mayor de 4.2% a
efectos de tener un tamaño de muestra mayor que en el caso de la encuesta
directa y con una confiabilidad del 95%, resultando un tamaño de 404
estudiantes.
Descripción de la técnica de Encuesta Directa
Consta de preguntas directas hechas por un entrevistador. Los cuestionarios
fueron contestados por escrito marcando la respuesta de las preguntas
categóricas con un aspa por el propio encuestado y posteriormente depositados
en un sobre para darles mayor confidencialidad.
Descripción de la técnica de Encuesta de Respuesta Aleatoria
Con la finalidad de darle más confianza al encuestado, se les entregó una cartilla
de instrucciones:
Paso 1: Baraja las cartas que te van a entregar
Paso 2: Selecciona una carta al azar y no se la muestres a NADIE
Paso 3: La pregunta que contestarás en cada juego, dependerá del COLOR de la
carta que obtengas:
Si es color negro, contesta a la pregunta NEGRO
Si es color rojo, contesta a la pregunta ROJO
Este procedimiento lo repetirás para cada juego
El encuestado únicamente tuvo que poner en la hoja de preguntas un aspa en la
respuesta que elegía y después de haber terminado de llenar los espacios con las
respuestas, se depositaba la ficha de la encuesta en una bolsa. En el desarrollo de
la técnica de respuesta aleatorizada es necesario utilizar un proceso aleatorio que
nos ayude a aleatorizar las respuestas.
El procedimiento que se eligió es un grupo de 6 cartas de una baraja inglesa, con
4 cartas negras y 2 rojas y que va a dar lugar a un juego fácil de ejecutar.
La anterior forma de distribución nos permite conocer fácilmente la probabilidad
de que cualquier carta sea escogida al azar.
Las preguntas sensibles están precedidas de la palabra Negro, y las no sensibles
de la palabra Rojo. Cuando se aplica la encuesta a cada estudiante de la muestra,
62
Respuesta aleatoria y técnicas de preguntas indirectas
se le entrega el grupo de cartas, para que lo revuelva como se hace usualmente.
Después se le pide que elija una carta al azar. Si la carta que elije es de color
negro, las preguntas que tendrá que contestar serán las sensibles. Por otra parte si
la carta que elije es de color rojo, las preguntas que tendrá que contestar serán
las no sensibles.
De esta forma conocemos la probabilidad de que nos conteste a las preguntas
sensibles, que es 4/6, y como consecuencia, la probabilidad de que nos conteste
las preguntas no sensibles es de 2/6. Con esto garantizamos que la probabilidad
del cuestionario del cual nos interesa conocer las respuestas, tiene más
probabilidad de ser contestado.
Resultados
Los resultados que se obtuvieron después de la aplicación de las encuestas son
sumamente importantes, ya que a partir de éstos podemos hacer inferencias,
comparaciones y contrastes.
Comparación y contraste de ambas técnicas
Uno de los objetivos de este trabajo es comprobar la eficacia de la técnica de
respuesta aleatorizada, por medio de la comparación y el contraste de las
estimaciones obtenidas con el método de encuesta directa contra los de la
aleatorizada.
Preguntas sensibles
1.¿Sueles consumir alimentos o
bebidas en la sala de cómputo?
2.¿Alguna vez has consumido drogas
alucinógenas?
3.¿Algunas veces has copiado en los
exámenes?
4.¿Has consumido bebidas
alcohólicas, cerca a la Universidad?
5.¿En este ciclo, has faltado a clase
sin motivo justificable?
Proporción
Encuesta
directa
Proporción
Respuesta
aleatorizada
Varianza
Encuesta
directa
Varianza
Respuesta
aleatorizada
0.32058824
0.52052
0.0006406
0.000129404
0.08235294
0.227826
0.0002222
0.000083361
0.78235294
0.819767
0.0005008
0.000134604
0.53529412
0.616575
0.0007316
0.000135904
0.62352941
0.685932
0.0006904
0.000137820
63
Aplicaciones de la técnica de Respuesta Aleatoria
Podemos notar que no son muy grandes las diferencias en cuanto a los valores
que tienen las proporciones de las preguntas 3 y 5, que son las referentes a
copiar en los exámenes y faltar a clases injustificadamente.
También se aprecia fácilmente la diferencia entre las proporciones resultantes de
ambas técnicas, ya que las obtenidas por medio de encuesta directa, son más
pequeñas que las obtenidas por medio de respuestas aleatorizadas. Esto se
traduce en que con la primera técnica, la población encuestada no acepta su
participación en ciertas acciones, etiquetadas y rechazadas por la sociedad en
general.
Es importante mencionar que el método de respuesta aleatoria proporciona
estimaciones con errores típicos pequeños, por lo que si bien no puede afirmarse
que los resultados obtenidos resulten 100% verdaderos, son muy cercanos a la
realidad.
Ejemplo de la Universidad de Granada
Presentamos una breve descripción del proceso que hemos diseñado para la aplicación
de las preguntas del método de respuesta aleatoria, mediante el modelo U.
La encuesta la aplicamos a una muestra representativa de la población de estudiantes de
la Universidad de Granada. El muestreo se hizo mediante muestreo por conglomerados.
Diseño de la encuesta
Formato de Encuesta con el modelo U
Para esta técnica de respuesta aleatoria, se aplica el método U, para lo cual es
necesario un cuestionario adicional con las siguientes características:

Las preguntas no deben de ser sensibles.

No deben estar relacionadas con el tema de la pregunta “sensible”.

Para cada una de las preguntas que miden variables cualitativas, las
respuestas deben tener una probabilidad conocida.
64
Respuesta aleatoria y técnicas de preguntas indirectas
Encuesta anónima
Marcar con un X su respuesta
Sexo
Femenino
Masculino
Titulación
Curso
1º
2º
3º
4º
5º
CARA
CRUZ
¿Has copiado alguna vez en un examen?
¿Naciste el mes de julio?
SÍ
NO
CARA
CRUZ
¿Te has peleado con algún profesor?
¿Tu DNI termina en número 2?
SÍ
NO
CARA
CRUZ
¿Has sufrido acoso?
¿Naciste del 1 al 20 del mes?
SÍ
NO
CARA
CRUZ
¿Has acosado alguna vez a alguien?
¿Tu DNI termina en número 5?
SÍ
NO
¿Has consumido drogas en las instalaciones de la
universidad?
¿Naciste del 15 al 25 del mes?
SÍ
NO
¿Has mantenido relaciones sexuales en las
instalaciones de la universidad?
¿Naciste el mes de abril?
SÍ
NO
CARA
CRUZ
CARA
CRUZ
Para la estimación de resultados, será necesario tomar en cuenta las
probabilidades del cuestionario de preguntas no sensibles:
#
1
2
3
4
5
6
Pregunta
¿Naciste el mes de julio?
¿Tu DNI termina en número 2?
¿Naciste del 1 al 20 del mes?
¿Tu DNI termina en número 5?
¿Naciste del 15 al 25 del mes?
¿Naciste el mes de abril?
Probabilidad de respuesta
1/12
1/10
20/30
1/10
10/30
1/12
65
Aplicaciones de la técnica de Respuesta Aleatoria
Descripción de la técnica del modelo U
Con la finalidad de darle más confianza al encuestado, se les entregó una cartilla
de instrucciones:
Paso 1: Lanza una moneda y no le muestres a NADIE el lado obtenido
Paso 2: La pregunta que contestarás en cada juego, dependerá de que obtengas
CARA o CRUZ:
Si es cara, contesta a la pregunta CARA
Si es cruz, contesta a la pregunta CRUZ
Este procedimiento lo repetirás para cada juego
El encuestado únicamente tuvo que poner en la hoja de preguntas un aspa en la
respuesta que elegía y después de haber terminado de llenar los espacios con las
respuestas, se depositaba la ficha de la encuesta en una bolsa. En el desarrollo de
la técnica de respuesta aleatorizada es necesario utilizar un proceso aleatorio que
nos ayude a aleatorizar las respuestas.
El procedimiento que se eligió es lanzar una moneda, un lado cara y otro cruz,
que va a dar lugar a un juego fácil de ejecutar.
La anterior forma de distribución nos permite conocer fácilmente la probabilidad
de que cualquier lado sea escogido al azar.
Las preguntas sensibles están precedidas de la palabra Cara, y las no sensibles de
la palabra Cruz. Cuando se aplica la encuesta a cada estudiante de la muestra, se
le entrega la moneda. Después se le pide que la lance al azar. Si el lado que
obtiene es de cara, las preguntas que tendrá que contestar serán las sensibles. Por
otra parte si el lado que obtiene es cruz, las preguntas que tendrá que contestar
serán las no sensibles.
De esta forma conocemos la probabilidad de que nos conteste a las preguntas
sensibles, que es 1/2, y como consecuencia, la probabilidad de que nos conteste
las preguntas no sensibles es de 1/2. Con esto garantizamos la total aleatoriedad
de respuesta.
Resultados
Los resultados que se obtuvieron después de la aplicación de la encuesta son sumamente
importantes, ya que a partir de éstos podemos hacer inferencias, comparaciones y
contrastes.
66
Respuesta aleatoria y técnicas de preguntas indirectas
Estimación por medio del modelo U
Para la estimación de las proporciones para las variables cualitativas en la
Técnica de Respuesta Aleatoria, se realizaron los siguientes pasos:

Por medio del programa SPSS, podemos saber fácil y rápidamente el número
de estudiantes de la muestra que hay en cada titulación, en cada curso y por
sexos y los que respondieron afirmativamente a cada una de las preguntas.
Titulación
titulacion
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
lic.matematicas
10
3,2
3,2
3,2
grado.matematicas
50
15,8
15,8
18,9
grado.ing.quimica
10
3,2
3,2
22,1
grado.farmacia
65
20,5
20,5
42,6
lade
34
10,7
10,7
53,3
6
1,9
1,9
55,2
grado.primaria
61
19,2
19,2
74,4
grado.turismo
72
22,7
22,7
97,2
derecho-lade
1
,3
,3
97,5
dip.turismo
1
,3
,3
97,8
NS NC
7
2,2
2,2
100,0
317
100,0
100,0
grado.infantil
Total
La muestra consta de 317 alumnos. Licenciados en Matemáticas son 10, Graduados en
Matemáticas 50, Graduados en Ingeniería Química 10, Graduados en Farmacia 65,
Licenciados en Administración y Dirección de Empresas 34, Graduados en Infantil 6,
Graduados en Primaria 61, Graduados en Turismo 72, Licenciados en Derecho y
Administración y Dirección de Empresas 1, Diplomados en Turismo 1, y no sabe, no
contesta 7.
67
Aplicaciones de la técnica de Respuesta Aleatoria
Curso
curso
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
primero
211
66,6
66,6
66,6
segundo
19
6,0
6,0
72,6
tercero
24
7,6
7,6
80,1
cuarto
23
7,3
7,3
87,4
quinto
22
6,9
6,9
94,3
NS NC
18
5,7
5,7
100,0
317
100,0
100,0
Total
La muestra consta de 317 alumnos. De primero son 211, de segundo 19, de tercero 24,
de cuarto 23, de quinto 22, y no sabe, no contesta 18.
68
Respuesta aleatoria y técnicas de preguntas indirectas
Sexo
sexo
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
mujer
194
61,2
61,2
61,2
hombre
108
34,1
34,1
95,3
NS NC
15
4,7
4,7
100,0
317
100,0
100,0
Total
La muestra consta de 317 alumnos. Mujeres son 194, hombres 108 y no sabe, no
contesta 15.
69
Aplicaciones de la técnica de Respuesta Aleatoria
Pregunta 1:¿Has copiado alguna vez en un examen? / ¿Naciste el mes de julio?
Pregunta1
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
si
152
47,9
47,9
47,9
no
164
51,7
51,7
99,7
1
,3
,3
100,0
317
100,0
100,0
NS NC
Total
Se observa que el 47.9% de los estudiantes contestaron afirmativamente a la pregunta
frente al 51.7% que contestaron negativamente.
Pregunta 2:¿Te has peleado con algún profesor? / ¿Tu DNI termina en número 2?
Pregunta2
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
si
66
20,8
20,8
20,8
no
250
78,9
78,9
99,7
1
,3
,3
100,0
317
100,0
100,0
NS NC
Total
Se observa que el 20.8% de los estudiantes contestaron afirmativamente a la pregunta
frente al 78.9% que contestaron negativamente.
70
Respuesta aleatoria y técnicas de preguntas indirectas
Pregunta 3:¿Has sufrido acoso? / ¿Naciste del 1 al 20 del mes?
Pregunta3
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
si
135
42,6
42,6
42,6
no
181
57,1
57,1
99,7
1
,3
,3
100,0
317
100,0
100,0
NS NC
Total
Se observa que el 42.6% de los estudiantes contestaron afirmativamente a la pregunta
frente al 57.1% que contestaron negativamente.
71
Aplicaciones de la técnica de Respuesta Aleatoria
Pregunta 4:¿Has acosado alguna vez a alguien? / ¿Tu DNI termina en número 5?
Pregunta4
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
si
34
10,7
10,7
10,7
no
281
88,6
88,6
99,4
2
,6
,6
100,0
317
100,0
100,0
NS NC
Total
Se observa que el 10.7% de los estudiantes contestaron afirmativamente a la pregunta
frente al 88.6% que contestaron negativamente.
Pregunta 5:¿Has consumido drogas en las instalaciones de la universidad? / ¿Naciste
del 15 al 25 del mes?
Pregunta5
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
si
70
22,1
22,1
22,1
no
246
77,6
77,6
99,7
1
,3
,3
100,0
317
100,0
100,0
NS NC
Total
Se observa que el 22.1% de los estudiantes contestaron afirmativamente a la pregunta
frente al 77.6% que contestaron negativamente.
72
Respuesta aleatoria y técnicas de preguntas indirectas
Pregunta 6:¿Has mantenido relaciones sexuales en las instalaciones de la universidad? /
¿Naciste el mes de abril?
Pregunta6
Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
si
21
6,6
6,6
6,6
no
295
93,1
93,1
99,7
1
,3
,3
100,0
317
100,0
100,0
NS NC
Total
Se observa que el 6.6% de los estudiantes contestaron afirmativamente a la pregunta
frente al 93.1% que contestaron negativamente.
73
Aplicaciones de la técnica de Respuesta Aleatoria

Se asignaron los datos conocidos de las probabilidades de las preguntas no
sensibles, así como los datos obtenidos del programa para cada una de las
preguntas sensibles como se presentan en la tabla 1.
Tamaño de la muestra = 317 estudiantes, Tamaño de la población = 53376
Probabilidad de la
Número de
Respuestas sí
p
1-p
característica no
pregunta
en la muestra
sensitiva
152
0.5
1-0.5=0.5
1/12=0.0833
1
66
0.5
0.5
1/10=0.1
2
135
0.5
0.5
20/30=0.6666
3
34
0.5
0.5
0.1
4
70
0.5
0.5
10/30=0.3333
5
21
0.5
0.5
0.0833
6
Tabla1. Datos obtenidos de la encuesta y probabilidades conocidas

El cálculo de la proporción y la estimación de la característica sensible se
presenta en la Tabla 2, para la muestra total utilizando la fórmula explicada
en el modelo U. (Todos los cálculos los he programado con R)
⁄
⁄
Estimación de la
Proporción
característica
sensible
0.47949527
0.87565720
1
0.20820189
0.31640379
2
0.42586751
0.18506835
3
0.10725552
0.11451104
4
0.22082019
0.10830705
5
0.06624606
0.04915878
6
Tabla 2. Estimación de las proporciones
Número de
pregunta

Al tener las proporciones estimadas a partir de la muestra, se procede a
calcular las varianzas de los estimadores de las preguntas sensibles, las
cuales se presentan en la Tabla 3.
74
Respuesta aleatoria y técnicas de preguntas indirectas
Número de
Varianza
pregunta
4.687036e-05
1
1.915936e-05
2
2.613577e-05
3
9.324953e-06
4
1.58719e-05
5
5.578476e-06
6
Tabla 3. Varianzas definitivas
Comentario
Teniendo en cuenta las preguntas sensibles
Pregunta 1:¿Has copiado alguna vez en un examen?
Pregunta 2:¿Te has peleado con algún profesor?
Pregunta 3:¿Has sufrido acoso?
Pregunta 4:¿Has acosado alguna vez a alguien?
Pregunta 5:¿Has consumido drogas en las instalaciones de la universidad?
Pregunta 6:¿Has mantenido relaciones sexuales en las instalaciones de la universidad?
y a la vista de las tablas vemos que las proporciones, las cuales indican la probabilidad
de contestar afirmativamente a la pregunta, sin tener en cuenta si es sensible o no, de
algunas preguntas son relativamente bajas, lo que nos dice que esas preguntas son
consideradas por los encuestados mucho más sensibles que las demás, como por
ejemplo las preguntas 6 y 4. Pero también es importante mencionar que en las preguntas
1 y 3 se tienen proporciones altas, lo cual significa que esas preguntas que se
consideraban sensibles, en realidad para los estudiantes no lo son tanto.
En cuanto a la estimación de la característica sensible, ésta nos indica la probabilidad de
contestar afirmativamente ante una pregunta sensible. Vemos como por ejemplo en la
pregunta 1 la probabilidad de responder Sí aumenta casi al doble, también aumenta en
las preguntas 2 y 4, pero en menor medida, mientras que en las preguntas 3 y 5 se
reduce casi a la mitad. La probabilidad de la pregunta 6 apenas varía.
Como podemos ver las varianzas de todas las preguntas son muy pequeñas, por lo que
la estimación de la característica sensible es bastante precisa.
75
Aplicaciones de la técnica de Respuesta Aleatoria
Si en lugar de hacerlo con el total de la población, estratifico mediante la variable sexo,
los resultados serían:
Estrato: Mujer
Tamaño de la muestra = 194 estudiantes; Tamaño de la población = 30644
Probabilidad
Estimación de
Número Respuestas
de la
la
de
sí en la
p
1-p
Proporción
característica
característica
pregunta
muestra
no sensitiva
sensible
91
0.5 1-0.5=0.5
1/12=0.0833
0.46907216
0.85481100
1
40
0.5
0.5
1/10=0.1
0.20618557
0.31237113
2
81
0.5
0.5
20/30=0.6666 0.41752577
0.16838488
3
13
0.5
0.5
0.1
0.06701031
0.03402062
4
44
0.5
0.5
10/30=0.3333 0.22680412
0.12027491
5
10
0.5
0.5
0.0833
0.05154639
0.01975945
6
Varianza
7.982517e-05
3.302979e-05
4.534204e-05
9.413053e-06
2.829673e-05
7.158287e-06
Estrato: Hombre
Tamaño de la muestra = 108 estudiantes; Tamaño de la población = 22732
Probabilidad
Estimación de
Número Respuestas
de la
la
de
sí en la
p
1-p
Proporción
Varianza
característica
característica
pregunta
muestra
no sensitiva
sensible
52
0.5 1-0.5=0.5
1/12=0.0833
0.48148148
0.87962963
0.0001105202
1
23
0.5
0.5
1/10=0.1
0.21296296
0.32592593
4.607634e-05
2
49
0.5
0.5
20/30=0.6666 0.45370370
0.24074074
6.21846e-05
3
15
0.5
0.5
0.1
0.13888889
0.17777778
2.913172e-05
4
21
0.5
0.5
10/30=0.3333 0.19444444
0.05555556
3.340046e-05
5
8
0.5
0.5
0.0833
0.07407407
0.06481481
1.493517e-05
6
Comentario
Volvemos a recordar las preguntas sensibles
Pregunta 1:¿Has copiado alguna vez en un examen?
Pregunta 2:¿Te has peleado con algún profesor?
Pregunta 3:¿Has sufrido acoso?
Pregunta 4:¿Has acosado alguna vez a alguien?
Pregunta 5:¿Has consumido drogas en las instalaciones de la universidad?
Pregunta 6:¿Has mantenido relaciones sexuales en las instalaciones de la universidad?
Las preguntas más sensibles siguen siendo la 6 y la 4, pero esta vez al estratificar por
sexos, vemos que para las mujeres son más sensibles que para los hombres. Las
preguntas 1 y 3 vuelven a tener las proporciones más altas, siendo mayores en los
hombres.
76
Respuesta aleatoria y técnicas de preguntas indirectas
En general las proporciones de todas las preguntas, excepto la 5, son mayores en los
hombres, siendo especialmente notable en la pregunta 4.
En cuanto a la estimación de la característica sensible las preguntas 1 y 2 tienen valores
semejantes en ambos sexos, sin embargo en las preguntas 3,4 y 6 la probabilidad de
contestar afirmativamente en los hombres es superior a la de las mujeres, siendo en la
pregunta 4 un aumento muy notable, es decir, para las mujeres es mucho más sensible
que para los hombres, y en la pregunta 5 la probabilidad en las mujeres es más del doble
que en los hombres, con lo cual, esta pregunta es más sensible para los hombres.
Como podemos ver las varianzas de todas las preguntas son muy pequeñas en ambos
sexos, por lo que la estimación de la característica sensible es bastante precisa.
77
Aplicaciones de la técnica de Respuesta Aleatoria
78
Respuesta aleatoria y técnicas de preguntas indirectas
BIBLIOGRAFÍA
Referencias
Adhikary, A.K., Chaudhuri, A., and Vijayan, K. 1984. Optimum sampling strategies
for RR trials. Int. Stat. Rev. 52, 115-125.
Ahsanullah, M. and Eichhorn, B.H. 1988. On estimation of response from scrambled
quantitative data. Pak, J. Statist. 4A, 83-91.
Arnab, R. 1990. On commutativity of design and model expectations in randomized
response surveys. Comm. Stat. Theo. Math. 19, 3751-3757.
Arnab, R. 1994. Non-negative variance estimator in randomized response surveys.
Comm. Stat. Theo. Math. 23, 1743-1752.
Arnab, R. 1995a. On admissibility and optimality of sampling strategies in randomized
response surveys. Sankhya, Ser B. 37(3), 385-390.
Arnab, R. 1995b. Optimal estimation of a finite population total under randomized
response surveys. Statistics 27(1), 175-180.
Arnab, R. 1996. Randomized response trials: a unified approach for qualitative data.
Comm. Stat. Theo. Math. 25(6), 1173-1183.
Arnab, R. 1998. Randomized response surveys: Optimum estimation of a finite
population total. Statistical Papers 39(4), 405-408.
Arnab, R. 2001. Optimum sampling strategies under randomized surveys. Stat. Papers
54, 159-177.
Arnab, R. 2004. Optional randomized response techniques for complex designs. Biom.
J. 46, 114-124.
Asok, C. 1980. A note on the comparison between simple mean and mean based on
distinct units in sampling with replacement. Am. Statist. 34, 158.
Bansal, M.L., Singh, S., and Singh, R. 1994. Multi-character survey using randomized
response technique. Comm. Statist. – Theory Methods 23(6), 1705-1715.
Basu, D. 1958. On sampling with and without replacement. Sankhya 20, 287-294.
Bellhouse, D.R.
1995. Estimation of correlation in randomized response. Survey
Methodology 21(1), 13-19.
Bhargava, M. and Singh, R. 1999. On the relative efficiency of certain randomized
response strategies. JISAS 52(2), 245-253.
Boruch, R.F. 1972. Relations among statistical methods for assuring confidentiality of
social research data. Soc. Sci. Rec. 1, 403-414.
79
Bibliografía
Bourke, P.D. 1990. Estimating a distribution for each category of a sensitive variate.
Comm. Stat. Theo. Math. 19, 3233-3241.
Bouza, C.N. 2009. Ranked set sampling and randomized response procedures for
estimating the mean of a sensitive quantitative character. Metrika, DOI. 10. 1007 / s00 /
84 – 008 – 0191 – 6, 267-277.
Chang, H.J. and Liang, D.H. 1996. A two-stage unrelated randomized response
procedure. Aust. J. Stat. 33(1), 43-51.
Chang, H. J., Wang, C. L., and Huang, K. C. 2004. On estimating the proportion of a
qualitative sensitive character using randomized response sampling. Quality and
Qauntity 38, 675-680.
Chaudhuri, A. 1987. Randomize response surveys of finite populations: A unified
approach with quantitative data. J. Stat. Plan. Inf. 15, 157-165.
Chaudhuri A. 1992. Randomized Response: Estimating mean square errors of linear
estimators and finding optimal unbiased strategies. Metrika 39, 341-357.
Chaudhuri, A. 2001a. Using randomized response from a complex survey to estimate a
sensitive proportion in a dichotomous finite population. J. Stat. Plan. Inf. 94, 37-42.
Chaudhuri, A. 2001b. Estimating sensitive proportions from unequal probability
samples using randomized responses. Pak. J. Stat. 17(3), 259-270.
Chaudhuri, A. 2002. Estimating sensitive proportions from randomized responses in
unequal probability sampling. CSAB 52, 315-322.
Chaudhuri, A. and Adhikary, A.K. 1981. On sampling strategies with RR trials and
their properties and relative efficiencies. Tech. Ref. ASC / 81 / 5, Indian Statistical
Institute, Calcutta.
Chaudhuri, A. and Adhikary, A.K. 1990. Variance estimation with randomized
response. Comm. Statist. Theory Meth. 19(3), 1119-1126.
Chaudhuri, A. and Dihidar, K. 2009. Estimating means of stigmatizing qualitative
and quantitative variables from discretionary responses randomized or direct. Sankhya B
71, 123-136.
Chaudhuri, A. and Mukerjee, R. 1985. Optionally randomized responses techniques
CSAB 34, 225-229.
Chaudhuri, A. and Mukerjee, R. 1988. Randomized Responses: Theory and
Techniques. Marcel Dekker, New York, NY.
80
Respuesta aleatoria y técnicas de preguntas indirectas
Chaudhuri, A. and Saha, A. 2005a. On relative efficiencies of optional versus
compulsory randomization i responses: A simulation-based numerical study covering
three RR schemes. Pak. J. Stat. 21(1), 87-98.
Chaudhuri, A. and Saha, A. 2005b. Optional versus compulsory randomized response
techniques in complex surveys. J. Stat. Plan. Inf. 135, 516-527.
Chaudhuri, A. and Stenger, H. 1992. Theory and Methods of Survey Sampling.
Marcel Dekker, Inc. NY.
Chaudhuri, A. and Stenger, H. 2005. Survey Sampling: Theory and Methods (2nd
Edn). New York, NY: Chapman & Hall.
Chaudhuri, A and Vos, J.W.E. 1988. Unified theory and strategies of survey
sampling. North Holland, Amsterdam.
Chen, Z., Bai, Z., and Sinha, B.K. 2004. Ranked set sampling: theory and
applications. Lecture Notes in Stat # 176. Springer, NY.
Chikkagoudar, M.S. 1966. A note on inverse sampling with equal probabilities.
Sankhya A 28, 93-96.
Christofides, T.C. 2003. A generalized randomized response technique. Metrika 57,
195-200.
Christofides, T.C. 2010. Comments on a method of comparison of randomized
response technique. J. Stat. Plan. Inf. 140, 574-575.
Chua, T.C. and Tsui, A.K. 2000. Procuring honest responses indirectly. J. Stat. Plan.
Inf. 90, 107-116.
Dalenius, T. and Vitale, R.A. 1974. A New RR Design for Estimating the Mean of a
Distribution. Technical Report 78. Brown University, Providence, RI.
Des, R. and Khamis, S.H. 1958. Some remarks on sampling with replacement. AMS
39, 550-557.
Devore, J.L. 1977. A note on the randomized response technique. Communications in
Statistics Theory and Methods 6: 1525-1529.
Dihidar, K. 2010a. On shrinkage estimation procedure combining direct and
randomized responses in unrelated question model. J. Ind. Soc. Agri. Stat. 63(3), 2009
283-286; (also online at www.isas.org.in).
Dihidar, K. 2010b. Modifying classical randomized response techniques with provision
for true response. Cal. Stat. Assoc. Bull. (in press).
81
Bibliografía
Duffy, J.C. and Waterton, J.J. 1988. Randomized response vs. direct questioning:
Estimating the prevalence of alcohol related problems in a field survey. Aust. J. Stat. 30,
1-14.
Eichhorn, B.H. and Hayre, L.S. 1983. Scrambled randomized response methods for
obtaining sensitive quantitative data. J. Statist. Plan. Inf. 7, 307-316.
Eriksson, S.C. 1973. A new model for RR. Int. Stat. Rev. 41, 101-113.
Flinger, M.A., Policello, G.E and Sing, J. 1977. A comparison of two RR survey
methods with consideration for the level of respondent protection. Commun. Statist.
Theory Methods 6, 1511-1524.
Fox, J.A. and Tracy, P.E. 1986. Randomized Response: A Method for Sensitive
Surveys. London: Sage.
Franklin, L.A. 1989a. Randomized response sampling from dichotomous population
with continuous randomization. Surv. Methodol. 15(2), 225-235.
Franklin, L.A. 1989b. A comparison of estimators for randomized response sampling
with continuous distributions from dichotomous population. Commun. Statist. Theory
Method 18(2), 489-505.
Gelfand, A.E., and Smith, A.F.M. 1990. Sampling-based approaches to calculating
marginal densities. JASA 85, 398-409.
Godambe, V.P. 1970. Foundations of survey sampling. Amer. Stat. 24, 33-38.
Godambe, V.P. 1980. Estimation in RR trials. Int. Statist. Rev. 48, 29-32.
Greenberg, B.G., Abul-Ela, A.-L., Simmons, W.R., and Horvitz, D.G. 1969. The
unrelated question RR model: Theoretical framework. JASA 64, 520-539.
Greenberg, B.G., Kuebler, R.R., Abernathy, J. R. and Horvitz, D.G. 1971.
Application of the randomized response technique in obtaining quantitative data. JASA
66, 243-250.
Guerriero, M. and Sandri, M.F. 2007. A note on the comparison of some randomized
response procedures. J. Stat. Plan. Inf. 137, 2184-2190.
Gupta, S., Gupta, B., and Singh, S. 2002. Estimation of sensitivity level of personal
interview survey questions. J. Stat. Plan. Inf. 100, 239-247.
Hartley, H.O. and Rao, J.N.K. 1968. A new estimation theory for sample surveys.
Biometrika 55, 547-557.
Hartley, H.O. and Rao, J.N.K. 1971a. Foundations of surveys sampling (a Don
Quixote tragedy). Amer. Stat. 25, 21-27.
82
Respuesta aleatoria y técnicas de preguntas indirectas
Hartley, H.O. and Rao, J.N.K. 1971b. Some comments on labels: A rejoinder to a
section of Godambe’s paper, ‘A reply to my critics’. Sankhya, Ser. C 37, 163-170.
Himmelfarb, S. and Edgell, S.E. 1980. Additive constant model: A randomized
response technique for eliminating evasiveness to quantitative response questions. J.
Psychol. Bull. 87, 525-530.
Horvitz, D.G., Shah, B.V., and Simmons, W.R. 1967. The unrelated question RR
model. Proc. Social Statist. Sec. ASA, 65-72.
Huang, K.C. 2004. A survey technique for estimating the proportion and sensitivity in
a dichotomous finite population. Stat. Neerlandice. 58, 75-82.
Ibrahim, J.G. 1990. Incomplete data in generalized linear models. J. Amer. Stat. Assoc.
85, 765-769.
Kerkvliet, J. 1994. Estimating a logit model with randomized data: The case of cocaine
use. Aust. J. Stat. 36(1), 9-20.
Kim, J.M. and Elam, M.E. 2005. A two-stage stratified Warner’s randomized
response model using optimal allocation. Metrika 61, 1-7.
Kim, J. and Warde, W.D. 2004a. A stratified Warner’s randomized response model. J.
Stat. Plan. Inf. 120(1-2), 155-165.
Kim, J. and Warde, W.D. 2004b. A mixed randomized response model. J. Stat. Plan.
Inf. 120, 155-165.
Kim, J. M., Tebbs, J., and An, S.W. 2006. Extensions of Mangat’s randomized
response model. J. Stat. Plan. Inf. 136(4), 1154-1567.
Krishnamoorthy, K. and Raghavarao, D. 1993. Untruthful answering in repeated
randomized response procedures. Can. J. Stat. 21, 233-236.
Kuk, A.Y.C. 1990. Asking sensitive questions indirectly. Biometrika 77(2), 436-438.
Lakshmi, D.V. and Raghavarao, D. 1992. A test for detecting untruthful answering in
randomized response procedures. J. Stat. Plan. Inf. 31, 387-390.
Landsheer, J.A., Heijden, P.V.D., and Gils, G.V. 1999. Trust and understanding, two
psychological aspect of randomized response. Quality Quantity 33, 1-12.
Lanke, J. 1975a. Some contribution to the theory of survey sampling. PhD Thesis,
University of Lund, Lund, Sweden.
Lanke, J. 1975b. On the choice of unrelated question in Simmons’ version of RR. JASA
70, 80-83.
Lanke, J. 1976. On the degree of protection in randomized interviews. Int. Stat. Rev.
44, 197-203.
83
Bibliografía
Leysieffer, R.W. and Warner, S.L. 1976. Respondent jeopardy and optimal design in
RR models. JASA 71, 649-656.
Liu, P.T., Chow, L.P., and Mosley, W.H. 1975. Use of RR technique with a new
randomizing device. JASA 70, 329-332.
Ljungqvist, L. 1993. A unified approach to measures of privacy in randomized
response models: a utilitarian perspective. JASA 88, 97-103.
Maddala, G.S. 1983. Limited Dependent and Qualitative Variables in Econometrics.
Cambridge University Press, New York.
Mangat, N.S. 1992. Two stage randomized response sampling procedure using
unrelated question. JISAS 44(1), 82-88.
Mangat, N.S. 1994. An improved randomized response strategy. JRSS, Ser. B 56(1),
93-95.
Mangat, N.S. and Singh, R. 1990. An alternative randomized response procedure.
Biometrika 77(2), 439-442.
Mangat, N. S. and Singh, R. 1991. An alternative approach to randomized response
survey. Statistica 51(3), 327-332.
Mangat, N.S., and Singh, S. 1994. Optional randomized response model. JISAS 32, 7175.
Mangat, N.S., Singh, R., and Singh, S. 1992. An improved unrelated question
randomized response strategies. CSAB 42, 227-281.
Mangat, N.S., Singh, R., Singh, S., and Singh, B. 1993. On Moors’ randomized
response model. Biom. J. 35, 727-32.
Mangat, N.S., Singh, R., Singh, S., Bellhouse, D.R., and Kashani, H.B. 1995. On
efficiency of estimator using distinct respondents in randomized response survey. Surv.
Methodol. 21, 21-23.
McIntire, G.A. 1952. A method of unbiased selection sampling using ranked sets. Aust.
J. Agri. Res. 3, 385-390.
Moors, J.J.A. 1971. Optimization of the unrelated question RR model. JASA 66, 627629.
Nayak, T.K. 1994. On randomized response surveys for estimating a proportion.
Comm. Statist. Theory Method, 23(3), 3303-3321.
Nayak, T.K. and Adeshiyan, S.A. 2009. A unified framework for analysis and
comparison of randomized response survey of binary characteristics. J. Stat. Plan. Inf.
139, 2757-2766.
84
Respuesta aleatoria y técnicas de preguntas indirectas
Padmawar, V.R. and Vijayan, K. 2000. Randomized response revisited. J. Stat. Plan.
Inf. 90, 293-304.
Pal, S. 2002. Contributions to emerging techniques in survey sampling. Unpublished
Ph. D. thesis, Indian Statistical Institute, Kolkata, India.
Pal, S. 2007a. Extending Takahashi-Sakasegawa’s indirect response technique to cover
sensitive surveys in unequal probability sampling. CSAB 59, 265-276.
Pal, S. 2007b. Estimation the proportion of people bearing a sensitive issue with an
option to item count lists and randomized response. Statist. Trans. 8(2), 301-310.
Pal, S. 2008. Unbiasedly estimating the total of a stigmatizing variable from a complex
survey on permitting options for direct or randomized response. Metrika 49, 157-164.
Pal, S. 2009. Extending Takahasi-Sakasegawa’s indirect response technique to cover
sensitive surveys in unequal probability sampling permitting direct answers.
Unpublished.
Pathak, P.K. 1962. On simple random sampling with replacement. Sankhya A 24, 287302.
Pollock, K.H. and Bek, Y. 1976. A comparison of three RR models for quantitative
data. JASA 71, 884-886.
Quatember, A. 2009. To copy with nonresponse and untruthful answering. Different
questioning designs for different variables. In Proceedings of the NTTS 2009 –
Conferences on New Techniques and Technologies for Statistics, www.ntts2009.eu.
Rao, J.N.K., Hartley, H.O., and Cochran, W.G. (RHC). 1962. On the simple
procedure of unequal probability sampling without replacement. JRSS B 24, 482-491.
Saha, A. 2003. On efficacies of Dalenius-Vitale technique with compulsory versus
optional randomized responses from complex surveys. CSAB 21(2).
Scheers, N.J. 1992. A review of randomized response techniques in measurement and
evaluation in counseling and development, Meas. Eval. Couns.
Dev. 25, 27-41.
Scheers, N.J. and Dayton, C.M. 1988. Covariate randomized response models. JASA
83, 969-974.
Sengupta, S. and Kundy, D. 1989. Estimation of finite population mean in randomized
response surveys. J. Stat. Plan. Inf. 23, 117-125.
Singh, R., Mangat, N.S., and Singh, S. 1993. A mail survey design for sensitive
character without using randomization device. Commun. Statist. Theory Method 22(9),
2661-2668.
85
Bibliografía
Singh, R., Singh, S., and Mangat, N.S. 2001. Mail survey design for sensitive
quantitative variable. Unpublished.
Singh, S. and Joarder, A.H. 1997. Unknown repeated trials in randomized response
sampling. JISAS 50, 70-74.
Singh, S. and Singh, R. 1992. Improved Franklin’s model for randomized response
sampling. J. Ind. Stat. Assoc. 30, 109-122.
Singh, S. and Singh, R. 1993. Generalized Franklin’s model for randomized response
sampling. Commun. Statist. Theory Method 22, 741-755.
Singh, S., Horn, S., and Chowdhuri, S. 1998. Estimation of stigmatized characteristics
of a hidden gang in finite population. Aust. N.Z. J. Stat. 4, 291-297.
Singh, S., Horn, S., Singh, R., and Mangat, N.S. 2003. On the use of modified
randomization device for estimating the prevalence of a sensitive attribute. Stat. in
Transition 6(4), 515-522.
Singh, S., Joarder, A.H., and King, M.L. 1996. Regression analysis using scrambled
responses. Aust, J. Stat. 38(2), 201-211.
Singh, S., Singh, R., and Mangat, N. S. 2000. Some alternative strategies to Moor’s
model. JASA 66, 627-629.
Sinha, B.K. and Hedayat, A.S. 1991. Randomized response: a data-gathering tool for
sensitive characteristics. In: Design and Inference finite Population Sampling. Eds.
Hedayat, A.S. and Sinha, B.K., New York, NY: John Wiley & Sons, Chapter 11, 310340.
Smith, A.F.M., and Robert, G.O. 1993. Bayesian complication via the Gibbs sampler
and related Markov chain Monte Carlo method (with discussion). JRSS B 55, 3-23, 53102.
Stem, Jr., D.E. and Steinhorst, R.K. 1984. Telephone interview and mail
questionnaire application of the randomized response model. JASA 79, 555-564.
Strachan, R., King, M., and Singh, S. 1998. Likelihood-based estimation of the
regression model with scrambled responses. Aust. NZ. J. Stat. 40(3), 279-290.
Takahasi, K. and Sakasegawa, H. 1977. An RR technique without use of any
randomizing device. Ann. Inst. Stat. Math 29,1-8.
Tanner, M.A. 1993. Tools for Statistical Inference: Methods for the Exploration of
Posterior Distributions and Likelihood Functions. 2nd Edn. New York, NY: SpringerVerlag.
86
Respuesta aleatoria y técnicas de preguntas indirectas
Tracy, D. and Mangat, N.S. 1996. Some development in randomized response
sampling during the last decades: A follow up of a review by Chaudhuri and Mukherjee.
JASS 4(2/3), 147-158.
Tracy, D.S. and Mukhopadhyay, P. 1994. On UMVU-estimation under randomized
response models. Statistics 25, 173-175.
Umesh, U.N. and Peterson, R.A. 1991. A critical evaluation of the randomized
response method. Soc. Meth. Res. 20(1), 104-138.
Van der Hout, A. and Van der Heijden, P.G.M., 2002. Randomized response,
statistical disclosure control and misclassification: A review. ISR 30(2), 269-288.
Warner, S.L. 1965. RR: A survey technique for eliminating evasive answer bias. JASA
60, 63-69.
Yan, Z. and Nie, Z. 2004. A fair comparison of the randomized response strategies.
Unpublished.
Enlaces de interés
http://rev-inv-ope.univ-paris1.fr/files/31310/31310-07.pdf
http://redalyc.uaemex.mx/pdf/302/30211234006.pdf
http://www.udc.es/dep/mate/biometria2003/Archivos/ps44.pdf
http://www.aloj.us.es/vmanzano/pdf/academia/respuestaaleatorizada.pdf
http://es.scribd.com/doc/55958638/105/El-muestreo-basado-en-el-metodo-de-respuestaaleatorizada
http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investi
gacion/IF_JULIO_2012/IF_POMALAYA%20VERASTEGUI_FCE.pdf
http://www.eio.uva.es/~tapia/erroresnomuestreo11-12.pdf
http://www.dartmouth.edu/~chance/teaching_aids/RResponse/RResponse.html
http://rev-inv-ope.univ-paris1.fr/files/31310/31310-06.pdf
87
Descargar