Usos indebidos de la estadística

Anuncio
Usos indebidos de la estadística
Triolla, M. (2004)
Probabilidad y Estadística. Capitulo I
Novena edición. Pearson Education. México
Extracto elaborado por: Gómez, A
Pensamiento crítico
El éxito en el curso introductorio de estadística por o regular requiere de más sentido
común que destreza matemática (a pesar de la advertencia de Voltaire de que “el sentido
común no es muy común”). Ya que ahora tenemos acceso a calculadoras y a
computadoras, las aplicaciones modernas de la estadística ya no requieren que
dominemos algoritmos complejos de operaciones matemáticas. En su lugar nos
enfocamos en la interpretación de los datos los resultados. Esta sección está diseñada
para ilustrar la forma en que se usa el sentido común cuando penamos de forma crítica
acerca de los datos y la estadística.
Hace cerca de un siglo, el estadista Benjamin Disraeli pronunció a famosa frase: “Hay
tres clases de mentiras: mentiras, viles mentiras y estadísticas”. También se ha dicho
que “las cifras no mienten; los mentirosos calculan las cifras”. El historiador Andrew
Lang dijo que algunas personas utilizan la estadística ‘como un borracho utiliza los
postes de alumbrado: como apoyo más que como iluminación”. El caricaturista político
Don Wright nos anima diciendo ‘retome el misterio de la vida: mienta a un
encuestador”. El autor Franklin P. iones escribió que “la estadística puede usarse para
sustentar cualquier cosa, en especial a los estadísticos”. En el Esar’s Comic Dictionary
encontramos la definición de que un estadístico es “un especia1ista que reúne
pensamientos y luego los conduce al extravío. Estas afirmaciones se refieren a ejemplos
donde los métodos estadísticos se utilizaron de forma errónea, de tal manera que
resultaron engañosos en última instancia. Hay dos fuentes principales de tal engaño: 1.
el intento malintencionado por parte de personas deshonestas, y 2. los errores de
descuido cometidos por personas que no conocen nada mejor. Sin tener en cuenta la
fuente, como ciudadanos responsables y como empleados profesionales valiosos,
debemos tener una habilidad básica para distinguir entre conclusiones estadísticas que
parecen ser válidas de las que son gravemente defectuosas.
Para mantener esta sección en la perspectiva apropiada, hay que saber que éste no es un
libro acerca de los malos usos de la estadística. El resto de este libro estará lleno de usos
muy importantes de métodos estadísticos válidos. Aprenderemos métodos generales
para usar datos muestrales y así poder hacer inferencias relevantes acerca de
poblaciones; aprenderemos acerca de encuestas y tamaños de muestra, acerca de
mediciones importantes de características fundamentales de los datos. Junto con las
explicaciones de estos conceptos generales. veremos muchas aplicaciones específicas
reales, tales como los efectos en el fumador pasivo, el predominio del alcohol y el
tabaco en las películas de dibujos animados para niños y la calidad de productos de
consumo, incluyendo dulces M&M, cereales. Coca Cola y Pepsi. Pero incluso en estas
aplicaciones reales y con significado debemos ser cuidadosos para interpretar
correctamente los resultados de métodos estadísticos válidos.
Comenzamos nuestro desarrollo del pensamiento crítico considerando muestras
erróneas, Estas muestras son erróneas en el sentido de que el método de muestreo
arruina la muestra, de modo que tiene la posibilidad de estar sesgada (es decir, de no ser
representativa de la población de la que se obtuvo).
A continuación se presentan ejemplos de muestras de respuesta voluntaria que, por su
naturaleza, adolecen de una carencia importante, pues no debemos obtener conclusiones
sobre una población con base en una muestra sesgada como ésta:
• Las encuestas manejadas a través de Internet en las que los sujetos deciden si
responden o no.
• Las encuestas por correo, donde los sujetos deciden si contestan.
• Las encuestas telefónicas, en las que anuncios en el periódico, la radio, la televisión, le
piden que tome un teléfono voluntariamente y llame a un número especia) para registrar
su opinión.
Con muestras de respuesta voluntaria como éstas, sólo es posible llegar a conclusiones
á1idas acerca del grupo específico que decide participar; pero sería una práctica
incorrecta común establecer conclusiones acerca de una población más grande. Desde
un punto de vista estadístico, una ¡nuestra como ésta fui la en lo esencial y no debe
utilizarse para realizar declaraciones generales acerca de una población mayor.
Muestras pequeñas. Las conclusiones no deben basarse en muestras que son
sumamente pequeñas. Por ejemplo, el Children’s Defense Fund publicó Child Out of
Schoo! in America, donde se reportó que de los estudiantes de escuela secundaria
suspendidos en una región, el 67% fueron suspendidos al menos tres veces. Pero esta
cifra está basada en una muestra de sólo tres estudiantes Los reportes en los medios de
comunicación fallaron al mencionar que el tamaño de la muestra era muy pequeño. (En
los capítulos 6 y 7 veremos que en ocasiones es posible realizar algunas deducciones
valiosas a partir de muestras pequeñas, aunque debemos ser cuidadosos y verificar que
se satisfagan los requisitos necesarios).
En ocasiones una muestra puede parecer relativamente grande (como en una encuesta de
“2000 adultos estadounidenses seleccionados al azar”) pero si se obtienen conclusiones
acerca de los subgrupos, por ejemplo, los republicanos de sexo masculino de 21 años de
edad de Pocatello, tales conclusiones estarían basadas en muestras demasiado pequeñas.
Si bien es importante tener una muestra que sea suficientemente grande, también lo es el
hecho de tener datos muestrales que se recolecten de una forma adecuada, como la
selección aleatoria. Aun las muestras grandes llegan a ser muestras erróneas.
Gráficas Las gráficas -como las de barras y las circulares- en ocasiones sirven para
exagerar o disfrazar la verdadera naturaleza de los datos. (En el capítulo 2 analizaremos
una variedad de gráficas diferentes). Las dos gráficas en la figura 1-1 de la siguiente
página representan los mismos datos del Bureau of Labor Statisties, aunque el inciso b)
está diseñado para exagerar la diferencia entre los salarios semanales de hombres y
mujeres. Al no iniciar el eje vertical en cero, la gráfica del inciso b) tiende a producir
una impresión subjetiva engañosa, que hace que los lectores incorrectamente crean que
la diferencia es mucho peor de lo que en realidad es. La figura 1-1 enseña una lección
importante: para interpretar una gráfica de manera correcta, debernos analizar la
información numérica dada en ella, para no engañarnos por su forma general. (El
término mediana que se utiliza en la figura 1-1 se describirá con claridad en la sección
2-4).
Figura 1-1 Salarios semanales de hombres y mujeres de 16 a 24 años
Pictogramas Los dibujos de objetos llamados pictogramas, también pueden resultar
engañosos. Algunos objetos que se usan comúnmente para representar datos incluyen
objetos tridimensionales, como bolsas de dinero, pilas de monedas, tan que militares
(para gastos militares), barriles (para producción petrolera) y casas (para construcción
de viviendas). Al dibujar tales objetos los artistas 1legan a crear impresiones falsas que
distorsionan las diferencias.
Porcentajes A veces se utilizan porcentajes engañosos o poco claros. Si usted toma el
100% de alguna cantidad, está tomándolo todo. (No debería requerir de un 1l0% de
esfuerzo para que la declaración anterior tenga sentido). En referencia a la pérdida de
equipaje, la Continental Airlines publicó anuncios afirmando trata de “un área en la que
ya hemos mejorado un 100% en los últimos seis meses”. En un editorial que criticaba
ese dato estadístico, el diario The New York Times interpretó correctamente que la cifra
de mejora en un 100% significa ya no se está perdiendo equipaje, logro que todavía no
disfruta Continental Airlines
Preguntas predispuestas Existen muchos aspectos que afectan las preguntas de una
encuesta. Estas llegan a estar ‘cargadas” o redactadas intencionalmente de manera que
propicien una respuesta deseada. Observe las calificaciones de respuesta “sí” reales para
las diferentes redacciones en una pregunta:
• 97% sí: “ el presidente utilizar su poder de veto para eliminar los desperdicios?”.
• 57% sí: “ el presidente utilizar su poder de veto o no?”
En The Superpollsters, David W. Moore describe un experimento donde se preguntó a
diferentes sujetos si estaban de acuerdo con las siguientes declaraciones:
• Se gasta muy poco dinero en subsidios del Estado.
• Se gasta muy poco dinero en asistencia a los pobres.
Aun cuando es el pobre quien recibe el subsidio del Estado, sólo el 19% estuvo de
acuerdo cuando se usaron las palabras ‘subsidio del Estado”, aunque el 63% estuvo de
acuerdo con “asistencia a los pobres”.
Orden de las preguntas En ocasiones las preguntas de una encuesta se cargan de forma
no intencional, en virtud de factores corno el orden de los reactivos que se someten a
consideración. Observe estas preguntas de una encuesta aplicada en Alemania.
• ¿Cree usted que el tránsito vehicular contribuye a la contaminación del aire más o
menos que la industria?
• ¿Cree usted que la industria contribuye a la contaminación del aire más o menos
que el tránsito vehicular?
Cuando se presentó primero el tránsito, el 45% culpó al tránsito y el 27% culpé a la
industria: cuando la industria se presentó primero, el 24% culpé al tránsito y el 57%
culpó a la industria.
Rechazo Cuando se invita a las personas a contestar una encuesta algunas se niegan con
firmeza a responder. La tasa de rechazo ha crecido en años recientes, en parte porque
muchos vendedores persistentes de empresas de telemercadeo buscan vender bienes o
servicios comenzando con una inducción de ventas que suena como si fuera parte de
una encuesta de opinión. En Lies, Damn Lies, anil Statisties. el autor Michael Wheeler
indica con acierto que “las personas que se niegan a hablar con los entrevistadores
parecen ser diferentes de quienes no lo hacen. Algunas quizá tengan miedo a los
extraños y otras sean celosas de su privacidad, pero su negativa a hablar demuestra que
su visión del mundo circundante es marcadamente diferente de aquellas otras personas
que permiten a los entrevistadores entrar a sus hogares”.
Correlación y causalidad Usaremos el término correlación para indicar que las dos
variables están relacionadas. Sin embargo, hacemos esta importante anotación la
correlación no implica causalidad. Esto significa que cuando nosotros encontramos una
asociación estadística entre dos variables, ‘o podernos concluir que una de las variables
es la causa de la otra (o que la afecta directamente). Si encontramos una correlación
entre la riqueza y el CI, no podemos concluir que el CI de un persona afecta
directamente su riqueza, ni tampoco podemos concluir que la riqueza de a persona
afecta directamente u puntuación de Cl. En los medios de Comunicación es bastante
común reportar una correlación recién encontrada con una redacción que indica o
implica directamente que una de las variables es causa de la otra.
Estudios para el propio beneficio Algunas veces los estudios reciben el patrocinio de
grupos c intereses específicos que buscan promover. Por ejemplo, Kiwi Erands, un
fabricante de abrillantador de calzado, encargó un estudio que suscitó esta declaración
impresa en algunos periódicos: “De acuerdo con una encuesta nacional realizada a 250
empleadores profesionales, a razón más común de! fracaso de un solicitante de trabajo
del sexo masculino al dar una buena primera impresión, fue llevar los zapatos
desaseados”. Debemos ser muy cautos con encuestas como éstas, cuyos resultados
generan ganancias económicas para el patrocinador. En los últimos años ha generado
preocupación creciente la práctica de las compañías farmacéuticas de financiar a
doctores que realizan experimentos clínicos y reportan sus resultados en revistas de
prestigio, como Journal of American Medical Association.
Números precisos En la actualidad existen 103,215,027 hogares en Estados Unidos.”
Puesto que esta cantidad es muy precisa, mucha gente considera erróneamente que
también es exacta. En este caso, ese número es un estimado y sería mejor decir que el
número de hogares es de alrededor de 103 millones.
Imágenes parciales “El 90% de todos nuestros automóviles vendidos en este país en
los últimos 10 años, continúa circulando”. Millones de consumidores escucharon ese
anuncio con y no se dieron cuenta de que el 90% de los automóviles que el anunciante
vendió en este país se vendieron durante los últimos tres años, de modo que la mayoría
de esos automóviles que circulaban estaban casi nuevos. La afirmación era técnicamente
correcta, aunque muy engañoza al no presentar los resultados completos.
Distorsiones deliberadas En el libro Tainted Truth, Cynthia Crossen cita un ejemplo de
la revista Corporare Travel que publicó resultados que mostraban que, entre las
compañías de renta de automóviles, Avis fue la ganadora en una encuesta realizada a
personas que utilizan ese servicio. Cuando Hertz solicitó información detallada acerca
de la encuesta, las respuestas originales de ésta desaparecieron y el coordinador de
encuestas de la revista renunció. Hertz demando a Mis (por publicidad falsa basada en
la encuesta) ya la revista; al final las compañías llegaron aun acuerdo.
Además de los casos ya citados, se conocen mochos otros usos incorrectos de la
estadística; algunos de estos otros casos se encuentran en libros como el clásico de
Darrel Hutí, How to Lie with Statistics; el de Robert Reichard, The figure finaglers, y el
de Cynthia Crossen, Tainted Truth. Comprender tales prácticas resultará
extremadamente útil en la evaluación de los datos estadísticos que se encuentran en
situaciones cotidianas.
¿Debe creerse en un estudio estadístico?
En la segunda edición de libro Statistical Reasoning for Evreryday Life los autores Jeff
Bennet, William Briggs y Mario Triola enumeran las siguientes directrices para evaluar
de forma crítica un estudio estadístico:
1. Identifique la neta del estudio, la población considerada y el tipo de estudio.
2. Considere la fluente, particularmente respecto de la posibilidad de la existencia de
prejuicios.
3. Analice e método de obtención de muestras.
4. Busque problemas en la definición o medición de variables de interés.
5. Tenga cuidado con variables confusas que podrían invalidar las conclusiones.
6. Considere el escenario y la redacción de cualquier encuesta.
7. Verifique que las gráficas representen los datos con fidelidad y que las conclusiones
tengan justificación.
8. Considere si las conclusiones logran los objetivos del estudio, si tienen sentido y si
tienen un significado práctico.
Destrezas y conceptos básicos
En los ejercicios 1 a 4 utilice el pensamiento crítico para desarrollar una conclusión
alternativa.
1. Un estudio demostró que los conductores de camiones pesan más que los: adultos que
no manejan camiones. Conclusión: Los camiones causan que la gente gane peso.
2. Un estudio concluyó que los propietarios de casas tienden a vivir más tiempo que
quienes no habitan viviendas propias. Conclusión: Poseer una casa crea paz y armonía
internas que causan que las personas tengan mejor estado de salud y vivan más tiempo.
3. Un estudio mostró que en el condado de Orange se expidieron más multas por exceso
de velocidad a personas de grupos minoritarios que a los blancos. Conclusión: En el
condado de Orange las personas de grupos minoritarios conducen a mayor velocidad
que los blancos.
.4. En un estudio de síntomas del resfriado, se encontró que cada uno de os sujetos de
estudio con resfriado mejoró das semanas después de tomar píldoras de jengibre
Conclusión: las píldoras de jengibre curan el resfriado.
En los ejercicios 5 a 16, utilice el pensamiento crítico para señalar el tema principal
5. El New York Times publicó un artículo que incluyó esta afirmación: ‘Por fin, e
chocolate ocupa el lugar que merece en la pirámide de los alimentos, junto a sus vecinos
de clase alta, el vino tinto, las frutas, os vegetales y el té verde. Varios estudios
reportados en el Journal of Nutrition mostraron que. después de comer chocolate, los
sujetos a prueba incrementaron los niveles de antioxidantes en su sangre. El chocolate
contiene flavonoides, antioxidantes asociados con la disminución del riesgo de
enfermedades cardiacas y derrame cerebral. Mars Inc., la compañía de dulces, y la
Chocolate Manufacturers Association financiaron gran parte de la investigación”. ¿Qué
está equivocado en este estudio?
6. Después de realizado el último censo nacional, el Poughkeepsie Journal imprimió
este titular de primera página: “281,421,906 en Estados Unidos”. ¿Qué está mal en este
titular?
7. Cuando la autora Shere Hite escribió Woman and Love: A Cultural Reyolution in
Progress, basó sus conclusiones en 4500 respuestas recibidas después de enviar por
correo 100.000 cuestionarios a varios grupos de mujeres. ¿Es probable que sus
conclusiones sean válidas, en e) sentido de que puedan aplicarse ala población general
de todas las mujeres? ¿Por qué sí o por qué no?
8. En una encuesta de Nightime de la ABC, 186,000 televidentes paga ron 50 centavos
cada uno para llamar a un número telefónico “900” y dar su opinión acerca de mantener
la sede de las Naciones Unidas en Estados Unidos. Los resultados demostraron que el
67% de quienes llamaron estuvieron a favor de que las Naciones Unidas salieran de
Estados Unidos. Interprete los resultados identificando lo que concluiríamos acerca del
sentir de la población general, respecto de mantener la sede de las Naciones Unidas en
Estados Unidos.
9. La Harthird Insurance Company lo contrató a usted para encuestar a una muestra de
adultos acerca de sus compras de automóviles. ¿C error al considerar a las personas
cuyos números telefónicos a listad directorios como población de la cual se t Ir la ni
ucstra?
10. El Newport Chronicle afirma que los paraderos de auto San crímenes, porque un
estudio concluyó que las tasas de crimen son más ah ciudades con paraderos de autobús,
que en las zonas rurales que carecen ¿Cuál es el error en esta afirmación?
Descargar