Usos indebidos de la estadística Triolla, M. (2004) Probabilidad y Estadística. Capitulo I Novena edición. Pearson Education. México Extracto elaborado por: Gómez, A Pensamiento crítico El éxito en el curso introductorio de estadística por o regular requiere de más sentido común que destreza matemática (a pesar de la advertencia de Voltaire de que “el sentido común no es muy común”). Ya que ahora tenemos acceso a calculadoras y a computadoras, las aplicaciones modernas de la estadística ya no requieren que dominemos algoritmos complejos de operaciones matemáticas. En su lugar nos enfocamos en la interpretación de los datos los resultados. Esta sección está diseñada para ilustrar la forma en que se usa el sentido común cuando penamos de forma crítica acerca de los datos y la estadística. Hace cerca de un siglo, el estadista Benjamin Disraeli pronunció a famosa frase: “Hay tres clases de mentiras: mentiras, viles mentiras y estadísticas”. También se ha dicho que “las cifras no mienten; los mentirosos calculan las cifras”. El historiador Andrew Lang dijo que algunas personas utilizan la estadística ‘como un borracho utiliza los postes de alumbrado: como apoyo más que como iluminación”. El caricaturista político Don Wright nos anima diciendo ‘retome el misterio de la vida: mienta a un encuestador”. El autor Franklin P. iones escribió que “la estadística puede usarse para sustentar cualquier cosa, en especial a los estadísticos”. En el Esar’s Comic Dictionary encontramos la definición de que un estadístico es “un especia1ista que reúne pensamientos y luego los conduce al extravío. Estas afirmaciones se refieren a ejemplos donde los métodos estadísticos se utilizaron de forma errónea, de tal manera que resultaron engañosos en última instancia. Hay dos fuentes principales de tal engaño: 1. el intento malintencionado por parte de personas deshonestas, y 2. los errores de descuido cometidos por personas que no conocen nada mejor. Sin tener en cuenta la fuente, como ciudadanos responsables y como empleados profesionales valiosos, debemos tener una habilidad básica para distinguir entre conclusiones estadísticas que parecen ser válidas de las que son gravemente defectuosas. Para mantener esta sección en la perspectiva apropiada, hay que saber que éste no es un libro acerca de los malos usos de la estadística. El resto de este libro estará lleno de usos muy importantes de métodos estadísticos válidos. Aprenderemos métodos generales para usar datos muestrales y así poder hacer inferencias relevantes acerca de poblaciones; aprenderemos acerca de encuestas y tamaños de muestra, acerca de mediciones importantes de características fundamentales de los datos. Junto con las explicaciones de estos conceptos generales. veremos muchas aplicaciones específicas reales, tales como los efectos en el fumador pasivo, el predominio del alcohol y el tabaco en las películas de dibujos animados para niños y la calidad de productos de consumo, incluyendo dulces M&M, cereales. Coca Cola y Pepsi. Pero incluso en estas aplicaciones reales y con significado debemos ser cuidadosos para interpretar correctamente los resultados de métodos estadísticos válidos. Comenzamos nuestro desarrollo del pensamiento crítico considerando muestras erróneas, Estas muestras son erróneas en el sentido de que el método de muestreo arruina la muestra, de modo que tiene la posibilidad de estar sesgada (es decir, de no ser representativa de la población de la que se obtuvo). A continuación se presentan ejemplos de muestras de respuesta voluntaria que, por su naturaleza, adolecen de una carencia importante, pues no debemos obtener conclusiones sobre una población con base en una muestra sesgada como ésta: • Las encuestas manejadas a través de Internet en las que los sujetos deciden si responden o no. • Las encuestas por correo, donde los sujetos deciden si contestan. • Las encuestas telefónicas, en las que anuncios en el periódico, la radio, la televisión, le piden que tome un teléfono voluntariamente y llame a un número especia) para registrar su opinión. Con muestras de respuesta voluntaria como éstas, sólo es posible llegar a conclusiones á1idas acerca del grupo específico que decide participar; pero sería una práctica incorrecta común establecer conclusiones acerca de una población más grande. Desde un punto de vista estadístico, una ¡nuestra como ésta fui la en lo esencial y no debe utilizarse para realizar declaraciones generales acerca de una población mayor. Muestras pequeñas. Las conclusiones no deben basarse en muestras que son sumamente pequeñas. Por ejemplo, el Children’s Defense Fund publicó Child Out of Schoo! in America, donde se reportó que de los estudiantes de escuela secundaria suspendidos en una región, el 67% fueron suspendidos al menos tres veces. Pero esta cifra está basada en una muestra de sólo tres estudiantes Los reportes en los medios de comunicación fallaron al mencionar que el tamaño de la muestra era muy pequeño. (En los capítulos 6 y 7 veremos que en ocasiones es posible realizar algunas deducciones valiosas a partir de muestras pequeñas, aunque debemos ser cuidadosos y verificar que se satisfagan los requisitos necesarios). En ocasiones una muestra puede parecer relativamente grande (como en una encuesta de “2000 adultos estadounidenses seleccionados al azar”) pero si se obtienen conclusiones acerca de los subgrupos, por ejemplo, los republicanos de sexo masculino de 21 años de edad de Pocatello, tales conclusiones estarían basadas en muestras demasiado pequeñas. Si bien es importante tener una muestra que sea suficientemente grande, también lo es el hecho de tener datos muestrales que se recolecten de una forma adecuada, como la selección aleatoria. Aun las muestras grandes llegan a ser muestras erróneas. Gráficas Las gráficas -como las de barras y las circulares- en ocasiones sirven para exagerar o disfrazar la verdadera naturaleza de los datos. (En el capítulo 2 analizaremos una variedad de gráficas diferentes). Las dos gráficas en la figura 1-1 de la siguiente página representan los mismos datos del Bureau of Labor Statisties, aunque el inciso b) está diseñado para exagerar la diferencia entre los salarios semanales de hombres y mujeres. Al no iniciar el eje vertical en cero, la gráfica del inciso b) tiende a producir una impresión subjetiva engañosa, que hace que los lectores incorrectamente crean que la diferencia es mucho peor de lo que en realidad es. La figura 1-1 enseña una lección importante: para interpretar una gráfica de manera correcta, debernos analizar la información numérica dada en ella, para no engañarnos por su forma general. (El término mediana que se utiliza en la figura 1-1 se describirá con claridad en la sección 2-4). Figura 1-1 Salarios semanales de hombres y mujeres de 16 a 24 años Pictogramas Los dibujos de objetos llamados pictogramas, también pueden resultar engañosos. Algunos objetos que se usan comúnmente para representar datos incluyen objetos tridimensionales, como bolsas de dinero, pilas de monedas, tan que militares (para gastos militares), barriles (para producción petrolera) y casas (para construcción de viviendas). Al dibujar tales objetos los artistas 1legan a crear impresiones falsas que distorsionan las diferencias. Porcentajes A veces se utilizan porcentajes engañosos o poco claros. Si usted toma el 100% de alguna cantidad, está tomándolo todo. (No debería requerir de un 1l0% de esfuerzo para que la declaración anterior tenga sentido). En referencia a la pérdida de equipaje, la Continental Airlines publicó anuncios afirmando trata de “un área en la que ya hemos mejorado un 100% en los últimos seis meses”. En un editorial que criticaba ese dato estadístico, el diario The New York Times interpretó correctamente que la cifra de mejora en un 100% significa ya no se está perdiendo equipaje, logro que todavía no disfruta Continental Airlines Preguntas predispuestas Existen muchos aspectos que afectan las preguntas de una encuesta. Estas llegan a estar ‘cargadas” o redactadas intencionalmente de manera que propicien una respuesta deseada. Observe las calificaciones de respuesta “sí” reales para las diferentes redacciones en una pregunta: • 97% sí: “ el presidente utilizar su poder de veto para eliminar los desperdicios?”. • 57% sí: “ el presidente utilizar su poder de veto o no?” En The Superpollsters, David W. Moore describe un experimento donde se preguntó a diferentes sujetos si estaban de acuerdo con las siguientes declaraciones: • Se gasta muy poco dinero en subsidios del Estado. • Se gasta muy poco dinero en asistencia a los pobres. Aun cuando es el pobre quien recibe el subsidio del Estado, sólo el 19% estuvo de acuerdo cuando se usaron las palabras ‘subsidio del Estado”, aunque el 63% estuvo de acuerdo con “asistencia a los pobres”. Orden de las preguntas En ocasiones las preguntas de una encuesta se cargan de forma no intencional, en virtud de factores corno el orden de los reactivos que se someten a consideración. Observe estas preguntas de una encuesta aplicada en Alemania. • ¿Cree usted que el tránsito vehicular contribuye a la contaminación del aire más o menos que la industria? • ¿Cree usted que la industria contribuye a la contaminación del aire más o menos que el tránsito vehicular? Cuando se presentó primero el tránsito, el 45% culpó al tránsito y el 27% culpé a la industria: cuando la industria se presentó primero, el 24% culpé al tránsito y el 57% culpó a la industria. Rechazo Cuando se invita a las personas a contestar una encuesta algunas se niegan con firmeza a responder. La tasa de rechazo ha crecido en años recientes, en parte porque muchos vendedores persistentes de empresas de telemercadeo buscan vender bienes o servicios comenzando con una inducción de ventas que suena como si fuera parte de una encuesta de opinión. En Lies, Damn Lies, anil Statisties. el autor Michael Wheeler indica con acierto que “las personas que se niegan a hablar con los entrevistadores parecen ser diferentes de quienes no lo hacen. Algunas quizá tengan miedo a los extraños y otras sean celosas de su privacidad, pero su negativa a hablar demuestra que su visión del mundo circundante es marcadamente diferente de aquellas otras personas que permiten a los entrevistadores entrar a sus hogares”. Correlación y causalidad Usaremos el término correlación para indicar que las dos variables están relacionadas. Sin embargo, hacemos esta importante anotación la correlación no implica causalidad. Esto significa que cuando nosotros encontramos una asociación estadística entre dos variables, ‘o podernos concluir que una de las variables es la causa de la otra (o que la afecta directamente). Si encontramos una correlación entre la riqueza y el CI, no podemos concluir que el CI de un persona afecta directamente su riqueza, ni tampoco podemos concluir que la riqueza de a persona afecta directamente u puntuación de Cl. En los medios de Comunicación es bastante común reportar una correlación recién encontrada con una redacción que indica o implica directamente que una de las variables es causa de la otra. Estudios para el propio beneficio Algunas veces los estudios reciben el patrocinio de grupos c intereses específicos que buscan promover. Por ejemplo, Kiwi Erands, un fabricante de abrillantador de calzado, encargó un estudio que suscitó esta declaración impresa en algunos periódicos: “De acuerdo con una encuesta nacional realizada a 250 empleadores profesionales, a razón más común de! fracaso de un solicitante de trabajo del sexo masculino al dar una buena primera impresión, fue llevar los zapatos desaseados”. Debemos ser muy cautos con encuestas como éstas, cuyos resultados generan ganancias económicas para el patrocinador. En los últimos años ha generado preocupación creciente la práctica de las compañías farmacéuticas de financiar a doctores que realizan experimentos clínicos y reportan sus resultados en revistas de prestigio, como Journal of American Medical Association. Números precisos En la actualidad existen 103,215,027 hogares en Estados Unidos.” Puesto que esta cantidad es muy precisa, mucha gente considera erróneamente que también es exacta. En este caso, ese número es un estimado y sería mejor decir que el número de hogares es de alrededor de 103 millones. Imágenes parciales “El 90% de todos nuestros automóviles vendidos en este país en los últimos 10 años, continúa circulando”. Millones de consumidores escucharon ese anuncio con y no se dieron cuenta de que el 90% de los automóviles que el anunciante vendió en este país se vendieron durante los últimos tres años, de modo que la mayoría de esos automóviles que circulaban estaban casi nuevos. La afirmación era técnicamente correcta, aunque muy engañoza al no presentar los resultados completos. Distorsiones deliberadas En el libro Tainted Truth, Cynthia Crossen cita un ejemplo de la revista Corporare Travel que publicó resultados que mostraban que, entre las compañías de renta de automóviles, Avis fue la ganadora en una encuesta realizada a personas que utilizan ese servicio. Cuando Hertz solicitó información detallada acerca de la encuesta, las respuestas originales de ésta desaparecieron y el coordinador de encuestas de la revista renunció. Hertz demando a Mis (por publicidad falsa basada en la encuesta) ya la revista; al final las compañías llegaron aun acuerdo. Además de los casos ya citados, se conocen mochos otros usos incorrectos de la estadística; algunos de estos otros casos se encuentran en libros como el clásico de Darrel Hutí, How to Lie with Statistics; el de Robert Reichard, The figure finaglers, y el de Cynthia Crossen, Tainted Truth. Comprender tales prácticas resultará extremadamente útil en la evaluación de los datos estadísticos que se encuentran en situaciones cotidianas. ¿Debe creerse en un estudio estadístico? En la segunda edición de libro Statistical Reasoning for Evreryday Life los autores Jeff Bennet, William Briggs y Mario Triola enumeran las siguientes directrices para evaluar de forma crítica un estudio estadístico: 1. Identifique la neta del estudio, la población considerada y el tipo de estudio. 2. Considere la fluente, particularmente respecto de la posibilidad de la existencia de prejuicios. 3. Analice e método de obtención de muestras. 4. Busque problemas en la definición o medición de variables de interés. 5. Tenga cuidado con variables confusas que podrían invalidar las conclusiones. 6. Considere el escenario y la redacción de cualquier encuesta. 7. Verifique que las gráficas representen los datos con fidelidad y que las conclusiones tengan justificación. 8. Considere si las conclusiones logran los objetivos del estudio, si tienen sentido y si tienen un significado práctico. Destrezas y conceptos básicos En los ejercicios 1 a 4 utilice el pensamiento crítico para desarrollar una conclusión alternativa. 1. Un estudio demostró que los conductores de camiones pesan más que los: adultos que no manejan camiones. Conclusión: Los camiones causan que la gente gane peso. 2. Un estudio concluyó que los propietarios de casas tienden a vivir más tiempo que quienes no habitan viviendas propias. Conclusión: Poseer una casa crea paz y armonía internas que causan que las personas tengan mejor estado de salud y vivan más tiempo. 3. Un estudio mostró que en el condado de Orange se expidieron más multas por exceso de velocidad a personas de grupos minoritarios que a los blancos. Conclusión: En el condado de Orange las personas de grupos minoritarios conducen a mayor velocidad que los blancos. .4. En un estudio de síntomas del resfriado, se encontró que cada uno de os sujetos de estudio con resfriado mejoró das semanas después de tomar píldoras de jengibre Conclusión: las píldoras de jengibre curan el resfriado. En los ejercicios 5 a 16, utilice el pensamiento crítico para señalar el tema principal 5. El New York Times publicó un artículo que incluyó esta afirmación: ‘Por fin, e chocolate ocupa el lugar que merece en la pirámide de los alimentos, junto a sus vecinos de clase alta, el vino tinto, las frutas, os vegetales y el té verde. Varios estudios reportados en el Journal of Nutrition mostraron que. después de comer chocolate, los sujetos a prueba incrementaron los niveles de antioxidantes en su sangre. El chocolate contiene flavonoides, antioxidantes asociados con la disminución del riesgo de enfermedades cardiacas y derrame cerebral. Mars Inc., la compañía de dulces, y la Chocolate Manufacturers Association financiaron gran parte de la investigación”. ¿Qué está equivocado en este estudio? 6. Después de realizado el último censo nacional, el Poughkeepsie Journal imprimió este titular de primera página: “281,421,906 en Estados Unidos”. ¿Qué está mal en este titular? 7. Cuando la autora Shere Hite escribió Woman and Love: A Cultural Reyolution in Progress, basó sus conclusiones en 4500 respuestas recibidas después de enviar por correo 100.000 cuestionarios a varios grupos de mujeres. ¿Es probable que sus conclusiones sean válidas, en e) sentido de que puedan aplicarse ala población general de todas las mujeres? ¿Por qué sí o por qué no? 8. En una encuesta de Nightime de la ABC, 186,000 televidentes paga ron 50 centavos cada uno para llamar a un número telefónico “900” y dar su opinión acerca de mantener la sede de las Naciones Unidas en Estados Unidos. Los resultados demostraron que el 67% de quienes llamaron estuvieron a favor de que las Naciones Unidas salieran de Estados Unidos. Interprete los resultados identificando lo que concluiríamos acerca del sentir de la población general, respecto de mantener la sede de las Naciones Unidas en Estados Unidos. 9. La Harthird Insurance Company lo contrató a usted para encuestar a una muestra de adultos acerca de sus compras de automóviles. ¿C error al considerar a las personas cuyos números telefónicos a listad directorios como población de la cual se t Ir la ni ucstra? 10. El Newport Chronicle afirma que los paraderos de auto San crímenes, porque un estudio concluyó que las tasas de crimen son más ah ciudades con paraderos de autobús, que en las zonas rurales que carecen ¿Cuál es el error en esta afirmación?