UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONÓMICAS Nombre: Mauricio Pesantes Como Mentir con estadísticas Introducción En este corto ensayo hablaremos sobre las situaciones y ejemplos de la vida cotidiana que ponen los autores del libro Darell Huff y Irvis Geis, este libro consta de 10 capítulos. Los nueve primeros abordan, cada uno, una técnica diferente de manipulación de los estadísticos, mientras que el último es una breve guía para intentar distinguir, en tres pasos, qué estadísticos son realmente informativos y cuales han sufrido este tipo de manipulación Las diferentes técnicas utilizadas periódicamente por empresas hacen que la aplicación de la estadística es muy importe ya que impacta directamente en la forma en que la interpretamos, en este contexto hablaremos sobre las muchas veces que creemos lo que alguien nos quiere vender asándose en razones estadísticas, Desarrollo El primer capítulo llamado” La Muestra que Presenta un Factor de Influencia en sí misma “trata sobre las muestras de estudios, investigaciones y publicaciones, en sí habla sobre de la importancia sobre el valor que tiene el correcto muestreo para la estadística, pues en este capítulo menciona ejemplos en los cuales se manipula la muestra y por ellos la necesidad de elaborarla correctamente. Se comenta que la muestra básica debe ser “aleatoria “y partiendo de una “población” para aplicarla, así evitando que las muestras sean pequeñas, esto quiere decir que se aplique a varias personas y que su resultado pueda ser considerado como general y específicamente valido en la matriz de estudio debido a que las muestras deben ser representativas de la información que se pretende obtener el resultado concreto. El segundo capítulo llamado “El Promedio bien escogido” el autor habla sobre el promedio ya que se pueden calcular diferentes en un mismo estudio lo cual hace que el promedio solo, por sí mismo, pierda sentido ya que el cálculo puede estar contaminado o prejuiciado hacia el interés del investigador, o de quien paga el estudio. Esta técnica es tan simple pues se puede utilizar distintos tipos de promedio (media, mediana o moda) según nos interese ofrecer un resultado u otro Huff nos pone distintos ejemplos como los estudios del promedio de la estatura de los norteamericanos o de salarios en una compañía donde el reporte aislado del promedio puede dar impresiones falsas sobre la distribución de los sujetos, reconoce que: El promedio como una medida útil, importante, cómoda y de frecuente uso, indica que puede no ser suficiente o precisa para entender las diferencias o la dispersión real de los sujetos de la muestra. (Huff y Geis pp 23) Concluye el autor que cuando se dice que algo es el promedio no se debe saltar a conclusiones si no tenemos información adicional como la que ofrecen la mediana y la moda. El capítulo llamado “Las Pequeñas cifras que no aparecen “habla sobre los niveles de significancia y la forma en que se interpretan las gráficas publicadas. Los niveles de significancia, expresados en probabilidad, también son omitidos frecuentemente en los reportes, lo que también afecta la interpretación. En este capítulo se trata de omitir algún dato numérico clave, alguna pequeña cifra para que los resultados sean visualmente impresionantes al no tener esa referencia. Por ejemplo, utilizar un grupo muestral muy pequeño para conseguir por azar un resultado favorable en alguna de las repeticiones de un experimento Huff nos dice: Depende de cuán grande y variada es la población que va a ser estudiada. La muestra debe adaptarse a las condiciones de tamaño y diversidad de la población para ser realmente representativa. Un buen reporte de resultados debe incluir información sobre los niveles de significancia de estos. Debemos tener cuidado con lo que se reporta como “normativo” (el promedio como norma) pues no incluye, muchas veces, los parámetros y/o promedios reales de la población estudiada En todo el caso, el punto determinante de este engaño se encuentra en la omisión de datos clave, sin los cuales no podemos confiar en la relevancia de estos estadísticos En el cuarto capitulo llamado “Mucho ruido y pocas nueces” habla sobre el error probable o el error estándar. el error estadístico establecido en la prueba faltando así a la precisión y confiabilidad de estos. El error estándar, según Huff, no debe nunca ser ignorado, pues indica La práctica intencional repetida es no publicar los datos cuando los estudios no arrojan resultados favorecedores, o repetir los mismos hasta que los resultados son satisfactorios (como se está haciendo actualmente con el EXADEP y sus repetidas administraciones en PR). Este capítulo concluye que el error estándar es tan importante como los resultados encontrados pues nos ayuda a precisar mejor los resultados incluyendo y/o absorbiendo los errores. La técnica consiste en exagerar desmesuradamente diferencias matemáticas que son reales y probables numéricamente, pero que no representan ninguna diferencia palpable en la realidad. En los capítulos 5 y 6 llamado “El grafico exclamativo y El personaje de la gráfica “los autores no hablan sobre las imágenes, gráficas y tablas son necesarias para demostrar los resultados estadísticos estas técnica, aplicadas a la representación gráfica de datos en forma de tabla, es de carácter puramente visual. Consiste en jugar con la forma de representación para exagerar los datos reales y que las diferencias parezcan mucho más significativas. También pueden ser usadas engañosamente para expresar solo lo que conviene, resultando en una práctica equivocada, y manipulativa de los resultados. Por ejemplo, Un aumento salarial en los empleados de una fábrica “X” puede ser de 800$ a 805$ de un año al siguiente. En la práctica, el aumento no es en absoluto significativo. Sin embargo, si en la gráfica aumentamos sensiblemente la altura de cada uno de los segmentos del eje de abcisas, la inclinación visual (que no real) será mucho mayor, por lo que producirá mayor impacto. En esta técnica podemos notar que no se requiere en absoluto de conocimientos matemáticos, sino simplemente de habilidad para jugar con la impresión visual En el capítulo 7 y 8 llamados “La cifra indirectamente relacionada y el Post Hoc aparece de nuevo” los autores nos hablan la estadística de la correlación cuando se asume con presunción de causalidad. Esto es, dos variables pueden mostrar relación estadística pero no por esto debemos saltar a conclusiones de causalidad. Dos ejemplos que trae en su libro son: decir que hay más accidentes en climas claros que en brumosos (p.79), ya que aunque las estadísticas muestran más accidentes en el primero, la realidad es que también hay muchos más días claros que brumosos en un año. En un segundo ejemplo nos dice: más personas han muerto en accidentes de aviones ahora que en el 1910 (p.79); Los autores nos indican que las falacias de este tipo a causa de errores no explicados en los resultados: (1) que la relación entre dos factores sea por puro accidente (“chance”, p. 89); (2) que de haberla no se puede identificar cual es la causa y cuál es el efecto; (3) que puede evidenciarse una correlación, pero sin que realmente haya relación entre esas variables del estudio (p.90); (4) que la correlación se asume más allá de los resultados que provee la data (p. 91); (5) advirtiendo que debemos asumir una correlación como falsa cuando no se desprende de los resultados, o cuando el autor de la investigación la sobre enfatiza más allá de lo que proveen los datos. Capitulo 9 y 10 Los autores en estos capítulos hablan sobre el método de manipulación estadística, sino que pretende enseñar brevemente al lector cómo enfrentarse con este tipo de técnicas a través de cinco sencillas preguntas: Quién lo dice, cómo lo sabe, qué falta, si dio alguien cierto giro a la información y si tiene sentido lo que se dice. Conclusiones Hay demasiada manipulación de cifras con el tema de las estadísticas, a veces se hace por simple ignorancia de las matemáticas más elementales y otras no pocas veces la intención es precisamente la de convencer de una situación que no es real. Para dar buena imagen se da una cifra suelta y se la vende como lo mejor o como lo más Nada más alejado de la verdad ya que hay que conocer varios parámetros para poder juzgar con precisión. La estadística bien usada nos da herramientas de análisis, nos permite saber dónde estamos parados. Pero si está mal usada, o es usada con expresa intención de engañar, la situación cambia radicalmente: se vuelve una importante herramienta de manipulación.