UNIVERSIDAD AUTÓNOMA DE YUCATÁN FACULTAD DE MATEMÁTICAS UNA PROPUESTA DIDÁCTICA SOBRE LA MEDIA ARITMÉTICA, LA MEDIANA Y SU REPRESENTATIVIDAD Elaborado por: Carlos Mariel Chan Ramayo Asesor: M. en C. Landy Elena Sosa Moguel Examen profesional para obtener el grado de: Licenciado en Enseñanza de las Matemáticas Modalidad: Tesis individual Mérida, Yucatán, México Junio de 2009 En memoria de mi padre Julio Cesar Chan Tun que en paz descanse A mi madre Mayra Margarita, siempre estaré a tu lado A mi novia Lourdes Jacqueline, quien está a mi lado i AGRADECIMIENTOS Quiero agradecer a la Universidad Autónoma de Yucatán y al Departamento de Investigación y Posgrado de la misma universidad, por haberme concebido como becario y depositar en mí la confianza para la realización de este trabajo de investigación y poder llegar al grado de ser un Licenciado en Enseñanza de las Matemáticas mediante la modalidad de tesis. La Facultad de Matemáticas ha sido mi segundo hogar durante cuatro años, años que fueron muy productivos y de los cuales no me arrepiento. Me brindó un espacio de enseñanzaaprendizaje, sus instalaciones, una comodidad, me ayudó a salir adelante dándome la oportunidad de representarlo nacional e internacionalmente. Agradezco al Dr. Luis Rodríguez y a la M. en C. Lucy Torres, por ser directores de la facultad. El Departamento de Matemática Educativa se esfuerza en realizar día a día la formación de los futuros docentes de matemáticas, llevan consigo una preocupación y entrega para lograr que la educación en nuestro estado sea de mejor calidad, Maestro Eddy, Maestra Landy, Martha y Lupita, que sus enseñanzas perduren por siempre y que no se queden en un simple recuerdo. Agradezco a la M. en C. Landy Sosa, por haberme brindado la oportunidad de ser mi directora de tesis, su conocimiento y amistad. Gracias a ti estoy aquí, presentando mi tesis como producto de mis cuatro años de carrera profesional. A mis compañeros de clase: Astrid, Rubén, Azucena, Luis, Lilia, Erik, Marisol, Jafet, Diana y Cecilia. Lo logramos y no nos queda más que seguir adelante. Agradezco a todas aquellas personas que contribuyeron directa o indirectamente con sus consejos, pláticas, buenos momentos y razonamientos lógicos que simplemente me hicieron pensar. ii AGRADECIMIENTOS A mis padres, por haberme traído al mundo y concederme la oportunidad de vivir… A Dios por no haberme arrebatado a mi padre en el momento más importante de mi vida personal y profesional… A mis primos Emmanuel, Ricardo y Fernando, que solo fregar gente saben hacer… Y a ti Jacquie, quien formas una parte muy importante de mi vida, por tu amor, cariño, tiempo paciencia, apoyos y consejos, te amo… ¡GRACIAS! iii ÍNIDICE PÁGINA 1 INTRODUCCIÓN CAPÍTULO I 5 DIDÁCTICA DE LA ESTADÍSTICA 1.1. LAS INVESTIGACIONES SOBRE DIDÁCTICA DE LA 5 ESTADÍSTICA EN EUROPA Y AMÉRICA, SUS INICIOS Y AVANCES 1.1.1. INVESTIGACIONES SOBRE DIDÁCTICA DE LA 7 1.1.1.1. Investigaciones acerca de la didáctica de la 7 ESTADÍSTICA EN EUROPA probabilidad 1.1.1.2. Investigaciones acerca de la didáctica de la 14 estadística 1.1.2. INVESTIGACIONES SOBRE DIDÁCTICA DE LA 17 ESTADÍSTICA EN AMÉRICA 1.1.3. LA EDUCACIÓN ESTADÍSTICA EN MÉXICO 21 1.1.3.1. La educación estadística en el nivel básico 21 1.1.3.2. La educación estadística en el nivel medio 25 CAPÍTULO II PROBLEMA DE INVESTIGACIÓN 31 2.1. PROBLEMA DE INVESTIGACIÓN 32 2.2. OBJETIVO DE TRABAJO 38 2.3. JUSTIFICACIÓN 39 iii CAPÍTULO III SITUACIONES DIDÁCTICAS Y LA INGENIERÍA DIDÁCTICA 43 3.1. SITUACIONES DIDÁCTICAS Y A-DIDÁCTICAS 44 3.2. METODOLOGÍA DE INVESTIGACIÓN: INGENIERÍA 49 DISEÑO DE LAS SITUACIONES DIDÁCTICAS SOBRE LA 54 DIDÁCTICA CAPÍTULO IV MEDIA ARITMÉTICA Y LA MEDIANA 4.1. ANÁLISIS EPISTEMOLÓGICO 4.1.1. Acerca de la media aritmética y el tratamiento de la 54 55 información en la antigüedad 4.2. ANÁLISIS COGNITIVO 4.2.1. Dificultades y errores en el estudio de la media aritmética y 57 58 mediana 4.3. ANÁLISIS DIDÁCTICO 4.3.1. Tratamiento de la media aritmética y mediana en los libros 64 64 de texto 4.3.1.1. Libros con contenidos estadísticos del nivel 64 básico: Secundaria 4.3.1.2. Libros de estadística del nivel medio 73 iv CAPÍTULO V UNA SITUACIÓN DIDÁCTICA SOBRE LA MEDIA 93 ARITMÉTICA, LA MEDIANA Y SU REPRESENTATIVIDAD 5.1. ANÁLISIS DE LAS SITUACIÓNES DIDÁCTICAS 94 5.1.1. Actividad 1 96 5.1.2. Actividad 2 105 5.1.3. Actividad 3 111 5.1.4. Actividad 4 115 5.1.5. Actividad 5 116 5.1.6. Actividad 6 119 CAPITULO VI REFLEXIONES Y CONSIDERACIONES 124 6.1. REFLEXIÓN SOBRE LA SITUACIÓN ESCOLAR DE LA 124 ESTADÍSTICA 6.2. CONSIDERACIONES DIDÁCTICAS PARA EL TRATAMIENTO 125 DE CONCEPTOS ESTADÍSTICOS BIBLIOGRAFÍA 127 v LISTA DE FIGURAS CAPÍTULO PÁGINA I 9 IV 55 IV 57 IV 66 Figura 5. Registro del crecimiento de las estalactitas por año IV 67 Figura 6. Perfil de crecimiento de las estalactitas IV 67 Figura 7. Diagrama de caja y brazos del tiempo que tarda un IV 68 Figura 8. Distribución de puntajes de un examen por grupos IV 68 Figura 9. Precipitación pluvial media entre dos entidades IV 69 Figura 10. Gráfica de la distancia de salto alcanzada por dos IV 70 IV 71 IV 72 Figura 13. Gráfica del número de televidentes por edad IV 77 Figura 14. Histogramas de frecuencia y frecuencia relativa IV 80 Figura 1. El experimento de la bandeja Figura 2. Registro del movimiento de los astros realizada por los astrónomos babilonios Figura 3. Gráfico del promedio de vida de una persona de cierta edad Figura 4. Gráfica del costo de servicio telefónico de dos compañías medicamento en hacer efecto grupos de estudiantes Figura 11. Gráfica de la compra de discos compactos por grupos de edad Figura 12. Gráficas de los promedios de precipitación y temperatura en Monterrey por mes de calificaciones finales de matemáticas de un grupo de quinto grado de primaria vi Figura 15. Polígono de frecuencias relativas porcentuales de IV 80 Figura 16. Polígono de frecuencias acumuladas de la tabla 2 IV 82 Figura 17. Gráfica del porcentaje de aprobación de materias IV 83 IV 86 Gráfica 1. Cantidad de días soleados por mes en el año 2008 V 101 Gráfico 2. Cantidad de días nublados o lluviosos por mes en V 102 V 104 V 108 V 108 V 109 V 113 V 114 V 121 las calificaciones finales de un grupo de quinto grado de primaria de un grupo de alumnos de preparatoria Figura 18. Gráfica del tiempo en minutos empleados por un alumno para contestar diferentes pruebas psicométricas el año 2008 Figura 19. Datos del clima de la ciudad de Mérida en el 2008 Figura 20. Comparación de la cantidad original de días con la cantidad promedio Gráfica 3. Dispersión entre los datos y su valor representativo Gráfica 4. Dispersión entre los datos y su valor representativo Gráfica 5. Dispersión entre los datos y el primer valor representativo obtenido Figura 21. Datos de la cantidad de días nublados y lluviosos, con menor dispersión que los originales Gráfica 6. Cantidad de días soleados vii Gráfica 7. Cantidad de días nublados o lluviosos V 121 Figura 22. Tablas y gráficas del período 2001-2009 V 123 V 123 incompleto Figura 23. Tablas y gráficas del período 2001-2009 completo viii LISTAS DE TABLAS CAPÍTULO PÁGINA IV 79 IV 81 Tabla 3. Número de hijos de las 250 familias encuestadas IV 83 Tabla 4. Frecuencia de calificaciones de un grupo de quinto IV 88 IV 88 IV 89 IV 90 Tabla 8. Número de hijos de las 250 familias encuestadas IV 91 Tabla 9. Resumen del salario percibido por los empleados IV 91 Tabla 10. Cantidad de días soleados por mes en el año 2008 V 100 Tabla 11. Cantidad de días nublados o lluviosos por mes en V 101 Tabla 12. Cantidad media de días soleados por mes V 103 Tabla 13. Cantidad media de días nublados o lluviosos por V 103 Tabla 1. Frecuencia y frecuencia relativa de calificaciones finales de matemáticas de un grupo de quinto grado de primaria Tabla 2. Frecuencia acumulada de las calificaciones finales de matemáticas de un grupo de quinto grado de primaria grado de primaria Tabla 5. Frecuencia acumulada de calificaciones de un grupo de quinto grado de primaria Tabla 6. Frecuencia de calificaciones de un grupo de quinto grado de primaria Tabla 7. Frecuencia acumulada de calificaciones de un grupo de quinto grado de primaria de un centro comercial el año 2008 mes ix Tabla 14. Dispersión entre la cantidad de días soleados y su V 107 V 108 Tabla 16. Nueva cantidad de días nublados o lluviosos V 113 Tabla 17. Valores representativos de la cantidad de días V 118 V 119 V 122 valor representativo Tabla 15. Dispersión entre la cantidad de días soleados y su valor representativo soleados y nublados y lluviosos período 2000-2008 Tabla 18. Valores representativos de la cantidad de días soleados y nublados o lluviosos período 2000-2009 Tabla 19. Valores representativos hipotéticos de la cantidad de días soleados o nublados o lluviosos en el periodo 20012010 x INTRODUCCIÓN La estadística proporciona métodos y técnicas de análisis de una o más colecciones de datos de fenómenos, con la característica de ser aleatorios, para ofrecer información de carácter predictivo o informativo. Una manera común de presentar un conjunto de datos de manera condensada es mediante el uso de gráficos, los cuales pueden ser de diversos tipos, algunos más complejos que otros, siempre con un mismo fin: presentar y enviar información a todas las sociedades particulares o generales, las cuales deben de interpretarla para predecir o tomar decisiones ante situaciones de incertidumbre. Existe una relación muy fuerte entre lo que es el desarrollo de un país y el grado en que su sistema de registro y manejo de información produce estadísticas completas y fiables, ya que esta información es necesaria para la toma de decisiones de tipo económico, social y político. Esto conlleva a que la educación estadística no sólo sea de especialistas o técnicos en ésta área, sino también de los profesionales y ciudadanos que requieren interpretar tablas y análisis estadísticos, sobre información acerca de la población, las finanzas, educación, producción, etc. de un país. Lo anterior, demanda una sólida formación escolar en estadística. La estadística se ha ido incorporando a los programas de estudio, de manera generalizada dentro de los currículos escolares de primaria, secundaria, preparatoria, carreras universitarias y de posgrado en México, así como en otros países, pero la asimilación y comprensión de las nociones y métodos estadísticos, es una problemática aún por resolver en los sistemas de educación. Se espera en el nivel medio educativo, formar al alumno en el manejo de datos y del cálculo de las probabilidades, para comprender los fenómenos que existen en diversos ámbitos profesionales como la economía, la administración, etc., así como permitir la continuidad hacia una formación profesional o ingreso al campo laboral; en ambos casos con habilidades en el manejo de información. Entre los propósitos de la educación matemática de bachillerato 1 se especifica que el estudiante no puede limitarse a un aprendizaje enciclopédico por lo que debe desarrollar habilidades de pensamiento, de comunicación, una metodología, tener calidad, valores, una educación ambiental y la democracia y derechos humanos, es decir, competencias logrando crear así estructuras de pensamiento y acción, esenciales para la formación integral del estudiante (Dirección General de Bachillerato, 2006). Décadas atrás, pocos investigadores del ámbito educativo, se interesaban en los problemas de enseñanza y aprendizaje de la estadística, pero en la actualidad se puede apreciar un aumento notable de publicaciones, diseños curriculares e investigaciones relacionados con este tema, enfocándose ya no solo en la metodología de enseñanza, sino en qué estudiar en estadística y en intentar dar explicaciones sobre la construcción de las nociones y procedimientos estadísticos en situación escolar. Es así como se han detectado y reportado algunas dificultades y errores que presentan los estudiantes de secundaria y bachillerato, durante el tratamiento de conceptos estadísticos como la media aritmética, la mediana y sobre su propiedad de representatividad. Se sabe, que los estudiantes de bachillerato presentan dificultades durante el aprendizaje de los conceptos estadísticos, en particular aquellos ligados a la media aritmética y mediana, tales como: aplicar inversamente el algoritmo para calcular la media y mediana en un conjunto de datos, dar un resumen cuando los datos son proporcionados mediante gráficos, elegir la medida de tendencia central más adecuada en una situación determinada generar argumentos para la toma de decisiones, entre otras. Por tanto, la realización de propuestas didácticas acerca de las medidas de posición central, en particular, y de los conceptos y procesos estadísticos, en general, será un paso para coadyuvar el fortalecimiento de la educación estadística. El objetivo de la investigación es elaborar una propuesta didáctica sobre la media aritmética y la mediana, mediante el uso de gráficas, para generar entendimiento con respecto a su propiedad de representatividad. A fin de dar un panorama de la investigación en didáctica de la estadística, que proporcione referentes teóricos para el desarrollo de este trabajo y posteriores, en el capítulo uno se exponen algunos resultados sobre la didáctica de la probabilidad y de la estadística en el 2 continente europeo, seguido de los reportados por especialistas en el continente americano. Este capítulo concluye, con los fines de la educación estadística en los niveles distintos niveles educativos en México, con la intención de identificar los objetivos del estudio de la estadística en el currículo matemático de nivel medio. En el capítulo dos, se presenta el problema de investigación de este trabajo, que centra la atención en la propiedad de representatividad de los conceptos estadísticos: media aritmética y mediana. En el capítulo tres, se presentan los aspectos sobre el marco teórico para la elaboración de del trabajo, enmarcado en la Teoría de las Situaciones Didácticas. De modo que, la propuesta didáctica se encuentra conformada de situaciones de acción, formulación, validación que el estudiante debe de resolver, así como de institucionalización. Así mismo, presentamos la metodología que se siguió en el diseño de la propuesta, la cual se basa en la Ingeniería Didáctica. Dicha metodología, conlleva realizar un análisis preliminar de los conceptos a investigar, la elaboración de la secuencia didáctica, su implementación y, por último, la validación de los resultados obtenidos después de su aplicación. En el capítulo cuatro, se describe la primera fase seguida en el diseño de la propuesta didáctica, la cual consiste en una serie de análisis de carácter epistemológico, didáctico y cognitivo de los conceptos media aritmética y mediana. Los análisis se enfocaron en identificar aquellas prácticas que formaron parte de la génesis, evolución e institucionalización de dichos conceptos; la forma en que son introducidos y presentados en el currículo escolar, los libros de texto y el profesor; y por último, los efectos que las metodologías de enseñanza tienen sobre el aprendizaje los estudiantes. Esto, nos permitió definir las variables y factores inmersos en la propuesta didáctica. En el capítulo cinco, se presenta el análisis a priori, el propósito y la descripción de cada una las actividades didácticas que conforman la propuesta, en las que se considera el uso de gráficas y un software para el manejo de información. 3 En el capítulo seis, finalizamos con algunas reflexiones sobre la educación estadística, así como consideraciones y sugerencias para la enseñanza y aprendizaje de conceptos estadísticos, particularmente, sobre la media aritmética y la mediana. 4 CAPÍTULO I. DIDÁCTICA DE LA ESTADÍSTICA 1.1. LAS INVESTIGACIONES SOBRE DIDÁCTICA DE LA ESTADÍSTICA EN EUROPA Y AMÉRICA, SUS INICIOS Y AVANCES Introducción Presentamos en este capítulo los inicios de la investigación en didáctica de la estadística en el continente europeo bajo la influencia de la psicología cognitiva, así como los trabajos realizados por investigadores del área de América, los cuales proporcionan un referente teórico sobre estudios ligados la construcción del conocimiento estadístico por parte del estudiante. Se presentan en tres periodos: investigaciones de Fischbein y Piaget en los años cincuentas, de Kahneman y Tversky en los setentas y, en la actualidad, las desarrolladas por Batanero, Godino, Garfield, entre otros. Siempre que se sugiere introducir un nuevo tema en el currículo, es conveniente considerar el desarrollo cognitivo de los alumnos, para mirar la viabilidad de que sean capaces de aprehender ciertos saberes. Se sabe que los niños son como “esponjas”, es decir, absorben todos los resultados de sus experiencias con el mundo real, es por ello que no solamente aprenden en la escuela, sino también fuera de ella, en la sociedad, con la familia, amigos, etc., interactuando con todo a su alrededor. Para entender cómo aprenden las personas conceptos de la Probabilidad y de la Estadística, es importante realizar un análisis del razonamiento de los niños, puesto que desde un principio se comienza a trabajar con ideas muy abstractas, las cuales no siempre se van a poder ligar con la 5 experiencia de objetos concretos de la realidad, como suele suceder si se trabaja con conceptos geométricos o numéricos. Sucede que los niños desde temprana edad aprenden a estimar, discriminar y diferenciar entre formas, distancias y cantidades, creadas por experiencias dadas dentro y fuera de la escuela. También, las operaciones básicas pueden llegar a ser concretizadas en objetos físicos como juntar, quitar, separar, junto con su propiedad de ser reversibles (Batanero, 2001), es decir, al deshacer las operaciones ellos pueden obtener el objeto primario. Con lo aleatorio no sucede lo mismo, porque no pueden ser controlados los fenómenos para obtener un caso específico y mucho menos revertirlo, por ejemplo, una moneda cuya cara de arriba es sol y al lanzarla cae águila, nada me garantiza que al realizar otro lanzamiento para revertir el fenómeno, ocurra que caiga sol. Esta falta de reversibilidad de los experimentos aleatorios, sin duda, influyen en el desarrollo más tardío de las nociones de probabilidad (Batanero, 2001). Con respecto a la Estadística, Batanero (2001) afirma que son prácticamente inexistentes los estudios sobre el desarrollo evolutivo de los conceptos y, los pocos existentes, se centran en la instrucción. De hecho, no solamente en Europa sucede esto, sino también en los demás continentes del mundo, pero con el pasar de los años las investigaciones en didáctica de la estadística han ido creciendo y abarcando una gran variedad de tópicos que proporcionan directrices para su enseñanza en la escuela, así como resultados sobre las dificultades y errores que los alumnos manifiestan en su aprendizaje. A continuación daremos una breve presentación de las investigaciones desarrolladas sobre estocástica (término europeo que refiere a la probabilidad y estadística1), teniendo como punto de partida las realizadas en probabilidad, proporcionando un panorama general de la evolución que ha tenido y del estado en el que actualmente se encuentra. 1 Tomado del libro Investigación en probabilidad y estadística. Reflexiones y orientaciones. Traducido por Sánchez, E. 6 1.1.1. Investigaciones sobre didáctica de la estadística en Europa 1.1.1.1. Investigaciones acerca de la didáctica de la probabilidad Las primeras investigaciones de estocástica que se realizaron en Europa fueron de carácter psicológico sobre Probabilidad y se centraron en el desarrollo cognitivo de los niños (Piaget e Inhelder, 1975; Fischbein, 1975, citados por Batanero 2001). Piaget se enfocó en dar criterios para determinar en qué nivel de desarrollo intelectual se encuentra el niño en diversas edades y analiza la comprensión formal de los conceptos. Postula que la experiencia, la actividad y el conocimiento previo son las bases que determinan el aprendizaje, es por ello que el conocimiento es construido activamente por el sujeto y no recibido pasivamente del entorno, dándose así la adaptación del niño al mundo que lo rodea. Entonces, cuando una idea nueva se le presenta, se crea un “conflicto cognitivo” o “desequilibrio”, como una especie de “lucha” que se crea en la mente entre los conocimientos ya existentes y entre los nuevos que está adquiriendo. Pero, ¿cómo reaccionar ante este desequilibrio? Para esto se requiere un proceso de “equilibración” que consiste en los procesos de asimilación y acomodación, donde la asimilación es la incorporación o aceptación por parte del sujeto de los datos nuevos y la acomodación es el cambio o reestructuración de los ya existentes, es decir, el aprendizaje se concibe como un proceso que progresa lentamente con puntos conflictivos que el alumno debe superar mediante el proceso descrito. Conocer es un proceso de adaptación que organiza el propio mundo de la experiencia. Fischbein, por su parte, se preocupó por demostrar que los niños tienen ideas correctas, parcialmente formadas, sobre los conceptos probabilísticos y analizó el efecto de la instrucción para la mejora de estas intuiciones, concibiendo con gran importancia a la intuición como componente de la inteligencia. Para Fischbein las intuiciones son procesos cognitivos que intervienen directamente en las acciones prácticas o mentales, y tienen las siguientes características: inmediatez, por surgir de forma espontánea y no darse mediante la reflexión; globalidad, por ser un todo y no estar descompuesto en partes; capacidad extrapolatoria, al ir más allá de un caso particular, pues en 7 cierto modo tienen un carácter teórico y por eso sirven para extrapolar o hacer predicciones; estructurabilidad, al tener varias intuiciones relacionadas entre sí pueden crear estructuras de razonamiento; y auto-evidencia, pues para el propio ser son autoevidentes que no llega a necesitar de demostración alguna. A la vez diferencia entre dos tipos de intuiciones: primarias y secundarias. • Las intuiciones primarias, son aquellas que son adquiridas directamente de la experiencia sin necesidad de instrucción alguna. Ejemplo: el cálculo de distancias y localización de objetos. • Las intuiciones secundarias, están formadas mediante la instrucción o educación. Un ejemplo muy claro son las que se dan en la escuela. Sin embargo, una intuición secundaria no se reduce simplemente a una fórmula aceptada o utilizada automáticamente, si no se vuelve parte de uno al transformarla en una convicción, creencia, en un sentimiento de evidencia. Ésta no se va a formar a partir de la información recibida, más bien, de las experiencias que se generen de su utilización en las acciones y predicciones durante gran parte de su desarrollo intelectual. En su investigación sobre la intuición del azar, recomienda como primer paso, antes de enseñar probabilidad, hacer que los niños sean capaces de diferenciar entre las situaciones aleatorias y deterministas, apreciando algunas características básicas de sus propiedades. Para esta investigación, Piaget e Inhelder (1951), citados por Batanero (2001), defienden que la comprensión del azar por parte del niño es complementaria a la de la relación causa-efecto, es decir, que éste lo va a concebir como el resultado de la interferencia y combinación de una serie de causas, que actuando independientemente van a producir un efecto. Como consecuencia de ello, el niño no podrá tener un marco de referencia sobre la aleatoriedad si antes no ha comprendido la idea de causa-efecto. En el clásico experimento piagetiano, se utiliza una bandeja (figura 1), cuyo centro no tiene caminos específicos, donde se colocan cuatro bolas blancas (círculos con una X en medio) y cuatro negras (símbolo de vacio). Antes de balancear la bandeja de un lado a otro para que las 8 bolas que en un principio se encuentran ordenadas se mezclen progresivamente, Piaget pide a los niños que hagan una predicción sobre la colocación final de las bolas. Figura 1. El experimento de la bandeja 2 En el período preoperacional los niños piensan que, después de mover varias veces la bandeja, las bolas vuelven nuevamente a su lugar de origen, o bien, que el conjunto completo de bolas blancas acabarán ocupando el lugar de las bolas rojas, y viceversa. Piaget interpreta esta reacción típica de los niños, antes de los 7 años, indicando que el niño no comprende la naturaleza irreversible de la mezcla aleatoria por tener un pensamiento reversible, es decir, los niños creen que todo puede regresar a su estado original. Esta opinión de Piaget es rechazada por Fischbein, para quien la intuición primaria del azar, como la distinción entre lo aleatorio y determinista, aparece antes de los siete años. Él se basa en que los niños son capaces de elegir las situaciones de mayor probabilidad durante juegos sencillos. En el período de las operaciones concretas, al adquirir esquemas operacionales espaciotemporales y lógicos-matemáticos, el niño logra alcanzar la capacidad de distinguir entre el azar y lo deducible, aunque esta comprensión no es completa, puesto que el pensamiento está todavía muy ligado al nivel concreto, debido a que no llega a construir la idea de azar por 2 Tomado de Batanero, C. (2001). Didáctica de la Estadística. Publicación del Departamento de Didáctica de la Estadística de la Universidad de Granada. 9 comprender la interferencia de las causas, sin reconocer su independencia, o su independencia y no la interferencia. Ya en el período de operaciones formales, Piaget sostiene que la idea de azar no puede ser totalmente adquirida hasta que no ha desarrollado el razonamiento combinatorio. Mientras tanto, Fischbein sostiene que la distinción entre el azar y lo deducible no se realiza de manera espontánea y completamente al nivel de las operaciones formales. En experimentos realizados con adolescentes en la que se requiere calcular probabilidades, busca dependencias causales que reduzcan lo incierto, incluso donde no existan esas dependencias, donde la influencia se da por las tradiciones culturales y educativas de la sociedad moderna, que orientan el pensamiento hacia las explicaciones deterministas. Con la suposición de que el niño es capaz de diferenciar los fenómenos aleatorios y deterministas, surge el segundo paso, que pueda estimar en una serie de experimentos, cuáles son los sucesos que aparecen con mayor o menor frecuencia, es decir, que sea capaz de estimar la frecuencia relativa. Los resultados obtenidos de experimentos desarrollados por varios psicólogos apoyan fuertemente la conclusión de que, en el periodo preoperacional, el niño adapta sus predicciones a las probabilidades de los sucesos que se le presentan como un estímulo, como por ejemplo, cuando un niño recibe una recompensa por cada vez que haga algo bien o un castigo por hacer algo mal. La estimación de la frecuencia relativa de sucesos mejora en el período de operaciones concretas, como resultado de experiencias acumuladas desarrollándose de modo natural cuando el niño se enfrenta con situaciones que implican sucesos aleatorios. Por ejemplo, hacer una predicción sobre si va a llover o no, dependiendo de qué tan nublado sea el día o el tiempo que transcurre entre un camión y otro, en la parada del autobús. En el periodo de operaciones formales se comienzan a crear estrategias óptimas ante situaciones en condiciones aleatorias para la toma de decisiones. Ante la estimación de posibilidades a favor y en contra, Piaget e Inhelder aseguran que los niños no pueden realizarla por no poseer los recursos necesarios como: la habilidad de 10 distinguir entre el azar y lo deducible, el concepto de proporción y los procedimientos combinatorios. En contraparte, Fischbein piensa que, a pesar de no tener dichos recursos, el niño puede hacer juicios probabilísticos, en situaciones sencillas. Por ejemplo, que elija entre dos urnas con un número diferente de bolas blancas y negras, aquella que ofrezca mayor posibilidades de obtener una bola blanca. Durante el periodo de operaciones concretas, los niños pueden resolver problemas que implican la comparación de probabilidades de un suceso A en dos experimentos, siempre y cuando los casos favorables o no favorables a A sean iguales en ambos. Más adelante, en los años setentas, las investigaciones psicológicas se comienzan a centrar sobre el razonamiento estocástico de sujetos adultos en lo que respecta a las heurísticas y sesgos, realizadas por Daniel Kahneman y Amos Tversky, proporcionando a los educadores un marco teórico para la investigación sobre el aprendizaje de la probabilidad y la estadística. Su tesis original era que las personas con poco o ningún conocimiento de estadística, estiman la probabilidad de un evento por medio de ciertos juicios heurísticos, como la representatividad y la disponibilidad (Kahneman y Tversky, 1972, 1973a, 1973b; Kahneman y Tversky, 1974, citados por Shaughnessy, 1992). De acuerdo con la heurística de la representatividad, las personas estiman las probabilidades de los eventos con base en lo bien que representa cierto aspecto de su población original (Kahneman y Tversky, 1972, citado por Shaughnessy, 1992). Las personas creen que una muestra debe de reflejar la distribución de la población original o que esa muestra debe de reflejar el proceso según el cual se generan los ejemplos aleatorios. Por ejemplo, muchas personas creen que en una familia con seis hijos, es más probable que ocurra la secuencia HMMHMH, donde H = hombre y M = mujer, que las secuencias HHHHMH o HHHMMM (Kahneman y Tversky, 1972; Shaughnessy, 1977, citado por Shaughnessy, 1992). En el primer caso, la secuencia HMMHMH llega hacer más representativa por ser cercana al 50-50 de niños y niñas, es decir, las personas tienden a creer que si primero nace un hombre, por consiguiente va a nacer una mujer, y viceversa. 11 Algo similar ocurre con la “falacia del jugador”, cuando muchos sujetos tienden a pensar que, al lanzar repetidas veces una moneda, después de una serie de soles la probabilidad de que caiga águila en el siguiente tiro es mayor. Ahora, cuando las personas estiman la probabilidad de eventos a partir de la facilidad que tienen para recordar ciertas instancias particulares del evento, se encuentran utilizando la heurística de la disponibilidad. Por ejemplo, si usted se encuentra manejando en cierta localidad y sufre un accidente por alguna otra persona que se paso el alto, es más probable que usted de una estimación más alta de la frecuencia de accidentes en esa localidad, que alguien que lleva años viviendo en ella sin sufrir un solo accidente. Otras personas, aún teniendo estudios avanzados sobre estocástica, se encuentran propensas a calificar ciertos tipos de eventos conjuntivos, como con mayor probabilidad que sus eventos originales, dándose a conocer esto como la falacia de la conjunción. Al respecto, Kahneman y Tversky (1983), citado por Shaughnessy (1992), reportaron que sujetos universitarios con poco conocimiento del área, calificaron el porcentaje de personas de 55 años y que tuvieron un ataque cardíaco, como mayor que el porcentaje de personas que sólo sufrieron del ataque cardíaco, ya que las ideas de ataque cardíaco y 55 años pueden estar íntimamente ligadas en la mente el alumno, viéndolo como una consecuencia, debido a la experiencia que ha tenido. Es por ello, que les fue más fácil pensar que es más probable que una persona de 55 años sufra de un ataque cardíaco, en vez de preguntarse si la persona que tuvo el paro cardíaco necesariamente debe tener 55 años. En la actualidad, gran parte de las investigaciones en Didáctica de la Matemática o Matemática Educativa, se interesan por estudiar y explicar los diversos fenómenos didácticos cuando los saberes matemáticos son llevados al aula y presentados al alumno. En los casos en los que no se trata de una simple distracción u olvido, se dice que tal tarea resulta demasiado difícil para el alumno en cuestión. Pero, las dificultades de aprendizaje no se presentan de forma aleatoria o imprevisiblemente. Con frecuencia encontramos errores que se repiten, o que se producen regularidades, y asociaciones con variables propias de las tareas propuestas, de los sujetos o de las circunstancias presentes o pasadas. Es por ello, que la 12 investigación en didáctica trata de identificar y explicar estos errores, que con frecuencia son debidos a las creencias de los profesores. En investigaciones que se centran en el significado y comprensión de los conceptos, se han reportado los distintos elementos que conforman al significado y la influencia que tienen las dimensiones institucional y personal del conocimiento. Entre los significados atribuidos a conceptos estadísticos, se encuentra la del significado subjetivo de la aleatoriedad, en donde se ha logrado mostrar que los sujetos tienden a encontrar patrones deterministas en las situaciones aleatorias, es decir, tratan de encontrar asociaciones inexistentes, con objeto de reducir la incertidumbre. También, se tiende a inferir aleatoriedad en situaciones en la que no está presente, como por ejemplo, al hacer rachas cortas de dos o de tres símbolos adyacentes en algún sentido, ya sea empleando números consecutivos o letras sucesivas del alfabeto. En la generación de resultados aleatorios, Green (1991), citado por Batanero (2001), pide a niños de 7 a 11 años escribir una sucesión que represente el lanzamiento de una moneda al lanzarla 50 veces. De las sucesiones que se generaron, identifica tres aspectos básicos: la frecuencia relativa de cada uno de los sucesos, la independencia de los elementos de la secuencia y la consistencia entre las dos mitades de la secuencia generada. Es decir, los niños piensan que, después de una racha de soles, seguirá una cara o viceversa; otros, que no depende de cuál haya sido el número de veces seguidas que sea solo cara, son independientes; y que son muy exactos al reflejar la equiprobabilidad, en este caso, la igualdad o cercanía, del mismo número de veces que aparece sol y cara en la secuencia. Del mismo modo, se ha investigado el reconocimiento de resultados aleatorios, hechas por Green (1983) y Toohey (1995), en donde se descubrió que la mayor parte de los niños eligen precisamente la secuencia aleatoria y que no mejora la apreciación de la aleatoriedad con la edad. Por su parte, Lecoutre (1992), citado por Batanero (2001), describe la creencia de los sujetos en la equiprobabilidad de todos los sucesos asociados a cualquier experimento aleatorio. Como ejemplo, usan un problema en el que se pregunta si al lanzar dos dados hay la misma probabilidad de obtener un 5 y un 6, que la de obtener dos veces un 5. Sin importar el contexto 13 y el formato de la pregunta, los resultados siempre coinciden y demuestran la estabilidad de la creencia en que los dos resultados son equiprobables. Lecoutre y sus colaboradores defienden que ello no es debido a la falta de razonamiento combinatorio, sino a que los modelos combinatorios no se asocian fácilmente con las situaciones en que interviene el azar. Por último, otro concepto implicado en la comprensión de la aleatoriedad es la independencia. Algunos puntos conflictivos sobre la independencia y la probabilidad condicional son los siguientes: apreciar la independencia en ensayos sucesivos de un mismo experimento; comprender que la probabilidad de un suceso pueda condicionarse por otro que ocurra después de él; confundir las probabilidades P(B/A) y P(A/B); confundir los sucesos independientes con sucesos mutuamente excluyentes y no identificar correctamente cuál es el suceso que hay que poner como condición en una probabilidad condicional. 1.1.1.2. Investigaciones acerca de la didáctica de la estadística Por otra parte, las investigaciones en didáctica de la estadística se han centrado en lo que respecta a la asociación estadística, la cual tiene una gran relevancia en la educación matemática, porque extiende la dependencia funcional y es fundamental para muchos métodos estadísticos, permitiendo modelizar numerosos fenómenos en diversas áreas. El fin principal de algunas de las aplicaciones que se realizan, es encontrar explicaciones causales que nos ayuden a comprender nuestro entorno. Sin embargo, la asociación no implica necesariamente relación causal, como muchas personas tienden a concebir. Aparte de la dificultad epistemológica presentada arriba, las investigaciones psicológicas han mostrada que la habilidad para emitir juicios de asociación no se desarrolla intuitivamente. Las personas adultas, a veces basan sus juicios en creencias previas sobre el tipo de asociación que debería existir entre las variables, en lugar de las contingencias empíricas presentadas. No obstante, con respecto a este tema, son muy pocas las investigaciones que se han llevado a cabo, enfocándose la mayoría en tablas de contingencias de 2 x 2. La tabla de contingencia sólo es un caso particular del campo de problemas del que emerge la asociación estadística. Es por ello, que para la resolución de este problema es preciso realizar y establecer relaciones con las diferentes frecuencias que aparecen o pueden calcularse en la tabla. Otro problema diferente es valorar la correlación existente entre dos variables 14 cuantitativas. Un tercer tipo de problema consiste en tratar de averiguar si una variable numérica tiene la misma distribución en dos muestras diferentes. Con estos tres problemas, en Granada se llevó a cabo un estudio sobre el aprendizaje de la asociación, comenzando con el estudio del significado personal que los estudiantes daban al concepto de asociación antes de haber estudiado el tema. Durante la investigación, se aplicaron ítems sobre tablas de contingencia y asociación entre variables, y se controlaron las siguientes variables: el signo e intensidad de la asociación, relación entre las creencias previas de los alumnos sobre el contexto del problema y el tipo de asociación presentada. En cada ítem se analizó el tipo de asociación percibido por los estudiantes, lo cual permitió clasificar las estrategias de resolución utilizadas por ellos desde un punto de vista matemático, para poder identificar las estrategias intuitivas correctas que sugieren concepciones correctas o parcialmente correctas sobre la asociación estadística. Como ejemplo se tienen las siguientes: 1. Utilizar la tendencia constante, creciente o decreciente de los puntos en los diagramas de dispersión para justificar el tipo de asociación (nula, positiva o negativa). 2. Utilizar las medias o los totales para comparar la distribución de una variable en dos muestras diferentes. 3. Comparar las frecuencias a favor y en contra de la asociación en cada valor de la variable independiente, o la razón de estas frecuencias en tablas de contingencia de 2xr, donde r represente el número de columnas. Así como se obtuvieron respuestas correctas, se presentaron estrategias inadecuadas para la resolución del problema, las cuales les proporcionaban juicios incorrectos de asociación, entre ellas están las siguientes: 1. Concepción determinista de la asociación: algunos estudiantes no admiten más que un valor de la variable independiente, por cada valor de la variable dependiente, es decir, la relación funcional, desde el punto de vista matemático, sólo puede tener un valor y sólo uno. 15 2. Concepción unidireccional de la asociación: sí se percibe la dependencia sólo cuando es positiva (asociación directa), considerando la asociación inversa como independencia. 3. Concepción local de la asociación: utilizar solamente parte de los datos proporcionados por el problema para emitir juicios de asociación, es decir, si en una parte de los datos encuentra un tipo de asociación, ese adoptan en sus respuestas. 4. Concepción causal de la asociación: algunos de los estudiantes solamente consideran la existencia de asociación entre variables si se puede atribuir una relación causal entre ellas. Por otra parte, la Estadística y la Inferencia Estadística son estudiadas en los niveles superiores de educación, ya sea en las áreas de ciencias exactas, sociales, humanas, biológicas, etc., en los que también se han reportados diversos errores y dificultades al trabajar con algunos conceptos como los siguientes: medidas de tendencia central, variación de los datos, lectura e interpretación de gráficos, etc. La idea central de la inferencia estadística es que una muestra proporciona “alguna” información sobre la población y, de este modo, aumenta nuestro conocimiento sobre la misma, pero comprender este concepto implica el equilibrio adecuado entre dos ideas aparentemente antagónicas: la representatividad muestral y la variabilidad de la muestra. La primera de estas ideas nos sugiere que la muestra tendrá a menudo características similares a la de la población, si ha sido elegida con las precauciones adecuadas. La segunda, refiere al hecho de que no todas las muestras son iguales entre sí. Tener un punto adecuado entre los extremos de información total e información nula respecto a la población, depende de tres factores: variabilidad de la población (las muestras dependen de las características que se vayan analizar), tamaño de la muestra (debido a que la varianza de la muestra cambia con respecto al tamaño) y el coeficiente de confianza. En algunos países, el tema de contraste de hipótesis es presentado en los últimos años de la enseñanza secundaria (nivel educativo medio en México); Batanero (2001) afirma que probablemente es uno de los conceptos menos comprendido, más confundido y de los que más se ha abusado en toda la estadística. En particular los estudiantes tienen dificultades en los siguientes aspectos: 16 1. La determinación de la hipótesis nula H 0 y la hipótesis alternativa H 1 ; 2. La distinción entre los errores Tipo I y Tipo II; 3. La comprensión del propósito y uso de las curvas características operativas o curvas de potencia; y 4. La comprensión de la terminología empleada al establecer la decisión. 1.1.2. INVESTIGACIONES SOBRE DIDÁCTICA DE LA ESTADÍSTICA EN AMÉRICA Hasta el momento hemos presentado de manera breve resultados de estudios llevados a cabo en el continente europeo. Dichas investigaciones que comenzaron desde el desarrollo cognitivo de las intuiciones en el área de probabilidad hasta el concepto de muestra o nivel de significancia en inferencia estadística, ha influenciado en otros continentes, como el americano. Por ejemplo, en la Facultad de Ingeniería de la Universidad Nacional del Cuyo, de Argentina, se hizo un rediseño del método de evaluación al estudiante, para dar un marco de evaluación al curso de Estadística en carreras de Ingeniería, basados en la evaluación continua y una permanente interacción teórica-práctica, además de la incorporación de los proyectos de análisis de datos como técnica didáctica. Con este marco se aspira a que la educación se vuelque sobre el contexto, creando un escenario para la puesta en obra del aprendizaje de la estadística a partir de un variado menú de actividades, abriendo puertas para enriquecer el aprendizaje a través de la búsqueda de información, la observación, las entrevistas, la interacción, la experimentación, la utilización de recursos tecnológicos e informáticos, la producción oral y escrita, y el trabajo en equipo (Fernández y Guitart, 2005). 17 Algunas de las conclusiones que se obtuvieron fueron que: las pruebas objetivas no solamente se emplearon como un instrumento de autoevaluación, sino como un útil instrumento de evaluación continua; las pruebas de resolución de problemas tienen el carácter de evaluaciones integradoras, complementarias al de las pruebas de objetivos, permitiendo también la observación de aspectos procedimentales y actitudinales. Un punto muy importante, desde nuestra perspectiva, fue la identificación de errores y dificultades que con mayor frecuencia presentan los alumnos durante la enseñanza y aprendizaje de la Estadística y la Probabilidad, para progresar en el mejoramiento continuo del proceso. Otra investigación en el mismo país, en la Universidad Nacional Superior del Profesorado “Joaquín V. González”, fue sobre el análisis de una propuesta de aplicación del Teorema de Bayes a partir del planteamiento de situaciones en las que el decisor puede contemplar la posibilidad de comparar información adicional que le ayude a delinear, dentro de su visión subjetiva, el comportamiento de una o más variables inciertas estimadas relevantes en su problema. Con los procedimientos que se analizaron en los distintos casos a considerar, el decisor tuvo que calcular el valor esperado de la alternativa óptima en cada matriz de decisión que podría suscitarse ante la posibilidad de cada mensaje. Luego, y sobre la base de la probabilidad de cada mensaje, obtener un valor esperado resultante de la distinta combinación de alternativas óptimas según el que acontezca. Ese será el valor esperado calculado, si decidiera comparar información (Blanco, 2006). Una vez llevada a cabo la puesta en escena de la propuesta, se reportaron como resultados que: • La modelización es un proceso clave muy poco trabajado en el aula y permite a los alumnos comprender la utilidad de los conceptos matemáticos para la resolución de situaciones problemáticas de la realidad, y • La reflexión sobre el trabajo debería ser una tarea cotidiana. Este aprovechamiento de los conceptos estadísticos es fundamental para la comprensión del valor de la información adicional y medición de su cantidad, entre otros. 18 Con respecto a la probabilidad, Urrea (2005) identifica y analiza algunas de las estrategias y desviaciones presentes en el razonamiento probabilístico de un grupo de estudiantes universitarios, al abordar cierto tipo de situaciones en las que se requiere usar ideas básicas relacionadas con el concepto de la probabilidad. Específicamente, en su estudio se consideraron los siguientes tres aspectos: el curricular, el psicológico cognitivo y el relacionado con el desarrollo de las nociones de probabilidad y aleatoriedad desde la perspectiva de la disciplina. Algunos de los resultados que salieron a la luz, fue que durante la revisión de los programas de asignatura de los cursos que contemplan probabilidad, se pudo ver que la estructura que tienen, está orientada a priorizar el desarrollo de la estructura lógico secuencial de la disciplina, más que el desarrollo de las concepciones e intuiciones que el estudiante debe lograr al terminar dichos cursos; produciendo en cambio, sesgos de equiprobabilidad, del enfoque del resultado aislado, insensibilidad al tamaño de la muestra y concepciones erróneas en las secuencias aleatorias. En un estudio (Grande y Velázquez, 2007) se pretendió reconocer la práctica o la estrategia de simulación, que realizan los estudiantes al momento de resolver problemas de probabilidad. Como avances, sólo se pudo hacer ver que los alumnos se acercaron a la solución de los problemas planteados mediante el uso de los diagramas de árbol, monedas de diferente denominación y papelitos. Los autores afirman que la práctica de la simulación enriquece el conocimiento matemático del ser humano y, en particular, el de la probabilidad. En lo que respecta a la didáctica de la estadística, en la actualidad la formación estadística en el nivel universitario demanda cimientos desde la educación básica, tal como hacen referencia Maldonado y Ojeda (2007), cuyo trabajo de investigación tuvo por objetivo caracterizar la comprensión de ideas fundamentales de la estadística: muestra y variable estocástica en educación primaria, y diseñar actividades para la enseñanza de estos contenidos en ese nivel educativo. En su primera etapa, examina la propuesta institucional “tratamiento de la información” en el plan y programas de estudio de educación básica, así como las respectivas lecciones en los libros de texto, como referente para investigar su enseñanza en este nivel educativo. 19 Se obtuvo que la enseñanza de conceptos estadísticos, en particular las ideas de muestra y variable estocástica, han sido muy limitadas. Esta situación emerge de una formación escasa en ésta área, lo cual sugiere la necesidad de introducir su enseñanza desde el nivel básico (preescolar y primaria). En general, no se hace énfasis en la idea de muestra, necesaria para identificar la previsión de unos datos respecto a otros. Con relación a la idea de variable estocástica, ésta se utiliza para asignar números a los resultados de un espacio de muestra. Por otro lado, ¿qué referentes se tienen respecto al uso de tecnología para la enseñanza de la Probabilidad y Estadística? Torres y Gibert (2007) presentan un proyecto del uso de programas de aplicación en matemáticas, con miras a que sea utilizado para la compresión de la Probabilidad y Estadística como una prioridad para las Escuelas desde los niveles Medio y Superior. Al impulsar la implantación del uso de esas herramientas, el alumno pondrá en práctica los métodos y conocimientos adquiridos en el aula, visualizando los resultados e interpretando los mismos de una manera amigable, poniendo en práctica sus conocimientos adquiridos en cursos de computación y en el uso de paquetes como Statgraphics, Excel, Statistica, Minitab, MAPLE, entre otros. Las computadoras pueden cambiar la relación entre estudiantes y profesores, al permitir al estudiante ser cognitivamente más activo y favorecer la reorganización de sus esquemas conceptuales. En síntesis, la investigación en Didáctica de la Estadística cada vez se va fortaleciendo, estableciendo condiciones para el desarrollo de prácticas educativas centradas en la construcción del conocimiento, orientadas a culturizar a los alumnos estadísticamente para poder tomar decisiones, interpretar gráficos, hacer inferencias, entras otras cosas, que no necesariamente tienen que ser de carácter laboral, pues en la actualidad, la información en forma de gráficos, tablas, listados y concentrados de datos, los encontramos en cualquier medio de información. 20 1.1.3. LA EDUCACIÓN ESTADÍSTICA EN MÉXICO 1.1.3.1. La educación estadística en el nivel básico La educación estadística en México comienza a impartir de los niveles básicos, particularmente en la primaria se realizan acercamientos sobre conjuntos de datos, gráficos, las medidas de posición central, todos ligados al tratamiento de la información. Durante la formación de los alumnos en el nivel básico (primaria) la educación estadística se divide en dos temas, Tratamiento de la información y Predicción y al azar. Algunos de los fines educativos de nivel primaria sobre el Tratamiento de la información son los siguientes: • Realizar interpretación de información contenida en ilustraciones, registros y pictogramas (lectura de gráficos). • Resolución de problemas a partir de la información de los gráficos. • Recolección de datos de forma periódica y a través de la observación para la resolución de problemas. • Representación de información en tablas de frecuencia y gráficas de barras (representación de información mediante estadísticos; construcción de gráficos). • Análisis de las tendencias en gráficas de barras: promedios, valor más frecuente, la mediana (propiedad de representatividad). • Elaborar gráficas de variación proporcional y no proporcional para resolver problemas (análisis de la variación de los datos). • Uso de la frecuencia relativa (predicción). • Lectura de diversas fuentes para la obtención de datos (investigación). Con respecto a la Predicción y al azar se tienen los siguientes: • Predicción de hechos y sucesos donde no interviene el azar (predicción). • Uso de las expresiones más probable y menos probable en la predicción de resultados. 21 • Análisis e interpretación de gráficas para hacer predicciones (lectura, interpretación y predicción). Para el logro de todo lo anterior, se tiene que la construcción de los conocimientos estadísticos en los niños se puede dar mediante experiencias concretas. El diálogo, la interacción y la confrontación de puntos de vista ayudan al aprendizaje, favoreciendo la construcción de conocimientos; y tal proceso es reforzado por la interacción con los compañeros y con el profesor. Además, para llegar al éxito en el aprendizaje en la disciplina de las matemáticas depende, en cierta forma, del diseño de actividades que promuevan la construcción de conceptos a partir de experiencias concretas, en la interacción con otras personas y la socialización de ideas. En esas actividades, las matemáticas deberán ser para el niño herramientas funcionales y flexibles que le permitan resolver las situaciones o problemas que se le planteen. Las matemáticas permiten resolver problemas en diversos ámbitos, como el científico, el técnico, el artístico y la vida cotidiana. Si bien todas las personas construyen conocimientos fuera de la escuela que les permiten enfrentar dichos problemas, esos conocimientos no bastan para actuar eficazmente en la práctica diaria. Los procedimientos generados en la vida cotidiana para resolver situaciones problemáticas muchas veces son largos, complicados y poco eficientes, si se les compara con los procedimientos convencionales que permiten resolver las mismas situaciones con más facilidad y rapidez. Se requieren contar con habilidades cognitivas, conocimientos estadísticos y formas de expresión para poder comunicar y comprender la información matemática presentada a través de medios de distinta índole. Se considera como una de las funciones de la escuela, brindar situaciones en las que los estudiantes utilicen los conocimientos que ya tienen para resolver ciertos problemas y que, a partir de sus soluciones iniciales, comparen sus resultados y sus formas de solución para hacerlos evolucionar conceptualizaciones propias de las matemáticas. hacia los procedimientos y las Por tanto, vemos que la creación de situaciones didácticas (Brousseau, 1986) tiene presencia en el quehacer de la educación primaria y que deben de ser creados con un fin en particular, la construcción de objetos matemáticos, dejando que sea el alumno quien interactúe con el medio y obtenga sus propios resultados. 22 Continuando con la educación básica, en la secundaria se hace presente nuevamente el estudio de las medidas de posición central y el tratamiento de la información, pero ahora con conceptos cada vez más sólidos y trabajos más complejos. De la misma manera que en la primaria, la educación estadística en secundaria se divide en dos ejes temáticos, estos son: Manejo de la información y Representación de la información (Reforma de Secundaria, 2006). Entre los fines del primero se encuentran: • Resolver situaciones en donde se halle un valor faltante en diversos contextos, mediante diversos métodos: los flexibles, operadores fraccionarios y decimales, y procedimientos expertos. • Elaboración y empleo de procedimientos para resolver problemas de reparto proporcional (repartición equitativa). • Interpretación del efecto causado por la aplicación de factores constantes de proporcionalidad. • Representación de gráficas cuya relación de proporcionalidad se dé en el plano cartesiano. • Interpretación, elaboración y empleo de gráficas de un conjunto de datos para analizar su distribución a partir de la mediana o media de dos o más poblaciones. Respecto al segundo se tienen: • Resolución de problemas mediante el empleo de tablas y diagramas de árbol (uso de los gráficos). • Interpretación y comunicación de información mediante la lectura, descripción y construcción de tablas de frecuencia (lectura de gráficos). • Interpretación de información representada en gráficas de barras, circulares, de frecuencias, provenientes de distintos medios de información y la comunicación de estos a través de otras formas de representación (Lectura de gráficos y tránsito entre distintos tipos de representación). • Comparación de comportamientos de dos o más conjuntos de datos referidos a una misma situación o fenómeno a partir de sus medidas de posición central (análisis de la variación de los datos). 23 • Anticipación de resultados en problemas de conteo (predicción). • Interpretación y cálculo de las medidas de posición central de un conjunto de datos agrupados; consideración especial de las propiedades de la media aritmética (propiedad de representatividad). • Interpretación y empleo de dos o más gráficas de línea que representan una situación o fenómeno para tener mayor información y, en su caso, tomar decisiones (toma de decisiones). • Construcción, interpretación y utilización de gráficos. Con base en lo antes expuesto, podemos sintetizar los principales fines de la educación estadística en la educación básica, al observar la relación entre el tratamiento de los conceptos estadísticos y el tratamiento de la información en la primaria y secundaria. De modo que, se esperaría que al llegar al nivel medio los estudiantes sean capaces de: • Recolectar datos. • Leer gráficos para comunicar información proveniente de diversas fuentes. • Construir y manejar gráficos. • Calcular las medidas de posición central. • Transitar entre distintos gráficos. • Analizar la variación de los datos. • Tomar decisiones ante situaciones o fenómenos en donde la incertidumbre se hace presente. Se aprecia claramente que existe una evolución y preservación de los fines de la educación estadística, perseguidos en la educación primaría y secundaria. Con respecto al enfoque didáctico para la consecución de estos fines, debe basarse en la metodología didáctica en la que se sustentan los programas de educación secundaria, la cual consiste en llevar a las aulas actividades de estudio que despierten el interés de los alumnos y los inviten a reflexionar, a encontrar diferentes formas de resolver problemas y a formular argumentos que validen los resultados, enmarcada en la teoría de situaciones didácticas (Brousseau, 1986). Bajo esta perspectiva, el medio y el problema serán importantes para “enganchar” a los estudiantes, teniendo que afrontar el profesor problemas tales como: la 24 resistencia que los alumnos presentan ante el aprendizaje de las matemáticas, la dificultad para leer y por lo tanto para comprender los problemas, el desinterés para trabajar en equipo, la falta de tiempo para concluir las actividades y los espacios suficientes para compartir experiencias. Entre las competencias que se desean alcanzar durante la evaluación de la situación están: el planteamiento y la resolución de problemas, la argumentación, la comunicación y el manejo de técnicas. 1.1.3.2. La educación estadística en el nivel medio Podemos ver cómo es que, desde cursos previos al bachillerato, la educación estadística se hace presente y se encuentra ligada al tratamiento de la información. No obstante, puede observarse en la realidad educativa un gran trecho entre la educación estadística del nivel básico y el medio. Ahora, ¿los fines de la educación básica se encuentran ligados con los de la educación media? De ser así, se deben de preservar algunos y otros deben de evolucionar, por lo que para responder a dicha pregunta, presentaremos los fines propuestos en el nivel medio (tomados de la Dirección de Bachillerato General, 2006). Para comenzar, en la introducción de este capítulo expresamos que en la educación estadística del nivel medio se extiende el número de horas de la materia Probabilidad y Estadística, dividiéndose en dos partes, en virtud de su importancia por la necesidad, casi instintiva del ser humano, de tomar en cuenta datos de diversos hechos que resultan esenciales en su vida; por otra parte, la necesidad de convivencia y organización entre los individuos nos lleva a considerar que es difícil imaginar un organismo social sin datos con propósitos estadísticos. La asignatura Probabilidad y Estadística I, introduce al alumno hacia el conocimiento y necesidad de interpretar datos, y al cálculo de posibilidades de la ocurrencia de un evento, centrándose en la: • Recolección de datos, teniendo como finalidad la obtención de un conjunto de datos, tras conocer su clasificación y utilidad, mediante el manejo conceptual y práctico de los términos básicos de la estadística y los tipos muestreo; • al análisis de situaciones de su vida cotidiana o escolar; 25 • la Representación tabular y gráfica, donde construirá una representación tabular y gráfica de un conjunto de datos, tras conocer el tipo de datos, aplicando los procedimientos propuestos, mostrando una actitud reflexiva y crítica; • las Medidas de tendencia central y variabilidad, donde calculará la media, mediana, moda, desviación estándar y varianza de un conjunto de datos, tras conocer su comportamiento en datos agrupados y no agrupados, aplicando los procedimientos propuestos, mostrando una actitud crítica y propositiva. Se tiene entonces que los alumnos deben de poder realizar: • Recolección de datos. • Construcciones tabulares y gráficas. • Calcular medidas de posición central y de variación de los datos. Al parecer la educación estadística en educación media gira en torno a estos tres ejes, empero de acuerdo con los propósitos de la reforma curricular, la formación de los estudiantes no puede limitarse simplemente a la adquisición de conocimientos, de manera memorística o “enciclopédica”, por lo que se han establecido Siete Líneas de Orientación Curricular con la finalidad de desarrollar las capacidades básicas que fortalezcan las estructuras de pensamiento y acción, esenciales para la formación integral del estudiante, lográndose a través de la selección de actividades didácticas. Las líneas de orientación curricular son: • Habilidades de pensamiento: se presentan al establecer conceptos con palabras propias, presentar ejemplos y argumentar su selección, relacionándolo con lo aprendido; comparar conceptos, jerarquizar u ordenar información; razonamiento lógico y analógico al plantear situaciones de su propio interés para aplicar los conocimientos y presentar resultados y conclusiones. • Habilidades de comunicación: el estudiante debe de exponer, explicar, comentar y discutir los resultados obtenidos, así como argumentar sus conclusiones, en trabajos individuales y en grupo; de esta forma también el alumno comunica el tema que ha seleccionado no solamente en forma oral o escrita, sino también a través del uso del lenguaje gráfico. 26 • Metodología: sobre la presentación de los trabajos, aquí el profesor orienta sobre la forma en que se aplica el conocimiento de los diferentes temas y el alumno, con base en esta experiencia, lo traslada al trabajo escolar requerido, a través de ejercicios referentes a la aplicación de distintas técnicas para obtener, recolectar, organizar, medir y representar datos y resultados, utilizando métodos de muestro, encuestas, censos; distribución de frecuencias para datos agrupados y sin agrupar; la representación tabular y gráfica, con simbología y diagramas; las técnicas de conteo; la aplicación de medidas de tendencia central y variabilidad en el análisis descriptivo e inferencial de los datos. • Calidad: entendida como el creciente perfeccionamiento en el proceso educativo, al fomentar en el alumno una tendencia permanente para el fortalecimiento de actitudes. • Educación ambiental: aquellas actividades que buscan que el alumno adopte una actitud ante el medio ambiente fomentándole una conciencia de corresponsabilidad entre las acciones que contribuyen a la conservación del equilibrio ecológico y el uso de los recursos naturales. • Democracia y derechos humanos: se promueve el respeto, la tolerancia, la capacidad de solidarizarse frente a las necesidades de los otros por medio del trabajo grupal en exposiciones, y la libertad de tratar los temas que se consideren de interés. Con estas Siete Líneas de Orientación también se buscan contrarrestar algunas de las dificultades que se presentan en la educación secundaria, las cuales pueden ser transportadas a las aulas del nivel medio si no son corregidas con anterioridad. Ahora trataremos sobre los contenidos que se trabajan en la materia. Con respecto a la Recolección de datos se realiza la presentación de los términos que serán empleados durante el curso y con sus respectivas definiciones, como lo son: población, muestra, variable, parámetro estadístico, etc., y los distintos tipos de muestro. Las estrategias de enseñanza para esta unidad radican en la presentación de ejemplos de situaciones reales donde se haga uso de la estadística, como lo son encuestas realizadas por periódicos, revistas, empresas, etc., en las que se lleva a cabo un pequeño análisis o lectura de ellos mediante ciertas preguntas, tales como: ¿Qué se pretende al presentar estadísticas? ¿Cómo se obtuvieron los datos? ¿Cuál es la importancia de los datos?, y otras, 27 relacionándolas con definiciones y con situaciones de interés para los estudiantes. Es una estrategia sugerida también, la formación de grupos de trabajo para que los alumnos seleccionen una situación de interés y obtengan la muestra representativa acorde a las necesidades de estudio. En la unidad Representación tabular y gráfica se realiza el tratamiento de distribuciones de frecuencias, relativas, absolutas y acumuladas, su construcción para datos agrupados y sin agrupar, en forma ascendente o descendente, y su representación gráfica. Las estrategias de aprendizaje se llevan a cabo mediante el planteamiento de situaciones reales o ficticias, donde sea posible obtener datos de los alumnos, mostrar la forma en que se construye una distribución de frecuencias y su interpretación, tanto con datos agrupados como sin agrupar. También situaciones sobre histogramas, polígonos de frecuencias, ojiva, gráficas de barras o de pastel, provenientes de periódicos, revistas, televisión y otros medios de comunicación. En las actividades, los estudiantes deberán comentar la forma en que se construyen cada una de ellas e interpretarlas. La tecnología aparece hasta en este nivel, en donde programas como Word, Excel y Power Point serán usados para la explicación y construcción de gráficos. Por último, haremos referencia a la unidad de Medidas de tendencia central y variabilidad, en donde se calcularán las medidas de tendencia central (media, mediana y moda) y de variabilidad (rango, varianza y desviación estándar) para un conjunto de datos agrupados y no agrupados mediante los algoritmos presentados en el aula. Las estrategias de aprendizaje para dicha unidad consisten en presentar artículos de periódicos o de revistas, que ejemplifiquen el uso de las medidas de posición central, mostrar el procedimiento para calcularlas, relacionarlas con alguna gráfica y la graficación de las medidas de posición central. El mismo argumento es empleado para las medidas de variación, solicitando al estudiante la elaboración de la gráfica correspondiente, indicar la ubicación de las medidas y determinar la cantidad de datos que se encuentran, por ejemplo, entre la media ± 3 desviaciones estándar. El programa Excel es empleado para la obtención de dichas medidas, es decir, como una herramienta de cálculo de valores. 28 Resaltamos que durante la materia de Probabilidad y Estadística I, no se realizan la construcción de los algoritmos de las medidas de tendencia central, simplemente son presentadas por el profesor y, por lo tanto, queda en lo memorístico. Se habla de medidas de tendencia central más nunca de sus características, propiedades, cuándo emplearlas, en qué contextos, bajo qué condiciones, por lo que la propiedad de representatividad no se hace presente; se realizan las gráficas de dichas medidas sin hacer referencia a su obtención mediante el empleo de gráficos, es decir, no existe una relación entre las medidas de tendencia central y la lectura de gráficos; se debe de excluir lo de situaciones ficticias y tratar de que los datos sean los más reales posibles; no se realizan predicciones; es necesario que se propicie la toma de decisiones por parte del estudiante; la tecnología es empleada como una herramienta, al igual que una calculadora científica, para calcular valores o para graficar, más no para realizar un análisis de la variación de los datos. La estrategia de enseñanza en la asignatura de Probabilidad y Estadística II recae en el tratamiento de las variables cualitativas y cuantitativas con respecto a su obtención, concentración en tablas, elaboración de diagramas, su interpretación, la correlación existente entre dos variables, todo esto mediante la proposición de ejercicios hacia los alumnos los cuales serán trabajados en equipos. Se llega a tener de nueva cuenta el proceso de: definiciones, ejemplos, ejercicios. Finalizamos expresando que uno de los puntos importantes que se aprecian en cada uno de los programas de estudios de probabilidad y estadística del Colegio de Bachilleres de Yucatán, es que en la primera se trabaja sobre las medidas de tendencia central en general; mientras que en la segunda, se hace una particularización del tratamiento de la media aritmética en las distribuciones, ya sean discretas o continuas, junto con su empleo en los modelos de regresión lineal. De manera que, si en un principio, el estudiante no ha comprendido las medidas de tendencia central, le será difícil relacionarlas con los conceptos subsecuentes, al no saber por qué ese valor y no otro. En ambas asignaturas, se tiene también que es el profesor quien presenta la gran mayoría de la información, comenzando por las definiciones, el tratamiento de los ejemplos, la explicación de la manera de obtener ciertos resultados, los algoritmos, etc., seguido de los ejercicios correspondientes, individualmente o en equipo. Se deja a un lado, la parte en donde es el 29 alumno quien construye su conocimiento, enfocándose en los procedimientos para la resolución de ejercicios más no de problemas. Al final, se logra apreciar cómo es que poco a poco la estadística y la probabilidad llegan a parecer un “recetario” de fórmulas y técnicas. Por otra parte, la bibliografía propuesta no se hace explícita, se remite a una página de internet en la cual se encontrará un listado de libros. En cuanto a los libros de textos, la introducción y tratamiento de los conceptos, los tipos de ejemplos y ejercicios empleados en algunos tipos de bachillerato, se analizarán con mayor detalle en el apartado de análisis didáctico en el capítulo IV, el cual reservamos para ello. Finalmente, los objetivos de la educación estadística en el nivel medio se centran en: fomentar la cultura estadística en las personas (para que adopten la cultura de tomar decisiones), predecir valores, hechos o fenómenos, interpretar y construir gráficos estadísticos, elegir un valor representativo de un conjunto de datos el cual lo describa lo mejor posible, y utilizar la estadística, no como un simple formulario para calcular valores, sino más bien para poder explicar y justificar hechos y situaciones de la vida real de carácter aleatorio. 30 CAPÍTULO II. PROBLEMA DE INVESTIGACIÓN Introducción Con el paso del tiempo, la estadística se ha ido incorporando a los currículos escolares propiciándose su tratamiento, desde los niveles básicos hasta los más avanzados de la educación, así como su aplicación a diversas ciencias fuera de la matemática pura como lo son: las ciencias humanas, sociales, ingenierías y demás. El estudio de la estadística va más allá de simplemente realizar cálculos matemáticos o aritméticos, mediante la sustitución de valores en fórmulas ya dadas; es realizar un análisis de la variación del conjunto de datos, su comportamiento tendencial, los patrones que producen, la interpretación de resultados ante distintas situaciones para la toma de decisiones, etc. En México, la educación estadística comienza desde la primaria con nociones y acercamientos a situaciones de la vida real en el que el estudiante está sumergido. Conforme avanza su formación académica, el conocimiento estadístico cada vez se hace más rígido, las aplicaciones en situaciones reales son más frecuentes con la llegada al nivel universitario en donde la estadística es empleada para realizar investigaciones de campo, con el fin de reportar hechos, sucesos y tomar decisiones. En situación escolar, los conceptos de medidas de posición central, son concebidos como fórmulas para calcular valores o promedios, dejando a un lado el análisis de la variación de los datos, y sobre todo, la falta de entendimiento de su propiedad de representatividad. En este capítulo damos pie a lo que es nuestro problema, objetivo y justificación de la investigación. 31 2.1. PROBLEMA DE INVESTIGACIÓN Diversas investigaciones en didáctica de la estadística (Batanero, 2001; Mayén, Cobo, Batanero y Balderas, 2007) alrededor de las medidas de posición central, reportan su incomprensión por parte de los alumnos, tanto de secundaria como de bachillerato. Se observan también dificultades, tales como: aplicar inversamente el algoritmo para calcular la media y mediana en un conjunto de datos, dar un resumen cuando los datos son proporcionados mediante gráficos, reconocer su propiedad de representatividad, identificar las posiciones relativas de media y mediana en distribuciones asimétricas y en la elección de la medida de tendencia central más adecuada en una situación determinada y el uso de los promedios en la comparación de distribuciones, entre otras. De modo que, se hace evidente la carencia de significado de estos conceptos, así como su nula interpretación para la toma de decisiones. Algunas causas de lo anterior, refieren a las prácticas docentes en el aula para la enseñanza de la estadística, enfocadas en secuencias de definiciones, ejemplos, ejercicios, basadas en aplicaciones de fórmulas y tablas de datos. Dichas prácticas ocasionan grandes lagunas en los alumnos sobre los conceptos ya antes mencionados, al priorizarse la mecanización y memorización de algoritmos y sustitución de valores de los datos en fórmulas, generando una comprensión instrumental de éstos, más no conceptual. Se deja de lado el uso de gráficos para el tratamiento de la media aritmética y mediana, por lo que un análisis de la variación de los datos, para notar los efectos que tienen las valores del conjunto de datos sobre las medidas de posición central, no se lleva a cabo. Por lo tanto, no se centra la atención en la propiedad de representatividad inherente a estos dos conceptos estadísticos, suscitando la falta de herramientas o fallas en la toma de decisión de cuál es el valor más representativo de un conjunto de datos. Por otra parte, en México, se realizó una investigación con el fin de poder comprobar si las dificultades detectadas, sobre las medidas de posición central, en el contexto español son 32 específicas o bien, compartidas por estudiantes de edades próximas, pero en un contexto educativo diferente; ya que este sería un primer paso para plantear propuestas didácticas, las cuales permitan superar las dificultades detectadas, en estudiantes de bachillerato entre 17 y 18 años. Como resultados se obtuvieron que las dificultades presentadas por los estudiantes españoles también son compartidas por los mexicanos y, en el caso de los segundos, se mantienen con la edad. Algunas de las dificultades presentes fueron: estimar la mediana a partir de un gráfico; el cálculo de la media ponderada, dado que los alumnos no tienen en cuenta la ponderación de los datos; la falta de ordenamiento al momento de calcular la mediana y no resolver la indeterminación que surge cuando se tienen dos valores centrales; así como, no reconocer el efecto que tienen los valores atípicos sobre los valores representativos de un conjunto de datos. No obstante, se tienen resultados satisfactorios cuando no aparece la ponderación de los datos, pues los alumnos reconocen intuitivamente algunos campos de problemas y propiedades de la media, y son capaces de realizar correctamente el algoritmo. Aún así, aparecen todavía errores y dificultades, algunos muy frecuentes. Un factor de tales dificultades, es la falta de conocimiento de los profesores de la génesis, prácticas humanas e ideas ligadas al desarrollo y aplicación de los conceptos estadísticos. Esto es, que los profesores lleven a cabo una vigilancia epistemológica de los conceptos para diseñar actividades didácticas que favorezcan la construcción de los mismos, en situaciones propicias para entender el sentido y el significado de los conceptos y métodos estadísticos. Con respecto a la evolución de las medidas de tendencia central, como concepto y como método para determinar un valor representativo de un conjunto de datos, se sabe que, desde la antigüedad, ha estado ligado al tratamiento de la información y al uso de gráficos. Por ejemplo, los egipcios realizaban censos de la población y de sus tierras para una nueva repartición de las mismas, debido al nivel de cauce del rio Nilo que subía cada año. Por su parte, los Babilonios asentaron en tablillas de arcilla, registros sobre los movimientos de los astros y planetas, resolviendo un problema de estimación mediante el cálculo de la suma total 33 de las observaciones y dividiéndolo por el número de datos para determinar la posición de los planetas (Plackett, 1970). En siglo XV, cuando las tormentas causaban en las embarcaciones la pérdida de bienes, estos tenían que ser pagados mediante un acuerdo de todos los que llevaban mercancía en el mismo buque. El daño causado por el mar al cargamento se conocía como “havaria”, y la palabra llegó a aplicarse naturalmente al dinero que cada individuo tenía que pagar como compensación. De esta palabra latina se deriva la palabra avarage (promedio), que en nuestros días es empleada como sinónimo de media aritmética, mediana o moda, pero más como la primera, (Newman, 1968). En 1669, Huygens, extraído de Michael y Denis (2007), realizó el primer gráfico de una función continua y la demostración de cómo determinar el promedio de vida restante de una persona de cierta edad. Por otro lado, la construcción de gráficas, es parte esencial de los cursos de estadística en bachillerato. No obstante, muchas veces el uso de las gráficas en el aula se restringe a considerarla como una forma alternativa de representación y manejo de datos, en ocasiones solo se miran como figuras carentes de significado. Es decir, en el contexto escolar no se propicia un análisis puntual y global de las gráficas y su interpretación en el tratamiento de información para hacer inferencias y tomar decisiones. Los profesores suponen, a veces, que la elaboración de tablas y gráficos es muy sencilla y dedican poco tiempo a su tratamiento en el aula de clase. Sin embargo, elaborar una tabla de frecuencias o un gráfico supone una primera reducción estadística, pues se pierde la originalidad de cada uno de los datos individuales, al momento de pasarse a la distribución de frecuencias (Batanero 2001). Cuando las gráficas son usadas en clase, ya sea proporcionadas por el profesor o elaboradas por el estudiante, no se tienen en cuenta que cada una de ellas posee diferentes componentes: ejes, escalas y elementos específicos que son cruciales en su interpretación, tales como el título o las indicaciones que hacen referencia a las variables representadas en cada uno de los ejes. Esto trae como consecuencia dificultades para su análisis e interpretación. 34 En el caso más sencillo, los gráficos tienen un eje de coordenadas cartesianas en dos o tres dimensiones, aunque cada eje puede representar valores de las variables, frecuencias, promedios u otros resúmenes estadísticos que requieren de los títulos relativos a cada variable, dependiendo del gráfico, y en algunos casos los ejes están implícitos, como en el gráfico del tallo y hojas o están basados en coordenadas polares como el gráfico de sectores. La destreza de la lectura crítica de datos, es una componente de la alfabetización cuantitativa y una necesidad en nuestra sociedad tecnológica, pues encontramos tablas y gráficos en la prensa, el comercio, la profesión, así como en distintas asignaturas del currículo matemático. Además, las nuevas tecnologías posibilitan realizar gráficos estadísticos de modo rápido y eficaz. Por su parte Curcio (1989), citado por Batanero (2001), ha exhibido cuatro niveles distintos para la lectura de tablas y gráficos estadísticos que pueden aplicarse en el aula: 1. “Leer los datos”: este nivel de comprensión requiere de una lectura literal del gráfico; no se realiza interpretación de la información contenida en el mismo, es realizarlo de manera general. 2. “Leer dentro de los datos”: incluye la interpretación e integración de los datos en el gráfico; requiere la habilidad para comparar cantidades y el uso de otros conceptos y destrezas matemáticas, como por ejemplo la variación de los datos. 3. “Leer más allá de los datos”: requiere que el lector realice predicciones e inferencias a partir de los datos sobre informaciones que no se reflejan directamente en el gráfico. 4. “Leer detrás de los datos”: supone valorar la fiabilidad y completitud de los datos. Con base en lo anterior, tampoco se lleva a cabo la teoría de Wainer (1992), citado por Batanero (2001), quien clasifica el tipo de preguntas que se pueden plantear a partir de una gráfica en tres niveles: • Nivel elemental. Las preguntas se encuentran relacionadas únicamente con la extracción de datos directamente del gráfico. 35 • Nivel intermedio. Las preguntas se relacionan con la evaluación de tendencias basándose en una parte de los datos. • Nivel superior. Las preguntas son acerca de la estructura profunda de los datos presentados en su totalidad, usualmente comparando tendencias y notando agrupaciones. Sin esto, los estudiantes no son capaces de cuando menos estar dentro de las tres primeras categorías que Gerber y cols (1995), citado por Batanero (2001), distinguen sobre los niveles de habilidades que los estudiantes presentan para la interpretación y compresión de las gráficas. Siendo éstas las siguientes: Categoría I. En esta categoría los estudiantes no se centran en los datos, sino más bien en las características idiosincrásicas de los mismos, que relacionan con su comprensión limitada del mundo de forma bastante imprecisa. No sólo tienen dificultades en interpretar el contenido de los gráficos, sino que son incapaces de procesar la información contenida en ellos de forma coherente. Categoría 2.Se centran en los datos representados pero de forma incompleta; se centran en aspectos parciales de los datos y no aprecian el propósito de cada gráfico. Categoría 3.Aquí ya se centran en todo el conjunto de datos y aprecian el propósito de cada gráfico pero no comprenden los aspectos específicos que son clave para entender la representación. Los estudiantes describen proporciones discretas de los datos, más que patrones y regularidades. No llegan a realizar una interpretación global del gráfico. Ligada a la construcción y análisis de gráficos se encuentra la variación de los datos. Loosen y cols., citados por Batanero (2001), realizaron un experimento con 154 alumnos de psicología, que no recibieron curso alguno sobre dispersión, a quienes se les presentó dos conjuntos diferentes de bloques A y B. Las longitudes de los bloques A fueron 10, 20, 30, 40, 50, y 60 cm. y las del conjunto B fueron 10, 10, 10, 60, 60 y 60 cm. Al preguntar cuál de los dos conjuntos presentaban mayor variabilidad se obtuvieron las siguientes respuestas: el 50% pensó que el conjunto A era más variable, el 36% que el B, y el 14% restante que ambos eran igual de variables. Los autores interpretaron éstos resultados como prueba de que el concepto 36 intuitivo de variabilidad se iguala al de “no semejanza”, es decir, se preguntan cuánto varían las observaciones entre ellas, en vez de cuánto varían con respecto a un punto fijo. El uso de gráficas, haría más sencillo observar la variación de los datos, pues se apreciaría mejor qué varia, cómo varía y cuánto varía. El tratamiento de la información, surge ante la necesidad de recopilar, organizar y transmitir información, tarea que se hace más sencilla mediante el uso de gráficas, empero se precisa saberlas construir, interpretar y comunicar. Este es un aspecto que falta concretizar en las aulas desde la educación básica. Es por ello, que una de las principales dificultades que se han reportado en el estudio de la estadística, es que los estudiantes no llegan a entender la propiedad de representatividad de la media aritmética y mediana, por no llevarse a cabo un análisis de la variación de los datos y el manejo de gráficas. La idea de representante de un conjunto de datos es importante en las aplicaciones prácticas, por ejemplo, al comparar dos conjuntos de datos respecto a una misma variable de interés. Como indican Mokros y Russell, citados por Batanero (2001), hasta que los estudiantes no conciben el conjunto de datos como un todo, y no como un agregado de valores, no podrán comprender las ideas de resumen de los datos o representante de los datos, que se refiere al conjunto global y no a ninguno de sus valores aislados. Si la media aritmética es un parámetro estadístico utilizado para resumir información de un conjunto de datos, entender este concepto implica reconocer el papel de representante del conjunto de datos. La idea de representatividad no es inmediata, antes de llegar a ella los alumnos deben captar la idea del conjunto de datos como una unidad. Como se sabe, la media es un valor "típico" o "representativo" de los datos. Campbell, citado por Batanero (2001) observa que, debido a ello, se tiende a situar la media en el centro del recorrido de la distribución, propiedad que es cierta para distribuciones simétricas. No obstante, cuando la distribución es muy asimétrica, la media se desplaza hacia uno de los extremos y la moda o la mediana serían un valor más representativo del conjunto de datos. Esto no es siempre comprendido por algunos alumnos, quienes invariablemente eligen la 37 media como mejor representante de los datos, sin tener en cuenta la simetría de la distribución o la existencia de valores atípicos, como hemos observado en nuestra propia experiencia. Respecto a la comprensión de la mediana Barr, citado por Batanero (2001), indica que los alumnos entienden que la mediana es el centro de "algo", pero no siempre comprenden a que se refiere ese "algo", porque no comprenden realmente que una tabla de frecuencia es sólo un resumen de los datos y no son capaces de pasar de la tabla a la lista de valores que es una representación alternativa de los datos. Incluso, si se les da los datos en forma de lista, no entienden por qué hay que ordenarlos para calcular la mediana, porque no es claro para ellos que la mediana es un estadístico que se refiere al conjunto ordenado de datos. Tomando en cuenta el uso e interpretación de gráficos en el tratamiento de la información, las dificultades que los estudiantes presenta durante el tratamiento de las medidas de posición central, en particular la media aritmética y mediana, y la contextualización, es que presentamos los aspectos a considerar en la elaboración de una propuesta didáctica para el estudio de la media aritmética y la mediana. 2.2. OBJETIVO DEL TRABAJO El objetivo de la investigación es elaborar una propuesta didáctica sobre la media aritmética y la mediana, mediante el uso de gráficas para generar entendimiento con respecto a su propiedad de representatividad. Atendiendo a las prácticas que normaron la evolución y constitución de estos conceptos de la estadística, consideramos la práctica de la repartición equitativa y el uso de los gráficos para que los estudiantes puedan predecir, tomar decisiones y atribuir un significado a la propiedad de representatividad de las medidas de posición central. La tarea entonces consiste, en crear 38 las condiciones para los estudiantes construyan nociones e ideas sobre la media aritmética y mediana, sus algoritmos, así como que generen significados sobre estos conceptos, al transitar entre los registros gráficos, algebraicos y verbales (en algún contexto). Con ello, se espera que los alumnos sean capaces de conjeturar, argumentar, interpretar y tomar decisiones ante situaciones de la vida real las cuales serán cruciales tanto en su vida profesional como en la diaria. 2.3. JUSTIFICACIÓN El comprender la media aritmética y la mediana como representantes de un conjunto de datos y la asignación de significados, ayudaría al alumno a entender mejor otros conceptos estadísticos como lo son: el valor esperado de X o esperanza de X, la desviación estándar, la frecuencia relativa, la frecuencia absoluta, la interpretación de gráficos de frecuencias, entre otros, útiles para el manejo de información y toma de decisiones. Su extrapolación hacia las carreras de Matemáticas, Actuaría, Veterinaria, Medicina, Psicología, entre otros, propicia un nuevo uso e interpretación de su significado. Por ejemplo, durante el tratamiento de distribuciones de probabilidad, en donde la presentación de la media aritmética, en particular, y la desviación estándar son de la siguiente forma: X~N(µ, σ2) lo cual significa que una muestra de tamaño n se distribuye normalmente con media µ y varianza σ2. Para este caso, en el estudiante podrían suscitarse dos cosas: que simplemente acepte la información presentada, o bien, preguntarse qué significa que la media sea µ y su varianza σ2, con valores específicos. En un caso particular, sería así: X~N (5,36) 39 Vemos como la media es 5 y la varianza 36 de una muestra X que se distribuye normalmente, entonces si su media es 5 significa que ese valor es aquel que mejor representa al conjunto de datos que forman la muestra, pero ¿cómo se modificaría la distribución de las probabilidades, si la media fuera 3 en lugar de 5? Es como en este tipo de situaciones, en lo que resulta importante saber qué es la media aritmética y qué representa. En la educación media superior, es importante la enseñanza de la estadística, debido al manejo frecuente de datos en la vida cotidiana, por su relación con otras asignaturas que el alumno debe de cursar, así como por sus aplicaciones en diversas disciplinas científicas durante investigaciones de campo. Sin embargo, el tratamiento que en el nivel básico y medio se da a los conceptos estadísticos de media aritmética y mediana, es siguiendo la secuencia: definición, ejemplos y ejercicios, la cual poco favorece su comprensión. En las prácticas en el aula, las definiciones son presentadas con su respectiva fórmula y los ejemplos en relación al concepto ya visto. El tratamiento de la información, permanece ajeno al análisis e interpretación de representaciones gráficas, inhibiendo en el estudiante el análisis de la variación de los datos. Se ha reportado, que en los currícula escolares y los libros de texto (referentes inmediatos de la práctica docente), se concibe la matemática como algo acabado, despersonalizada y desincretizando los saberes matemáticos. Este aspecto promueve que los docentes, se centran en la presentación y realización de ejercicios, más que en problemas que puedan provocar la reorganización de los esquemas cognitivos de los estudiantes y la construcción de su conocimiento. Cabe aclarar que entre ejercicios y problemas existe una gran diferencia. La primera, consiste en que los ejercicios son para automatizar la ejecución de fórmulas, despejes, sustituciones, etc., mientras que los problemas son más que una simple ejecución, precisa de estrategias, habilidades y puesta en juego de conocimientos, que le permitan formular un modelo matemático relacionado a la situación, ejecutarlo e interpretar los resultados. La segunda diferencia refiere a que los ejercicios son de carácter memorístico y mecanicista, no conlleva al análisis, al planteamiento de preguntas, la extrapolación de resultados, métodos 40 y secuencias; los problemas sí, proponen un análisis de la situación que da pie a una lectura más precisa y objetiva, a plantear e implementar un método de resolución, y una interpretación de los resultados para predecir acontecimientos y tomar decisiones. Las prácticas educativas referidas anteriormente, no van acordes con una de las metas de la educación estadística que, en general, consiste en la culturización estadística de las personas para que sean capaces de realizar análisis de los conjuntos de datos, representarlos gráficamente, identificar patrones de comportamiento, interpretar y extrapolar resultados, tomar decisiones, predecir y comunicar información. Es por ello que la construcción de propuestas didácticas, como segundo paso a las investigaciones que reportan las dificultades y errores que los estudiantes presentan durante el tratamiento de las medidas de posición central, en particular para la media aritmética, mediana y su propiedad de representatividad, consideramos ayudarán a culturizar estadísticamente a los estudiantes como futuras personas que encabezarán a la sociedad, para entender la información que aparece en los medios de comunicación y desempeñarse adecuadamente en lo laboral. Acciones como interpretar, comunicar, validar, predecir y tomar decisiones ante situaciones de incertidumbre, empleando estadísticos, analizando gráficos, tablas, la variación de los datos, etc., serán requisitos necesarios para enfrentar tanto la vida profesional como lo que respecta a lo social. De este modo, se llevaría a cabo la participación activa de los estudiantes, creando condiciones favorables para la argumentación de métodos, resultados, elecciones y acciones, que los estudiantes vayan generando hacia la construcción de conocimiento estadístico. Así, en las instituciones se transformaría la manera de enseñar los conceptos de media aritmética y mediana, al considerar incluso el uso de software, como Excel, por las facilidades de poder manipular los datos y de generar gráficos. Con la presente propuesta, se pretende que los estudiantes sean capaces de construir el algoritmo de la media aritmética y mediana, analizar la variación de los datos para elegir el valor que mejor represente a un conjunto, predecir futuros acontecimientos y tomar decisiones. Esto, conlleva un beneficio para el estudiante al dotarlo de ciertas herramientas que le permitan el uso de la estadística, tanto en contextos cotidianos como profesionales. 41 Con este trabajo, intentamos exhibir un nuevo panorama de la educación estadística, haciendo énfasis en la construcción de los saberes matemáticos por parte del estudiante. Aunado a lo anterior, tomamos como punto importante el uso, interpretación y utilidad de los gráficos en el tratamiento de la información la cual es una actividad inmersa en el desarrollo de la estadística, así como en diversos ámbitos profesionales y la generación de nuevo conocimiento en diversas áreas. Así mismo, posibilita que los estudiantes sean capaces de conjeturar y dar argumentaciones para justificar sus resultados y métodos, hacer inferencias y tomar decisiones. El mundo que nos rodea está plagado de información en constante cambio. Los medios de comunicación cada vez emplean más y más a las representaciones gráficas por su capacidad de condensar la información. Su análisis debe de ser minucioso para comprender, entender, predecir y tomar decisiones a futuro para la vida, por lo que la propuesta didáctica pretende comenzar a culturizar a los estudiantes en la estadística más que en construir un algoritmo para ser empleado en cualquier momento. 42 CAPÍTULO III. SITUACIONES DIDÁCTICAS Y LA INGENIERÍA DIDÁCTICA Introducción Este trabajo se desarrolló en el marco de la teoría de las situaciones didácticas (Brousseau, 1986), centrándonos en el análisis del proceso de construcción de los conocimientos estadísticos, con el fin de poder llevar a cabo la elaboración de una propuesta didáctica sobre la media aritmética y mediana y, por ende, su construcción por parte de los estudiantes a través de sus argumentaciones, verbales y no verbales, producidas por ellos mismos durante el proceso de comunicación y validación de sus resultados. Dicha teoría tuvo su origen en Francia desarrollada por Guy Brousseau; se ha desarrollado e implementado en diversos sitios del mundo y ha alcanzado hasta el momento resultados sumamente interesantes. Aunque esta teoría fue concebida para el campo particular de la didáctica de la matemática, hoy en día se busca su extensión a otros dominios del conocimiento y en diferentes niveles de escolaridad. Con dicha teoría, se estudian y modelan fenómenos didácticos que ocurren cuando un profesor se propone enseñar una noción, un teorema o un procedimiento a sus estudiantes, es por ello que esta se refiere a la interrelación entre tres agentes que forman el triángulo didáctico: profesor, alumno y saber. En este intento, las palabras: enseñar, aprender, pensar, entender, saber y conocer, adquieren diversos significados, pues dependiendo del concepto, materia y fines de la investigación serán los significados atribuidos y los resultados esperados (Cantoral, et al, 2003). Surge a partir de la teoría de Piaget, el cual considera al alumno como un ser que aprende cuando éste es sometido en un medio donde se crean conflictos cognitivos, creando en su mente choques entre los conocimientos que ya tiene y que considera válidos, contra los que surgen de un problema. Así, el alumno tiene que similar los nuevos conocimientos para luego acomodarlos en el esquema que antes tenía construido, es decir, crear al final una reorganización del conocimiento nuevo y el previo. 43 Así pues, esta teoría de situaciones permite diseñar y explorar un conjunto de secuencias de clases concebidas por el profesor (o investigador) con el fin de disponer de un medio para desarrollar un proyecto de aprendizaje. 3.1. SITUACIONES DIDÁCTICAS Y A-DIDÁCTICAS Actualmente, se considera al profesor como un profesional reflexivo, quien decide, diseña, implementa y experimenta estrategias de acción para lograr el aprendizaje de los alumnos. De manera que, aprender matemáticas no se reduce a recordar fórmulas matemáticas y teoremas, o definiciones para resolver problemas, mediante la imitación de las explicaciones del profesor en clase o con apego a los métodos ilustrados en los textos escolares. La teoría de las situaciones didácticas propone el estudio de las condiciones en las cuales se constituyen los conocimientos matemáticos; y se considera que el control de esas condiciones permitirá reproducir y optimizar los procesos de adquisición escolar del conocimiento. Se parte de la base que, el conocimiento de los fenómenos relativos a la enseñanza de las matemáticas no es resultado de la simple fusión de conocimientos provenientes de dominios independientes, como lo son las matemáticas, la psicología y la pedagogía, sino que requiere investigaciones específicas. Por otra parte, la investigación de los fenómenos relativos a la enseñanza de las matemáticas tampoco puede reducirse a la observación y análisis de los procesos que tienen lugar cotidianamente en las aulas, puesto que su objetivo es la determinación de las condiciones en las que se produce la apropiación del saber por los alumnos. Para esto, necesita ejercer cierto grado de control sobre ellas, lo que implica su participación en la producción (o diseño) de las situaciones didácticas que analiza, ya que con esta interacción (investigador-alumno, situación) los resultados podrán ser mejor estudiados e interpretados. La presencia de un 44 contexto escolar no es esencial en la definición de una situación didáctica; lo que sí es esencial es su carácter intencional, el haber sido construido con el propósito explícito de que alguien aprenda algo; en nuestro caso, el propósito reside en construir un concepto estadístico y sus propiedades, asignándole significado. Uno de los objetivos de la didáctica de la matemática, es averiguar cómo funcionan las situaciones didácticas, es decir, cuáles de las características de cada situación resultan determinantes para la evolución del comportamiento de los alumnos y, subsecuentemente, de sus conocimientos. Esto no significa que sólo le interese analizar las situaciones didácticas exitosas. Incluso si una situación didáctica fracasa en su propósito de enseñar, su análisis puede constituir un aporte a la didáctica, si permite identificar los aspectos de la situación que resultaron determinantes de su fracaso. Para analizar las situaciones didácticas, en la teoría se modelan utilizando elementos de la teoría de juegos y de la teoría de la información. Para una situación didáctica determinada se identifica el estado inicial y el conjunto de los diversos estados posibles, entre los que se encuentra el estado final que corresponde a la solución del problema involucrado en la situación. Se hacen explícitas las reglas que permiten pasar de un estado a otro. La situación se describe, entonces, en términos de las decisiones que los alumnos pueden tomar en cada momento y de las diferentes estrategias que pueden adoptar para llegar al estado final (análisis a priori de la situación). Dentro de las situaciones didácticas existe otra llamada a-didáctica la cual se da mediante la interrelación entre los elementos del triángulo didáctico y el proceso en el que el docente le plantea al alumno un problema que se parezca a una situación de la vida real que podrá abordar a través de sus conocimientos previos, y que le permitirán generar hipótesis y conjeturas que asemejen el trabajo que se realice en una comunidad científica. En otras palabras, el alumno se verá en una micro-comunidad científica resolviendo situaciones sin la intervención directa del docente, con el propósito posterior de institucionalizar el saber adquirido (Chavarría, 2006). A diferencia de la situación didáctica, la situación a-didáctica carece de intencionalidad, ya que no ha sido creada con la finalidad de que el alumno aprenda o construya un saber. 45 Las situaciones a-didácticas se clasifican, entre las situaciones que se producen para su estudio experimental, cuatro tipos cuya secuencia en los procesos didácticos que organiza es la siguiente: 1. Las situaciones de acción, en la que se genera una interacción entre los alumnos y el medio físico. Los alumnos deben tomar las decisiones que hagan falta para organizar su actividad de resolución del problema planteado. 2. Las situaciones de formulación, cuyo objetivo es la comunicación en informaciones entre los alumnos. Para esto deben modificar el lenguaje que utilizan habitualmente, precisándolo y adecuándolo a las informaciones que deben comunicar. 3. Las situaciones de validación, en las que se trata de convencer a uno o varios interlocutores de la validez de las afirmaciones que se hacen. En este caso, los alumnos deben elaborar pruebas para demostrar que lo que dicen es cierto; hay que explicar que necesariamente tiene que ser así, es decir, justificar lo que se hizo para llegar al resultado. 4. Las situaciones de institucionalización, destinadas a establecer convenciones sociales. En estas situaciones se intenta que el conjunto de alumnos de una clase asuma la significación socialmente establecida de un saber que ha sido elaborado por ellos en las situaciones pasadas. Originalmente, la teoría de situaciones considera a las primeras tres como parte de ella, pues se encuentran enfocadas en el alumno, ya que es él quien las desarrolla durante la experimentación y, la última, se da por parte del profesor, pues regula todas las situaciones y es quien consensua, junto con los estudiantes, los resultados. Ahora, una parte importante del análisis de una situación didáctica lo constituye la identificación de las variables didácticas y el estudio tanto teórico como experimental de sus efectos. Lo que interesa son los intervalos de valores de estas variables que son determinantes para la aparición del conocimiento, que la situación didáctica pretende enseñar. Se trata de precisar las condiciones de las que depende que sea ese el conocimiento que interviene y no otro. Entre las variables que intervienen en una situación se tienen las denominadas variables de comando, que pueden ser manipuladas por el maestro para evolucionar los comportamientos de los alumnos. Su identificación resulta particularmente importante. 46 El análisis de una situación didáctica pasa por su comparación con otras situaciones didácticas, obtenidas mediante transformaciones de la primera. Por ejemplo, el esfuerzo de modelación de una situación didáctica está subordinado al propósito de identificar los elementos que podrían variarse para lograr efectos didácticos diferentes de los que se obtendrían con la situación original. Se constituye así toda una familia de situaciones didácticas relativas a un conocimiento específico, con la hipótesis de que cada una de ellas hará funcionar dicho conocimiento bajo una modalidad diferente. Se postula que entre estas situaciones existe una, a la que se designa como situación fundamental, que es capaz de engendrar a todas las demás, a través de la asignación de diversos rangos de variación o valores particulares a las variables que las caracteriza. Una situación es fundamental con respecto del conocimiento que interesa enseñar, cuando es posible, mediante el juego de las variables presentes en ella, hacerla coincidir con cualquier situación en la cual intervenga ese conocimiento. De este modo el empleo de las situaciones didácticas no plantea, de ninguna manera, promover a priori un cierto tipo de pedagogía, por razones ideológicas sin el respaldo de los resultados experimentales correspondientes. Sin embargo, las situaciones diseñadas y sometidas a experimentación obedecen a ciertas características, en función de los presupuestos epistemológicos subyacentes a su producción. En efecto, se considera que todo conocimiento es una respuesta, una adaptación que la humanidad ha logrado ante situaciones que ha enfrentado o ante problemas que se ha planteado. Los conocimientos que han surgido en contextos funcionales como instrumentos para la adaptación, son transformados posteriormente con el propósito de relacionarlos con otros conocimientos, de conservarlos y transmitirlos, adoptando la modalidad de objetos culturales. Un saber cultural que se encuentra desligado de su génesis constituye un producto descontextualizado y despersonalizado. Es a partir de esta modalidad que los conocimientos ingresan a los programas escolares y es allí donde se contextualizan, los personaliza el profesor para que sea adquirido por el alumno, para luego éste descontextualizarlo y despersonalizarlo, Chevallard (1997). La forma como los sistemas educativos organizan la enseñanza de los temas incluidos en los programas escolares implica una determinada concepción de los procesos de adquisición de los conocimientos. Hasta la fecha, ha predominado una concepción según la cual, basta con 47 descomponer un saber en su modalidad cultural, en pequeños trozos aislados y luego organizar su ingestión por los alumnos en períodos breves y bien delimitados, según secuencias determinadas sobre la base del análisis del propio saber. Esta manera de organizar la enseñanza no atribuye importancia al contexto específico, a la situación específica, donde los conocimientos se adquieren, tampoco a su significación y valor funcional, durante su adquisición. Este planteamiento se apoya en la tesis de que, la persona que aprende necesita construir por sí mismo sus conocimientos mediante un proceso adaptativo similar al que realizaron los productores originales de los conocimientos que se quiere enseñar. Se trata, entonces, de producir una génesis artificial de los conocimientos, de que los alumnos aprendan haciendo funcionar el saber, o más bien, de que el saber aparezca para el alumno como el medio de seleccionar, anticipar, ejecutar y controlar las estrategias que aplica a la resolución del problema planteado por la situación didáctica. Las situaciones a-didácticas nos ayudarán en la investigación para lograr que el estudiante interactúe con el medio responsabilizándose del problema, pues se espera la participación activo por parte de éste, llevando a cabo una interacción profesor-alumno, alumno-alumno, durante la explicación de sus procedimientos, la argumentación de sus decisiones y elecciones así como la institucionalización de los saberes matemáticos de media aritmética y mediana. Otro punto muy importante para la construcción de los conceptos de media aritmética y mediana es que, durante las fases de comunicación y validación los alumnos tendrán que exponer los resultados a los que llegaron y los caminos que tomaron, así como los distintos significados atribuidos a las medidas de posición central y la generalización que logren crear. Se espera desarrollar en el estudiante, para la justificación en la elección de la media aritmética y mediana como mejores representantes de un conjunto de datos, argumentos sobre la variación de los datos al precisar quién cambia, como cambia y porqué cambia; sobre el comportamiento que las mismas variaciones presentan, ya sea mediante una descripción escrita acompañada de sus representaciones gráficas, explicadas con movimientos de las manos en donde simulen el comportamiento que describen las gráficas; y la toma de decisiones para la predicción de ciertos sucesos a partir de sus justificaciones. 48 Al final, en la fase de institucionalización, se llegarán a los consensos finales de cada uno de los conceptos matemáticos construidos, así como los significados considerados como válidos sobre las medidas de posición central, su propiedad de representatividad y las generalizaciones finales, pues durante las tres primeras fases han quedado justificados cada uno de los pasos que fueron empleados en la construcción de los de los algoritmos de la media aritmética y mediana, durante la interacción con la situación y su validación. 3.2. METODOLOGÍA DE INVESTIGACIÓN: INGENIERÍA DIDACTICA La noción de Ingeniería Didáctica surgió en la didáctica de las matemáticas a principios de los años ochentas. Se denominó con este término a una forma de trabajo didáctico equiparable con el trabajo del ingeniero quien, para realizar un proyecto determinado, se basa en los conocimientos científicos de su dominio y acepta someterse a un control de tipo científico. Sin embargo, al mismo tiempo, se encuentra obligado a trabajar con objetos mucho más complejos que los depurados de la ciencia, pues son distintos y pueden reaccionar de distinta manera a las esperadas, y se tiene que abordar prácticamente con todos los medios disponibles, problemas de los que las ciencias no quieren o no puede hacerse cargo. La atención de la ingeniería didáctica se centra en definir el problema de la acción y de los medios de la acción, sobre el sistema de enseñanza, debemos de centrarnos en cuáles son los problemas y los medios que son empleados durante el proceso de enseñanza y aprendizaje que se dan en el aula con respecto a las matemáticas; lo esencial es enlazar dos momentos del proceso científico-técnico (la investigación y acción) para reducir el significado de cada uno, así, uno se deshará de las restricciones que se encuentra en todo proceso de investigación, al responder que la acción prima. La acción “implementada” se presentará como “investigación” la cual escapará al juicio de valor al que sometemos a la más trivial de nuestras acciones. 49 La noción de ingeniería didáctica trazó su camino en el edificio de la didáctica con la doble función de desprenderse de las relaciones entre investigación y acción, pensadas en términos de innovación, para afirmar la posibilidad de una acción racional sobre el sistema y de resaltar la importancia de la “realización didáctica” en clase como práctica investigativa, tanto por razones vinculadas al estadio de la juventud de la investigación didáctica, como para responder a necesidades permanentes de poner en práctica las construcciones teóricas elaboradas, por lo que llega a significar tanto unas producciones para la enseñanza, basadas en resultados de investigaciones que han utilizado otras metodologías como una metodología de investigación específica. Como metodología de investigación, la ingeniería didáctica se caracteriza en primer lugar por un esquema experimental basado en las “realizaciones didácticas” en clase, es decir, sobre la concepción, realización, observación y análisis de secuencias de enseñanza. La metodología de la ingeniería didáctica se caracteriza también, en comparación con otros tipos de investigación basados en la experimentación en clase, por el registro en el cual se ubica por las formas de validación a las que está asociada. De hecho, las investigaciones que recurren a la experimentación en clase se sitúan por lo general dentro de un enfoque comparativo con validación externa, basada en la comparación estadística del rendimiento de grupos experimentales y grupos de control. Este es el caso de la ingeniería didáctica que se ubican por el contrario, en el registro de los estudios de caso y cuya validación es en esencia interna, basada en la confrontación entre el análisis a priori y a posteriori. Los objetivos de una investigación de ingeniería didáctica pueden ser diversos, por ejemplo, se encuentran las investigaciones que abordan el estudio de los procesos de aprendizaje de un concepto determinando y en particular la elaboración de génesis artificiales para un concepto determinado, de aquellas que no se ciñen a los contenidos, así su sustento sea la enseñanza de un dominio preciso, como por ejemplo, sobre el aprendizaje de métodos y el trabajo en grupo (Marilier, Robert, Tenaud, 1987, citados por Artigue, 1995), otros apuntan al dominio paramatemático (Chevallard, 1997) es decir, aquel que las nociones que, como aquellas de parámetro, ecuación, demostración, guardan un estatus de herramienta en la enseñanza, al menos en un nivel determinado, o incluso trabajos que abordan el estudio y la aplicación de 50 estrategias didácticas globales como por ejemplo “el problema abierto” o “el debate científico”. Por lo tanto, la ingeniería didáctica es singular no por los objetivos de las investigaciones que entran en sus límites, sino por las características de su funcionamiento metodológico. Dicha metodología se encuentra delimitada por un proceso de cuatro fases: • Análisis preliminar • Concepción y análisis a priori • Experimentación • Análisis a posteriori y evaluación En una investigación de ingeniería didáctica, la fase de análisis preliminar se basa no sólo en un cuadro teórico general y en los conocimientos didácticos previamente adquiridos en el campo de estudio, sino también en un determinado número de análisis preliminares. Entre los más frecuentes se encuentran: • El análisis epistemológico de los contenidos contemplados en la enseñanza • El análisis de la enseñanza tradiciones y sus efectos • El análisis de las concepciones de los estudiantes, de las dificultades y obstáculos que determinan su evolución • El análisis del campo de restricciones donde se va a situar la realización didáctica efectiva • Y, por supuesto, todo lo anterior se realiza teniendo en cuenta los objetivos específicos de la investigación Para los fines de nuestra investigación, solamente nos centraremos en los tres primeros análisis mejor conocidos como epistemológico, cognitivo y didáctico. En la fase de concepción y análisis a priori, el investigador toma la decisión de actuar sobre un determinado número de variables del sistema no fijadas por las restricciones. Estas son las variables de comando que él percibe como pertinentes con relación al problema estudiado. Dichas variables se encuentran ligadas a las de la teoría de las situaciones didácticas por lo que al nombrar a las del sistema, las de comando ya se encuentran definidas. 51 Existen dos tipos de variables de comando: • Las variables macro-didácticas o globales, concernientes a la organización de la ingeniería • Y las variables micro-didácticas o locales, concernientes a la organización local de la ingeniería, es decir, la organización de una secuencia o de una fase Tanto unas como otras pueden ser en sí variables generales o dependientes del contenido didáctico en el que se enfoca la enseñanza. Sin embargo, en el nivel micro-didáctico esta segunda distinción es clásica, ya que se diferencian las variables asociadas con el problema de las variables asociadas con la organización y la gestión del “medio”. Y entre estas, las variables didácticas son aquellas cuyo efecto didáctico se ha corroborado. Ligado a la teoría de situaciones didácticas, se tiene que el objetivo del análisis a priori es determinar en qué selecciones hechas permiten controlar los comportamientos de los estudiantes y su significado, es por ello que este análisis se basa en un conjunto de hipótesis de trabajo. La validación de estas hipótesis está, en principio, indirectamente en juego en la confrontación que se lleva a cabo en la cuarta fase, entre el análisis a priori y el análisis a posteriori. Su parte descriptiva y predictiva se centran en las características de situación a-didáctica que se ha querido diseñar y que se va a tratar de llevar a los alumnos: • Se describen las selecciones del nivel local (relacionándolas eventualmente con las selecciones globales) y las características de la situación didáctica que de ellas se desprenden • Se analiza qué podrá ser lo que está en juego en esta situación para un estudiante en función de las posibilidades de acción, de selección, de decisión, de control y de validación de las que él dispone, una vez puesta en práctica en un funcionamiento casi aislado del profesor • Se prevén los campos de comportamientos posibles y se trata de demostrar cómo el análisis realizado permite controlar su significado y asegurar, en particular, que los comportamientos esperados, si intervienen, sean resultado de la puesta en práctica del conocimiento contemplado por el aprendizaje 52 En la fase de experimentación, tres, se lleva a cabo la puesta en escena de las situaciones didácticas en donde el investigador podría tomar el papel de sólo observador o de participante, pero en la segunda existe el riesgo de que sus perspectiva se vea afectada por su subjetividad al igual que la participación de la muestra pues estos pueden llegar a sentirse cohibidos. En la fase de análisis a posterior, se basa en el conjunto de datos recogidos a lo largo de la experimentación, a saber, las observaciones realizadas de las secuencias de enseñanza, al igual que las producciones de los estudiantes en clase o fuera de ella. Estos datos se completan con frecuencia con otros obtenidos de la utilización de metodologías externas, como cuestionarios, entrevistas individuales o en pequeños grupos, aplicadas en distintos momentos de la enseñanza o durante su transcurso y es en la confrontación de los dos análisis, el a priori y a posterior, donde se fundamentan en esencia la validación de las hipótesis formuladas durante la investigación. En el siguiente apartado presentamos el análisis preliminar de los conceptos estadísticos media aritmética y mediana, comenzando por el epistemológico, seguido del cognitivo y por último del didáctico, para más adelante poder realizar el análisis a priori y la creación de las hipótesis de trabajo. 53 CAPÍTULO IV. DISEÑO DE LAS SITUACIONES DIDÁCTICAS SOBRE LA MEDIA ARITMÉTICA Y LA MEDIANA Introducción En este capítulo exponemos la primera fase de la Ingeniería Didáctica, la cual consiste en el análisis preliminar de la investigación en donde se realizan tres tipos de análisis: • El epistemológico • El cognitivo • El didáctico De estos análisis obtendremos las prácticas que generaron el desarrollo de los conceptos de media aritmética y mediana, los errores y dificultades que presentan los estudiantes durante su tratamiento en el aula y los procesos didácticos que son empleados por el profesor, los libros de textos y que son plasmados en los currículos escolares. 4.1. ANÁLISIS EPISTEMOLÓGICO En este análisis, se pretendió identificar cuáles fueron las prácticas y necesidades que le dieron origen a la media aritmética, así como los distintos cambios que sufrió con el pasó el tiempo. El reconocimiento de tales prácticas, fue un referente en el diseño de las actividades de la propuesta, siendo el andamio para la construcción del concepto y la asignación de un significado. 54 4.1.1. Acerca de la media aritmética y el tratamiento de la información en la antigüedad En la antigüedad, los astrónomos Babilonios asentaron en tablillas de arcilla (figura 2), registros sobre los movimientos de los astros y planetas, resolviendo un problema de estimación mediante el cálculo de la suma total de las observaciones y dividiéndolo por el número de datos (Plackett, 1970). Figura 2. Registro del movimiento de los astros realizada por los astrónomos babilonios 3 Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto, esto debido a que el nivel del río Nilo subieron y grandes extensiones de tierra que se encontraban a su alrededor se fueron perdiendo. Los griegos también efectuaron censos, pero de manera periódica, estos con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). Una investigación histórica ha revelado que se realizaron 69 censos para calcular impuestos, determinar los derechos de voto y ponderar la potencia de guerra. 3 Figura recuperada de la página web: http://www.astroyciencia.com/2007/06/19/tablillas-babilonicas/ 55 En esta misma época, los pitagóricos realizaron una teoría aritmética, la cual consiste en calcular valores medios o promedios de una serie de números, distinguiendo tres casos: la media aritmética, la media geométrica y la media armónica. Se dice que, tomándola prestada de los babilonios, introdujeron en Grecia la proporción más perfecta Donde 1979). 𝑎𝑎+𝑏𝑏 2 𝑎𝑎 2𝑎𝑎 = 𝑎𝑎 + 𝑏𝑏 𝑎𝑎 + 𝑏𝑏 2 𝑏𝑏 es la media aritmética de a y b, y 2𝑎𝑎𝑎𝑎 𝑎𝑎+𝑏𝑏 es la media armónica de a y b, (Collette, También, en épocas pasadas, cuando las tormentas en el mar causaban en las embarcaciones la pérdida de bienes, estos tenían que ser pagados mediante un acuerdo de todos los que tenían mercancía en el mismo buque. El daño causado por estas tormentas al cargamento se le conocía como “havaria” y la palabra llegó a aplicarse naturalmente al dinero que cada individuo tenía que pagar como compensación. De esta palabra latina se deriva la palabra avarage (promedio), (Newman, 1968). La idea de promedio tiene sus raíces, por lo tanto, en una clase primitiva de seguros, de modo que se compartía el riesgo, no sólo entre los que arriesgaban sus bienes en un viaje particular, sino entre grupos mayores de comerciantes. La distribución de este riesgo se desarrollo, más tarde, eventualmente en una profesión aparte, lucrativa y experimentada. El algoritmo de la media aritmética consiste en sumar todos los datos y dividirlo entre el número total de estos, lo que conlleva a realizar una repartición equitativa, tal y como hicieron los babilonios para estimar o predecir la posición de los astros y estrellas, los pitagóricos al crear su teoría aritmética o las civilizaciones que se dedicaban a la transportación marítima de cargamentos, por lo que fueron los primeros en realizar la construcción del algoritmo. En 1669, Huygens, extraído de Michael y Denis (2007), realizó el primer gráfico (figura 2) de una función continua y la demostración de cómo calcular el promedio de vida restante de una persona de cierta edad. 56 Figura 3. Gráfico del promedio de vida de una persona de cierta edad 4 La práctica que comúnmente se empleo en la antigüedad y que en nuestros días aún se hace presente, ya sea al calcular el promedio de calificación en la escuela, la cantidad de platillos para los niños que asistirán a una fiesta, etc., es la repartición equitativa, la cual emplearemos para lograr la construcción de una noción y del algoritmo de la media aritmética. Se espera que, mediante el tratamiento de información, se analice variación de los datos de un conjunto con respecto a los valores de medidas de posición central, a fin de poder construir la propiedad de representatividad de la media aritmética. 4.2. ANÁLISIS COGNITIVO Respecto a la cognición del estudiante, se analizaron cuáles son aquellas dificultades, errores y concepciones que los alumnos tienen y adquieren en el tratamiento escolar de los conceptos estadísticos, en particular, sobre la media aritmética y mediana. 4 Figura recuperada de la página web: http://euclid.psych.yorku.ca/SCS/Gallery/images/huygens-graph.gif 57 4.2.1. Dificultades y errores en el estudio de la media aritmética y mediana Sobre la comprensión de las medidas de posición central, Batanero (2001) hace una recopilación de diversas investigaciones, con la finalidad de presentar los distintos errores y dificultades que los alumnos exhiben después del proceso de enseñanza y aprendizaje. En estas investigaciones se reportan errores sobre la propiedad de representatividad de las medidas de posición central, el tratamiento de la información y el uso de gráficos, teniendo como factor influyente la metodología adoptada por el profesor para su enseñanza de los cuales, consideramos aquellas relacionadas con los conceptos media aritmética y mediana para la realización de la propuesta didáctica. Investigaciones desarrolladas en torno al concepto de media, muestran que no es un concepto tan simple como aparenta. Pollatsek, Lima y Well (1981), citados por Batanero (2001), reportaron que estudiantes universitarios no ponderan adecuadamente un conjunto de valores y, en ocasiones, emplean la media simple en vez de la media ponderada, dado que no fueron capaces de distinguir en qué situaciones deben calcular una u otra media. Al respecto, Li y Shen (1992), citados por Batanero (2001), indican que cuando los datos se agrupan en intervalos, los estudiantes olvidan con frecuencia que cada uno de estos grupos, deberían de ponderarse de modo distinto al calcular la media. Cai (1995), citado por Batanero (2001), muestra que, muchos estudiantes de 12-13 años aplican mecánica y correctamente el algoritmo de la media pero, al momento de tener que determinar un valor desconocido de un conjunto de datos con una media dada, sólo lo podían realizar unos cuantos. Una forma de poder calcular dicho valor, podría ser mediante el ensayo y error de forma indefinida, hasta encontrar aquel que satisfaga el valor de la media dada. Otros errores sobre las medidas de posición central, son descritos por Carvalho (1998), citado por Batanero (2001), al analizar las producciones escritas por un grupo de alumnos: • Moda: tomar la mayor frecuencia absoluta • Mediana: no ordenar los datos, calcular el dato central de las frecuencias absolutas ordenadas de forma creciente, calcular la moda en vez de la mediana y equivocarse al calcular el dato central 58 • Media: hallar la media de los valores de las frecuencias y no tener en cuenta la frecuencia absoluta de cada valor en el cálculo de la media Para el caso de la mediana, el algoritmo es distinto al de la media aritmética, pudiendo resultar complejo para el alumno, pues depende si el número total de los datos es par o impar (Cobo y Batanero, 2000). Por su parte, Gatusso y Mary (1998), citados por Batanero (2001), han estudiado la comprensión del algoritmo del cálculo de la media ponderada, y detectaron como variables que afectan la dificultad en la resolución de tareas: el formato (tabla, gráfica, serie de números), si los valores de las variables son o no mucho mayores que los de las frecuencias (lo que influye en que el alumno discrimine los dos conceptos) y si una suma de las frecuencias es mucho mayor que en las otras (de modo que se fuerza al estudiante a tener en cuenta las frecuencias). Para Gattuso y Mary (1996), citados por Batanero (2001), la comprensión conceptual no va paralela al número de años de instrucción en la materia en cuestión. Analizando las respuestas de estudiantes de secundaria y universitarios, con o sin instrucción previa sobre la media, los autores observaron que las estrategias preferidas por los estudiantes de mayor edad eran más algebraicas y además obtenían mejores resultados cuando calculaban medias de conjuntos de datos agrupados, mientras que los estudiantes más jóvenes preferían usar el conjunto de datos sin agrupar, aunque mostraron un nivel de éxito superior en los problemas de cálculo "inversos", es decir, aquéllos en los que se conoce la media y se deben averiguar algunos de los datos iniciales. Con respecto a las concepciones de los profesores, diversas investigaciones han arrojado que presentan dificultades en el tratamiento de los ceros y valores atípicos en el cálculo de promedios, posiciones relativas de media, mediana y moda en distribuciones asimétricas, elección de la medida de posición central más adecuada en una determinada situación y el uso de los promedios en la comparación de distribuciones (Batanero y cols., 1997, citados por Batanero (2001)). La conclusión que nos aporta, es que la enseñanza de los conceptos basada en la definición algorítmica y el cálculo, en colecciones de datos descontextualizados, no permite que el alumno llegue a una comprensión integral del concepto promedio. 59 De modo que, proponer el algoritmo de cálculo prematuramente, puede influir negativamente en la comprensión de los conceptos estadísticos, al no propiciar que sea el estudiante, quien construya su conocimiento por sí mismo, ocasionando que no le atribuya significado alguno. De esto Mevarech (1983), citado por Batanero (2001), dando una explicación posible a los errores descritos por Pollatsek (1981), citado por Batanero (2001), de que los estudiantes suelen creer que un conjunto de números, junto con la operación media aritmética constituye un grupo algebraico, satisfaciendo los cuatro axiomas: de clausura, asociatividad, elemento neutro y elemento inverso; incluso a observado que estudiantes universitarios piensan que la media tiene propiedad asociativa. Como profesores sabemos que los estudiantes, al estudiar por primera vez la media o media aritmética, mediana y moda, ya conocen ciertas operaciones aritméticas como la suma y multiplicación, por lo que ellos, inconscientemente, extrapolan las propiedades de dichas operaciones algebraicas a los conceptos de media aritmética y mediana. Por ello Strauss y Bichler (1988), citado por Batanero (2001), investigaron el desarrollo evolutivo de la comprensión de la noción de media, en alumnos de 8 a 12 años, distinguiendo las siguientes propiedades: a) La media es un valor comprendido entre los extremos de la distribución b) La suma de las desviaciones de los datos respecto de la media es cero, lo que hace que sea un estimador insesgado. c) El valor medio está influenciado por lo valores de cada uno de los datos. Por ello la media no tiene valor cero. d) La media no tiene por qué ser igual a uno de los valores de los datos. e) El valor obtenido de la media puede ser una fracción. f) Hay que tener en cuenta los valores nulos en el cálculo de la media. g) La media es un “representante” de los datos a partir de los que ha sido calculada No se encontraron efectos significativos respecto al tipo de datos o medio de presentación empleado, sugieren una mejora de la comprensión con la edad, y diferencias sobre las 60 dificultades en la comprensión de las propiedades, siendo más fáciles las a, c y d, que las b, e, f y g; aunque algunos estudiantes no tenían en cuenta el cero para calcular la media, o bien suponían que la media podría estar fuera del rango de variación de la variable, o que debería coincidir con uno de los valores de los datos. León y Zawojewsky (1991), citados por Batanero (2001), al realizar entrevistas a niños entre 8 y 14 años y analizando el efecto de la edad sobre la comprensión de estas propiedades, encontraron una importante influencia de la edad sobre la comprensión de la media, y que la contextualización de las tareas facilita mucho su resolución, pero propiedades tales como que la suma de desviaciones respecto a la media es cero, que la media es un calor representativo de los valores promedios o que hay que tener en cuenta los valores nulos en el cálculo de la media, continuaron siendo demasiado abstractas para una proporción importante de alumnos de 14 años. La idea de representante de un conjunto de datos, es importante en las aplicaciones prácticas. Como indican Mokros y Rusell (1995), citados por Batanero (2001), hasta que los niños no conciben el conjunto de datos como un todo, y no como un agregado de valores, no podrán comprender las ideas de resumen de los datos o representante de ellos, que refiere al conjunto global y no a ninguno de los valores aislados. La idea de representatividad no es inmediata, antes de llegar a ella los alumnos deben de captar la idea del conjunto de datos como una unidad. En cuanto a la representatividad, se sabe que la media es un valor “típico” o “representativo de los datos” y debido a ello, según Campbell (1974), citado por Batanero (2001), se tiende a situar la media en el centro del recorrido de la distribución, propiedad que es cierta para distribuciones simétricas. Esto no siempre es comprendido por algunos alumnos, quienes invariablemente eligen la media como mejor representante de los datos, sin cuestionarse si realmente será el mejor representante, al no tener en cuenta la simetría de la distribución o la existencia de valores atípicos. Respecto a la comprensión de la mediana, Barr (1980), citado por Batanero (2001), indica que los alumnos entienden que ésta es el centro de algo, pero no siempre comprenden a qué se refiere ese algo, porque no comprenden realmente que una tabla de frecuencias es un resumen 61 de los datos y no son capaces de pasar de la tabla a la lista de valores, que es una representación alternativa de ellos. Incluso, si se les dan los datos en forma de lista, no entienden por qué hay que ordenarlos para calcular la mediana, es decir, no lo consideran como un estadístico que se refiere al conjunto ordenados de los datos. Pollatsek y cols. (1981), citado por Batanero (2001), al aplicar un problema a estudiantes universitarios en donde se les pide determinar el dato faltante, reportaron que fueron pocos quienes dieron una respuesta correcta, y que, generalmente se busca un valor de la puntación del quinto dato tal que, sumada a las cuatro anteriores, dé un promedio dado. Observaron que los estudiantes esperan que la media de la muestra sea idéntica a la de la población, es decir, no aprecian la variabilidad aleatoria de la misma. Russell y Mokros (1991), citado por Batanero (2001), estudiaron las concepciones que los alumnos de cuarto a octavo de primaria (equivalentes en México de cuarto a sexto grado de primaria, el primer y segundo año de secundaria) que tienen sobre los valores de tendencia central aplicándoles tareas sobre, dado un conjunto de datos, comprender la necesidad de emplear un valor central, construir un conjunto de datos que tenga un promedio dado y comprender el efecto que, sobre los promedios, tiene un cambio en todos los datos o parte de ellos, resultando para los estudiantes más difícil la segunda. Los errores y dificultades que se han reportados con anterioridad muestran que no se está llevando a cabo una culturización estadística hacia la sociedad, porque, uno de los objetivos que persigue la educación estadística, es la capacidad de argumentación por parte de los estudiantes. Es por ello que tomar decisiones, hacer inferencias, argumentar, dificultades presentes en los alumnos ante situaciones de incertidumbre. La causa de esto podría ser el miedo, la inseguridad, la falta de conocimiento y preparación, los cuales se deben de combatir en el aula de clases mediante la participación activa del estudiante y su exposición con situaciones reales el cual le lleve a tener que recolectar, analizar, interpretar y dar a conocer y validar el trabajo que se encuentra realizando. Si los conocimientos que los alumnos “aprendieron”, carecen de significados propios o se quedaron como una simple interpretación del poco entendimiento que lograron hacer, la argumentación de los resultados que obtenga no tendrán sentido alguno o serán incorrectos. 62 Entre las investigaciones sobre el significado de los conceptos, están las de Russell y Mokros (1991), citados por Batanero (2001), quienes clasificaron en cuatro categorías los significados incorrectos atribuidos por los estudiantes a la palabra “media”: valor más frecuente (confusión con la moda), valor razonable (significado coloquial del término), punto medio (confusión con la mediana) y algoritmo (significado restringido donde a la media se ve sólo como el algoritmo de cálculo). Cada uno de estos aspectos puede ser cierto en un caso dado, pero falso en otro. Es por ello que señalan la necesidad de usar diferentes contextos y representaciones en la enseñanza de un concepto matemático. También influye la forma en que se es redactado un problema, ya que uno podría confundirse con la terminología entre las palabras “media”, “mediana” y “moda”. Reading y Pegg (1996), citados por Batanero (2001), estudiando la forma en que los niños de grados 7 a 12 reducen los conjuntos de datos, observaron que algunos que eran capaces de dar un resumen de los datos presentados en forma numérica, fracasaron en la tarea cuando los datos se presentaban por medio de un gráfico estadístico. También observaron que los niños mostraban dificultades a la hora de dar un argumento o justificar su respuesta de por qué elegía un cierto promedio. Para finalizar, Estapa y Batanero (1999), citado por Batanero (2001), concluyen que algunos alumnos del curso preuniversitario, basan sus argumentos en teorías previas en lugar de hacerlo en los datos, es decir, tienen mayor influencia las situaciones, experiencias vividas o información antes obtenida, que a la vez podría ser parte del conjunto de datos, en vez de realizar un análisis objetivo de los datos. Después de la realización de un análisis de carácter cognitivo, consideramos tres dificultades a tratar en la situación didáctica propuesta, que son de las más comunes durante el tratamiento de las medidas de posición central, a saber: el efecto que sufren los valores centrales cuando contienen algún valor atípico o cero, la inversión del algoritmo de la media aritmética y sobre la propiedad de representatividad. Tales dificultades, imposibilitan que el alumno comprenda qué es la media aritmética y la mediana y, como medida, cuál va a ser un mejor representante del conjunto de datos. 63 4.3. ANÁLISIS DIDÁCTICO El análisis didáctico se encuentra asociado a las características del funcionamiento del sistema de enseñanza. En este trabajo, nos centramos en analizar, el tratamiento de los conceptos media aritmética y mediana, llevado a cabo en los libros de texto del nivel básico y medio, con la intención de contrastarlo con su organización en el currículo, donde nos percatamos que la secuencia del tratamiento de los conceptos estadísticos es: definición, ejemplos y ejercicios. 4.3.1. Tratamiento de la media aritmética y mediana en los libros de texto 4.3.1.1. Libros con contenidos estadísticos del nivel básico: Secundaria La estadística es trabajada en el aula desde los niveles básicos hasta el profesional y se encuentra ligada al tratamiento de la información. Resulta que la estadística es primordial en la vida diaria, ya que los gráficos son empleados a cada momento para la información de resultados, propuestas, etc., en los cuales se necesita realizar una lectura de ellos, así como de su construcción, para poder inferir, predecir y tomar decisiones. Empezaremos con el análisis didáctico hecho al programa de secundaria 2006 propuesta en la reforma educativa presentando algunos de los ejercicios propuestos para los alumnos junto con sugerencias que el profesor podría emplear para la superación de ciertas “dificultades” durante su resolución: Si una vela de 25 cm de altura dura encendida 50 horas: ¿Cuánto tiempo duraría encendida otra vela del mismo grosor, de 12 cm de altura? Si los alumnos tienen dificultades para resolver este problema, el maestro puede ayudarles planteando las siguientes preguntas: 64 • ¿Cuánto duraría una vela de 1 cm? • ¿Cuánto duraría una vela de 10 cm? • ¿Y una de 11 cm? • Tres amigos obtienen un premio de $1 000.00 en la lotería. ¿Cómo deben repartírselo según lo que gastó cada uno si uno de ellos puso $12.00, el otro $8.00 y el tercero $15.00? Una variante del problema anterior, donde deben hacerse algunos cálculos para obtener la información necesaria, sería ésta: • Supongan ahora que el premio es de $1 500.00; si uno de ellos aportó una séptima parte del costo del billete y los otros dos amigos, el resto en partes iguales, ¿qué cantidad le corresponden a cada uno, si reparten el premio proporcionalmente? Se sugiere buscar ejemplos que consideren diversos contextos culturales. • Los lados de un triángulo miden respectivamente 5, 8 y 11 cm. Si en un triángulo hecho a escala de éste, el lado correspondiente a 5 cm mide 8 cm, ¿cuánto deben medir los otros dos lados? En caso de que en el grupo no surja el uso del factor de proporcionalidad, que en este caso es 8/5, por el cual se puede multiplicar las medidas originales para obtener las nuevas medidas, el profesor puede sugerir este procedimiento y solicitar a los alumnos que lo prueben con otros problemas similares. Con estos ejemplos se busca que el alumno halle un valor faltante de manera directa y que emplee procedimientos de repartición equitativa para la resolución de problemas, procesos que serán esenciales para entender el concepto de media aritmética. La razón de cambio de un fenómeno o situación representada en una línea recta es siempre la misma y está relacionada con la inclinación de dicha recta. • La gráfica muestra el costo del servicio telefónico en dos compañías. 65 Figura 4. Gráfica del costo de servicio telefónico de dos compañías ¿Son distintos los incrementos en el costo por llamada telefónica en una y otra compañía? ¿Por qué el costo por 100 llamadas telefónicas es el mismo en las dos compañías telefónicas? ¿Cuál es el incremento en el costo de 50 a 100 llamadas en la compañía A? ¿Y en la B? ¿Cuál es el incremento por cada llamada telefónica en cada compañía? En la compañía A, ¿el incremento en el costo de 1 a 50 llamadas es el mismo que de 51 a 100 llamadas? Estos y otros contextos permiten dar sentido a la noción de razón de cambio y sientan las bases para que los estudiantes puedan abordar, en grados posteriores, el estudio de procesos de cambio más complejos, que se modelan con funciones no lineales. El propósito del ejercicios anterior es construir, interpretar y utilizar gráficas de relaciones lineales asociadas a diversos fenómenos, anticipar el comportamiento de gráficas lineales de la forma y = mx + b. • En el año de 1990 la población mundial de la Tierra era de 5 292 millones de habitantes. Suponiendo que la tasa de crecimiento durante una década es de 18% y ésta se mantiene constante, ¿cuál será la población en los años 2000, 2010, 2020...? Una vez que los alumnos encuentren los resultados, puede sugerirles que los organicen en un cuadro para que observen el carácter recursivo y que los representen gráficamente para observar la forma de la curva y la posibilidad de anticipar otros valores. 66 • ¿Qué son y cómo crecen las estalactitas y las estalagmitas? Las siguientes tablas muestran cómo han crecido una estalactita y su correspondiente estalagmita durante los últimos 6 años. Figura 5. Registro del crecimiento de las estalactitas por año La cueva tiene 2 m de alto. Cuando se midió por primera vez se observó un perfil como el siguiente: Figura 6. Perfil de crecimiento de las estalactitas • Transcurridos dos años desde la primera medición, ¿qué tan cerca estarán las dos puntas? ¿Y en 6 años? • Hagan una predicción acerca del momento en que se unirán la estalactita y la estalagmita. Justifiquen su respuesta. Estas habilidades les servirán de base a los alumnos para desarrollar otras más complejas, por ejemplo, la de producir o derivar información nueva a partir de otra ya conocida. Se pretende que los alumnos sean capaces de interpretar y comparar las representaciones gráficas de crecimiento aritmético o lineal y geométrico o exponencial de diversas situaciones. 67 Analizar la relación entre datos de distinta naturaleza, pero referidos a un mismo fenómeno o estudio que se presenta en representaciones diferentes, para producir nueva información. • La siguiente gráfica muestra los minutos que tarda en hacer efecto un medicamento en una población, tomando como referente la mediana de los datos. Figura 7. Diagrama de caja y brazos del tiempo que tarda un medicamento en hacer efecto Se observa que hubo personas muy sensibles al medicamento, pues el efecto empezó a los 20 minutos (límite inferior), en tanto que otras tardaron hasta 120 minutos (límite superior) en reaccionar. La gráfica muestra también que la mediana de los datos (Me) es 75 minutos, aproximadamente; esto significa que la mitad de la población tardó entre 20 y 75 minutos en sentir el efecto de la medicina, en tanto que la otra mitad tardó entre 75 y 120 minutos. Para elaborar esta gráfica se ordenan los datos (tiempos) de menor a mayor y se dividen en cuatro grupos, cada uno de los cuales representa 25% de la población estudiada. Así, en la gráfica se observa que a los 40 minutos la medicina había hecho efecto a 25% de la población; a los 75 minutos, a 50%; a los 85 minutos, a 75%, y a los 120 minutos, a toda la población. • Las siguientes gráficas muestran: a) La distribución de los puntajes obtenidos por un grupo en un examen. b) La distribución de los puntajes entre los varones del grupo. c) La distribución de los puntajes entre las mujeres. Figura 8. Distribución de puntajes de un examen por grupos 68 ¿Qué porcentaje de alumnos del grupo tiene menos de 4 puntos en el examen? ¿Qué porcentaje de varones tiene menos de 4 puntos? ¿Y de mujeres? ¿Es mayor el promedio del grupo que el de varones? ¿Y que el de mujeres? La gráfica de caja-brazos constituye un primer acercamiento de los alumnos al análisis de la distribución de los datos de una población considerando estadísticas descriptivas. Así, por ejemplo, la longitud de la caja está relacionada con la dispersión de los datos: si es larga, los datos son dispersos; si es corta, no lo son. En cuanto a los brazos, si el primero es más largo que el segundo, significa que 25% de la población es más dispersa que el último y que, por tanto, la caja está corrida a la derecha. Estos conocimientos y habilidades son un punto de partida para que los alumnos interpreten de manera intuitiva la curva de una distribución normal. Con estos dos tipos de ejercicios se trabajan lo que son las medidas de tendencia central y dispersión y tienen que llegar los alumnos a interpretar, elaborar y utilizar gráficas de cajabrazos de un conjunto de datos para analizar su distribución a partir de la mediana o de la media de dos o más poblaciones. Los ejercicios anteriormente presentados son ejemplos de los propuestos en la reforma curricular destinados a los profesores para que sean empleados en el aula en distintos bloques de cada curso escolar. Se aprecia que el tratamiento de la información utiliza lo que son los modelos matemáticos, su gráfica, relacionándolo principalmente con la variación de los datos, la tendencia de ellos, la construcción de gráficas, la predicción y la toma de decisiones. • La precipitación pluvial media mensual en dos entidades se representa así: Figura 9. Precipitación pluvial media entre dos entidades 69 Donde a partir de la gráfica anterior se pueden contestar diversas preguntas, como las siguientes: • ¿Cuál es el mes en que más llueve en ambos estados? • ¿Cuál es el promedio de precipitación pluvial en cada estado? • ¿En qué mes la precipitación pluvial fue igual en ambos estados? • ¿Cuál de los dos estados es menos lluvioso? El ejemplo anterior propone la lectura de gráficos para poder llevada hacia otras personas. Una lectura por partes hacia una lectura general es uno de los métodos que emplearemos durante la investigación para el tratamiento de la información ligado a la construcción de los conceptos de media aritmética y mediana. En otro tipo de ejemplos se busca que los ellos puedan interpretar y comunicar información mediante polígonos de frecuencia, como el siguiente: Figura 10. Gráfica de la distancia de salto alcanzada por dos grupos de estudiantes Con base en la información que proporcionan las gráficas se pueden plantear preguntas como las siguientes: • ¿Cuál es la longitud de salto que más estudiantes lograron en el grupo A? ¿Y en el grupo B? ¿En cuál de los dos grupos se logró el mayor salto? De acuerdo con el tabulador de puestos de una compañía, los salarios que obtienen los trabajadores son los que se muestran a continuación: $16 400, $16 000, $12 000, $31 000, $14 600, $15 000, $13 000, $16 200, $12 500, $15 900 70 • ¿Cuál es el salario promedio? ¿Consideras que el salario promedio es representativo de lo que gana un trabajador en esa compañía? Justifica tu respuesta. Otro en donde el gráfico aparece como medio para describir dichas medidas es: • Se realizó un estudio para tener información sobre la edad de los compradores de discos, los datos se presentan en la siguiente gráfica: Figura 11. Gráfica de la compra de discos compactos por grupos de edad • ¿Cuál es la edad promedio de los compradores de discos? • ¿Qué dato estadístico (media, mediana, moda) representa el grupo de edad de 15-25 años en la gráfica? En estos dos ejemplos debe tenerse en cuenta que los datos están agrupados en intervalos de edades, lo cual implica que para calcular la media de las edades debe obtenerse la marca de clase de cada intervalo (que es el punto medio del intervalo correspondiente) y la frecuencia del intervalo (porcentaje de ventas). Se hace presente la palabra promedio el cual podría tomarse, por parte de los alumnos, como sinónimo de media aritmética. La pregunte sobre que dato representa mejor al gráfico es muy buena, el cual podría complementarse con el análisis de la variación de los datos con respecto a las medidas que el alumno ya encontró para observar que tan alejados o cercanos se encuentran los datos a dichas medidas. 71 Es así, que una de las finalidades perseguidas en los ejemplos es interpretar y calcular las medidas de tendencia central de un conjunto de datos agrupados, considerando de manera especial las propiedades de la media aritmética. • ¿Cuál es el mes más adecuado para visitar Monterrey, considerando la lluvia y la temperatura? ¿Por qué? ¿Es cierto que cuando en Monterrey hace más frío, llueve menos? Justifiquen su respuesta. Figura 12. Gráficas de los promedios de precipitación y temperatura en Monterrey por mes Y mediante este tipo de ejemplo se pretende que interpreten y utilicen dos o más gráficas de línea que representan características distintas de un fenómeno o situación para tener información más completa y en su caso tomar decisiones. Se hace más frecuente el empleo de gráficos, y se da conforme los cursos se van haciendo más avanzados. También se ve necesario advertir que, además de los fenómenos o situaciones que se pueden modelar totalmente con una función lineal, existen otros fenómenos que admiten una modelación local por medio de una función lineal; es decir, que la modelación se da mediante funciones lineales por tramos o segmentos. Además, se realizan lo que son los vínculos con otras materias al hablar de las matemáticas contextualizadas, en materias como Español con el tema: Interpretar la información en tablas, 72 gráficas y diagramas, y Participar en eventos comunicativos formales para compartir información; Geografía: Composición actual de la población en México y su comparación con las tendencias demográficas de otros países del mundo; Historia: Diversidad cultural en España y América; y Física: Movimiento rectilíneo. Concluimos que desde el nivel básico de secundaria se espera que el alumno ya pueda realizar la construcción de gráficos, en particulares, poligonales, circulares, de barras y realizar un análisis de ellos para estimar comportamientos, predicciones, tomar decisiones y lo más importante, repartir equitativamente, lo cual será la pauta para la construcción del algoritmo de la media aritmética. Una de las cosas que resaltamos es el empleo de los listados de datos para hallar las medidas de posición central, y que proponen emplear gráficas para hallarlas, que es lo que nosotros proponemos para el nivel medio. Con respecto a este último vemos las siguientes carencias: • La falta de precisión de los datos pues la marca es un punto y los alumnos pueden tomar otros valores y obtenerse distintos resultados los cuales pueden perjudicar a los alumnos. • El empleo de la palabra promedio de forma general, el cual puede atribuírsele muchos significados por los alumnos. • Una gráfica estática, la cual no deja ver el comportamiento o tratamiento de esta. En el siguiente apartado trataremos el análisis del los libros de texto en el nivel medio para ver si los conceptos evolucionan y se encuentran relacionados con lo aprendido en el nivel básico, además de observar si el tratamiento es distinto o se mantiene en definición, ejemplos y ejercicios. 4.3.1.2. Libros de estadística del nivel medio El discurso matemático empleado en el aula para el tratamiento a nivel medio sobre los conceptos de media aritmética y mediana podría resumirse de la siguiente manera: “Definición, ejemplos y ejercicios” Podría considerarse una verdadera afirmación debido a que realmente sucede, es por ello que muchas veces a la estadística es visto como un gran formulario o “recetario” que solamente 73 hay que aplicarse en diversos casos y situaciones en los que una vez encontrados los resultados simplemente se presentan sin considerar el contexto así como los diversos factores que podrían afectarlo. Para la realización del análisis didáctico tomamos el libro “Introducción a la probabilidad y la estadística” (Bargas y Camargo, 2004), el cual es empleado en las escuelas Preparatoria Uno y Dos de la Universidad Autónoma de Yucatán y algunas otras escuelas como las incorporadas a dicha universidad y los Colegios de Bachilleres de Yucatán, durante el quinto semestre. La Preparatoria Uno de la Universidad Autónoma de Yucatán, imparte la materia de Matemáticas V, la cual se refiere a la probabilidad y estadística. Dicha materia tiene como objetivo, el cual se encuentra dentro del programa de estudios que puede ser consultado en la página de internet de esta escuela, el siguiente: Interpretar y manejar información estadística y resolver problemas sobre el cálculo de probabilidades y distribuciones probabilísticas empleando los conceptos básicos de estadística y probabilidad para comprender la utilidad y aplicación de estas disciplinas en la vida diaria. El contenido se encuentra dividido en tres partes: I. II. III. Estadística Teoría de la Probabilidad Distribuciones de la probabilidad Tomamos solamente la primera unidad cuyo propósito es: Recopilar información y representar un conjunto de datos mediante el empleo de tablas, gráficas y el cálculo de las medidas de centralización y dispersión con la finalidad de interpretar y comprender la información estadística que se le presente en la vida diaria. Contenido de la unidad: 1. Introducción a la Estadística 2. Estadística Descriptiva 2.1 Datos ordenados 74 2.1.1. Organización de datos 2.1.2. Representaciones gráficas 2.1.3. Medidas de centralización 2.1.4. Medidas de dispersión 2.2 Datos agrupados 2.2.1. Organización de datos 2.2.2. Representaciones gráficas 2.2.3. Medidas de centralización 2.2.4. Medidas de dispersión Cuya única estrategia específica hacía las medidas de centralización es: A partir de ejemplos concretos y cotidianos resolver preguntas intercaladas relacionadas con las medidas de centralización y dispersión. Comenzamos expresando que, el título de un gráfico describe claramente gran parte de la información que se desea transmitir; los nombres de los ejes indica contra quien se está haciendo un comparación o un cambio; el estilo de gráfico tiene que ser el adecuado para tener una presentación clara y precisa de la información; y por último la escala empleada tiene que ser adecuada para no distorsionar al gráfico y su comportamiento y por ende no omitirla. El profesor por su parte, concibe que los alumnos ya son capaces de construir gráficos y lo hace a un lado, por lo que la lectura de ellos se hace escasa y no se llegan a lograr finalidades como tomar decisiones, predecir comportamientos, tendencias, lo que se quiere representar con, etc., y simplemente verlo como un instrumento condensador de datos. Ya el libro, primeramente se realiza una breve introducción a la estadística mediante un poco de historia explicando quienes fueron las primeras civilizaciones en emplear a la estadística, de forma sencilla, de qué manera y con qué fin, así como su aplicación en otras ciencias sociales y naturales como educación y la biología. Seguido se realiza una introducción a la estadística con un caso práctico el cual consiste en: 75 El jefe de redacción de un periódico local desea conocer el nivel de satisfacción de sus lectores respecto a la sección “social”, para esto, encuesta a 80 de sus lectores pidiéndoles que indiquen su nivel de satisfacción como: muy satisfecho, satisfecho, poco satisfecho. • ¿Cuál sería uno de los datos de esta encuesta? • ¿Cuál sería la población? • ¿Cuál sería la muestra? Para ya luego definir de manera concisa lo que es Estadística, población, muestra, la clasificación de la estadística, en descriptiva e inferencial, y de las variables en continua y discreta. Como siguiente tema se encuentra la organización de datos cuyo primer caso práctico es: Una compañía de botanas desea participar como patrocinador de un conocido programa de televisión; con la finalidad de los comerciales se adapten a su gusto de los televidentes, el responsable ha solicitado un informe de la distribución de las edades de los televidentes del programa. Los resultados de acuerdo al estudio realizado se presentan en la siguiente gráfica. Figura 13. Gráfica del número de televidentes por edad • ¿Qué representa la altura de cada rectángulo? • ¿Cuántos televidentes participaron en la encuesta? • ¿Qué representa el ancho de cada rectángulo? • ¿En qué rectángulo estaría una persona que cumple 28 en una semana? 76 Centrándose el tema al estudio de técnicas para organizar, ya sea ordenados o agrupados, y presentar los datos estadísticos: la tabular, y la gráfica, incluyendo los conceptos de frecuencia, relativa, acumulada y acumulada relativa, en los cuales se apoyan ambas maneras de organización y presentación de los datos, así como también, la interpretación de las tablas y gráficas, y la obtención de la información contenida en ellas. Con respecto a la presentación de los datos, se realiza mediante dos formas: la tabular y la gráfica, por lo que para los fines de la tesis nos centraremos en el tratamiento de la información de manera gráfica, cuyo énfasis se da en las más comunes para ellos: el histograma de frecuencias, el polígono de frecuencias y el polígono acumulativo. Luego se lleva a cabo la presentación de la definición o más bien, de qué es y cómo se construye un histograma y polígono de frecuencias, porcentual y acumulativo seguido de ejemplos y ejercicios, los cuales presentamos a continuación: Histograma de frecuencias: El histograma de frecuencias es un gráfico que consiste en una serie de rectángulos que tienen sobre el eje horizontal sus bases de igual longitud y cuyos centros son los datos; las alturas son las frecuencias correspondientes a los representados sobre el eje vertical. Para construir un histograma de frecuencias se sitúan sobre el eje horizontal los valores de los datos. Para tener una presentación más adecuada del histograma, generalmente al construir la escala en el eje horizontal se empieza con un dato anterior a primer dato y se termina con un dato posterior al último dato. En el eje vertical se colocan las frecuencias utilizando la mayor frecuencia como referencia para presentar el máximo valor sobre el eje vertical; seguidamente se decide la escala a utilizar que las dimensiones entre los valores sea la misma. Una vez construidos los ejes se procede a asignar a cada dato su respectiva frecuencia, de la misma manera como se sitúa una pareja ordenada en eje coordenado. Ya marcados los puntos se trazan los rectángulo, que como se mencionó con anterioridad, las bases son segmentos iguale cuyos puntos medios son los datos y las alturas la frecuencia correspondiente a cada dato. 77 Ejemplo: La siguiente colección de datos muestra las calificaciones finales de matemáticas de 45 alumnos del 5º grado de una escuela primaria. La tabla de distribución de frecuencias es la siguiente: CALIFICACIONES (X) # DE ALUMNOS % DE ALUMNOS FRECUENCIA (f) FREC. RELATIVA % (f r ) 5 2 4.0 6 3 7.0 7 12 27.0 8 13 29.0 9 11 24.0 10 4 9.0 � 𝑓𝑓 = 45 � 𝑓𝑓𝑟𝑟 = 100.0 Tabla 1. Frecuencia y frecuencia relativa de calificaciones finales de matemáticas de un grupo de quinto grado de primaria Los histogramas de frecuencias correspondientes a los datos se presentan a continuación: 78 Figura 14. Histogramas de frecuencia y frecuencia relativa de calificaciones finales de matemáticas de un grupo de quinto grado de primaria Sobre polígonos tenemos el siguiente: Polígono de frecuencias relativas porcentuales. De la misma manera como se construye el polígono de frecuencias (haciendo referencia a una definición presentada párrafos arriba en el libro), se construye el polígono de frecuencias relativas porcentuales, solamente que en vez de representar las frecuencias en el eje vertical, se presenta la frecuencia relativa porcentual. La gráfica resulta un polígono irregular de n lados que describe en su parte superior el comportamiento de la frecuencia relativa de cada uno de los datos de un conjunto. Como se mencionó anteriormente esta gráfica construida a partir de la frecuencia relativa carece de objetividad. Ejemplo: Tomado de la información presentada en el ejemplo anterior se tiene la siguiente gráfica de polígono de frecuencias relativas porcentuales: Figura 15. Polígono de frecuencias relativas porcentuales de las calificaciones finales de un grupo de quinto grado de primaria 79 Por último tenemos lo que es el polígono acumulativo el cual se define de la siguiente manera: Polígono acumulativo. El polígono acumulativo es un diagrama tipo escalera que se construye señalando sobre cada dato representado en el eje horizontal, un punto de altura correspondiente a su frecuencia acumulada representada en el eje vertical; a partir de cada punto se dibujan segmentos de recta horizontales de longitud igual a la distancia entre dato y dato. Finalmente partiendo del primer dato se unen los extremos de los segmentos horizontales mediante segmentos verticales. Cuando se desea construir un polígono acumulativo porcentual, se presentan en el eje vertical las frecuencias acumuladas porcentuales en lugar de las frecuencias acumuladas. Ejemplo. El polígono acumulativo correspondiente a los datos del ejemplo anterior son los siguientes: CALIFICACIONES # DE ALUMNOS % DE ALUMNOS FRECUENCIA FRECUENCIA FREC. RELATIVA % ACUMULADA % (f) (f r ) 5 2 4.0 4.0 6 3 7.0 11.0 7 12 27.0 38.0 8 13 29.0 67.0 9 11 24.0 91.0 10 4 9.0 100.0 � 𝑓𝑓 = 45 � 𝑓𝑓𝑟𝑟 = 100.0 (X) Tabla 2. Frecuencia acumulada de las calificaciones finales de matemáticas de un grupo de quinto grado de primaria 80 Figura 16. Polígono de frecuencias acumuladas de la tabla 2 Una vez que se han presentado las diversas gráficas recomendadas para la organización de los datos, se sigue con los ejercicios. Algunos de ellos son los siguientes: 1. La siguiente tabla de distribución de frecuencias muestra el número de hijos manifestado por cada una de 250 familias encuestadas. Construir el histograma, el polígono de frecuencias y el polígono acumulativo. 81 HIJOS # DE FAMILIAS FRECUENCIA ACUMULADA (X) FRECUENCIA (f) 0 23 1 46 2 75 3 34 4 30 5 23 6 19 � 𝑓𝑓 = 250 Tabla 3. Número de hijos de las 250 familias encuestadas 2. En el siguiente histograma se describe el resultado de una encuesta realizada a una muestra de estudiantes del segundo año de una escuela preparatoria, sobre el número de materias que reprobaron el semestres escolar inmediato anterior; obsérvese la gráfica y respóndase las siguientes preguntas: a) ¿Cuántos estudiantes en total fueron encuestados? b) ¿Cuántos estudiantes no reprobaron las materias? c) ¿Cuántos estudiantes reprobaron I materia? d) ¿Qué porcentaje de estudiantes reprobaron 2 o más materias? Figura 17. Gráfica del porcentaje de aprobación de materias de un grupo de alumnos de preparatoria 82 Así como se presenta esta información para la organización de datos ordenados, de igual forma sucede para cuando lo datos son agrupados, nada más que aquí se lleva a cabo un tratamiento diferente al anterior debido a que se tienen que emplear lo que son los intervalos en las frecuencias con el fin de facilitar la comprensión de los conceptos de frecuencia relativa y acumulada, estos son los límites superiores e inferiores los cuales determinan el inicio y final de un intervalo, y nunca coinciden con el límite superior de un intervalo y con el inferior del siguiente; y los límites reales, que son los nuevos valores que se obtienen a partir de los límites de los intervalos, promediando el límite superior de un intervalo con el inferior del siguiente (coincidiendo ambos en un mismo punto). En nuestro caso no realizaremos el análisis en esta sección, debido a que nos centramos en la organización de los datos de manera ordenada y no agrupada. Una vez que se concluye el tema sobre organización de los datos se da pie a las medidas de centralización comenzando por un caso práctico el cual consiste en: Un sindicato obrero y una empresa sostienen un debato respecto a los salarios de los trabajadores. El sindicato reporta que un trabajador recibe en promedio un salario de $24 000 por año, mientras que el gerente de la empresa dice que el salario promedio es de $35 000. ¿A quién debe creerse? El fin que se le puede asignar a este caso práctico es tomar decisiones ante situaciones de incertidumbre, por lo que suponemos, es que se desea sembrar una cierta inquietud en los alumnos sobre quien tendrá la razón, donde lo único que tienen para decir ello es un solo valor, a partir de esto podrían conjeturar una respuesta o simplemente mencionar que no tienen los argumentos suficientes, pues no conocen la muestra de la cual provinieron dichos valores. Se resume que una manera de representar las características de un conjunto de datos es a través de un valor llamado “promedio”, el cual intenta identificar de alguna manera, el dato atípico o distintivo del conjunto. Ahora, las medidas de centralización o de posición central, tienen como propósito establecer valores que representen lo mejor posible las características de un conjunto de datos. Este 83 texto se enfoca al estudio de las tres medidas de centralización más comunes: la media aritmética, la mediana y moda. A) Media aritmética Cuando un alumno desea conocer el promedio de sus calificaciones obtenidas en el semestre inmediato anterior, de manera intuitiva suma todas las calificaciones y divide el resultado que obtiene entre el número de ellas; así, si sus calificaciones fueron 80, 70, 91, 63, 78, 84 y 63, la manera como calcula su promedio es: 𝑥𝑥̅ = 80 + 70 + 91 + 63 + 78 + 84 + 63 529 = = 75.57 7 7 Este promedio se denomina media aritmética. La media aritmética o promedio de una colección de datos se define como la suma de todos los datos entre el total de ellos, se simboliza con x y su fórmula es: 𝑥𝑥̅ = 𝑥𝑥1 + 𝑥𝑥2 + 𝑥𝑥3 + ⋯ 𝑥𝑥𝑛𝑛 = � 𝑥𝑥 𝑛𝑛 𝑛𝑛 Además, en un recuadro cerrado se tiene que: Media aritmética: Medida central o promedio en la intervienen todos los datos de un conjunto. Ejemplo: Los siguientes datos representan los tiempos en minutos empleados por un alumno para contestar diferentes pruebas psicométricas. Hallar el tiempo promedio. 9, 12, 7, 11, 15, 6, 10, 17, 8. Solución: Para obtener el promedio se utilizan la media aritmética: 𝑥𝑥 = 9 + 12 + 7 + 11 + 15 + 6 + 10 + 17 + 8 95 = = 10.56 9 9 Con esto podemos ver como la palabra promedio es empleada como sinónima de media aritmética en ejercicios prácticos desde un principio, sin hacer distinción alguna con otra medida de centralización. Seguido de realiza una analogía de la media aritmética con el punto de apoyo de una barra de equilibrio en la que se encuentran colocados pesos. La figura que a continuación presentamos representa la interpretación física de la media aritmética, tomado del libro el cual estamos analizando al considerar los datos del ejemplo anterior: 84 Figura 18. Gráfica del tiempo en minutos empleados por un alumno para contestar diferentes pruebas psicométricas La explicación que dan con respecto a la interpretación física consiste en: Despreciando el peso de la barra y considerando todos los cilindros con igual peso, se puede observar que la barra está en equilibrio, a pesar de que el punto de apoyo (representado por la media aritmética) no se encuentra en el centro de la barra; esto se debe a que aunque es diferente el número de cilindros en los lados de la barra, la suma de los momentos (fuerza por distancia) que generan dichos pesos a cada lado es igual. Las propiedades que se tratan sobre la media aritmética es sobre del porqué es que es tan ampliamente utilizado: • La media aritmética siempre se puede calcular para un conjunto de datos. • Existe una media aritmética única para un conjunto de datos. • En el cálculo de la media aritmética interviene cada uno de los valores del conjunto. Una vez terminado dicho tema cuando los datos son presentados de manera agrupada, se tiene una segunda medida de centralización, la mediana la cual se comienza su tratamiento con el siguiente ejemplo para dar pie a su definición: El alumno cuyas calificaciones fueron 80, 70, 91, 63, 78, 84, 63, puede tener además otro promedio que represente sus calificaciones, la manera de obtenerlo es ordenando las calificaciones de menor a mayor y localizando cuál de ellas ocupa la posición central, esto es: 85 63, 63, 70, 78, 80, 84, 90, de donde se obtiene que el valor central es 78, esta medida se denomina mediana. La mediana es la medida central de una serie de datos dispuestos en forma creciente o decreciente. Cuando el número de datos es impar, la mediana es el valor del dato central, y cuando es par, la mediana es la media aritmética de los datos centrales. Seguido se tienen los siguientes dos ejemplos: 1. Calcular la mediana de los siguientes datos: 9, 12, 7, 11, 15, 6, 10, 17, 8. Solución: Primeramente se ordenan los datos de menor a mayor quedando de la siguiente manera: 6, 7, 8, 9, 10, 11, 12, 15, 17 Se puede observar que el número de datos es impar (n=9), por lo que se localiza el dato central (dato # 5), que resulta ser el 10, entonces la mediana es el 10. 2. Calcular la mediana de los siguientes datos: 23, 28, 33, 21, 36, 20. Solución: Se ordenan los datos de menor a mayor y se observa que el número de datos es par (n=6), por lo tanto se calcula la media aritmética de los dos datos centrales (datos # 3 y 4) para obtener la mediana, 20, 21, 23, 28, 33, 36 𝑥𝑥 = 23 + 28 51 = = 25.5 2 2 Entonces el valor de la mediana es 25.5. Luego se realiza una pequeña comparación entre lo que es la media aritmética y la mediana así como la cualidad de la última expresados de la siguiente manera: La mediana divide a un conjunto ordenados de datos en dos grupos iguales; la mitad de los datos tendrán valores menores que la mediana, y la otra mitad mayores que ésta. En algunos casos particulares la mediana resulta más representativa que la media, ya que la mediana no está influenciada por los valores extremos del conjunto, como la media aritmética. 86 Si los datos se encuentran organizados en una tabla de datos ordenados, en el cálculo de la media se pueden presentar de dos formas: 1. Cuando la sumatoria de las frecuencias es impar, como se mencionó anteriormente, la mediana es el valor del dato central, el cual se obtiene sumando 1 a la frecuencia total y dividiendo la suma entre 2, el resultado de esta operación proporciona el lugar que ocupa el dato central, que se debe localizar en la columna de frecuencias acumuladas en la tabla de distribuciones. Cuando n es impar el dato central es 𝒏𝒏+𝟏𝟏 𝟐𝟐 Ejemplo: La siguiente tabla de distribución de frecuencias muestra las calificaciones de los alumnos de 5º grado. Calcular la mediana. CALIFICACIONES # DE ALUMNOS (X) FRECUENCIA (f) 5 2 6 3 7 12 8 13 9 11 10 4 � 𝑓𝑓 = 45 Tabla 4. Frecuencia de calificaciones de un grupo de quinto grado de primaria Solución: Se completa la tabla añadiendo la columna de la frecuencia acumulada. CALIFICACIONES # DE ALUMNOS FRECUENCIA ACUMULADA (X) FRECUENCIA (f) 5 2 2 6 3 5 7 12 17 8 13 30 9 11 41 10 4 45 � 𝑓𝑓 = 45 Tabla 5. Frecuencia acumulada de calificaciones de un grupo de quinto grado de primaria 87 La tabla muestra, que la sumatoria de frecuencias es 45, como es número impar se suma 1 a la frecuencia total y se divide entre 2 para encontrar el lugar que ocupa el dato central, esto es: 𝟒𝟒𝟒𝟒+𝟏𝟏 𝟐𝟐 = 𝟒𝟒𝟒𝟒 𝟐𝟐 = 𝟐𝟐𝟐𝟐, por lo tanto se debe localizar el dato que ocupa el lugar 23. De la tabla de frecuencias en la columna de frecuencias acumuladas se observa que el dato que ocupa el lugar 23 es la calificación 8 por lo tanto la mediana sería 8. 2. Si la suma de las frecuencias es par se sabe por definición que la mediana es la media aritmética de los datos centrales. Para localizar estos dos valores centrales se divide la suma de las frecuencias entre 2 y el resultado proporcionará el lugar que ocupa el primer dato central, el cual se localiza en la columna de frecuencias acumuladas, el segundo dato central es el inmediato posterior al primer dato central; una vez localizados los datos centrales se calcula la media aritmética de ellos para obtener la mediana. Cuando n es par los datos centrales son: 𝒏𝒏 𝟐𝟐 𝒚𝒚 𝒏𝒏 𝟐𝟐 + 𝟏𝟏 Ejemplo: La siguiente tabla de distribución de frecuencias muestra las calificaciones de los alumnos de 5º grado. Calcular la mediana. CALIFICACIONES # DE ALUMNOS (X) FRECUENCIA (f) 5 2 6 5 7 9 8 12 9 7 10 5 � 𝑓𝑓 = 40 Tabla 6. Frecuencia de calificaciones de un grupo de quinto grado de primaria 88 Solución: Se completa la tabla añadiendo la columna de la frecuencia acumulada. CALIFICACIONES # DE ALUMNOS FRECUENCIA ACUMULADA (X) FRECUENCIA (f) 5 2 2 6 5 7 7 9 16 8 12 28 9 7 35 10 5 40 � 𝑓𝑓 = 45 Tabla 7. Frecuencia acumulada de calificaciones de un grupo de quinto grado de primaria Se tiene que la sumatoria de las frecuencias es 40, por ser número par se debe encontrar la media aritmética de los dos datos centrales. Se divide 40 2 = 20, por lo tanto se deben de localizar los dos datos centrales, que ocupan el lugar 20 y 21 respectivamente. De la tabla de frecuencias en la columna frecuencias acumuladas se observa que el dato que ocupa el lugar 20 y 21 es la calificación 8 por lo tanto la mediana será: 𝟖𝟖+𝟖𝟖 𝟐𝟐 = 𝟖𝟖. Ya una vez realizado el tratamiento anterior para un conjunto de datos ordenados, se prosigue de la misma manera pero ahora con un conjunto de datos agrupados, el cual no analizaremos en esta investigación. Algunos de los ejercicios empleados para reforzar los conocimientos antes presentados se encuentran estructurados de la siguiente manera: 1. La siguiente tabla de distribución de frecuencias, muestra el número de hijos por cada una de 250 familias encuestadas: 89 HIJOS # DE FAMILIAS (X) FRECUENCIA (f) 0 23 1 46 2 75 3 34 4 30 5 23 6 19 � 𝑓𝑓 = 250 Tabla 8. Número de hijos de las 250 familias encuestadas CALCULAR: a) Media aritmética b) Mediana c) Moda 2. Para los siguientes puntajes: 205, 5, 5, 5, 2 y 1; obtener: a) la media aritmética, la mediana y la moda; b) ¿Qué medida de tendencia central no sería apropiada para describir el conjunto de puntajes? ¿Por qué? 3. Una sucursal de una cadena de minisupers tiene siete empleados, los cuales se quejan a la gerencia asegurando que el salario promedio semanal en esa sucursal es de $900.00. La gerencia responde que el salario promedio es de $1137.50. La siguiente tabla resume los datos: CARGO SALARIO NÚMERO DE EMPLEADOS Gerente $2,500.00 1 Subgerente $1,900.00 1 Cajero $1,100.00 2 Abarrotero $950.00 1 Auxiliar de venta $900.00 5 Mantenimiento 2 $800.00 Tabla 9. Resumen del salario percibido por los empleados de un centro comercial 90 4. Un grupo de 10 estudiantes presentaron una prueba diagnóstica e cierta facultad, la prueba tuvo una puntuación máxima de 100 puntos y los resultados fueron: 35, 24, 39, 30, 42, 98.5, 37.5, 97, 33, y 56. a) Calcular la media aritmética y mediana. b) Comparar los resultados y determinar la diferencia entre ellos. c) Si todas las puntuaciones se utilizan ¿Cuál sería el mejor promedio que describe el conjunto de datos? En resumen, se pretende que el alumno sea capaz de extrapolar los conocimientos estadísticos a situaciones reales, según su objetivo, el cual no se plasma en el tratamiento llevado a cabo en el libro. Cabe aclarar que el libro fue diseñado especialmente para hacer utilizado en dicha escuela basándose del programa de estudios. Es por ello que se esperaría que los alumnos logren llevar a situaciones reales los conceptos de media aritmética y mediana mediante ejemplo, los cuales serán inventados dentro de la realidad propiciada por la institución y por la sociedad. De la bibliografía presentada, notamos que son libros antiguos, y que el más empleado en clases fue el que empleamos para realizar este análisis, pues es propio de la Universidad ya que son libros editados por ella. Con respecto a la primera parte del tratamiento de la información, sólo se hace una especificación de las principales gráficas y sobre su construcción ligada a las tablas de recopilación de datos. Se centra más en la construcción de gráficos particulares, más no se lleva a cabo un análisis de algunos otros que pueden ser de barras, circulares, columnas, etc. Su lectura, predicción y toma de decisiones es muy escaso. Después de ello se llega al tema de medidas de centralización comenzando con la media aritmética, cuya explicación que se encuentra en el libro, no hace referencia de algún otro uso o interpretación, no se explica que pasa si hay valores atípicos o cero en el comportamiento de esta, no se hace referencia a la propiedad de representatividad de un conjunto de datos, sobre su uso inverso y mucho menos, algún tratamiento mediante el empleo de gráficas y por último, emplear otros contextos para extrapolar conocimientos, predecir y tomar decisiones. 91 El tratamiento de la mediana se lleva a cabo de igual forma como el de la media aritmética. Al final, en los ejercicios se trata de que el alumno deduzca, compare y hasta pudimos notar que reconozca ciertas particularidades como el exponer quién de las tres medidas representa mejor al conjunto de datos, los efectos de tener valores atípicos y tomar decisiones, cuando con anterioridad no han trabajado con ello o más bien, no han realizado el análisis de situaciones problema para poder conjeturar. Los contextos presentados son muy ordinarios, pues no se aprecia realmente la utilidad de las medidas de centralización. Es por ello que al final los alumnos no realizan un análisis de la situación provocando carencias, dificultades y errores tales como: no considerar el efecto de los valores atípicos a las medidas de media aritmética y mediana, de saber por qué solo uno representa de mejor manera al conjunto de datos, de predecir hechos o sucesos, tomar decisiones en momentos de incertidumbre, tener un uso en la vida real de los conceptos, construir gráficos, leerlos y sobre todo, obtener información y realizar un buen análisis a partir de ello; todo esto aunado a la falta de conocimientos estadísticos de los profesores quienes imparten dicha materia, por lo que esperamos que las situaciones realizadas para esta investigación disminuyan dichas carencias y ayuden al tratamiento de la propiedad de representatividad de las medidas de centralización en el aula. 92 CAPÍTULO V. UNA SITUACIÓN DIDÁCTICA SOBRE LA MEDIA ARITMÉTICA, LA MEDIANA Y SU REPRESENTATIVIDAD Introducción En este capítulo se trata un análisis descriptivo y predictivo de la situación didáctica propuesta sobre la media aritmética, mediana y su propiedad de representatividad. En dicho análisis se presentan los siguientes aspectos: • Se describen las selecciones de las variables a nivel local (relacionándolas eventualmente con las selecciones globales) y las características de cada situación didáctica que de ellas se desprenden. • Se analiza qué podría ser lo que está en juego en cada situación para un estudiante en función de las posibilidades de acción, selección de decisión, de control y de validación de las que él dispone, una vez puesta en práctica en un funcionamiento casi aislado del profesor. • Se prevén las posibles acciones esperadas de los estudiantes y se trata de exponer cómo el análisis realizado permite controlar su significado y asegurar, en particular, que los comportamientos esperados, si intervienen, sean resultado de la puesta en práctica del conocimiento contemplado por el aprendizaje. Para construir conocimiento sobre la media aritmética, la mediana y su representatividad, en el diseño de la situación didáctica se consideraron los siguientes aspectos: la práctica de repartición equitativa, la práctica de predicción y la toma de decisiones, el tratamiento de la información y el uso de gráficas, las dificultades y errores presentes en los estudiantes; tomando como referente el currículo y el tratamiento dado en los libros de texto. En esta propuesta didáctica, el estudiante se verá inmiscuido en situaciones de acción, formulación, validación e institucionalización. 93 El análisis a priori consistió en determinar las variables que permitan controlar los comportamientos de los estudiantes y su significado. Por lo anterior, este análisis se basa en un conjunto de hipótesis de trabajo, las cuales son: • La práctica de la repartición equitativa coadyuva a la construcción de los algoritmos de la media aritmética y mediana. • El uso de gráficos favorece la constitución y comprensión de la propiedad de representatividad de las medidas de posición central. • La práctica de la predicción está ligada a la construcción de conceptos matemáticos; en este caso sobre la noción de media aritmética y para la inversión del algoritmo de la media aritmética. • La contextualización es parte importante en el entendimiento y construcción de los conceptos de media aritmética y mediana junto, con su propiedad de representatividad. • El análisis de la variación de los datos, explica los efectos que los valores atípicos o ceros tienen sobre las medidas de posición central y en la elección del valor representativo de un conjunto de datos. 5.1. ANÁLISIS DE LA SITUACIÓN DIDÁCTICA Como elementos previos a la situación didáctica, para poder llevar a cabo las acciones requeridas en cada una de las situaciones propuestas, los estudiantes deben ser capaces de: • Calcular las diferencias absolutas o distancias entre dos valores. • Construir algoritmos o fórmulas para ser empleadas en distintas situaciones o problemas. • Llevar a cabo una lectura de gráficos mediante un enfoque local o global de este, identificando tendencias o comportamientos. 94 Las variables consideradas en la situación didáctica propuesta son: • El tipo de valores en el conjunto datos. Dichos valores tienen efectos sobre las medidas de centralización, pues en la media aritmética conlleva un desplazamiento hacia la derecha o a la izquierda, produciéndose así sesgos o tendencias en los datos. Sucede que al determinar las diferencias entre los valores del conjunto de datos y el valor representativo, se obtendrán distancias muy grandes o muy pequeñas, por lo que es posible una simetría o uniformidad en la representación gráfica de las distancias, o bien, gráficas con sesgos o comportamientos tendenciales con valores atípicos o ceros. Otra consideración es que los valores “cero” a veces no son considerados por el individuo en el cálculo de la media aritmética o mediana, pues los consideran como valores no existentes dentro del conjunto, al no hacerlo, se modifica al conjunto de dos maneras: uno, hacia el valor de la media aritmética o mediana, y el segundo, sobre el tamaño de la muestra. • Las argumentaciones gestuales o discursivas de los estudiantes con respecto a los procedimientos, métodos, fórmulas, comportamientos, comparaciones, valores y justificaciones en la toma de decisiones o predicciones que se susciten en la elección del valor más representativo de un conjunto de datos. • El valor de la media aritmética. La media aritmética se encuentra relacionada con los valores del conjunto y cuando uno de esos valores es modificado, el valor de la media aritmética se modifica. De igual manera, cuando la media aritmética de un conjunto de datos se modifica, el valor faltante o predictivo de ese mismo conjunto también se modifica. Su consideración será cuando el estudiante vaya a llevar a cabo la construcción del inverso algorítmico de la media aritmética. • La cantidad de valores en un conjunto de datos. La media aritmética también varía con respecto a la cantidad de datos del conjunto, así como de la de valores atípicos o ceros. • El tratamiento de la información y su representación gráfica. La construcción de la propiedad de representatividad de la media aritmética y mediana, se hará mediante el uso de gráficos. La elección del valor más representativo de un conjunto, estará influida por el análisis de la variación de los valores, la tendencia y el comportamiento de sus gráficas. 95 5.1.1. ACTIVIDAD 1 Propósito: Analizar la variación de los datos de un conjunto dado, de manera numérica o gráfica, para determinar un valor que represente o describa ese conjunto de datos. Un elemento importante a considerar para determinar el valor representativo de un conjunto de datos es el análisis de la variación de éstos, es decir, analizar qué tan cercanos o lejanos se encuentran los datos con respecto al valor representativo. Elegir un valor representativo precisa que el estudiante lleve a cabo acciones tales como: • Realizar una repartición equitativa: o Sumando todos los valores del conjunto de datos y dividirlos entre el número total de estos. o Distribuir todos los valores del conjunto de datos de tal manera que tengan el mismo valor. • Realizar ajustes a la gráfica de datos, según el exceso o defecto de los valores. • Llevar a cabo un ordenamiento ascendente de los datos y elegir aquel que se encuentre en el centro de todos los valores de los datos (si la cantidad de datos es impar) o el promedio de los dos centrales (si la cantidad de datos es par). • Elegir aquel valor que tiene mayor frecuencia en el conjunto de datos. A su vez, para elegir un valor representativo de un conjunto se precisa que el estudiante analice la variación de los datos, mediante la lectura, comprensión y transformación de gráficos, llevando a cabo acciones tales como: • La traducción de un gráfico a otro, de un gráfico a una tabla o viceversa; lo que requiere de un cambio en la forma de comunicar la información, e interpretar el gráfico a nivel descriptivo. • La interpretación del gráfico, que implica reorganizar el material y separar los factores más y menos importantes, búsqueda de relaciones entre los elementos específicos del gráfico o entre los elementos y las escalas en los ejes, para realizar un análisis de la variación de los datos con respecto a: qué cambia, cuánto cambia y cómo cambia. 96 • La interpolación/extrapolación implica la extensión de la interpretación, identificando tendencias o convenios implícitos para poder predecir o describir comportamientos. Entre las variables consideradas en esta actividad tenemos: • La inclusión de valores atípicos y ceros en uno de los dos conjuntos de datos, con la intensión de más adelante crear un conflicto cognitivo en los estudiantes, por los efectos producidos sobre los valores representativos determinados. • Las argumentaciones discursivas y visuales que los estudiantes empleen en la justificación sobre el cálculo del valor representativo de cada conjunto. Análisis a priori De esta actividad se espera, en un primer momento, que el estudiante calcule un valor representativo para cada uno de los dos conjuntos presentados de manera gráfica. El primer conjunto de datos tendrá la característica de no contener valores atípicos o ceros, mientras que el segundo sí los tendrá, lo cual servirá para causar un conflicto cognitivo posteriormente al estudiar los efectos que tienen sobre los valores representativos. El cálculo del valor representativo de los conjuntos será de manera heurística, es decir, se dejará que el alumno determine alguna manera de hacerlo, entre los cuales están: a) Sumar todos los valores y dividirlos entre el número total de estos. En este caso el alumno estará realizando una repartición equitativa, la cual es una práctica muy antigua que por intuición podría llevar a cabo. Dicha forma se encuentra ligada al algoritmo de la media aritmética, por lo que hacerlo de esta manera, favorecerá la construcción del algoritmo posteriormente. b) Distribuir todos los valores de tal manera que se realice una repartición equitativa. Otra forma no tan directa como la anterior podría ser ésta, pues no tendría que sumar todos los valores, sino más bien, tomar los excedentes de los valores más grandes y sumárselos a los más pequeños; mediante ensayo y error estaría determinando el valor representativo. c) Realizar ajustes a la gráfica mediante el exceso o defecto de los valores. En este caso, el alumno se fijaría no solamente en el valor numérico del dato, sino también de la 97 distancia (vertical) existente entre los valores, por lo que al realizar la distribución para ajustar los datos, su objetivo sería que la altura de todas las columnas del gráfico sean iguales. En este caso, vuelve hacerse presente el ensayo y error. d) Elegir aquel valor que se encuentre en el centro de todos los datos (si la cantidad de datos es impar) o el promedio de los dos centrales (si la cantidad de datos es par). De hacerlo de esta forma, el alumno se tendría que centrar en el ordenamiento de los datos, pero en un ordenamiento ascendente, pues por intuición se tiene que de izquierda a derecha los números van creciendo o en aumento. Dicha forma se encuentra ligada a la mediana, lo cual más adelante sería utilizado para la construcción de su algoritmo. El segundo momento se dará cuando el alumno tenga que justificar el por qué de ese valor representativo, y no otro, a partir de la lógica y el esquema empleado por él para determinar dicho valor. Comenzará a realizar una comunicación de lo construido hasta el momento, así como una validación de ello, confrontando sus argumentos con los de sus compañeros. La situación didáctica se desarrolla en el siguiente contexto. INTERFERENCIA EN LA SEÑAL DE UN SATÉLITE La NASA y el Instituto Politécnico Nacional pretenden evaluar un proyecto desarrollado hace aproximadamente 12 años, el cual consistió en poner en órbita un satélite, que servirá única y exclusivamente para la transmisión de información entre instituciones escolares o independientes a nivel mundial. La información es mandada mediante señales electromagnéticas que viajan por el aire junto con el sonido, hasta llegar al satélite atravesando el cielo, a veces despejado o lluvioso, perjudicando la calidad de la señal. Es decir, si está despejado la señal es mejor transmitida que cuando está nublado y lloviendo, ya que el agua también afecta la transmisión. En esos casos hay que modificar la magnitud de la potencia con la que se manda la información, evitando en gran medida problemas de estática y comunicación. 98 Para determinar cuándo hay que realizar un cambio en la magnitud de potencia de salida se hace necesario predecir en qué meses predominará el clima soleado o nublado. Abre el archivo llamado “Clima de la ciudad de Mérida” de Excel, que contiene las siguientes tablas y gráficas, donde se presentan la cantidad de días soleados y nublados o lluviosos de dicha ciudad. Estos datos nos ayudarán a predecir el momento en el que se deberá hacer un cambio en la magnitud de potencia. Mes Días soleados Enero 24 Febrero 23 Marzo 24 Abril 25 Mayo 31 Junio 23 Julio 27 Agosto 19 Septiembre 24 Octubre 24 Noviembre 25 Diciembre 26 Total 265 Tabla 10. Cantidad de días soleados por mes en el año 2008 99 Días soleados 35 Cantidad de días 30 31 25 20 24 23 24 25 27 24 23 24 25 26 19 15 10 5 0 Mes Gráfica 1. Cantidad de días soleados por mes en el año 2008 Mes Días nublados o lluviosos Enero 7 Febrero 6 Marzo 7 Abril 5 Mayo 0 Junio 7 Julio 4 Agosto 12 Septiembre 6 Octubre 7 Noviembre 5 Diciembre 5 Total 71 Tabla 11. Cantidad de días nublados o lluviosos por mes en el año 2008 100 Días nublados o lluviosos 14 cantidad de días 12 12 10 8 6 4 7 7 5 2 0 7 6 5 4 0 7 5 5 Mes Gráfica 2. Cantidad de días nublados o lluviosos por mes en el año 2008 Actividad 1 1. Con base en la información anterior, determina un valor representativo 5 del número de días al mes (en el año 2008), en los que es posible se tengan: a) Días soleados b) Días nublados o lluviosos Describe el método que empleaste para determinar los valores representativos, en cada caso. 2. Sin hacer variar el número total de días soleados y nublados o lluviosos al año, completa las siguientes tablas, de tal manera que cada mes tenga la misma cantidad de: a) Días soleados b) Días nublados o lluviosos 5 Representativo: aquel valor que reúne y describe las características del conjunto de datos. 101 MES Días Nueva cantidad soleados Enero 24 Febrero 23 Marzo 24 Abril 25 Mayo 31 Junio 23 Julio 27 Agosto 19 Septiembre 24 Octubre 27 Noviembre 25 Diciembre 26 TOTAL: 295 Tabla 12. Cantidad media de días soleados por mes MES Días nublados o Nueva cantidad lluviosos Enero 7 Febrero 6 Marzo 7 Abril 5 Mayo 0 Junio 7 Julio 4 Agosto 12 Septiembre 6 Octubre 6 Noviembre 5 Diciembre 5 TOTAL: 71 Tabla 13. Cantidad media de días nublados o lluviosos por mes 3. ¿Consideras que esas dos nuevas cantidades, obtenidas en el ejercicio 2, representan el número de días soleados y nublados o lluviosos que se tienen mensualmente en el año 2008? Justifica tu respuesta. 102 4. ¿Cuál de los valores obtenidos hasta el momento, consideras representa mejor la cantidad de: a) Días soleados b) Días nublados o lluviosos que se tienen mensualmente en el 2008? Justifica tu respuesta Descripción de la actividad 1 En el apartado uno de la actividad se espera que los estudiantes, empleando las tablas del archivo “Clima de la Ciudad de Mérida” (Figura 19) realicen una repartición equitativa, elijan el valor más grande del conjunto de datos o tomen aquel que se repita más veces, para determinar el valor que mejor represente cada uno de los dos conjuntos de datos. Figura 19. Datos del clima de la ciudad de Mérida en el 2008 Cuando los estudiantes hayan determinado su propio valor representativo de días soleados y nublados con lluvia, lo confrontarán con un nuevo valor proveniente del segundo ejercicio de la actividad uno, donde el método para determinarlo es a través de la repartición equitativa. Al momento de completar las tablas 3 y 4 de la actividad 1, se generarán de manera automática las gráficas correspondientes a los nuevos valores obtenidos en el ejercicio 2, las cuales serán 103 de utilidad para hacer comparaciones entre los datos y analizar su dispersión, respecto a esos valores representativos. Figura 20. Comparación de la cantidad original de días con la cantidad promedio Por último, deben de elegir el valor que mejor represente entre el que determinaron en un principio y el que calcularon en el ejercicio 2, del conjunto de días soleados y al de días nublados o lluviosos. Los argumentos pueden estar relacionados con la lejanía o cercanía que tienen los valores representativos con los valores de los conjuntos de datos, o por el hecho de que el método para determinarlos fue el mismo que los estudiantes emplearon en el ejercicio uno de esta actividad. 5.1.2. ACTIVIDAD 2 Propósito: Calcular la dispersión entre los valores del conjunto de datos y el valor representativo, mediante su representación numérica y gráfica. 104 La variación de los datos se encuentra ligada a la dispersión que existe entre los valores del conjunto de datos y su valor representativo, por lo que para llevar a cabo el cálculo de las dispersiones se considera que el estudiante debe de realizar, alguna de las siguientes acciones esperadas: • Calcular las diferencias absolutas o distancias entre los valores del conjunto de datos y su valor representativo. Esto indicará que tan alejados o cercanos se encuentran los valores originales de dicho valor que en teoría los representa. • Calcular los excesos y defectos entre los valores originales del conjunto y su valor representativo. Se podrá apreciar con esto, cómo es el comportamiento que presenta dichos efectos y defectos, y relacionarlos con algún patrón. • Calcular los excesos y defectos, y elevarlos al cuadrado. Esta acción convierte todos los valores en positivos, pero con una característica en particular, que unos valores crecerán mucho más rápidos que otros por lo que la variación será más visible. • La representación gráfica de alguna de las acciones anteriores. Plasmar los valores de las diferencias o los cuadrados de éstas, mediante una gráfica, para el análisis y descripción de su comportamiento tendencial, y reconocimiento de algún patrón en el comportamiento de los datos. • Realizar un análisis del gráfico de las diferencias absolutas. Esto, mediante una descripción del comportamiento que presentan y de las diferencias que identifiquen entre los dos gráficos (variaciones de días soleados vs. variaciones de días nublados o lluviosos). El tipo de valores que conformen a los conjuntos de datos será la variable en juego. Los valores atípicos o ceros considerados en un conjunto de datos, al calcular las distancias, harán que surjan diferencias tanto numéricas como gráficas, cuando el comportamiento de los gráficos de las variaciones no sea idéntico o presenten sesgos. Se espera que en esta actividad el estudiante emplee la operación aritmética de diferencia absoluta o el cálculo de diferencias al cuadrado, para cuantificar la distancia existente entre los valores de cada conjunto y su respectivo valor representativo. Una vez calculadas dichas diferencias o su cuadrado, representarlos gráficamente, para luego realizar un análisis del comportamiento que describen. 105 Actividad 2 1. ¿Cuál de los dos valores que obtuviste en la actividad 1, inciso 2, está más cercano y cuál más alejado de su conjunto de datos? 2. ¿En qué meses se debe modificar la potencia con la que es transmitida la información hacia los satélites? Justifica tu respuesta. 3. Las siguientes tablas y gráficas, presentan la dispersión entre la cantidad de días soleados y su valor representativo; así como, la dispersión entre la cantidad de días nublados o lluviosos y su valor representativo. Analiza el comportamiento de la variación que describen las dispersiones y responde las preguntas 4 y 5. MES Nueva cantidad de días soleados Distancia Enero 24.583 0.583 Febrero 24.583 1.583 Marzo 24.583 0.583 Abril 24.583 0.417 Mayo 24.583 6.417 Junio 24.583 1.583 Julio 24.583 2.417 Agosto 24.583 5.583 Septiembre 24.583 0.583 Octubre 24.583 0.583 Noviembre 24.583 0.417 Diciembre 24.583 1.417 Total 294.996 Tabla 14. Dispersión entre la cantidad de días soleados y su valor representativo 106 Dispersión entre los datos y su valor representativo 7 6.417 5.583 6 DIferencias 5 4 3 2.417 1 1.583 1.583 2 0.583 1.417 0.583 0.583 0.417 0.583 0.417 0 Mes Gráfica 3. Dispersión entre los datos y su valor representativo MES Nueva cantidad de días nublados Distancia Enero 5.916 1.084 Febrero 5.916 0.084 Marzo 5.916 1.084 Abril 5.916 0.916 Mayo 5.916 5.916 Junio 5.916 1.084 Julio 5.916 1.916 Agosto 5.916 6.084 Septiembre 5.916 0.084 Octubre 5.916 1.084 Noviembre 5.916 0.916 Diciembre 5.916 0.916 Total 70.992 Tabla 15. Dispersión entre la cantidad de días soleados y su valor representativo 107 Dispersión entre los datos y su valor representativo 6.084 Diferencias 5.916 1.084 0.084 1.084 0.916 1.084 1.916 0.084 1.084 0.916 0.916 Mes Gráfica 4. Dispersión entre los datos y su valor representativo 4. ¿Podrían ser las nuevas cantidades de días nublados o lluviosos obtenidos, representativos del número de días Soleados que se tuvieron mensualmente en el 2008? Justifica tu respuesta. 5. ¿Podrían ser las nuevas cantidades de días nublados o lluviosos obtenidos, representativos del número de días Nublados o lluviosos que se tuvieron mensualmente en el 2008? Justifica tu respuesta Comentarios. Los nuevos valores representan la Medía aritmética del conjunto de datos. La media aritmética tiene como características: • Surge a partir de realizar una repartición equitativa • Es un promedio del conjunto de datos, es decir, la suma de los valores observados entre el total de datos obtenidos • Puede ubicarse al centro, a la izquierda o a la derecha de los datos • Es un valor representativo de los datos del conjunto, con este valor se puede describir las características principales del conjunto 108 Descripción de la actividad Para esta actividad, los estudiantes deben de analizar qué tan alejados o cercanos se encuentran los valores representativos del conjunto de datos, es decir un análisis de la variación de los mismos. La tabla se presentará en Excel de la siguiente manera: Figura 20. Dispersión entre el conjunto de datos y su respectivo valor representativo Es en esta actividad, donde los estudiantes comenzarán a ejecutar la toma de decisiones respecto a la situación planteada, a fin de determinar si hay que modificar la potencia de la señal de trasmisión y en qué mes(es) se debe realizar dicha modificación. Posteriormente, dicho valor obtenido por la repartición equitativa será denominado como Media Aritmética junto con su caracterización. 109 5.1.3. ACTIVIDAD 3 Propósito: Generar argumentos discursivos y visuales, mediante el análisis de la variación de los datos, para justificar cuál es el valor más representativo del conjunto. En esta actividad, se considera que los estudiantes deben argumentar con respecto a las diferencias o el cuadrado de éstas, determinadas entre los valores del conjunto de datos y su valor representativo, analizando la variación de los datos y la descripción de las gráficas de diferencias, centrándose en: • Las variaciones más grandes o más pequeñas provocadas por los valores atípicos o ceros. • El comportamiento uniforme que las variaciones tienen provenientes del conjunto de datos que no contiene valores atípicos o ceros. • La posición o lugar (en medio, a la derecha o a la izquierda) donde el gráfico de las variaciones sufre un cambio de decreciente a creciente, o viceversa. • El patrón que presentan las variaciones positivas y negativos. El lugar en la gráfica donde sucede un cambio de signo (en el centro, a la derecha o la izquierda). Todo esto, para poder determinar los efectos que provocan los valores atípicos o ceros sobre el valor representativo de cada conjunto de datos. La variable a considerar en esta actividad son las argumentaciones gestuales y discursivas, ambas consideradas en las justificaciones de los resultados y métodos empleados por el estudiante, siendo de dos tipos: la primera, de carácter cuantitativo al momento de analizar los valores de la dispersión entre los datos y su valor representativo; el segundo, de carácter cualitativo, cuando el análisis se centre en el comportamiento de las gráficas generados por los valores de la dispersión en la observación de ciertas particularidades que estas presentan, tales como: el crecimiento de las diferencias positivas, el decrecimiento de las diferencias negativas, la cantidad de diferencias positivas o negativas, su ubicación en la gráfica, etc. Se espera que los estudiantes discutan y argumenten sobre los siguientes aspectos: 110 • El comportamiento que describen las variaciones no son iguales en ambas gráficas, en una hay un comportamiento más o menos uniforme mientras que en la otra no. • Los valores atípicos y ceros hacen que el comportamiento gráfico de las variaciones sean diferentes, puesto que en una, la que no contiene los valores atípicos o ceros, el valor representativo se encuentra en el centro o casi en el centro de los datos; mientras que en la otra, que sí los contiene, se encuentra a la derecha o a la izquierda. • Las variaciones entre los valores de los conjuntos de datos, que no contienen valores atípicos o ceros, son más o menos iguales, y las variaciones entre los valores del conjunto de datos que sí contiene valores atípicos o ceros son muy grandes o muy pequeñas; por lo que el comportamiento de ambos conjuntos de datos no es igual. • El comportamiento gráfico que presentan las variaciones de los datos, en particular, respecto al lugar (en el centro, a la derecha o a la izquierda) donde se suscita un cambio de creciente a decreciente en las gráficas, generados por las diferencias o distancias entre el conjunto de datos y su respectivo valor representativo. • El gráfico del cuadrado de las diferencias o de las variaciones de ambos climas, se diferencian en que el comportamiento de la gráfica es uniforme en la primera, mientras que en la segunda se presentan valores demasiado grandes y pequeños, tanto que se encuentran alejados unos de otros. Con esto, se pretende que el estudiante tenga herramientas para poder dar el siguiente paso de la actividad, la cual consiste en elegir aquel valor más representativo del conjunto de datos. Las justificaciones se espera se produzcan a partir de los resultados numéricos que hayan determinado y de los patrones o comportamientos de las gráficas, los cuales ayudarán para su correcta elección. Actividad 3 1. Completa la siguiente tabla, que muestra el número de días nublados o lluviosos del 2008, de manera que haya menor dispersión entre los datos y el valor representativo, que la que se tenía originalmente. Nota. Verifica que el número total de días (resultante) del año sea 366, dado que es bisiesto. 111 MES CANTIDAD DE DÍAS ENERO 7 FEBRERO 6 MARZO 7 ABRIL 5 MAYO JUNIO 7 JULIO 4 AGOSTO SEPTIEMBRE 6 OCTUBRE 7 NOVIEMBRE 5 DICIEMBRE 5 TOTAL 71 Tabla 16. Nueva cantidad de días nublados o lluviosos 2. Si las cantidades de días nublados o lluviosos fueran las anteriores, determina el valor de la media aritmética que los representa. Dispersión entre los datos y su valor representativo 6.084 Diferencias 5.916 1.084 0.084 1.084 0.916 1.084 1.916 0.084 1.084 0.916 0.916 Mes Gráfica 5. Dispersión entre los datos y el primer valor representativo obtenido 112 3. ¿Cuál de los dos valores de las medias aritméticas, obtenidas hasta el momento, representa mejor la cantidad de días nublados o lluviosos por mes? Justifica tu respuesta. Descripción de la actividad En esta actividad, se espera que los estudiantes observen que una modificación en los datos del conjunto, afecta su dispersión respecto al valor representativo y, por ende, este valor también cambia. La hoja de trabajo será como la siguiente: Figura 21. Datos de la cantidad de días nublados y lluviosos, con menor dispersión que los originales 113 5.1.4. ACTIVIDAD 4 Propósito: Determinar otro valor representativo del conjunto de datos, a partir de los resultados obtenidos del análisis de la variación de los mismos, a fin de elegir el más representativo entre dos valores distintos. Para la elección del valor que represente mejor a un conjunto de datos, se consideran las argumentaciones empleadas en las justificaciones de los resultados obtenidos en las actividades anteriores. Es decir, todas aquellas argumentaciones gestuales y discursivas, partiendo del método que emplearon para calcularlo, hasta el análisis de la variación de los datos. Con respecto a la realización de otro algoritmo o forma de calcular el valor que represente a un conjunto de datos, se considera el empleo del ordenamiento ascendente de los datos o de la repartición equitativa. De modo que, si primeramente empleó la repartición equitativa, en el conjunto que no le favoreció dicha forma tendrá que emplear la de enlistar a los valores de mayor a menor y tomar el valor central, si es impar, o el promedio de los centrales, si es par, o viceversa. Las argumentaciones discursivas de los estudiantes serán variables, puesto servirán para poder justificar: • La construcción de un nuevo método para determinar el valor representativo del conjunto de datos • Los efectos que tienen los valores atípicos o ceros sobre los valores representativos. Se espera que, los alumnos elijan la frecuencia esperada que mejor represente a cada uno de los conjuntos de datos. Se tendrá, que solamente uno de los dos valores representativos podrá ser elegido. Si el estudiante usó la repartición para determinar un valor representativo, entonces éste solo será representativo de aquel conjunto que no contenga datos atípicos o cero; si empleó el 114 ordenamiento ascendente, el valor determinado representará a ambos conjuntos, puesto que la mediana coincide con la media aritmética cuando los datos se comportan de manera uniforme. Si los alumnos emplean el ordenamiento ascendente de los valores de los datos, se les pedirá la construcción de otro método, o intentar con la repartición equitativa de los valores, aprovechando los resultados que otros estudiantes hayan tenido con este método. Esto propiciará interacciones alumno-alumno, sobre las ideas que tuvieron del por qué usar determinada forma de obtener el valor representativo y justificando para qué casos es válido emplear la repartición equitativa y en cuáles el ordenamiento. Actividad 4 1. En la actividad 1, inciso 2 obtuviste las medias aritméticas del clima soleado y clima nublado y lluvioso. Luego, realizaste un análisis de la variación de los datos y de los efectos que tienen estos sobre la media aritmética, por lo que ¿cuál media representa mejor al clima de la ciudad? ¿La media aritmética de los días soleados o la de los días nublados o lluviosos? Justifica tu respuesta. 2. Determina el valor que mejor representará la cantidad de días de cielo nublado o lluvioso del año 2008. Descripción de la actividad Para esta actividad, el estudiante deberá decidir cuál es el valor que mejor representa a su respectivo conjunto de datos, justificando su respuesta con base en los resultados que anteriormente ya obtuvo, mediante el análisis de la variación de los datos y de los efectos que sobre la media tienen los valores del conjunto de datos. 5.1.5. ACTIVIDAD 5 Propósito: Construir el algoritmo de la media aritmética y mediana, para calcular un valor representativo de un conjunto de datos en cualquier contexto o situación. 115 Para la construcción del algoritmo de la media aritmética se considera la práctica de la repartición equitativa; para la mediana, el ordenamiento ascendente de los valores. Las argumentaciones discursivas del estudiante será una variable y se encontrará centrada sobre la construcción de los algoritmos de la media aritmética y mediana, más aún, en la descripción de los casos en donde es válido el empleo del primero y en cuáles el segundo. Dichas argumentaciones se encuentran ligadas a los valores atípicos o ceros, que son también variables, puesto que depende de su existencia en el conjunto de datos para decidir emplear el algoritmo de la media aritmética o mediana Se espera que el alumno distribuya los valores de los datos entre éstos, de tal forma que cada dato tenga la misma frecuencia o, sumando todos los valores y dividiéndolo entre el número total de datos, para tener un primer acercamiento al algoritmo de la media aritmética. Una vez realizada la repartición equitativa, representar el método de manera general, para dar pie a la construcción del algoritmo de la media aritmética. Se espera que al momento de discutirse la situación, en la fase de validación, los estudiantes tomen las ideas de los otros y las trabajen, es decir, que si uno realizó la distribución de los valores, él tome las ideas de aquel que decidió emplear al ordenamiento, y viceversa. Así mismo, se expresen las características de la media aritmética y mediana con respecto a los valores de los conjuntos de datos, enfatizando su propiedad de representatividad. Actividad 5: 1. Los investigadores analizan el clima de la ciudad de Mérida durante el período de 2000 al 2008 para pronosticar el del año 2009. En la siguiente tabla se presentan los climas de días soleados y nublados o lluviosos que hubieron durante ese período. Propón un método para determinar el valor que mejor represente el número de: a) días soleados b) días nublados o lluviosos 116 AÑO DÍAS SOLEADOS DÍAS NUBLADOS 2000 23.7 7.5 2001 22.9 8.5 2002 22.4 8.5 2003 23.3 7.5 2004 24.2 6.5 2005 23.1 7 2006 25.1 6.5 2007 10.1 7 2008 24.58 6 Tabla 17. Valores representativos de la cantidad de días soleados y nublados y lluviosos período 2000-2008 2. ¿Se debería de mantener, disminuir o aumentar la potencia con la que se mandaría la información al espacio en el año 2009? Justifica tu respuesta Comentarios. Al valor que representa al número de días soleados se llama mediana y consiste en un valor que se encuentra justamente a la mitad del conjunto de datos, puede tomar o no el valor de algún dato y no se es tan modificado por los valores atípicos. El valor que representa a los días nublados se llama media aritmética y es un valor que se encuentra a la mitad de un conjunto de datos que no tiene valores atípicos, es decir, que tienen un comportamiento uniforme. 3. Para el período, 2000-2009, los investigadores deciden estudiar el comportamiento de los climas soleado o nublado y lluvioso, a fin de predecir el del 2010. Propón una fórmula general para determinar la media aritmética y mediana de cierto clima, si se tienen los siguientes datos: 117 AÑO VALORES 2000 x1 2001 x2 2002 x3 2003 x4 2004 x5 2005 x6 2006 x7 2007 x8 2008 x9 2009 x 10 Tabla 18. Valores representativos de la cantidad de días soleados y nublados o lluviosos período 2000-2009 Descripción de la actividad Esta actividad, forma parte de la generalización de los métodos para determinar la media aritmética y mediana, con la finalidad de construir los algoritmos para calcular esos valores representativos. La práctica de la repartición equitativa proporcionará el modelo del algoritmo de la media aritmética; cuando se tengan datos con valores muy grandes o muy pequeños, el ordenamiento de los datos, será un aspecto a considerar en el cálculo de la mediana. La predicción, de nueva cuenta, tomará el papel para ejercer la toma de decisiones de los estudiantes. 5.1.6. ACTIVIDAD 6 Propósito: Construir el algoritmo inverso de la media aritmética, para poder calcular el valor faltante de un conjunto de datos, dada su media aritmética. 118 En la mayoría de los casos, los estudiantes tienden a resolver ejercicios o problemas mediante el ensayo y error, por lo que es posible considerar ésta técnica para determinar el valor faltante de un conjunto de datos (conocida la media aritmética), y así poder llevar a cabo la inversión del algoritmo. El algoritmo inverso se construiría, algebraicamente, mediante el planteamiento de una fórmula para el cálculo de la media aritmética y despejando el valor faltante. Se pretende también que, a través de esta actividad, el estudiante descubra ciertos patrones o características que tienen el conjunto de datos sobre la media aritmética o la media aritmética sobre el conjunto de datos. El valor de la media aritmética, la cantidad de datos y los valores atípicos o ceros dentro de un conjunto de datos serán considerados como variables de esta actividad, debido a que: • El valor de la media aritmética y la cantidad de datos, hacen variar al valor faltante de un conjunto de datos. • Los valores atípicos o ceros hacen variar a la media y al valor faltante, sobre todo los valores cero, pues aunque no tenga un valor numérico, siempre es considerado como un dato del conjunto. Se espera que el alumno comience utilizando el ensayo y error, para calcular el valor faltante del conjunto de datos, dada su media aritmética, de tal forma que sume todos los datos y divida el resultado entre el número total de éstos. Esto le sería útil para observar que el dato faltante, se encuentra ligado a los valores del conjunto y que, para calcularlo, es más sencillo despejarlo a partir del algoritmo de la media aritmética. También, se podría esperar que directamente despeje la fórmula, esto si su capacidad de abstracción es elevada o es capaz de evidenciar tal tratamiento que se ha dado. Actividad 6 1. Durante el período 2001-2009, se espera que en promedio por año haya 23.2 días soleados y 7.5 días nublados o lluviosos. ¿Cómo será el clima en el año 2009, si del 2001 al 2008 se tuvieron las frecuencias indicadas en las gráfica 6 y 7? 119 Días soleados 30 Cantidad de días 25 25.6 20 15 19.9 21.2 22.5 24.8 21.1 22.6 23.9 10 5 0 2001 2002 2003 2004 2005 2006 2007 2008 2009 Año Gráfica 6. Cantidad de días soleados Días nublados o lluviosos 12 Cantidad de días 10 11.1 9.9 9.8 8 8.5 8.4 6 5.4 4 7.1 6.2 2 0 2001 2002 2003 2004 2005 2006 2007 2008 2009 Año Gráfica 7. Cantidad de días nublados o lluviosos 2. Estima el número de días soleados que en promedio se esperaría tener en el año 2010, para que la media aritmética anual, del 2001 al 2010 sea X. Considera para ello los siguientes datos 120 Año Valor representativo 2001 𝑥𝑥1 2002 2003 2004 2005 2006 2007 𝑥𝑥2 𝑥𝑥3 𝑥𝑥4 𝑥𝑥5 𝑥𝑥6 𝑥𝑥7 2009 𝑥𝑥8 2010 𝑥𝑥9 ¿? Media aritmética X 2008 Tabla 19. Valores representativos hipotéticos de la cantidad de días soleados o nublados o lluviosos en el periodo 2001-2010 3. Una persona decidió determinar el valor representativo del número de días soleados por mes del año 2008, de la siguiente forma: Primero, sumó los días soleados que hubo de enero a mayo y los dividió entre cinco. 24 + 23 + 24 + 25 + 31 = 25.4 𝑑𝑑í𝑎𝑎𝑎𝑎 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑝𝑝𝑝𝑝𝑝𝑝 𝑚𝑚𝑚𝑚𝑚𝑚 5 Luego, sumó la de los últimos siete meses, de junio a diciembre, y los dividió entre siete. 23 + 27 + 19 + 24 + 24 + 25 + 26 = 24 𝑑𝑑í𝑎𝑎𝑎𝑎 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑝𝑝𝑝𝑝𝑝𝑝 𝑚𝑚𝑚𝑚𝑚𝑚 7 Al final, sumó estos dos valores y los dividió entre dos, dando como resultado: 25.4 + 24 = 24.7 𝑑𝑑í𝑎𝑎𝑎𝑎 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑝𝑝𝑝𝑝𝑝𝑝 𝑚𝑚𝑚𝑚𝑚𝑚 𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑒𝑒𝑒𝑒 𝑎𝑎ñ𝑜𝑜 2008 2 ¿Es correcto el procedimiento empleado por esta persona para determinar la media aritmética del número de días soleados? Justifica tu respuesta. 121 Descripción de la actividad En esta actividad, los estudiantes pueden trabajar con las siguientes hojas de Excel: Figura 22. Tablas y gráficas del período 2001-2009 incompleto Figura 23. Tablas y gráficas del período 2001-2009 completo En la última parte de la actividad, se realizará una confrontación entre el método que los estudiantes construyeron previamente y este segundo método propuesto, para el cálculo de la media aritmética, a fin de que los estudiantes discutan sobre los efectos que tiene obtener la media aritmética mediante la aplicación de la propiedad asociativa. Se espera que generen argumentos para justificar, por qué este segundo método no es correcto. 122 CAPÍTULO VI. REFLEXIONES Y CONSIDERACIONES En las instituciones escolares es necesario enfatizar la construcción del conocimiento matemático por parte del estudiante, mediante situaciones didácticas en donde la acción, formulación, validación e institucionalización del conocimiento se lleve a cabo. En el caso de la educación estadística, se propone hacerlo con situaciones o problemas, que generen en los estudiantes la capacidad de: tomar decisiones ante situaciones de incertidumbre, leer gráficos para comunicar información proveniente de diversos medios, construir y emplear gráficas, utilizar las medidas de posición central y su propiedad de representatividad, analizar la variación de los datos, realizar investigación de campo para la recolección de datos y predecir hechos o acontecimientos. 6.1. REFLEXIÓN SOBRE LA SITUACIÓN ESCOLAR DE LA ESTADÍSTICA La recopilación de investigaciones realizadas por Batanero (2001) y Shaugnessy (1992), presenta a la comunidad de profesores de matemáticas y de estadística, los diversos fenómenos didácticos que se suscitan en el aula cuando se realiza el tratamiento de conceptos estadísticos, desde los estudiantes de nivel básico, hasta aquellos de nivel superior; incluso en el ámbito profesional. Algunos errores y dificultades sobre las medidas de posición central, varianza, desviación estándar, distribuciones de probabilidad, pruebas de hipótesis, entre otros, se encuentran relacionados con el tratamiento de las representaciones estadísticas de los conjuntos de datos, en particular, cuando son en forma de gráficas (columnas, barras, circulares, etc.). . Entre los factores que pueden ocasionar tales dificultades, se tienen las prácticas que los docentes de matemáticas ejecutan durante el tratamiento de los conceptos estadísticos, 123 teniendo como secuencia: definición ejemplos y ejercicios, siguiendo la predeterminación de los currículos escolares y los libros de texto. Es por ello, que se espera que los docentes propicien en el aula de clases la participación activa de los estudiantes, mediante el análisis de situaciones y problemas, en donde tenga lugar la investigación de campo para la obtención de muestras, su representación gráfica, lectura y la toma de decisiones. En particular, el cálculo de las medidas de posición central debe partir de la recolección, análisis e interpretación de los datos, es decir, obtener muestras estadísticas, analizar la variabilidad de éstos, identificar comportamientos tendenciales y patrones en su representación gráfica, analizar los efectos de la variabilidad de las muestras sobre los valores representativos de media aritmética y mediana, la predicción de hechos o sucesos y la toma de decisiones. Es importante, que los docentes presten atención a los resultados e interpretaciones que los estudiantes produzcan y expongan, para poder identificar cuáles son las carencias, dificultades y errores que ellos presentan. También se sugiere, que los docentes propongan situaciones a resolver a través de tecnología, pues el manejo de la información con un software conlleva a realizar una mejor construcción y trabajo de los conceptos estadísticos, al centrar la atención en el análisis e interpretación de los datos, y no en tediosos cálculos. 6.2. CONSIDERACIONES DIDÁCTICAS PARA EL TRATAMIENTO DE CONCEPTOS ESTADÍSTICOS El tratamiento de los conceptos estadísticos en el aula, se ve favorecido por situaciones en contextos reales, donde la incertidumbre, la aleatoriedad, la toma de decisiones, se encuentren presentes, como necesidad de predecir y comunicar hechos y sucesos. 124 Recolectar datos, analizar su variabilidad, construir una gráfica que los represente, identificar sus comportamientos tendenciales, patrones y argumentaciones, son acciones que favorecen que los estudiantes estén en contacto con los conceptos estadísticos y los puedan caracterizar. En las situaciones didácticas escolares, se recomienda que los profesores tomen en cuenta las siguientes consideraciones para la construcción del conocimiento estadístico: • Predicciones sobre fenómenos aleatorios • Contextualización de los problemas • Representación tabular y gráfica de un conjunto de datos • Análisis de la variación de datos • Construcción de algoritmos • Toma de decisiones • Investigación de campo • Dificultades y errores que los estudiantes presentan durante el tratamiento de los conceptos estadísticos De esta manera, se esperaría propiciar que los estudiantes generen argumentos para construir su conocimiento estadístico y aplicarlo ante cualquier situación de la vida cotidiana. En situación escolar, por tanto, se hace necesario culturizar estadísticamente a la población estudiantil, empleando la estadística como una herramienta de la vida diaria para la lectura, comunicación de información y toma de decisiones. 125 BIBLIOGRAFÍA 1. Artigue, M., Douady, R. y Moreno, L. (1995). Ingeniería didáctica en educación matemática. Un esquema para la investigación y la innovación en la enseñanza y aprendizaje de las matemáticas. México: Editorial Iberoamerica. 2. Batanero, C. (2001). Didáctica de la estadística. Recuperado el 18 de junio del 2006, del sitio web del Departamento de Didáctica de la Matemática de la universidad de Granada. 3. Bargas, R., y Camargo, M., (2004). Introducción a la probabilidad y estadística. Publicaciones de la Universidad Autónoma de Yucatán, Mérida, México: Editorial Progreso. 4. Blanco, H. (2006). Una aplicación de Bayes en la toma de decisiones. ALME: Acta Latinoamericana en Matemática Educativa 19, 169-172. 5. Brousseau, G. (1997). Theory of Didactical Situations in Mathematics. Kluwer Academic Publishers. Great Britain. [Editado y traducido por Nicolás Balacheff, Martín Cooper, Rosamund Sutherland y Virginia Warfiel] 6. Cantoral, R., Farfán, R., Cordero, F., Alanís, J., Rodríguez, R., Garza, A., (2003). Desarrollo del pensamiento matemático. México: Editorial Trillas. 7. Chavarria, J., (2006). Teoría de las Situaciones Didácticas. Cuadernos de investigación y formación en educación matemática, 1 vol. 2. Recuperado el 28 de septiembre de 2008 de http://www.cimm.ucr.ac.cr/cuadernos/cuaderno2/Cuadernos%202%20c%203.pdf 8. Chevallard, Y., (1997). La transposición didáctica. Del Saber Sabio al Saber Enseñado. Buenos Aires: Editorial AIQUE. 9. Cobo, B. y Batanero, C. (2004). Razonamiento numérico en problemas de promedios. Suma. Vol.45, pp.79-86. 10. Cobo, B., y Batanero, C. (2000). La mediana en la educación secundaria. ¿Un concepto sencillo? UNO, 24. 11. Collette, J., (1985). Historia de las Matemáticas I. México: Editorial Siglo XXI. 12. Dirección General de Bachillerato (2006). Programa de estudios: Probabilidad y Estadística I. Secretaría de Educación Pública. México, D. F. Recuperado de: 126 http://www.dgb.sep.gob.mx/informacion_academica/programasdeestudio/cfp_5osem/P rob_Estadistica_%20I.pdf 13. Dirección General de Bachillerato (2006). Programa de estudios: Probabilidad y Estadística II. Secretaría de Educación Pública. México, D. F. Recuperado de http://www.dgb.sep.gob.mx/informacion_academica/programasdeestudio/cfp_6osem/P rob_Estadistica_%20II.pdf 14. Educación básica. Secundaria. Matemáticas. Programas de estudio 2006. Publicado por la Dirección General de Desarrollo Curricular. Secretaria de Educación Pública. México. 15. Fernández, D., y Guitart, M. (2005). Un marco para la evaluación de la Estadística en Ingeniería. ALME: Acta Latinoamericana en Matemática Educativa 18, 79-85. 16. Grande, C., y Velázquez, S. (2007). La práctica de la simulación en la solución de problema de probabilidad. En G. Buendía (Ed.). Memoria de la XI Escuela de invierno en Matemática Educativa. Universidad Autónoma de Yucatán, México. 17. Maldonado, J., y Ojeda, A. (2007). Comprensión de ideas fundamentales de estadística en la educación primaria. En G. Buendía (Ed.). Memoria de la XI Escuela de invierno en Matemática Educativa. Universidad Autónoma de Yucatán, México. 18. Mayén, S., Cobo, B., Batanero, C. y Balderas, P. (2007). Comprensión de las medidas de posición central en estudiantes mexicanos de bachillerato. UNIÓN: Revista Iberoamericana de educación matemática 9, 187-201. 19. Michael, F., y Denis, D. (2007). Milestones in the History of Thematic Cartography, Statistical Graphics, and Data Visualization. Recuperado el 28 de octubre de 2007 del Departamento de Matemáticas de la Universidad de York: http://maths.york.ac.uk/www/ResearchStats 20. Newman, J. (1968). Sigma El mundo de las matemáticas Vol. 3. Traducido de la 1ª edición de Simon and Schuster, Inc., Nueva York, 1956, con el título de The world of mathematics. Editorial Grijalbo, Barcelona, España. 21. Plackett, R. (1970). Studies in the History of Probability and Statistics. VII The Principle of the Arithmetic Mean. Biometrika 45, 130-135. 22. Shaughnessy, J. (1992). Research in probability and statistics: Reflections and Directions en Grouws D. A. Handbook of Research on Mathematics Teaching and 127 learning, New York: Macmillan Publishing Company, pp. 465-494. (Editado y traducido por Ernesto Sánchez, Gabriel Yánez y Roberto Ávila). 23. Torres, J., y Gibert, R. (2007). La enseñanza de la probabilidad y estadística usando Statgraphics. ALME: Acta Latinoamericana de Matemática Educativa 20,689-694 24. Urrea, M., (2005). Razonamiento probabilístico en estudiantes del nivel superior. ALME: Acta Latinoamericana de Matemática Educativa 18, 207-214. 25. Zamora, L., Alonso, I., (2007). Metodología para la impartición de tópicos de estadística y probabilidad es en la enseñanza preuniversitaria en cuba. ALME: Acta Latinoamericana de Matemática Educativa 20. 264-269. 128