Texto N°1 de la Bibliografía ampliatoria Amigues, R. y Zerbato-Poudou, M.T. (1999): Las prácticas escolares de aprendizaje y evaluación, México, FCE VII. Medir, Calificar, evaluar. ¿Es lo mismo? Muy a menudo los profesores principiantes se desconciertan ante los rasgos de las prácticas de evaluación. Se preguntan si han de hacer lo mismo cuando califican o evalúan y si se enfrentan o no a realidades diferentes; ¿evaluar es medir?; ¿se puede evaluar sin medir? Sí es así, ¿cómo pueden compararse evaluaciones diferentes?,. ¿La calificación es una medición o una evaluación?. ¿Sobre qué se fundamentan estas distinciones; tienen consecuencias prácticas? Por ejemplo, la calificación cifrada, comúnmente utilizada, ¿se basa en una escala de medición?, ¿Cómo explicarle a un alumno lo que habría tenido que hacer para obtener el promedio cuando sólo tiene 8? ¿Qué justificaciones darle a tal otro porque sacó 9,5 cuando tanto uno como el otro piensan que sus exámenes son comparables? Para contestar de manera informada a este tipo de preguntas presentamos primero un punto de vista técnico y petrológico, ya que constituyó el fundamento esencial de las críticas a los procedimientos de evaluación utilizados por los maestros. La calificación y la medición: Las diferentes escalas. De manera general, por medición se entiende “todo proceso que permite asignar números a sujetos que respeten y representen algunas propiedades” (Doron y Parot, 1991). En el campo escolar, la práctica de la calificación emplea escalas de calificación para comparar los diversos desempeños realizados por los alumnos, así como los criterios y las normas a partir de los cuales se toman las decisiones. Esta parte ofrecerá referencias y precisará las relaciones que mantienen las calificaciones, la medición y los actos de evaluación. En general, la medición de un objeto o de un fenómeno se vincula con la escala de medición usada, y la descripción o la representación que se hará de él, con mayor o menor precisión, dependerá del tipo de escala empleada. En otras palabras, la naturaleza de las informaciones obtenidas, utilizadas y transmitidas por el maestro dependerá íntimamente de los instrumentos de evaluación utilizados y, en particular, de las escalas de calificación. Existen cuatro tipos de escala, que presentaremos rápidamente. La escala nominal permite distribuir los objetos en clases o categorías determinadas por criterios distintivos. Por ejemplo, distribuir a individuos conforme a su profesión o a su nivel socioeconómico (las categorías socioprofesionales propuestas por el Instituto Nacional de Estadísticas y Estudios Económicos resultan de este tipo de escala) A veces estas categorías se designan por medio de números independientes de su propiedad matemática; son “números” de categorías o un medio para codificarlas conforme a un orden. Por ejemplo, designar a los varones con un 1 y a las niñas con un 2. En cambio, esta clasificación permite simplemente clasificar a los varones y a las niñas en dos categorías excluyentes y obtener así una distribución de la población de un establecimiento escolar; por ejemplo, y buscar la clase en la que la efectividad es mayor. El uso de este tipo de escala permite representar observaciones (en forma de cuadros, de histogramas…) y hacer comparaciones entre distribuciones desiguales de observaciones. Sin embargo, este tipo de escala sigue siendo más circunstancial que sistemático en las prácticas escolares de los maestros. La escala ordinal permite ordenar los objetos conforme a cierto orden a partir de un criterio dado, como por ejemplo la estatura. En este caso, es importante señalar que la distancia –o el intervalo- entre dos objetos vecinos no se precisa. Así sucede con la distancia entre trabajos similares clasificados conforme a un orden de preferencia, o entre obras literarias seleccionadas por un jurado. Sucede también con ciertas boletas escolares que utilizan las categorías A,B,C,D,E (donde A reúne a los muy buenos alumnos y E a los menos buenos de una clase) para indicar la pertenencia de un alumno particular a una categoría, o para dar una imagen de los rendimientos de la clase. Pero el intervalo entre dos categorías no se define. Desde un punto de vista teórico, este tipo de escala no permite calcular un promedio aritmético. Sin embargo, esta clase de limitante teórica no siempre es compatible con las “categorías del entendimiento profesoral” (Bourdieu y Saint-Martín, 1965) cuyo deseo es muy a menudo afinar los juicios de evaluación relativos a los rendimientos de los alumnos. Así sucede cuando estas categorías se utilizan conforme al modo de la “calificación cifrada”, del tipo B++, B+, B-, B-. Pero asimismo veremos más adelante, a propósito de otras escalas de medición, que las prácticas pedagógicas se permiten muchas “libertades” con el rigor petrológico oficial. Tal vez esto sucede con las prácticas de evaluación cifrada porque, al principio, la calificación introducida por los jesuitas tenía como meta estimular competitividad entre los alumnos de la aristocracia, y no medir los rendimientos de estos últimos o la eficacia de la enseñanza impartida con referencia a una norma establecida. A imagen de una competencia deportiva, cada alumno debía aprender a medirse con los demás y, en cierta manera, los puntos que marcaba le hacían ser consciente de su lugar en la jerarquía social. Actualmente estos tipos de escalas constituyen un medio de transcripción, un código que permite situar el desempeño de un alumno, la efectividad de cada categoría, resumir informaciones relativas a la distribución de los alumnos en la clase, con respecto a una norma o a un nivel escolar. La escala de intervalo introduce una limitante suplementaria: la unidad. Así, el tamaño de la diferencia comprobada entre dos valores de una escala es cuantitativamente igual al observado en otra parte de la escala. Por ejemplo, los calendarios emplean este tipo de escala para proponer una unidad de tiempo. Pero no permiten afirmar que transcurrió dos veces más tiempo en año 1000 que en el año 500. Lo mismo sucede con la escala de temperatura representada por el termómetro, cuyo punto de origen, correspondiente a “cero”, se basa en una convención: la temperatura del hielo cuando se derrite. Sin embargo, 20 grados (Celsius) no representan dos veces 10 grados (Celsius). Para cerciorarse de ello, basta convertir estos intervalos a la escala Kelvin para comprobar que 293 grados (Kelvin) no son el doble de 283 grados (Kelvin). En el campo escolar este tipo de escala, que dispone también de un origen convencional (cero) se utiliza con frecuencia con la calificación cifrada. Ahora bien, ni los alumnos ni los profesores piensan que un examen calificado con 17 vale dos veces el que obtuvo 9; o que dos exámenes calificados con 9 pueden hacer uno que valgo 18. Asimismo, nadie se sorprende de que la primera calificación obtenida por los alumnos franceses que empiezan a aprender chino no sea cero, cuando lo ignoran todo del idioma chino. La escala de relación, o proporcional, dispone de un origen, y permite entonces operaciones particulares, como el cálculo del promedio aritmético, por ejemplo. Lo mismo sucede con las escalas de peso o de longitud, y más generalmente con las mediciones efectuadas en el campo de las ciencias de la naturaleza. Sin embargo no nos equivoquemos: desde un punto de vista matemático, las escalas de calificación que permiten evaluar los exámenes no se asemejan a escalas de peso. Pero desde el punto de vista práctico, se consideran escalas de peso provistas de un origen (el cero) y de una unidad de medición, el punto. Pero un punto no es una unidad de masa o de fuerza. Desde la perspectiva de las prácticas pedagógicas la evaluación de los exámenes escolares se asemeja a los comentarios de los meteorólogos, para quienes las temperaturas estarían a veces “por encima” o “por debajo” de las “normales estacionales”. En las ciencias sociales las escalas de relación se emplean raras veces. La medición suele llevarse a cabo de manera indirecta, con escalas de medición menos rígidas que en las ciencias físicas, y siempre adquiere aspectos estadísticos (descriptivos o inferenciales). Es precisamente la razón por la cual la evaluación escolar representa un campo particular de investigación sobre la metodología de la medición. Con la evaluación escolar nos encontramos constantemente en presencia de dos tipos de discurso. Por un lado el de los docentes, cuyas evaluaciones se basan en un registro muy amplio: apreciaciones cualitativas no ordenadas (anotaciones de copias, apreciaciones en las boletas escolares), y ordenadas (MB,B,S…), con apreciaciones cifradas (calificación), etc. Por otro el de los especialistas de la medición, que intentan, por medio de un procedimiento científico, determinar el nivel adecuado de la medición a fin de llevar a cabo exclusivamente las operaciones apropiadas a la naturaleza de las variables estudiadas. Pareciera juicioso separar bien estos dos tipos de discurso, aunque sólo fuese para evitar ambigüedades en el sentido que debe atribuirse a tal o cual tipo de evaluación. Sin embargo, su distinción se basa necesariamente en un mejor conocimiento de las propiedades técnicas de las herramientas de medición utilizadas. Y tal vez es ahí donde reside la dificultad esencial. En efecto, a semejanza de las rutinas pedagógicas, el análisis reflexivo acerca de este tipo de práctica no se impone como una necesidad desde el momento en que las escalas de calificaciones son de uso común, Sin embargo, las escalas de medición no lo dicen todo. Dicen lo que pueden decir… y hasta lo que no se desearía oír. Por ejemplo, la inteligencia humana se mide por medio de un coeficiente intelectual (ci): la relación entre la edad mental y la edad real. Sin embargo, convencionalmente los rendimientos obtenidos por sujetos de un mismo grupo de edad ante una prueba se distribuyen en una escala normalizada cuyo promedio es 100 y la diferencia tipo 15. El ci de un sujeto es, entonces, la calificación obtenida en dicha escala. Se trata por consiguiente de un rango, y no de un coeficiente. Así, decir que un individuo tiene un ci de 140 es indicar una medición, su rango en un grupo de referencia. Decir que tiene una inteligencia superior al promedio es un juicio de valor. Se concibe fácilmente el desconcierto del genio, revelado así por la prueba, que hubiera tal vez preferido conocer la medición exacta de su propia inteligencia, única susceptible de dar un testimonio objetivo de su valor personal. Este tipo de cuestión plantea, de nuevo, la de los vínculos que unen a los “hechos” producidos con los métodos utilizados que permiten producirlos. Ya evocamos este problema a propósito del aprendizaje. Pero si consideramos las escalas de calificaciones como medio de información (en el sentido de dar forma a evaluaciones que nos esforzamos por objetivar), puede ser interesante saber cómo funcionan estos medios, cuáles son sus intereses y sus límites. Por ejemplo no sólo saber calcular un promedio de calificaciones para interpretar los rendimientos de los alumnos, apreciar la dificultad del ejercicio propuesto, o también cerciorarse de la homogeneidad del grupo de la clase, o de su heterogeneidad. Es evidente que las prácticas escolares de evaluación no constituyen propiamente actos de medición, en el sentido en que se entiende el mundo físico. Pero que dichas prácticas escolares se permiten algunas fantasías con la medición no las vuelve condenables justamente en nombre del rigor petrológico y merecedoras de supresión, como lo reclaman algunos. En este caso un gran número de prácticas sociales estarían amenazadas de erradicación. Semejante proceso de intención reduciría en gran medida el campo de las prácticas económicas, por ejemplo. Más seriamente, avanzaremos poco en este campo si nos atenemos a posiciones rígidas y dicotómicas: ¡la medición o nada! En cambio, es muy diferente considerar desde el punto de vista de la teoría de la medición las cuestiones métricas planteadas por las prácticas escolares de evaluación. Esta última perspectiva permitiría una mejor comprensión de las diversas funciones de la evaluación, de los diferentes niveles de decisión y de su articulación. Es lo que examinaremos con la noción de nivel escolar.