¿Que nos indica la nota de un examen o la nota que sacamos en un curso? ¿Si soy un profesor – y lo soy – qué estoy indicando cuando pongo una nota a uno de mis estudiantes?
En teoría la nota es un indicador del grado de conocimiento que tiene un estudiante sobre una materia, es una medida de aprendizaje. Es como la lectura de un termómetro que nos dice el nivel de conocimiento en la cabeza del estudiante. ¿Verdad?
Pues no.
André Antibí es un profesor e investigador francés que hace unos 13 años publicó una teoría inquietante. La idea es la siguiente: Imaginemos una maestra o maestro excelente, que trabaja con un grupo de alumnos muy motivados que trabajan, colaboran y aprenden un montón. Por lo tanto todos obtienen un excelente como nota merecida. Lo que va a suceder probablemente es que los evaluadores de calidad de su centro o del estado van a marcar a este profesor y curso como sospechosos de mala práctica en la evaluación. 
¿Porqué?
Pues porqué las notas de este curso – todos con excelente -no son las que se esperan, no son normales. No encajan… con la campana de Gauss.
La  Campana de Gauss y las notas de clase.
Vamos a hacer un dibujo. En una linea horizontal pondremos una escala con las posibles notas que pueden sacar los alumnos de una clase en un examen. Ahora vamos a tomar a cada estudiante y lo representaremos como un cuadraticono. (Un cruadraticono es un invento mío
Observemos que los cuadraticonos que aprueban están mucho más contentos que los cuadraticonos que suspenden. Que pasada, ¿no? Sigamos.
Vamos a ir colocando los cuadraticonos correspondientes a cada estudiante. Si hay dos cuadraticonos que van en el mismo sitio, pues los apilamos. Y nos va quedar algo como esto:
Histograma con cuadraticonos
¿Que chulo no? Este tipo de dibujo se llama histograma y si has estudiado algo de estadística seguro que ya lo sabes. Pero con cuadraticonos mola mucho más, ¿a que sí? Los que saben de estadística os contarán que con un histograma se pueden saber cosas muy chulas acerca de una población* .
Cuando alguien se arremanga** para hacer un análisis estadístico de un histograma lo primero que va a hacer es ver si hay algún cuadraticono fuera de sitio. !No vaya a ser que los datos reales vayan a estropear nuestro hermoso análisis teórico! Por eso, vamos a coger los cuadraticonos que afean el dibujo y los vamos a descartar. A estos cuadraticonos los llamamos outliers o tipejos raros.
Ahora que hemos descartado unos cuantos datos incómodos, a los estadísticos les gusta sentirse cómodos – ¿a quien no? -, podemos ver que nuestro montón de cuadraticonos o histrograma sigue una curva muy bonita con forma de campana.
Y esta curva en forma de campana fue descubierta y estudiada por un señor que se llamaba Carl Friedrich Gauss a principios del S. XIX. Este tipo de curvas aparecen a menudo en un montón de muestras de datos. Las hay de gorditas y estrechitas, y  pueden estar más bien a la derecha, más bien a la izquierda o más bien centradas. Pero el caso es que esperamos que estén ahí.
Y cuando la montaña de cuadraticonos o histograma no representa una campana de Gauss, aparecen las sospechas que algo no ha ido bien.

La campana de Gauss y las notas.

Los docentes y los evaluadores de la calidad de la docencia – “calidad de la docencia”… ¿a que suena a rancio de narices? – hemos aprendido a esperar la campana de Gauss. Entre los alumnos de toda clase esperamos que los haya de mejores y peores***, y esperamos – estamos convencidos – que se distribuirán siguiendo una campana de Gauss.
Y por eso, si nuestro examen o forma de evaluación está bien hecho… las notas se van a distribuir según una campana de Gauss.

La constante macabra

Según Antibí (y yo suscribo sus palabras) los docentes no evaluamos el conocimiento o el aprendizaje de sus estudiantes, sino que diseñamos las pruebas y evaluamos para poder colocar a cada los alumnos en su lugar dentro de la curva de Gauss. Y por ello existe una constante macrabra: el porcentaje mínimo de alumnos que van a suspender independientemente de lo que se trabaje o aprenda en su clase.
Según encuestas hechas en Francia por el equipo de investigación de André Antibí un porcentaje abrumador de docentes franceses creen en la validez de la teoría de constante macabra.
Hay profesores de universidad que en su primera clase informan tranquilamente a sus alumnos que solo un X por ciento de ellos van a aprobar. Estos profesores saben que la constante macabra existe, ellos la predicen y saben que se cumple a rajatabla cada semestre.
El problema es cuando la constante macabra deja de ser un fenómeno estadístico y se convierte en una predicción que altera la realidad para garantizar su propio cumplimiento. 
Por ejemplo: en el mundo de la informática Gordon Moore predijo en los 1960’s algo así como que la potencia de los microprocesadores se doblaba cada 2 años y que se iba a seguir doblando en el futuro. Esto se conoce como la ley de Moore. La industria de los microprocesadores no solo se creyó la Ley de Moore, sino que desde entonces utiliza la ley de Moore para organizar sus planes de trabajo y el ritmo al que van a comercializar sus nuevos procesadores. La Ley de Moore es una predicción que, mediante la reacción ante la industria, garantiza su propio cumplimiento.
La expectativa de encontrar una distribución tipo Campana de Gauss hace lo mismo que la ley de Moore.
Hay docentes que organizan talleres sobre evaluación en congresos educativos para explicar como usan hojas de cálculo para asegurarse que a medida que van calificando exámenes las notas van formando la curva de Gauss. Una predicción que se cumple a si misma. QED.
Ir mirando la media de las notas puestas a medida que se corrige me parece una práctica deplorable. Significa que este docente no pone la nota en función de los conocimientos que el alumno demuestra, sino en función de lo bien que lo hayan hecho los exámenes anteriores. Muy pocos iluminados usan estas herramientas**** pero es muy habitual que los profesores echen una ojeada al histograma antes de publicar las notas. A veces, esto beneficia a los estudiantes. Si la media es demasiado baja se aplica alguna fórmula matemática para subir todas las notas de forma proporcionada, para que la campana de Gauss se siga manteniendo y dejar el número de suspendidos justo en la constante macabra esperada para esa asignatura.
Esto significa que los exámenes no están diseñados para evaluar conocimientos o el aprendizaje, sino para determinar la posición relativa del estudiante dentro de la clase o el grupo que se examina. !No hacemos exámenes… hacemos oposiciones, desde primaria!

La constante macabra está causada por un error de lógica.

¿Podemos culpar a los docentes por evaluar de forma que se obtengan campanas de Gauss? Al fin y al cabo lo que hacemos los docentes bien intencionados se basa en el siguiente razonamiento lógico.
  a) los alumnos de cada clase se distribuyen entre buenos, malos y normalitos según una curva de Gauss.
     b) por consiguiente las notas se van a distribuir siguiendo una curva de Gauss.
     y finalmente saben que
     c) Cuando una asignatura es difícil un porcentaje (una parte de la campana) va a suspender. Y este porcentaje no depende de los alumnos, ni de mi trabajo como docente, ni de la motivación del grupo… es una constante y se repite cada año. Punto.
Salvo que este razonamiento está mal.
Sólo para simplificar las cosas vamos a aceptar que existen alumnos buenos, malos y normalitos. Tendríamos que discutir mucho sobre esto, pero lo vamos a dar por cierto. ¿Vale? Pues sigo…
Supongamos también que al final del curso los mejores van a acabar dominando más la materia estudiada y los peores menos. ¿Podemos deducir entonces que las notas se van a distribuir según una campana de Gauss?
Pues no.
Si fijamos con antelación cual es el nivel de conocimiento que esperamos que los alumnos aprendan, los alumnos que han llegado a ese nivel deben sacar un 10, la calificación máxima. ¿correcto? Vale, pues sigo.
En un curso típico vemos que los alumnos aprenden un poco, alguno o alguna llega al nivel de conocimiento necesario para sacar un 10 y el resto se van quedando por el camino bien ordenaditos según la distribución de Gauss.
Resulta que no existe un límite a que los alumnos pueden llegar a aprender. Si el docente es realmente bueno, y sus alumnos se motivan, se entusiasman por aprender, trabajan, critican, se equivocan, rectifican, investigan, juegan, se divierten, crean, comparten … pueden aprender mucho más de lo que hemos establecido como 10. Hasta el más “malo” de ellos puede llegar más allá del 10.
Por ello creo que cuando la constante macabra está en acción es por uno de estos motivos.
1- el objetivo de aprendizaje no es realista.
2- el docente fracasa en su tarea.
3- el docente no evalúa el conocimiento sino que se dedica a seleccionar los alumnos dignos de aprobar.

Ahora toca reflexionar.

La constante macabra existe y actúa de forma ubicua en el sistema educativo. Los estudiantes poco a poco van aprendiendo que no todos van a aprobar, por mucho que se esfuercen y trabajen (casi) siempre va a acabar habiendo una campana de Gauss en el histograma de notas.
Alicia, una de mis lectoras, me ha comentado que esto parece que ejerza un efecto nocebo – el contrario al placebo – en algunos estudiantes: Ven que no van a ser mejores que sus compañeras y compañeros. Y esto hace que acaben desmotivados por el curso y los estudios. Y hace que la constante macabra sea una predicción que hace que se cumpla a si misma.
Algo huele a podrido y no es en Dinamarca. Nuestro sistema educativo, en el que una gran mayoría de educadores estamos motivados y tenemos buenas intenciones, esta fracasando. La constante macabra es endémica y causa frustración, sufrimiento y fracaso escolar a todos los niveles.
Y tu ¿qué opinas? ¿Estás de acuerdo conmigo (y Antibí) ? ¿Hay errores graves en los razonamientos que expongo? Me gustaría saberlo, deja un comentario y me lo haces saber.

Notas al pié.

* Los estadísticos usan palabras como “variable, «“población”, “media”, “mediana» y “desviación estándar” porqué les hace sentir más estadísticos.
** Todo el mundo sabe que para hacer un análisis serio de lo que sea hay que arremangarse. Los que vamos en camiseta no nos podemos arremangar y por tanto no podemos hacer análisis serios.
*** Tendríamos que hablar mucho de que criterios usamos para decir que un estudiante es mejor o peor que otro. Pero lo dejaremos para otro día.
**** Pero seguro que ya se está experimentando en software para corregir automáticamente con la función de Gauss bien integrada en sus algoritmos.