2.1. La web winmates.net

[El error como problema de los problemas, 2. Metodología]

Todos los datos en los que se basa la presente investigación salen de las bases de datos de winmates.net recogidos a lo largo de más de 30 años.
A final del apartado 1.1. mencionábamos muy de pasada la evolución del winmates y las tablas que recogen sus datos. Desde los inicios del trabajo hasta su gestión desde la web han pasado casi 15 años y en este tiempo la tecnología informática ha dado un gran paso de mejora, extensión y estandarización que ha obligado a cambios a veces bruscos en el software y en el tratamiento de los datos.

Pero permítaseme una ligera historia de cómo fueron estos inicios a través de algunos viejos pero emblemáticos aparatos y primeros lenguajes de programación de carácter popular y con pretensiones generalistas.
Mi primer ordenador, en el que comencé a introducir las primeras colecciones de problemas era un Sinclair ZX Spectrum. Tenía 48 kb de memoria RAM después de ampliar la memoria y el código creado se grababa en un cassette, que emitía un ruido muy característico tanto cuando almacenaba como cuando leía.

      Características del ZxSpectrum
   Ordenador de 8 bites
   Con un microprocesador Zilog Z80A a 3,5 MHz
   Bus de datos de 8 bits y bus de direcciones de 16 bits
   16 kb de ROM más 16 (ampliable a 32) de RAM 16Kb
   Software: intérprete de BASIC Sinclair incluido en la ROM
   Teclado de caucho incial (que podía ser sustituido)
   Video: matriz de 256x192 pixels. Resolución color: 32x24
   Necesitaba un TV y un cassete para guardar el código
   Lanzado al mercado el 23 de abril de 1982
     

Los datos eran parte del programa y se almacenaban en las últimas líneas del programa en sentencias DATA. Todo era muy lento y complicado. Grabar o cargar 20 o 30 Kb necesitaba varios minutos (trabajaba a una velocidad crucero de unos unos 15 kb por minuto) y los errores en la transmisión tanto de entrada como de salida estaban a la orden del día. Corría el año 1986 u 87.

El lenguaje de programación era Basic Sinclair, venía implementado en el firmware del aparato y ésta fue mi primera experiencia en programación de ordenadores.
De ahí pasamos al Amstrad Sinclair que supuso un cambio en cuanto a velocidad, resolución y almacenamiento, con mejoras importantes, y después otro. Y otro. Y Digital Research con el SO CP/M y por fin MS-DOS y el PC. Más tarde Windows. Y cómo no, Internet: la web.

Del Basic de Sinclair recuerdo que pase dbase. La mejoras de este último en relación a las bases de datos era muy importante. De dbase un nuevo cambio a Clipper un lenguaje que gestionaba muy ágilmente las bases de datos y era más abierto que dbase. Ahí estuvimos varios años hasta pasar a php/mysql (con sus respectivas actualizaciones, que no han sido pocas) ya en la web. De htlm a html5 complementado por CSS en línea con la tendencia a separar contenido de continente.

Hoy winmates gestiona una base de datos con más de 100 tablas alguna de las cuales contiene millones de registros que se han ido almacenando a lo largo de un amplio periodo de tiempo con miles de usuarios (algunos registrados y otros anónimos).
Los datos de esas tablas cuyos registros siguen creciendo en la medida que winmates es utilizado, han sido retomados ahora, principios de 2020, con un confinamiento de más de 45 días, con tiempo a raudales, con distancia suficiente de los datos (llevo jubilado varios años) para poderlos trabajar sin otras urgencias del día a día que siempre impone el trabajo activo.
En ellas existen datos de alumnos registrados y anónimos. De los primeros tenemos además de las respuestas su edad, sexo, curso, nacionalidad, nombre del colegio y tutor. De los segundos sólo sus respuestas. La diferencia entre unos y otros es que los registrados poseen un registro en el que se pueden indexar sus respuestas para análisis, seguimiento del trabajo y acceso al histórico individual que permite, entre otras cosas, continuar el trabajo en el punto de interrupción donde lo dejó el día anterior. Los anónimos cada día comienzan como si fueran nuevos alumnos desde unos de los 9 puntos previstos por el programa según edad/maduración.

Nuestro análisis de resultados se hace a partir de bases y tablas cerradas a 1 de marzo de 2020 y la tabla base de nuestro trabajo es basedif0, cuya información puede ser complementada con la de otras tablas en función de objetivos específicos que nos iremos marcando a lo largo del trabajo.

La tabla base6000, es el punto de partida con la que comenzamos nuestro trabajo. No es la única, pero sí la que más peso tiene en nuestra estudio. Más adelante, en el punto 2.3.3 Depuración de base6000, comentaremos con algo más de detalle lo que ahora dejaremos solamente apuntado.
Base6000 tiene 6000 registros. Cada uno de ellos guarda información relativa de los campos que se muestran a continuación:
. N: Nº del problema -ordenados por dificultad-.
. At: Nº de veces que ha sido resuelto correctamente.
. Et: Nº de veces que sido fallado.
. Ati: Tiempo invertido en los problemas acertados.
. Eti: Tiempo dedicado a los equivocados.
. Cate: Categoría del Problema en base a la operación que necesita su resolución.
. Proble: Enunciado del problema.
. Rsmal: Respuestas incorrectas dadas y almacenadas.
. Datos: Información explícita en el problema.

Existen otros campos con información de interés secundario para el lector pero necesarias para la gestión y control de la tabla, que no hemos mostrado para no dificultar su lectura.

A partir de basedif0 se ha comenzado un árduo trabajo de depuración.
Las características específicas de la recogida de los datos, que se pueden resumir en un amplio margen del alumno trabajando solo o sin suficiente control para evitar introducir datos e información basura, hacen necesario un trabajo de filtrado que pueda evitar la contaminación e invalidez de los resultados.

Lo primero que hicimos fue eliminar de esos 6000 problemas (registros de la tabla) aquellos cuyas respuestas erróneas [*8] presentaban una frecuencia de aparición baja.
Muchos de dichos errores son repetidos una y otra vez por alumnos diferentes, desconocidos entre ellos, de distintos centros, provincias, estados e incluso continentes y esa igualdad en el error nos hace pensar en una especie de patrón de comportamiento o en un tipo de razonamiento similar ante determinados enunciados.
Para evitar poner la lupa y también el tiempo ante errores poco frecuentes que pudieran falsear los análisis posteriores y dada la gran amplitud de nuestra muestra de problemas, decidimos tomar como corte la frecuencia 5, es decir despreciamos los problemas cuyas respuestas erróneas sean menores a iguales a 5.

No se han eliminado problemas fáciles ni difíciles, largos ni cortos, sólo aquellos que no presentaban en sus respuestas erróneas frecuencias menores o igual a 5.
Obviamente, a igualdad de número de veces hecho un problema, aquellos que tienen más errores tienen más probabilidad de figurar entre los elegidos, pero no por su dificultad sino por altas tasas de reiteración en los mismos errores.

Ello excluiría de la selección, por ejemplo, a problemas con un nivel alto de dificultad pero que muestran una amplia gama de errores diferentes con frecuencias inferiores a 6.
También han sido eliminados un pequeño grupo de problemas en los que los que aparecían errores de notación en la escritura de las cantidades. Más concretamente, el uso del punto decimal como separador de miles. Nuestro software había clasificado como respuesta errónea lo que habían sido diferencias de anotación de cantidades idénticas [* 9].


[Nota *8.] Las respuestas erróneas cometidas por los alumnos se han ido almacenando en el campo Rsmal para posteriores análisis.

[Nota *9.] Recuerdo que siendo yo estudiante de Primaria, aquí, en España, se utilizaba la coma en la notación decimal y el punto en la separación de miles (entre tercera y cuarta cifra comenzando por la derecha), un 1 pequeño -tipo subíndice- entre la sexta y la séptima que marcaba los millones, etc. Sin que yo sepa ni como ni cuándo, aunque seguramente lo haya, esto ha ido cambiando. El modelo de notación americana y el uso de dispositivos electrónicos -calculadoras, ordenadores…- han producido el cambio de notación. Ha desaparecido la coma decimal sustituída por el punto, que a su vez ha sido eliminado de la notación de miles, si bien vemos que aún se mantiene en algunos lugares de Hispanoamérica, creo yo aunque sin haberlo corroborado con exactitud.

2.1 La web winmates.net 2.2 El software utilizado
2.3 Proceso de elaboración 2.4 La muestra


Volver al Índice
Derechos Reservados © Juan A Cordero, 2020