Una investigación, en la que ha participado profesorado de la Universidad del País Vasco, ha explorado el impacto de la inteligencia artificial en la evaluación educativa. Los resultados mostraron cómo el desempeño de las IA generativas replicaron con una precisión cercana al 70 % la evaluación proporcionada por los humanos.
Impacto de la inteligencia artificial en la evaluación educativa
Un estudio liderado por investigadores de la UPV/EHU destaca que la IA replicó el comportamiento de los docentes con una precisión del 70 %
- Investigación
Fecha de primera publicación: 15/10/2024
Un equipo de investigadores de la Universidad del País Vasco y la Université de Pau ha llevado a cabo un innovador estudio que analiza la capacidad de la inteligencia artificial (IA) para replicar las evaluaciones realizadas por docentes en formación. El artículo, publicado en la revista científica ‘EDUTEC’ bajo el título ‘Un análisis experimental de la relación entre las evaluaciones proporcionadas por la inteligencia artificial y las proporcionadas por los docentes en formación’, destaca el creciente interés en integrar herramientas basadas en IA en el ámbito educativo.
El estudio involucró a 507 docentes en formación, quienes, utilizando una rúbrica diseñada específicamente, evaluaron una serie de textos escritos de estudiantes de Educación Primaria. Al mismo tiempo, diferentes sistemas de IA, incluyendo ChatGPT de OpenAI, Gemini de Google y Copilot de Bing, realizaron la misma tarea. El objetivo era determinar en qué medida las evaluaciones de la IA se asemejaban a las de los futuros docentes, con especial atención a las posibles diferencias según el género, nivel académico y rendimiento de los estudiantes.
Los resultados revelaron que ChatGPT, entre las IAs analizadas, fue la que consiguió el mayor nivel de replicabilidad humana en la evaluación de textos escritos, logrando replicar cerca del 70 % de las evaluaciones humanas. De igual modo, uno de los aspectos más interesantes del estudio fue la evaluación de las diferencias entre los docentes en formación según su rendimiento académico. Se encontró que aquellos docentes en formación con un desempeño más alto tendían a proporcionar evaluaciones más alineadas con las realizadas por la IA, lo que sugiere que la precisión de la IA podría estar relacionada con el nivel de formación y la alfabetización evaluativa de los futuros docentes. Por otro lado, el género y el nivel académico no parecieron influir significativamente en la precisión de las evaluaciones, lo que refuerza la capacidad de la IA para ser una herramienta de apoyo inclusiva y efectiva.
Como indica Héctor Galindo-Domínguez, profesor adjunto del Departamento de Didáctica y Organización Escolar en la Facultad de Educación y Deporte de la UPV/EHU e investigador principal del estudio, “en un contexto en el que las aulas son tan numerosas y en las que el profesorado destina tanto tiempo a realizar tareas asociadas a la evaluación de trabajos académicos, aproximadamente una media de entre un tercio y la mitad de su tiempo, estos resultados son de utilidad en cuanto a que arrojan luz sobre cómo la IA generativa podría tratarse de una herramienta de apoyo en las actividades docentes, pudiendo permitir así reducir parcialmente la carga asociada a la evaluación y pudiendo permitir al docente destinar ese tiempo en trabajar en la mejora de distintos aspectos cruciales de sus tareas, como la personalización de la enseñanza, la inclusión, el clima social o el cooperativismo”.
Referencia bibliográfica
- Un análisis experimental de la relación entre las evaluaciones proporcionadas por la inteligencia artificial y las proporcionadas por los docentes en formación
- Edutec, Revista Electrónica De Tecnología Educativa, (89), 84–104
- DOI: 10.21556/edutec.2024.89.3509