Deep Learning para la detección automática del nivel de concentración mediante la generación de imágenes de los universitarios

Saboya Rios, NemiasCruz Antazu, Ian DanyVilca Chambi, Joel Ronald2026-02-042026-02-042026-01-19https://hdl.handle.net/20.500.12840/9771En este estudio se propone un modelo basado en CNN y LSTM como método ligero y explicable para clasificar automáticamente, en tiempo real, los niveles de concentración de estudiantes universitarios a partir de la detección de 68 puntos faciales. Para ello, se recopilaron 3000 imágenes de 500 sujetos en un entorno académico controlado; cada imagen fue redimensionada y normalizada. Por otro lado, se calcularon tres indicadores clave: el Eye Aspect Ratio (EAR); la apertura bucal y la centralidad del iris. El sistema clasifica un fotograma como “desconcentrado” si la boca permanece abierta o el EAR es inferior a 0.25, como “medio concentrado” cuando la mirada se desvía más de un 20% del centro sin apertura bucal, y como “concentrado” en los casos restantes. La evaluación, realizada mostró precisiones de 95 % para concentración alta, 88% para media y 78% para baja, con F1-scores de 0.95, 0.88 y 0.78 respectivamente. Estos resultados demuestran que un enfoque basado en visión clásica y reglas lógicas puede ofrecer una alternativa eficiente y transparente a las arquitecturas de aprendizaje profundo, facilitando su implementación en herramientas de apoyo docente y plataformas de e-learning para el monitoreo dinámico de la atención estudiantil.application/pdfspainfo:eu-repo/semantics/openAccessLSTMCNNFacialesEstudiantes universitariosNivel de concentraciónDeep Learning para la detección automática del nivel de concentración mediante la generación de imágenes de los universitariosinfo:eu-repo/semantics/masterThesishttp://purl.org/pe-repo/ocde/ford#2.02.04