Sistema de recomendación de libros basado en algoritmos de similaridad para el Centro de Recursos para el Aprendizaje y la Investigación de la Universidad Peruana Unión
Cargando...
Fecha
2022-09-05
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Peruana Unión
Resumen
El presente trabajo tiene el propósito de optimizar el performance del sistema de recomendación de libros basado en algoritmos de similaridad que permita sugerir recomendaciones de textos con contenidos relevantes a los usuarios del Centro de Recursos para el Aprendizaje y la Investigación de la Universidad Peruana Unión. El método CRISP DM se ha aplicado a un caso de sistema de recomendación de libros para el análisis de datos y optimización del modelo. El método de filtrado colaborativo ha permitido identificar las preferencias de los usuarios y la de otros usuarios con características similares para generar las predicciones; y se ha usado el modelo K-Nearest Neighbor con el algoritmo de similitud de coseno para calcular la mayor similitud entre los usuarios y los libros para ofrecer recomendaciones a los usuarios. En la experimentación se ha obtenido un buen performance del modelo de recomendación con un promedio de 0.83 de exactitud medainte el ajuste de hiperparámetros en el entrenamiento. Sin embargo, en los problemas de clasificación de multiclase se presentan las clases desequilibradas, donde las clases minoritarias obtienen promedios muy bajos; para manejar esta situación se ha usado la técnica de sobremuestreo de las clases minoritarias logrando balancear los datos, lo que ha permitido obtener el promedio total de 0.91 de accuracy, lo que muestra el mejor performance del modelo. La métrica de evaluación que se ha aplicado es la matriz de confusión, obteniendo promedios esperados de precisión (0,91) y de sensibilidad (0.91) lo que evidencia que se puede realizar la predicción de las recomendaciones precisas. Se concluye que se puede lograr la optimización del performance del modelo de sistema de recomendación de libros basados en algoritmos de similitud sin demandar mucha capacidad de cómputo dependiendo del tamaño de la muestra del conjunto de datos.
Descripción
Palabras clave
Sistema de recomendación, Filtrado colaborativo, Algoritmo de similitud, K-Nearest neighbor