Magíster en Ingeniería de Sistemas con Mención en Dirección y Gestión en Tecnología de Información
URI permanente para esta colección
Examinar
Examinando Magíster en Ingeniería de Sistemas con Mención en Dirección y Gestión en Tecnología de Información por Autor "Huanca Torres, Fredy Abel"
Mostrando 1 - 3 de 3
Resultados por página
Opciones de ordenación
Ítem Fine-Tuning de Modelos Monolingües BERT preentrenados para el análisis de sentimientos en contextos de jerga peruana(Universidad Peruana Unión, 2024-09-30) Calizaya Milla, Sergio Elvis; Santos Gonzales, Jair Samuel; Huanca Torres, Fredy AbelLa innovación en el procesamiento del lenguaje natural (NLP) ha llevado a la creación de modelos como BERT, RoBERTa, GPT-4o, Llama 3 y Gemini. Sin embargo, la adaptación de estos modelos a dialectos específicos, especialmente en lenguas distintas del inglés, sigue siendo poco explorada, especialmente con jergas o lenguaje informal. En respuesta a esta necesidad, nuestra investigación evalúa modelos monolingües al español que mejor se adapten a las expresiones coloquiales peruanas, siendo la mejor alternativa RoBERTuito, un modelo pre-entrenado en un extenso corpus de tweets en español que destaca su eficacia en tareas de clasificación de texto. Afinamos y comparamos este modelo para reflejar las características del español peruano. Implementamos un proceso de recolección y preprocesamiento de datos de Facebook, enfocándonos en comentarios en español peruano. Este dataset especializado con más de 11,000 comentarios etiquetados fueron usados para entrenar modelos monolingües en la tarea de análisis de sentimientos y obtener una detección más precisa de la polaridad en textos que incluyen jergas peruanas. RoBERTuito obtuvo un F1-score equilibrado de 0.750, con una precisión de 0.858, un recall de 0.870 y una exactitud de 0.789. En comparación, BETO alcanzó una precisión de 0.794, recall de 0.725 y exactitud de 0.669; BERTuit, una precisión de 0.751, recall de 0.869 y exactitud de 0.722; y RoBERTa-BNE, una precisión de 0.783, recall de 0.759 y exactitud de 0.750. Este estudio no solo proporciona una solución para el análisis de sentimientos en español peruano, sino que también establece una base para adaptar modelos monolingües a contextos lingüísticos específicos.Ítem Método basado en el framework TOGAF y la cultura DevOps en implementación y despliegue de software(Universidad Peruana Unión, 2022-02-03) Chanchari Yumbato, Maydeline; Huanca Torres, Fredy Abel; Asin Gomez, Fernando ManuelEl estudio comprende el desarrollo e implementación de un método denominado TDevOps organizado en 4 etapas: identificar requerimientos, alinear TOGAF en sus fases con la cultura DevOps, desarrollar y aplicar el método en un caso de estudio analizado en una organización de Desarrollo de software, donde se utilizó las buenas prácticas de TOGAF y la cultura DevOps. El método consideró las fases B, C y D de TOGAF después de un análisis y validación del framework con las necesidades y estrategia de la organización, asimismo, se consideró componentes de la cultura DevOps en relación con integración y despliegue continuo, después de identificar los requerimientos necesario para la colaboración de los stakeholder involucrados en el proceso de desarrollo de software. Para las pruebas respectivas se consideró 3 proyectos de gran envergadura y la ejecución del método se hizo en las fases de implementación y despliegue del proceso de desarrollo de software. Los resultados estuvieron basados en indicadores tales como reducción de número de errores identificados en el entregable, la reducción del tiempo de entrega en la fase de integración y despliegue continuo, donde después de la aplicación del método mejoraron de manera significativa a favor del estudio y se concluyó que el método ayudó a la comunicación, colaboración e integración de los equipos involucrados en el desarrollo de software de los proyectos seleccionados y esto a su vez contribuyó al cumplimiento de la estrategia de negocio de la organización.Ítem Sistema de recomendación de libros basado en algoritmos de similaridad para el Centro de Recursos para el Aprendizaje y la Investigación de la Universidad Peruana Unión(Universidad Peruana Unión, 2022-09-05) Mamani Chile, Rogelio; Huanca Torres, Fredy AbelEl presente trabajo tiene el propósito de optimizar el performance del sistema de recomendación de libros basado en algoritmos de similaridad que permita sugerir recomendaciones de textos con contenidos relevantes a los usuarios del Centro de Recursos para el Aprendizaje y la Investigación de la Universidad Peruana Unión. El método CRISP DM se ha aplicado a un caso de sistema de recomendación de libros para el análisis de datos y optimización del modelo. El método de filtrado colaborativo ha permitido identificar las preferencias de los usuarios y la de otros usuarios con características similares para generar las predicciones; y se ha usado el modelo K-Nearest Neighbor con el algoritmo de similitud de coseno para calcular la mayor similitud entre los usuarios y los libros para ofrecer recomendaciones a los usuarios. En la experimentación se ha obtenido un buen performance del modelo de recomendación con un promedio de 0.83 de exactitud medainte el ajuste de hiperparámetros en el entrenamiento. Sin embargo, en los problemas de clasificación de multiclase se presentan las clases desequilibradas, donde las clases minoritarias obtienen promedios muy bajos; para manejar esta situación se ha usado la técnica de sobremuestreo de las clases minoritarias logrando balancear los datos, lo que ha permitido obtener el promedio total de 0.91 de accuracy, lo que muestra el mejor performance del modelo. La métrica de evaluación que se ha aplicado es la matriz de confusión, obteniendo promedios esperados de precisión (0,91) y de sensibilidad (0.91) lo que evidencia que se puede realizar la predicción de las recomendaciones precisas. Se concluye que se puede lograr la optimización del performance del modelo de sistema de recomendación de libros basados en algoritmos de similitud sin demandar mucha capacidad de cómputo dependiendo del tamaño de la muestra del conjunto de datos.