Método para la detección de polaridad sobre una base de datos de reseñas de películas de cine, basado en una técnica combinada de selección y clasificación
Director
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2022-10-25Resumen
Las críticas de cine tanto positivas como negativas tiene un impacto directo en la recaudación en taquilla de las producciones cinematográficas. Detectar si una crítica es positiva o negativa, representa un asunto de importancia para las empresas productoras, pues entre más críticas positivas reciban, mejores serán las probabilidades de que la película sea un éxito. El análisis de sentimientos se presenta como una herramienta útil para comprender la reacción del público y de la crítica hacia una película, especialmente cuando en la actualidad las redes sociales son una fuente de datos de las opiniones que hacen los usuarios sobre estas. Mediante el uso de técnicas de procesamiento de lenguaje natural, diferentes investigaciones han explorado la mejor forma para detectar la polaridad de una crítica; estas se han enfocado en dos aspectos principalmente, la selección de características y el método de clasificación, no obstante, ninguna de las investigaciones estudiadas plantea una técnica combinada de un método de selección y de clasificación, como lo son los métodos de ensamble. Para esta investigación se seleccionaron 3 arquitecturas descritas en la literatura y sus resultados fueron utilizados como las líneas base; luego, se propuso un modelo combinado con una arquitectura de dos caminos para realizar la detección de polaridad, y finalmente, se compararon y validaron los resultados de los modelos de referencia y del modelo propuesto. La arquitectura diseñada, que se construyó con base a los métodos de ensamble y de fusión, alcanzó un accuracy del 96% y un recall del 90%, además, al ser una arquitectura de dos caminos permitió analizar la importancia de diferentes variables, así como también de diferentes métodos en la predicción final. (Texto tomado de la fuente)Abstract
Movie reviews both positive and negative have a direct impact at the box office of the cinematographic productions. Detect if a review is positive or not, represents a matter of importance by the production’s companies, because more positive reviews a movie receives the better the probabilities to the movie be a success. Sentiment analysis is a useful tool to understand the audience and the professional critics reaction towards a movie, specially nowadays that people use social media networks to share their opinions. With the use of natural language processing techniques, different research had explored the best way to determine a movie’s review polarity, most of them had focused on two main aspects, feature selection and the classification method, however, none of them proposed a combine technique of a feature selection method and a classification method, like the ensemble methods. For this investigation, 3 studies were selected, and their result were used as benchmarks; then, a new method was proposed with a two-way architecture, to detect the polarity of movie reviews, after this process was completed, the results of the benchmarks and the proposed model were compared and validated. The new proposed architecture, based on ensemble methods, achieved a 96% accuracy and 90% recall, also, this architecture allowed to analyze the importance of different variables in the model as well as the importance of different methods in the final prediction.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, diagramas, tablas
Colecciones
![Reconocimiento 4.0 Internacional](/themes/Mirage2//images/creativecommons/cc-generic.png)