Método para la detección de polaridad sobre una base de datos de reseñas de películas de cine, basado en una técnica combinada de selección y clasificación

dc.contributor.advisorEspinosa Bedoya, Albeiro
dc.contributor.authorRamirez Sandoval, Luis Miguel
dc.date.accessioned2022-10-28T14:50:23Z
dc.date.available2022-10-28T14:50:23Z
dc.date.issued2022-10-25
dc.descriptionilustraciones, diagramas, tablasspa
dc.description.abstractLas críticas de cine tanto positivas como negativas tiene un impacto directo en la recaudación en taquilla de las producciones cinematográficas. Detectar si una crítica es positiva o negativa, representa un asunto de importancia para las empresas productoras, pues entre más críticas positivas reciban, mejores serán las probabilidades de que la película sea un éxito. El análisis de sentimientos se presenta como una herramienta útil para comprender la reacción del público y de la crítica hacia una película, especialmente cuando en la actualidad las redes sociales son una fuente de datos de las opiniones que hacen los usuarios sobre estas. Mediante el uso de técnicas de procesamiento de lenguaje natural, diferentes investigaciones han explorado la mejor forma para detectar la polaridad de una crítica; estas se han enfocado en dos aspectos principalmente, la selección de características y el método de clasificación, no obstante, ninguna de las investigaciones estudiadas plantea una técnica combinada de un método de selección y de clasificación, como lo son los métodos de ensamble. Para esta investigación se seleccionaron 3 arquitecturas descritas en la literatura y sus resultados fueron utilizados como las líneas base; luego, se propuso un modelo combinado con una arquitectura de dos caminos para realizar la detección de polaridad, y finalmente, se compararon y validaron los resultados de los modelos de referencia y del modelo propuesto. La arquitectura diseñada, que se construyó con base a los métodos de ensamble y de fusión, alcanzó un accuracy del 96% y un recall del 90%, además, al ser una arquitectura de dos caminos permitió analizar la importancia de diferentes variables, así como también de diferentes métodos en la predicción final. (Texto tomado de la fuente)spa
dc.description.abstractMovie reviews both positive and negative have a direct impact at the box office of the cinematographic productions. Detect if a review is positive or not, represents a matter of importance by the production’s companies, because more positive reviews a movie receives the better the probabilities to the movie be a success. Sentiment analysis is a useful tool to understand the audience and the professional critics reaction towards a movie, specially nowadays that people use social media networks to share their opinions. With the use of natural language processing techniques, different research had explored the best way to determine a movie’s review polarity, most of them had focused on two main aspects, feature selection and the classification method, however, none of them proposed a combine technique of a feature selection method and a classification method, like the ensemble methods. For this investigation, 3 studies were selected, and their result were used as benchmarks; then, a new method was proposed with a two-way architecture, to detect the polarity of movie reviews, after this process was completed, the results of the benchmarks and the proposed model were compared and validated. The new proposed architecture, based on ensemble methods, achieved a 96% accuracy and 90% recall, also, this architecture allowed to analyze the importance of different variables in the model as well as the importance of different methods in the final prediction.eng
dc.description.curricularareaÁrea Curricular de Ingeniería de Sistemas e Informáticaspa
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ingeniería - Analíticaspa
dc.format.extentxiv, 64 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/82528
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellínspa
dc.publisher.departmentDepartamento de la Computación y la Decisiónspa
dc.publisher.facultyFacultad de Minasspa
dc.publisher.placeMedellín, Colombiaspa
dc.publisher.programMedellín - Minas - Maestría en Ingeniería - Analíticaspa
dc.relation.referencesSang Ho Kim, Namkee Park y Seung Hyun Park, «Exploring the Effects of Online Word of Mouth and Expert Reviews on Theatrical Movies'Box Office Success,» Journal of Media Economics, vol. 26, nº 2, pp. 98-114, 2013.spa
dc.relation.referencesS. Follows, «Do Hollywood movies make a profit?,» 25 July 2016. [En línea]. Available: https://stephenfollows.com/hollywood-movies-make-a-profit/. [Último acceso: September 2019].spa
dc.relation.referencesS. Follows, «How movies make money: $100m+ Hollywood blockbusters,» 10 July 2016. [En línea]. Available: https://stephenfollows.com/how-movies-make-money-hollywood-blockbusters/. [Último acceso: September 2019].spa
dc.relation.referencesSaurabh Kumar, Avinay Mehta y Joy Pal, «Movie Success Prediction using Data Mining,» Vellore Institute of Technology, 2019.spa
dc.relation.referencesFachrul Rozy Saputra Rangkuti, M. Ali Fauzi, Eka Dewi Lukmana Sari y Yuita Arum Sari, «Sentiment Analysis on Movie Reviews Using Ensemble Features and Pearson Correlation Based Featured Selection,» International Conference on Sustainable Information Engineering and Technology, pp. 88-91, 2018.spa
dc.relation.referencesSari Widya Sihwi, Insan Prasetya Jati y Rini Anggrainingsih, «Twitter Sentiment Analysis of Movie Reviews Using Information Gain and Naive Bayes Classifier,» International Seminar on Application for Technology of Information and Communication, 2018.spa
dc.relation.referencesRosy Indah Permatasari, M. Ali Fauzi, Eka Dewi Lukmana Sari y Putra Pandu Adikara, «Twitter Sentiment Analysis of Movie Reviews using Ensemble Features Based Navie Bayes,» International Conference on Sustainble Information Engineering and Technology, pp. 92-95, 2018.spa
dc.relation.referencesYin Fulian, Pan Xingyi, Wang Yanyan y Su Pei, «A Word Vector based Review Vector method for Sentiment Analysis of Movie Reviews Exploring the applicability of the Movie Reviews,» de 3rd International Conference on Computational Intelligence and Applications, 2018.spa
dc.relation.referencesNhamo Mtetwa, Awukam Ojang Awukam y Mehdi Yousefi, «Feature Extraction and Classification of Movie Reviews,» 5th International Conference on Soft Computing and Machine Intelligence, 2018.spa
dc.relation.referencesJyostna Devi Bodapati, N. Veeranjaneyulu y Shareef Shaik, «Sentiment Analysis from Movie Reviews Using LSTMs,» Ingenierie des Systemes d'Information, vol. 24, nº 1, pp. 125-129, 2019.spa
dc.relation.referencesSwastika Pandey, Santwana Sagnika y Bhabani Shankar Prasad Mishra, «A Technique to Handle Negation in Sentiment Analysis on Movie Reviews,» de International Conference on Communication and Signal Processing, India, 2018.spa
dc.relation.referencesAnwar Ur Rehman, Ahmad Kamran Malik, Basit Raza y Waqar Ali, «A Hybrid CNN-LSTM Model for Improving Accuracy of Movie Reviews Sentiment Analysis,» Multimedia Tools and Applications, vol. 78, nº 18, pp. 26597-26613, 2019.spa
dc.relation.referencesSujata Rani y Parteek Kumar, «Deep Learning Based Sentiment Analysis Using Convolution Neural Network,» Arabian Journal for Science and Engineering, vol. 44, nº 4, pp. 3305-3314, 2019.spa
dc.relation.referencesS. Basuroy, S. Chatterjee y S. A. Ravid, «How Critical Are Critical Reviews? The Box Office Effects of Film Critics, Star Power, and Budges,» Journal of Marketing, vol. 67, pp. 103-117, 2003.spa
dc.relation.referencesSuhariyanto, Ari Firmanto y Riyanarto Sarno, «Prediction of Movie Sentiment based on Reviews and Score on Rotten Tomatoes using SentiWordnet,» International Seminar on Application for Technology of Information and Communication, 2018.spa
dc.relation.referencesMais Yasen y Sara Tedmori, «Movie Reviews Sentiment Analysis and Classification,» IEEE Jordan International Joint Conference on Electrical Engineering and Information Technology, 2019.spa
dc.relation.referencesH. T. N. y M. L. N. , «An ensemble method with sentiment features and clustering support,» Neurocomputing, vol. 370, pp. 155-165, 2019.spa
dc.relation.referencesThaís L. D. Souza, Marislei Nishijima y Ana C. P. Fava, «Do consumer and expert reviews affect the length of time a film is kept on screens in the USA?,» Journal of Cultural Economics, vol. 43, nº 1, pp. 145-171, 2019.spa
dc.relation.referencesM. Bramer, Principles of Data Mining, Springer, 2013.spa
dc.relation.referencesY. Goldberg, Neural Network Methods for Natural Language Processing, Morgan & Claypool Publishers, 2017.spa
dc.relation.referencesC. D. Manning, P. R. y H. Schütze, An Introduction to Information Retrieval, Cambridge: Cambridge University Press, 2009.spa
dc.relation.referencesT. Hastie, R. Tibshirani y J. Friedman, The Elements of Statistical Learning, Springer, 2009.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseReconocimiento 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/spa
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadoresspa
dc.subject.ddc770 - Fotografía, arte computacional, cinematografía::777 - Cinematografía y videografíaspa
dc.subject.lembCrítica de cinespa
dc.subject.lembMoving-picture criticismeng
dc.subject.proposalProcesamiento de lenguaje naturalspa
dc.subject.proposalAnálisis de sentimientosspa
dc.subject.proposalRedes neuronales recurrentespa
dc.subject.proposalRedes neuronales convolucionesspa
dc.subject.proposalMétodos de ensamblespa
dc.subject.proposalNatural language processingeng
dc.subject.proposalSentiment analysiseng
dc.subject.proposalRecurrent neural networkseng
dc.subject.proposalConvolutional networkseng
dc.subject.proposalEnsemble methodseng
dc.titleMétodo para la detección de polaridad sobre una base de datos de reseñas de películas de cine, basado en una técnica combinada de selección y clasificaciónspa
dc.title.translatedMethod for polarity detection on a database of movie reviews, based on a combined selection and classification techniqueeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentEstudiantesspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentPúblico generalspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1088288591.2022.pdf
Tamaño:
905.01 KB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería - Analítica

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: