Mostrar el registro sencillo del documento
Método para la detección de polaridad sobre una base de datos de reseñas de películas de cine, basado en una técnica combinada de selección y clasificación
dc.rights.license | Reconocimiento 4.0 Internacional |
dc.contributor.advisor | Espinosa Bedoya, Albeiro |
dc.contributor.author | Ramirez Sandoval, Luis Miguel |
dc.date.accessioned | 2022-10-28T14:50:23Z |
dc.date.available | 2022-10-28T14:50:23Z |
dc.date.issued | 2022-10-25 |
dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/82528 |
dc.description | ilustraciones, diagramas, tablas |
dc.description.abstract | Las críticas de cine tanto positivas como negativas tiene un impacto directo en la recaudación en taquilla de las producciones cinematográficas. Detectar si una crítica es positiva o negativa, representa un asunto de importancia para las empresas productoras, pues entre más críticas positivas reciban, mejores serán las probabilidades de que la película sea un éxito. El análisis de sentimientos se presenta como una herramienta útil para comprender la reacción del público y de la crítica hacia una película, especialmente cuando en la actualidad las redes sociales son una fuente de datos de las opiniones que hacen los usuarios sobre estas. Mediante el uso de técnicas de procesamiento de lenguaje natural, diferentes investigaciones han explorado la mejor forma para detectar la polaridad de una crítica; estas se han enfocado en dos aspectos principalmente, la selección de características y el método de clasificación, no obstante, ninguna de las investigaciones estudiadas plantea una técnica combinada de un método de selección y de clasificación, como lo son los métodos de ensamble. Para esta investigación se seleccionaron 3 arquitecturas descritas en la literatura y sus resultados fueron utilizados como las líneas base; luego, se propuso un modelo combinado con una arquitectura de dos caminos para realizar la detección de polaridad, y finalmente, se compararon y validaron los resultados de los modelos de referencia y del modelo propuesto. La arquitectura diseñada, que se construyó con base a los métodos de ensamble y de fusión, alcanzó un accuracy del 96% y un recall del 90%, además, al ser una arquitectura de dos caminos permitió analizar la importancia de diferentes variables, así como también de diferentes métodos en la predicción final. (Texto tomado de la fuente) |
dc.description.abstract | Movie reviews both positive and negative have a direct impact at the box office of the cinematographic productions. Detect if a review is positive or not, represents a matter of importance by the production’s companies, because more positive reviews a movie receives the better the probabilities to the movie be a success. Sentiment analysis is a useful tool to understand the audience and the professional critics reaction towards a movie, specially nowadays that people use social media networks to share their opinions. With the use of natural language processing techniques, different research had explored the best way to determine a movie’s review polarity, most of them had focused on two main aspects, feature selection and the classification method, however, none of them proposed a combine technique of a feature selection method and a classification method, like the ensemble methods. For this investigation, 3 studies were selected, and their result were used as benchmarks; then, a new method was proposed with a two-way architecture, to detect the polarity of movie reviews, after this process was completed, the results of the benchmarks and the proposed model were compared and validated. The new proposed architecture, based on ensemble methods, achieved a 96% accuracy and 90% recall, also, this architecture allowed to analyze the importance of different variables in the model as well as the importance of different methods in the final prediction. |
dc.format.extent | xiv, 64 páginas |
dc.format.mimetype | application/pdf |
dc.language.iso | spa |
dc.publisher | Universidad Nacional de Colombia |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ |
dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores |
dc.subject.ddc | 770 - Fotografía, arte computacional, cinematografía::777 - Cinematografía y videografía |
dc.title | Método para la detección de polaridad sobre una base de datos de reseñas de películas de cine, basado en una técnica combinada de selección y clasificación |
dc.type | Trabajo de grado - Maestría |
dc.type.driver | info:eu-repo/semantics/masterThesis |
dc.type.version | info:eu-repo/semantics/acceptedVersion |
dc.publisher.program | Medellín - Minas - Maestría en Ingeniería - Analítica |
dc.description.degreelevel | Maestría |
dc.description.degreename | Magíster en Ingeniería - Analítica |
dc.identifier.instname | Universidad Nacional de Colombia |
dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia |
dc.identifier.repourl | https://repositorio.unal.edu.co/ |
dc.publisher.department | Departamento de la Computación y la Decisión |
dc.publisher.faculty | Facultad de Minas |
dc.publisher.place | Medellín, Colombia |
dc.publisher.branch | Universidad Nacional de Colombia - Sede Medellín |
dc.relation.references | Sang Ho Kim, Namkee Park y Seung Hyun Park, «Exploring the Effects of Online Word of Mouth and Expert Reviews on Theatrical Movies'Box Office Success,» Journal of Media Economics, vol. 26, nº 2, pp. 98-114, 2013. |
dc.relation.references | S. Follows, «Do Hollywood movies make a profit?,» 25 July 2016. [En línea]. Available: https://stephenfollows.com/hollywood-movies-make-a-profit/. [Último acceso: September 2019]. |
dc.relation.references | S. Follows, «How movies make money: $100m+ Hollywood blockbusters,» 10 July 2016. [En línea]. Available: https://stephenfollows.com/how-movies-make-money-hollywood-blockbusters/. [Último acceso: September 2019]. |
dc.relation.references | Saurabh Kumar, Avinay Mehta y Joy Pal, «Movie Success Prediction using Data Mining,» Vellore Institute of Technology, 2019. |
dc.relation.references | Fachrul Rozy Saputra Rangkuti, M. Ali Fauzi, Eka Dewi Lukmana Sari y Yuita Arum Sari, «Sentiment Analysis on Movie Reviews Using Ensemble Features and Pearson Correlation Based Featured Selection,» International Conference on Sustainable Information Engineering and Technology, pp. 88-91, 2018. |
dc.relation.references | Sari Widya Sihwi, Insan Prasetya Jati y Rini Anggrainingsih, «Twitter Sentiment Analysis of Movie Reviews Using Information Gain and Naive Bayes Classifier,» International Seminar on Application for Technology of Information and Communication, 2018. |
dc.relation.references | Rosy Indah Permatasari, M. Ali Fauzi, Eka Dewi Lukmana Sari y Putra Pandu Adikara, «Twitter Sentiment Analysis of Movie Reviews using Ensemble Features Based Navie Bayes,» International Conference on Sustainble Information Engineering and Technology, pp. 92-95, 2018. |
dc.relation.references | Yin Fulian, Pan Xingyi, Wang Yanyan y Su Pei, «A Word Vector based Review Vector method for Sentiment Analysis of Movie Reviews Exploring the applicability of the Movie Reviews,» de 3rd International Conference on Computational Intelligence and Applications, 2018. |
dc.relation.references | Nhamo Mtetwa, Awukam Ojang Awukam y Mehdi Yousefi, «Feature Extraction and Classification of Movie Reviews,» 5th International Conference on Soft Computing and Machine Intelligence, 2018. |
dc.relation.references | Jyostna Devi Bodapati, N. Veeranjaneyulu y Shareef Shaik, «Sentiment Analysis from Movie Reviews Using LSTMs,» Ingenierie des Systemes d'Information, vol. 24, nº 1, pp. 125-129, 2019. |
dc.relation.references | Swastika Pandey, Santwana Sagnika y Bhabani Shankar Prasad Mishra, «A Technique to Handle Negation in Sentiment Analysis on Movie Reviews,» de International Conference on Communication and Signal Processing, India, 2018. |
dc.relation.references | Anwar Ur Rehman, Ahmad Kamran Malik, Basit Raza y Waqar Ali, «A Hybrid CNN-LSTM Model for Improving Accuracy of Movie Reviews Sentiment Analysis,» Multimedia Tools and Applications, vol. 78, nº 18, pp. 26597-26613, 2019. |
dc.relation.references | Sujata Rani y Parteek Kumar, «Deep Learning Based Sentiment Analysis Using Convolution Neural Network,» Arabian Journal for Science and Engineering, vol. 44, nº 4, pp. 3305-3314, 2019. |
dc.relation.references | S. Basuroy, S. Chatterjee y S. A. Ravid, «How Critical Are Critical Reviews? The Box Office Effects of Film Critics, Star Power, and Budges,» Journal of Marketing, vol. 67, pp. 103-117, 2003. |
dc.relation.references | Suhariyanto, Ari Firmanto y Riyanarto Sarno, «Prediction of Movie Sentiment based on Reviews and Score on Rotten Tomatoes using SentiWordnet,» International Seminar on Application for Technology of Information and Communication, 2018. |
dc.relation.references | Mais Yasen y Sara Tedmori, «Movie Reviews Sentiment Analysis and Classification,» IEEE Jordan International Joint Conference on Electrical Engineering and Information Technology, 2019. |
dc.relation.references | H. T. N. y M. L. N. , «An ensemble method with sentiment features and clustering support,» Neurocomputing, vol. 370, pp. 155-165, 2019. |
dc.relation.references | Thaís L. D. Souza, Marislei Nishijima y Ana C. P. Fava, «Do consumer and expert reviews affect the length of time a film is kept on screens in the USA?,» Journal of Cultural Economics, vol. 43, nº 1, pp. 145-171, 2019. |
dc.relation.references | M. Bramer, Principles of Data Mining, Springer, 2013. |
dc.relation.references | Y. Goldberg, Neural Network Methods for Natural Language Processing, Morgan & Claypool Publishers, 2017. |
dc.relation.references | C. D. Manning, P. R. y H. Schütze, An Introduction to Information Retrieval, Cambridge: Cambridge University Press, 2009. |
dc.relation.references | T. Hastie, R. Tibshirani y J. Friedman, The Elements of Statistical Learning, Springer, 2009. |
dc.rights.accessrights | info:eu-repo/semantics/openAccess |
dc.subject.lemb | Crítica de cine |
dc.subject.lemb | Moving-picture criticism |
dc.subject.proposal | Procesamiento de lenguaje natural |
dc.subject.proposal | Análisis de sentimientos |
dc.subject.proposal | Redes neuronales recurrente |
dc.subject.proposal | Redes neuronales convoluciones |
dc.subject.proposal | Métodos de ensamble |
dc.subject.proposal | Natural language processing |
dc.subject.proposal | Sentiment analysis |
dc.subject.proposal | Recurrent neural networks |
dc.subject.proposal | Convolutional networks |
dc.subject.proposal | Ensemble methods |
dc.title.translated | Method for polarity detection on a database of movie reviews, based on a combined selection and classification technique |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa |
dc.type.content | Text |
dc.type.redcol | http://purl.org/redcol/resource_type/TM |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 |
dcterms.audience.professionaldevelopment | Estudiantes |
dcterms.audience.professionaldevelopment | Investigadores |
dcterms.audience.professionaldevelopment | Público general |
dc.description.curriculararea | Área Curricular de Ingeniería de Sistemas e Informática |
Archivos en el documento
Este documento aparece en la(s) siguiente(s) colección(ones)
![Reconocimiento 4.0 Internacional](/themes/Mirage2//images/creativecommons/cc-generic.png)