Prototipo de sistema para el resumen automático de textos en castellano en un dominio específico

Thumbnail Image

Authors

Beltrán Arrieta, Rolando

Director

Content type

Trabajo de grado - Maestría

Document language

Español

Publication date

2011

Journal Title

Journal ISSN

Volume Title

PDF documents

Abstract

Este proyecto fue concebido con el objetivo de contribuir a la solución de la indispensable necesidad de las organizaciones de manejar y explotar eficientemente los grandes volúmenes de información sobre los cuales operan en la actualidad. Este aporte se enfoca específicamente en el área de resumen de texto. El proyecto presenta una herramienta prototipo de software, que permite la obtención de resúmenes a partir de textos en castellano. El prototipo llamado RES-UN fue ajustado al dominio específico del calzado. Permite que el usuario introduzca artículos noticiosos sobre el calzado y obtenga un resumen que contiene los fragmentos más relevantes. Fue comparado con otras herramientas, como el creador de resúmenes de Word y mostró resultados competitivos. Durante su desarrollo se elaboró un esquema de solución fácilmente replicable y se adaptó al problema un modelo de aprendizaje de máquina, al cual se le incluyó de forma novedosa, información semántica, para extraer los fragmentos más relevantes del texto. / Abstract. This project was developed to help solve the essential organizational requirement to manage and exploit the large volumes of information on which organizations operate today. This contribution focuses specifically on the text summarization area. The project presents a prototype software tool, which allows the production of summaries from texts in Spanish. The prototype called RES-UN was adjusted to the specific domain of the footwear (calzado). It allows users to enter footwear news articles and get a summary containing the most relevant fragments. RES_UN was compared with other tools like Word summarizer, it showed competitive results. During project development, a solution scheme was created it can be easily replicated. Additionally a machine learning model was adapted, it include novel semantic information to extract relevant text fragments.

Abstract

Physical/Logical/Digital Description

Keywords

Citation