Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información
dc.contributor | León Guzmán, Elizabeth | spa |
dc.contributor.author | Ariza Ladino, Carlos Fernando | spa |
dc.date.accessioned | 2019-06-24T23:26:47Z | spa |
dc.date.available | 2019-06-24T23:26:47Z | spa |
dc.date.issued | 2012 | spa |
dc.description.abstract | En este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requerido para solucionar consultas basadas en frases y obtener mayor cantidad de documentos solución. Para esto se hace uso de un índice de frases parciales que almacena n-gramas basados en entidades nominales y palabras de alta frecuencia. El sistema también posee un modelo de clasificación jerárquica de documentos recuperados que asume que la consulta es un único término. Los resultados obtenidos demuestran que el uso del índice de frases propuesto como alternativa del índice de frases parciales tradicional permite disminuir el tiempo de búsqueda para las consultas que contienen entidades nominales y que la resolución de correferencias en los documentos tiene gran potencial para mejorar la medida de recuerdo del sistema. / Abstract. In this document an information retrieval system based on combined indexes and information extraction is shown. The system uses named entity recognition and coreference resolution to add information to a combined index in order to decrease the search time employed for solving phrase queries and to obtain greater quantities of retrieved documents. The combined index includes a proposed partial phrase index that stores n-grams based on named entities and stopwords. The system also uses a ranking retrieval model that assumes that the query is a single term. The results obtained with our system as compared to the traditional partial phrase index, decreases the search time for solving phrase queries. It is also concluded that the coreference resolution process is potentially a great tool for improving the recall measure of the system. | spa |
dc.description.degreelevel | Maestría | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.eprints | http://bdigital.unal.edu.co/7020/ | spa |
dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/9961 | |
dc.language.iso | spa | spa |
dc.relation.ispartof | Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería | spa |
dc.relation.ispartof | Facultad de Ingeniería | spa |
dc.relation.references | Ariza Ladino, Carlos Fernando (2012) Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información. Maestría thesis, Universidad Nacional de Colombia. | spa |
dc.rights | Derechos reservados - Universidad Nacional de Colombia | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.license | Atribución-NoComercial 4.0 Internacional | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0/ | spa |
dc.subject.ddc | 0 Generalidades / Computer science, information and general works | spa |
dc.subject.proposal | Índice de Frases | spa |
dc.subject.proposal | Recuperación de Información | spa |
dc.subject.proposal | Extracción de Información | spa |
dc.subject.proposal | Reconocimiento de Entidades Nominales | spa |
dc.subject.proposal | Resolución de Correferencias | spa |
dc.subject.proposal | Clasificación Jerárquica / Phrase index | spa |
dc.subject.proposal | Information Retrieval | spa |
dc.subject.proposal | Information Extraction | spa |
dc.subject.proposal | Named entity recognition | spa |
dc.subject.proposal | Coreference resolution | spa |
dc.title | Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información | spa |
dc.type | Trabajo de grado - Maestría | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | spa |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
dc.type.content | Text | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | spa |
dc.type.version | info:eu-repo/semantics/acceptedVersion | spa |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
Archivos
Bloque original
1 - 1 de 1