Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información

dc.contributorLeón Guzmán, Elizabethspa
dc.contributor.authorAriza Ladino, Carlos Fernandospa
dc.date.accessioned2019-06-24T23:26:47Zspa
dc.date.available2019-06-24T23:26:47Zspa
dc.date.issued2012spa
dc.description.abstractEn este trabajo se presenta un sistema de recuperación de información basado en índices combinados de términos y extracción de información. Este sistema utiliza entidades nominales y correferencias para enriquecer a un índice combinado de términos, con el _n de disminuir el tiempo de búsqueda requerido para solucionar consultas basadas en frases y obtener mayor cantidad de documentos solución. Para esto se hace uso de un índice de frases parciales que almacena n-gramas basados en entidades nominales y palabras de alta frecuencia. El sistema también posee un modelo de clasificación jerárquica de documentos recuperados que asume que la consulta es un único término. Los resultados obtenidos demuestran que el uso del índice de frases propuesto como alternativa del índice de frases parciales tradicional permite disminuir el tiempo de búsqueda para las consultas que contienen entidades nominales y que la resolución de correferencias en los documentos tiene gran potencial para mejorar la medida de recuerdo del sistema. / Abstract. In this document an information retrieval system based on combined indexes and information extraction is shown. The system uses named entity recognition and coreference resolution to add information to a combined index in order to decrease the search time employed for solving phrase queries and to obtain greater quantities of retrieved documents. The combined index includes a proposed partial phrase index that stores n-grams based on named entities and stopwords. The system also uses a ranking retrieval model that assumes that the query is a single term. The results obtained with our system as compared to the traditional partial phrase index, decreases the search time for solving phrase queries. It is also concluded that the coreference resolution process is potentially a great tool for improving the recall measure of the system.spa
dc.description.degreelevelMaestríaspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.eprintshttp://bdigital.unal.edu.co/7020/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/9961
dc.language.isospaspa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingenieríaspa
dc.relation.ispartofFacultad de Ingenieríaspa
dc.relation.referencesAriza Ladino, Carlos Fernando (2012) Sistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Información. Maestría thesis, Universidad Nacional de Colombia.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc0 Generalidades / Computer science, information and general worksspa
dc.subject.proposalÍndice de Frasesspa
dc.subject.proposalRecuperación de Informaciónspa
dc.subject.proposalExtracción de Informaciónspa
dc.subject.proposalReconocimiento de Entidades Nominalesspa
dc.subject.proposalResolución de Correferenciasspa
dc.subject.proposalClasificación Jerárquica / Phrase indexspa
dc.subject.proposalInformation Retrievalspa
dc.subject.proposalInformation Extractionspa
dc.subject.proposalNamed entity recognitionspa
dc.subject.proposalCoreference resolutionspa
dc.titleSistema de Recuperación de Información Utilizando Índices Combinados de Términos y Extracción de Informaciónspa
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
299792.2012.pdf
Tamaño:
1.29 MB
Formato:
Adobe Portable Document Format