Extracción de instancias de una clase desde textos en lenguaje natural independientes del dominio de aplicación

dc.contributorZapata Jaramillo, Carlos Mariospa
dc.contributor.authorBlandón Andrade, Juan Carlosspa
dc.date.accessioned2019-07-02T15:11:03Zspa
dc.date.available2019-07-02T15:11:03Zspa
dc.date.issued2017-02spa
dc.description.abstractLas ontologías en computación se incluyen en el mundo de la inteligencia artificial y constituyen representaciones formales de un área de conocimiento o dominio. Las ontologías permiten modelar el conocimiento mediante una estructura de conceptos relacionados, lo cual proporciona un vocabulario común y que es de vital importancia para compartir información. La ingeniería ontológica es la disciplina que se encarga del estudio y construcción de herramientas para agilizar el proceso de creación de ontologías desde el lenguaje natural y tiene tres etapas cruciales: aprendizaje de ontologías (Ontology Learning), población de ontologías (Ontology Population) y enriquecimiento de ontologías (Ontology Enrichment). La literatura especializada muestra gran interés por las tres etapas y, para desarrollarlas, utiliza distintos métodos como estadística, extracción de información, procesamiento de lenguaje natural, aprendizaje de máquina (Machine Learning) y combinaciones entre ellos. Sin embargo, algunos problemas subsisten, tales como la dependencia del dominio de aplicación, la carencia de métodos completamente automáticos y la carencia de identificación de instancias de atributos. En consecuencia, el problema que se aborda en esta Tesis Doctoral es la extracción automática de instancias desde el lenguaje natural, sin importar el dominio de aplicación, con el fin de contribuir con el proceso de población de ontologías. En esta Tesis Doctoral se propone un método computacional que utiliza técnicas de extracción de información y procesamiento de lenguaje natural para extraer instancias de una clase y generar como resultado un archivo con una ontología completa en formato OWL, utilizando la herramienta GATE (General Architecture for Text Engineering). Los resultados son prometedores, pues se logra crear ontologías desde cero automáticamente, sin importar el dominio de aplicación y con buenos niveles de precision, recall y F-measure.spa
dc.description.abstractAbstract: Ontologies in computation belong to artificial intelligence. Ontologies are formal representations of a knowledge area or domain. Ontologies can be used for modeling knowledge by using a structure of related concepts. Such structure provides a common vocabulary and it is crucial for sharing information. Ontological engineering is a discipline for studying and constructing tools for improving the process of ontology creation from natural language. Such a process has three crucial stages: ontology learning, ontology population, and ontology enrichment. The state of the art shows great concern with the three stages, which are developed by using methods like statistics, information extraction, natural language processing, machine learning, and combinations of them. However, some problems still remain—e.g., dependence on the application domain, lack of automation, and lack of attribute instance identification. Consequently, in this Ph.D. Thesis we address the problem of automated extraction of instances from natural language—regardless of the application domain—in order to contribute to the process of ontology population. In this Ph.D. Thesis we propose a computational method by using information extraction and natural language processing technologies in order to extract instances of a class and to generate as an output a file with a complete ontology in OWL format. We use the GATE (General Architecture for Text Engineering) tool for implementing the method. The results are promising, since we automatically create domain-independent ontologies from scratch. Also, our method exhibits satisfactory levels of precision, recall and F-measurespa
dc.description.degreelevelDoctoradospa
dc.format.mimetypeapplication/pdfspa
dc.identifier.eprintshttp://bdigital.unal.edu.co/56139/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/58998
dc.language.isospaspa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemasspa
dc.relation.ispartofEscuela de Sistemasspa
dc.relation.referencesBlandón Andrade, Juan Carlos (2017) Extracción de instancias de una clase desde textos en lenguaje natural independientes del dominio de aplicación. Doctorado thesis, Universidad Nacional de Colombia - Sede Medellín.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc62 Ingeniería y operaciones afines / Engineeringspa
dc.subject.proposalWeb semánticaspa
dc.subject.proposalOntologíasspa
dc.subject.proposalPoblación automática de ontologíasspa
dc.subject.proposalProcesamiento de lenguaje naturalspa
dc.subject.proposalExtracción de informaciónspa
dc.subject.proposalPatrones GATE-JAPEspa
dc.subject.proposalSemantic webspa
dc.subject.proposalOntologiesspa
dc.subject.proposalAutomatic ontology populationspa
dc.subject.proposalNatural language processingspa
dc.subject.proposalinformation extractionspa
dc.subject.proposalGate-Jape patternsspa
dc.titleExtracción de instancias de una clase desde textos en lenguaje natural independientes del dominio de aplicaciónspa
dc.typeTrabajo de grado - Doctoradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_db06spa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/doctoralThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TDspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
5283875.2017.pdf
Tamaño:
7.6 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Doctorado en Ingeniería - Sistemas