Show simple item record

dc.contributorGelbukh, Alexander
dc.creatorOrdóñez Salinas, Sonia
dc.date.accessioned2019-06-24T16:53:41Z
dc.date.available2019-06-24T16:53:41Z
dc.date.created2011
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/7653
dc.descriptionDentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados utilizando una estructura sintáctica que es modificada hasta obtener los GCs, lo que involucra dos procesos costosos: el análisis sintáctico y la transformación al los GCs. Esta tesis propone dos soluciones más simples para la transformación directa de texto a grafos conceptuales, sin involucrar una estructura intermedia. Una solución es a través de la construcción de una gramática especializada. Dicha gramática se crea de forma automática a partir de un recurso léxico existente construido para otro fin. Otra solución propuesta, es a través del desarrollo de un analizador sintáctico basado en un método estadístico no supervisado y pobre en conocimiento. El método usa las estadísticas de coocurrencia de las palabras en un corpus grande (o en Internet) y permite obtener estructuras simplificadas de GCs. Cabe mencionar que para su entrenamiento no se requiere ningún trabajo manual previo ya que se basa en un corpus no preparado, más aún, sólo se requieren las estadísticas de coocurrencia y no se requiere el acceso al corpus mismo, lo que es importante en el caso del uso de los motores de búsqueda en Internet como la fuente de información estadística. / Abstract. One of the computational structures used in natural language processing is the Conceptual Graphs (CGs), which thanks to their advantages can become an efficient tool for formal representation of the meaning of the text. GCs are usually created using some syntactic structure that is modified to obtain the CGs. This involves two costly processes: parsing and transformation to the CGs. This thesis proposes two simpler solutions for converting text to conceptual graphs directly, without involving an intermediate structure. One solution is through the construction of a specialized grammar. This grammar is automatically created from an existing lexical resource that has been built for another purpose. The other proposed solution is through the development of a parser based on a knowledge-poor unsupervised statistical method. The method uses co-occurrence statistics of words in a large corpus (or Internet) and generates simplified CG-like structures. It should be mentioned that the training process does not require any previous manual work because it is based on a raw text corpus. Moreover, it only requires the co-occurrence statistics and does not require access to the corpus itself, which is important for the use of Internet search engines as the source of statistical information.
dc.formatapplication/pdf
dc.relation.ispartofUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
dc.relation.ispartofDepartamento de Ingeniería de Sistemas e Industrial
dc.subjectProcesamiento de lenguaje natural
dc.subjectLingüística computacional
dc.subjectGrafos conceptuales
dc.subjectAnálisis sintáctico no supervisado
dc.subjectGramática especializada / Natural language processing
dc.subjectComputational linguistics
dc.subjectConceptual graphs
dc.subjectUnsupervised parsing
dc.subjectSpecialized grammar
dc.subject.ddc0 Generalidades / Computer science, information and general works
dc.subject.ddc62 Ingeniería y operaciones afines / Engineering
dc.titleTransformación automática de texto a grafos conceptuales
dc.typeinfo:eu-repo/semantics/doctoralThesis
dc.type.spaTesis/trabajos de grado - Thesis
dc.type.hasversioninfo:eu-repo/semantics/draft
dc.coverage.modalityDoctorado
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.identifier.bibliographicCitationOrdóñez Salinas, Sonia (2011) Transformación automática de texto a grafos conceptuales. Doctorado thesis, Universidad Nacional de Colombia.
dc.identifier.eprintshttp://bdigital.unal.edu.co/4095/


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record