Obtener un método para la extracción de información a partir de documentos semiestructurados producidos al interior del Servicio Nacional de Aprendizaje SENA, permitiendo su publicación, reutilización e intercambio a través de la web semántica

Abello Diaz, Jhonatan Alejandro

Obtener un método para la extracción de información a partir de documentos semiestructurados producidos al interior del Servicio Nacional de Aprendizaje SENA, permitiendo su publicación, reutilización e intercambio a través de la web semántica

dc.contributor	Rosero Muñoz, Mario Armando	spa
dc.contributor.author	Abello Diaz, Jhonatan Alejandro	spa
dc.date.accessioned	2019-07-02T11:27:20Z	spa
dc.date.available	2019-07-02T11:27:20Z	spa
dc.date.issued	2015	spa
dc.description.abstract	Actualmente en el Servicio Nacional de Aprendizaje SENA, existen gran cantidad de archivos, los cuales contienen información textual de manera semiestructurada, lo cual dificulta realizar consultas SQL complejas sobre la información allí contenida, impidiendo que esta información pueda ser utilizada de manera activa al interior de la Entidad. Aunque actualmente la entidad posee un avanzado gestor documental, el cual se encarga de gestionar, almacenar e indexar los documentos producidos por procesos realizados al interior de la entidad, la información que se puede extraer de los mismos es bastante limitada, obligando en muchas ocasiones a abrir el documento para poder observar con mayor detalle el contenido en su interior. Además la indexación de estos documentos, en la mayoría de los casos se realiza 100% manual, lo que expone a la entidad a errores humanos debidos a los altos volúmenes de documentos generados, así como a las múltiples fuentes que los generan; Esto impide que la información histórica contenida en estos documentos sea utilizada eficazmente como soporte en la toma de decisiones de la entidad. Para dar una alternativa de solucion a este problema es necesario construir una base de conocimiento siguiendo la estructura y los lineamientos de datos enlazados, que permitan que esta información relevante pueda ser publicada, consultada y usada como insumo vital en la toma de decisiones al interior de la entidad. Para esto durante el desarrollo de este trabajo se pretende obtener un método para la extracción de información a partir de documentos semiestructurados producidos al interior del Servicio Nacional de Aprendizaje SENA, Este método será plasmado en un prototipo que permitirá extraer la información necesaria mediante cuatro fases que abarcan desde la Extracción de Información hasta la fase de Persistencia de conocimiento, de manera que sea posible inferir la información requerida.	spa
dc.description.abstract	Abstract. Now in the Servicio Nacional de Aprendizaje SENA, there are lots of files, which contain textual semi-structured information, making it difficult to perform complex SQL queries about the information contained therein, preventing this information can be actively used inside SENA. Although the company now has an advanced document management system, which is responsible for managing, storing and indexing the documents produced by processes performed inside SENA, the information can be extracted from them is very limited, forcing many times to open the document to observe in detail the contents inside. Moreover indexing of these documents, in most cases 100% manually, which exposes the entity to human error due to high volumes of documents generated, as well as multiple sources that generate performed, this prevents the historical information contained in these documents to be used effectively as a support in the decision making in the organization. To give an alternative solution to this problem is necessary to build a knowledge base following the structure and guidelines linked data, which allow this relevant information can be posted, accessed and used as vital input in decision making inside the entity. For this during the development of this work it is to obtain a method for extracting information from semi-structured documents produced inside SENA, This method is embodied in a prototype which will extract the necessary information through four stages ranging from extraction to the phase information persistence of knowledge, so that it is possible to infer the required information	spa
dc.description.degreelevel	Maestría	spa
dc.format.mimetype	application/pdf	spa
dc.identifier.eprints	http://bdigital.unal.edu.co/51199/	spa
dc.identifier.uri	https://repositorio.unal.edu.co/handle/unal/55743
dc.language.iso	spa	spa
dc.relation.ispartof	Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de Sistemas	spa
dc.relation.ispartof	Ingeniería de Sistemas	spa
dc.relation.references	Abello Diaz, Jhonatan Alejandro (2015) Obtener un método para la extracción de información a partir de documentos semiestructurados producidos al interior del Servicio Nacional de Aprendizaje SENA, permitiendo su publicación, reutilización e intercambio a través de la web semántica. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.	spa
dc.rights	Derechos reservados - Universidad Nacional de Colombia	spa
dc.rights.accessrights	info:eu-repo/semantics/openAccess	spa
dc.rights.license	Atribución-NoComercial 4.0 Internacional	spa
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0/	spa
dc.subject.ddc	0 Generalidades / Computer science, information and general works	spa
dc.subject.ddc	37 Educación / Education	spa
dc.subject.ddc	62 Ingeniería y operaciones afines / Engineering	spa
dc.subject.ddc	65 Gerencia y servicios auxiliares / Management and public relations	spa
dc.subject.proposal	Extracción de información	spa
dc.subject.proposal	Gestión del conocimiento	spa
dc.subject.proposal	Datos Enlazados	spa
dc.subject.proposal	RDF	spa
dc.subject.proposal	Ontología	spa
dc.subject.proposal	Web Semántica	spa
dc.subject.proposal	SENA	spa
dc.subject.proposal	Information Extraction	spa
dc.subject.proposal	Knowledge Management	spa
dc.subject.proposal	Linked Data	spa
dc.subject.proposal	RDF	spa
dc.subject.proposal	Ontology	spa
dc.subject.proposal	Semantic Web	spa
dc.title	Obtener un método para la extracción de información a partir de documentos semiestructurados producidos al interior del Servicio Nacional de Aprendizaje SENA, permitiendo su publicación, reutilización e intercambio a través de la web semántica	spa
dc.type	Trabajo de grado - Maestría	spa
dc.type.coar	http://purl.org/coar/resource_type/c_bdcc	spa
dc.type.coarversion	http://purl.org/coar/version/c_ab4af688f83e57aa	spa
dc.type.content	Text	spa
dc.type.driver	info:eu-repo/semantics/masterThesis	spa
dc.type.redcol	http://purl.org/redcol/resource_type/TM	spa
dc.type.version	info:eu-repo/semantics/acceptedVersion	spa
oaire.accessrights	http://purl.org/coar/access_right/c_abf2	spa

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: jhonatanalejandroabellodiaz.2015.pdf
Tamaño:: 4.06 MB
Formato:: Adobe Portable Document Format

Descargar

Colecciones

Maestría en Ingeniería - Sistemas y Computación