Comparación de herramientas ETL de código abierto

dc.contributorJiménez Ramírez, Claudiaspa
dc.contributor.advisorVelázquez Henao, Juan David (Thesis advisor)spa
dc.contributor.authorRuíz Borja, Jhoan Estebanspa
dc.date.accessioned2019-07-03T10:33:23Zspa
dc.date.available2019-07-03T10:33:23Zspa
dc.date.issued2019spa
dc.description.abstractEl objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ETL, y de facilitar no solo a los usuarios, sino también a empresas, que deseen aplicar algún proceso ya sea de extracción, transformación o carga de datos, mejorando el enfoque de inteligencia del negocio con estas herramientas adecuadas para el tratamiento de datos. Se propuso describir varias herramientas de la actualidad, donde luego se describen los motivos de selección de las tres herramientas, prosiguiendo a la descripción detallada de las elegidas, para saber que capacidades poseen a la hora de realizar el proceso ETL, adicionalmente se dan los criterios de comparación, donde luego se presenta un ejemplo práctico, que permite comparar, para luego sugerir en qué casos puede ser más útil una herramienta con respecto a otra según sus características. Por último, se presentan cuadros comparativos, donde se podrá resaltar las ventajas y desventajas de cada herramienta, junto con unas sugerencias que plantea qué herramienta utilizar para un caso dado, según la necesidad del usuario o empresa.spa
dc.description.abstractAbstract: The main objective of the present final work is the comparison of Pentaho Data Integration, Talend Data Integration and OpenRefine, three open source tools of ETL (Extraction, Transformation and Load), with the purpose of promoting the importance that the ETL process currently has, and to facilitate not only to the users, but also the companies, who wish to apply some process, involving Extraction, Transformation or Loading of data, to improve the Business Intelligence approach with these appropriate tools for data processing. It was proposed to describe several current tools, then we describe the reasons for selecting the tools to be compared, continuing with the detailed description of the three tools chosen, to explore what capabilities they possess when carrying out the ETL process, additionally the comparison criteria are given, and then a practical example is presented, which allows comparing, and then suggesting in which cases a tool can be more useful with respect to another according to its characteristics. Finally, comparative tables are presented, where the advantages and disadvantages of each tool can be highlighted, along with a brief guide that suggests which tool should be used for a specific case, according to the user's or company's needspa
dc.description.degreelevelMaestríaspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.eprintshttp://bdigital.unal.edu.co/71803/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/69685
dc.language.isospaspa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemasspa
dc.relation.ispartofEscuela de Sistemasspa
dc.relation.referencesRuíz Borja, Jhoan Esteban (2019) Comparación de herramientas ETL de código abierto. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc0 Generalidades / Computer science, information and general worksspa
dc.subject.proposalPentaho Data Integration (PDI)spa
dc.subject.proposalTalend Data Integration (TDI)spa
dc.subject.proposalOpenRefine (OR)spa
dc.subject.proposalCódigo abiertospa
dc.titleComparación de herramientas ETL de código abiertospa
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1128440307.2018.pdf
Tamaño:
4.36 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería - Ingeniería de Sistemas