• Correo ElectrónicoCorreo Electrónico
  • Dirección Nacional de Información AcadémicaDNINFOA - SIA
  • BibliotecaBibliotecas
  • ConvocatoriasConvocatorias
  • Identidad U.N.Identidad U.N.
Escudo de la República de ColombiaEscudo de la República de Colombia
  • English 
    • español
    • English
    • português (Brasil)
  • Aspirantes
  • Estudiantes
  • Egresados
  • Docentes
  • Administrativos
repositorio.unal.edu.co
Bibliotecas
  • Mapa de sedes
  • Amazonía
  • Bogotá
  • Caribe
  • Manizales
  • Medellín
  • Orinoquía
  • Palmira
Biblioteca Digital
  • Repositorio Institucional
  • Entrega de tesis y publicación en línea
  • Digitalización de documentos
  • Normatividad publicación en línea
  • Portal de Revistas UN
  • Suscripción a contenidos UN
  • Contáctenos
Recursos Bibliográficos
  • Recursos electrónicos
  • Catálogo UN
  • Diccionarios y enciclopedias
  • Herramientas bibliográficas
  • Libros electrónicos
  • Descubridor
  • Índices bibliográficos
  • Adquisicion de material bibliografico
Formación
  • Agenda de formación
  • Solicitud de nuevo taller
  • Guía de autoarchivo de documentos
Acerca de
  • Misión y visión
  • Dirección Nacional de Bibliotecas
  • Convenios y redes
  • Video del Sinab
  • Preguntas frecuentes
Sedes
  • Amazonia
  • Bogotá
  • Caribe
  • De La Paz
  • Manizales
  • Medellín
  • Orinoquia
  • Palmira
  • Tumaco
Servicios
Perfiles
Home
    • español
    • English
    • português (Brasil)
  • Login
View Item 
  •   Institutional Repository of Universidad Nacional
  • 1- Tesis y Disertaciones
  • Sede Medellín
  • Facultad de Minas
  • Departamento de Materiales y Minerales
  • View Item
  •   Institutional Repository of Universidad Nacional
  • 1- Tesis y Disertaciones
  • Sede Medellín
  • Facultad de Minas
  • Departamento de Materiales y Minerales
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Guia metodológica para la selección de técnicas de depuración de datos

Thumbnail
71644758.20103.pdf (68.19Kb)
71644758.20102.pdf (320.6Kb)
71644758.20104.pdf (243.1Kb)
71644758.20101.pdf (2.203Mb)
Date published
2010
Author
Amón Uribe, Iván
Metadata
Show full item record

Summary
Los problemas de calidad de los datos han capturado la atención de los investigadores, llevando al desarrollo de múltiples técnicas para detectar y corregir los problemas en los datos, pero no es trivial decidir cuáles técnicas deben aplicarse a un conjunto de datos particular de la vida real. Para lograr buenos resultados en procesos de limpieza de datos, la elección de la técnica es fundamental, pero no se conoce de alguna metodología que detalle la forma de realizar dicha selección de técnicas. Es por esto que esta tesis de maestría construye una guía metodológica que oriente al analista de los datos hacia una selección, con mayor rigor científico, de las técnicas adecuadas para aplicar a un conjunto de datos particular de un dominio específico. La guía metodológica construida en este trabajo, orienta la selección de técnicas para tres de los posibles problemas que pueden presentar los datos: detección de duplicados, valores atípicos incorrectos y valores faltantes. Analistas de datos que requieran hacer tareas de depuración de datos para los tres problemas mencionados, encontrarán una guía metodológica expresada mediante diagramas de flujo, la cual recomienda una o varias técnicas –de entre algunas estudiadas- para su situación particular. / Abstract. Data quality problems have captured the attention of researchers, leading to the development of multiple techniques to detect and correct problems in the data, but it is not trivial to decide which techniques should be applied to a particular data set of real life. To achieve good results in data cleaning processes, the choice of technique is essential, but of the best of our knowledgement not known any methodology that details how to perform the selection of techniques. This work builds a methodological guide that orients the analyst of the data to a selection, with greater scientific rigor, appropriate techniques to apply to a particular data set from a specific domain. The guide direct the selection of techniques for three of the possible problems that may present the data: record linkage, outliers and missing values. Data analysts do tasks requiring data cleansing for the three problems mentioned above, find a methodological guide expressed by flowcharts, which recommends one or more techniques for their particular situation
Subject
Depuración en Ciencia del Computador ; Datos ; Bases de datos ; Programación (Computadores) ;
URI
https://repositorio.unal.edu.co/handle/unal/69915
Collections
  • Departamento de Materiales y Minerales [223]

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesKnowledge AreasThis CollectionBy Issue DateAuthorsTitlesKnowledge Areas

My Account

LoginRegister

Statistics

View Google Analytics Statistics
Régimen Legal
Talento humano
Contratación
Ofertas de empleo
Rendición de cuentas
Concurso docente
Pago Virtual
Control interno
Calidad
Buzón de notificaciones
Correo institucional
Mapa del sitio
Redes Sociales
FAQ
Quejas y reclamos
Atención en línea
Encuesta
Contáctenos
Estadísticas
Glosario

Contacto página web:
Carrera 45 # 26-85
Edif. Uriel Gutiérrez
Bogotá D.C., ; Colombia
(+57 1) 316 5000

© Copyright 2014
Algunos derechos reservados.
mediosdigitales@unal.edu.co
Acerca de este sitio web

Actualización: 04/10/19

Orgullo UNOrgullo UNAgencia de noticiasAgencia de noticias
Trámites en líneaContaduría General de la República