Modelo basado en agentes para las etapas de recopilación e integración de datos en el proceso de KDD
Author
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2010Metadata
Show full item recordSummary
La transformación de grandes cantidades de datos en información útil y conocimiento es una inminente necesidad para la industria y la sociedad en general. Buscando cubrir esta necesidad surge el proceso de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases, KDD), el cual está compuesto por varias etapas. Un conjunto de estas etapas es conocido como preparación de datos y en la actualidad representa la mayor parte del esfuerzo destinado en las organizaciones al proceso de KDD. En este trabajo se presenta un análisis para dos etapas de la preparación de datos (Recopilación e Integración de Datos), y se define un modelo sobre una arquitectura distribuida, escalable, basada en Sistemas Multi-Agentes que soporta el lanzamiento de agentes que logran llevar a cabo las actividades de estas etapas en bases de datos distribuidas. Este modelo finalmente se implemento sobre un caso de estudio práctico con datos reales y simulados logrando resultados que demuestran la pertinencia del mismo. / Abstract. The transformation of large amounts of data into useful information and knowledge is an imminent need for industry and society in general. Looking to fulfill this need, the process of Knowledge Discovery in databases (KDD) arises, which consists of several stages. A set of these stages is known as data preparation and currently represents the bulk of effort in organizations during the KDD process. This document presents an analysis for two stages of Data Preparation (Data Collection and Integration), and defines a model with a distributed architecture, scalable, based on Multi-Agent Systems that supports the release of agents that fail to bring out the activities of these stages in distributed databases. This model was finally implemented on a case study with real and simulated data achieving results that demonstrate its relevance.Keywords
Collections
This work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit