Show simple item record

dc.rights.licenseAtribución-NoComercial 4.0 Internacional
dc.contributorLeón Guzmán, Elizabeth
dc.contributor.authorRojas Hernández, Alix Érica
dc.date.accessioned2019-06-24T23:58:49Z
dc.date.available2019-06-24T23:58:49Z
dc.date.issued2010
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/11417
dc.description.abstractEn este documento se propone un modelo de minería enfocado al procesamiento de flujos de datos. Tratar con flujos de datos (o data streams, en inglés) trae retos computacionales debido a su volumen y su tasa de generación rápida y variable. Los datos en un flujo no pueden ser almacenados, ni mucho menos, procesados eficientemente utilizando procedimientos que requieran usar un dato varias veces. Para esto se propone el desarrollo de un modelo llamado SCOFI, que por sus siglas en inglés traduce Streaming Clasification based On Frequent Itemsets. Su diseño general presenta dos módulos funcionales: un módulo de selección y asociación y un módulo de clasificación. Para el primer módulo se propone el algoritmo Apriori+, que encuentra conjuntos de elementos frecuentes calculando el número de candidatos primos, cambiando así, la representación de los datos para obtener un problema más sencillo en el dominio de los números naturales. En el módulo de clasificación se usa una modificación del algoritmo M1 para construir el clasificador a partir de reglas de asociación. Finalmente, el modelo se aplica al análisis de clics generados en un sitio Web real. Para ello se emplea el conjunto de datos “Online retailer website clickstream analysis” de la KDD-Cup 2000 y se simula un ambiente en línea, con el fin de validar el modelo. / Abstract: In this document, a data mining model to process data streams is proposed. Dealing with data streams carries computational challenges since they cannot be stored or processed efficiently through procedures that use data several times because, data arrival rate and speed is variable and the volume is high. The proposed model is named SCOFI - Streaming Classification based On Frequent Item sets. Its general design relies on two functional modules: selection and association module and classification module. For the first module it is proposed the algorithm Apriori+. This algorithm finds frequent item sets calculating the amount of prime candidates; so that, it changes the data representation in order to get a simpler problem in the natural numbers domain. In the classification model it is used a modification of the M1 algorithm in order to build a classifier based on association rules. Finally, the model is applied to click stream analysis from real data. For this, the "Online retailer website click stream analysis" data set from KDD-Cup 2000 is used, and simulated an online environment for model validation.
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
dc.relation.ispartofDepartamento de Ingeniería de Sistemas e Industrial
dc.rightsDerechos reservados - Universidad Nacional de Colombia
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subject.ddc0 Generalidades / Computer science, information and general works
dc.titleModelo basado en minería de flujos de datos para el análisis de clics en un sitio web / A model based on data streams mining to clickstream analysis in a website
dc.typeTrabajo de grado - Maestría
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dc.identifier.eprintshttp://bdigital.unal.edu.co/8840/
dc.description.degreelevelMaestría
dc.relation.referencesRojas Hernández, Alix Érica (2010) Modelo basado en minería de flujos de datos para el análisis de clics en un sitio web / A model based on data streams mining to clickstream analysis in a website. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.subject.proposalFlujos de datos
dc.subject.proposalMinería de datos
dc.subject.proposalAnálisis de clics / Data streams
dc.subject.proposalData mining
dc.subject.proposalClickstream analysis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial 4.0 InternacionalThis work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit