• Correo ElectrónicoCorreo Electrónico
  • Dirección Nacional de Información AcadémicaDNINFOA - SIA
  • BibliotecaBibliotecas
  • ConvocatoriasConvocatorias
  • Identidad U.N.Identidad U.N.
Escudo de la República de ColombiaEscudo de la República de Colombia
  • English 
    • español
    • English
    • português (Brasil)
  • Aspirantes
  • Estudiantes
  • Egresados
  • Docentes
  • Administrativos
repositorio.unal.edu.co
Bibliotecas
  • Mapa de sedes
  • Amazonía
  • Bogotá
  • Caribe
  • Manizales
  • Medellín
  • Orinoquía
  • Palmira
Biblioteca Digital
  • Repositorio Institucional
  • Entrega de tesis y publicación en línea
  • Digitalización de documentos
  • Normatividad publicación en línea
  • Portal de Revistas UN
  • Suscripción a contenidos UN
  • Contáctenos
Recursos Bibliográficos
  • Recursos electrónicos
  • Catálogo UN
  • Diccionarios y enciclopedias
  • Herramientas bibliográficas
  • Libros electrónicos
  • Descubridor
  • Índices bibliográficos
  • Adquisicion de material bibliografico
Formación
  • Agenda de formación
  • Solicitud de nuevo taller
  • Guía de autoarchivo de documentos
Acerca de
  • Misión y visión
  • Dirección Nacional de Bibliotecas
  • Convenios y redes
  • Video del Sinab
  • Preguntas frecuentes
Sedes
  • Amazonia
  • Bogotá
  • Caribe
  • De La Paz
  • Manizales
  • Medellín
  • Orinoquia
  • Palmira
  • Tumaco
Servicios
Perfiles
Home
    • español
    • English
    • português (Brasil)
  • Login
View Item 
  •   Institutional Repository of Universidad Nacional
  • 1- Tesis y Disertaciones
  • Sede Bogotá
  • Facultad de Ingeniería
  • Departamento de Ingeniería de Sistemas e Industrial
  • View Item
  •   Institutional Repository of Universidad Nacional
  • 1- Tesis y Disertaciones
  • Sede Bogotá
  • Facultad de Ingeniería
  • Departamento de Ingeniería de Sistemas e Industrial
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Modelo basado en minería de flujos de datos para el análisis de clics en un sitio web / A model based on data streams mining to clickstream analysis in a website

Thumbnail
299675.2010.pdf (10.56Mb)
Date published
2010
Author
Rojas Hernández, Alix Érica
Metadata
Show full item record

Summary
En este documento se propone un modelo de minería enfocado al procesamiento de flujos de datos. Tratar con flujos de datos (o data streams, en inglés) trae retos computacionales debido a su volumen y su tasa de generación rápida y variable. Los datos en un flujo no pueden ser almacenados, ni mucho menos, procesados eficientemente utilizando procedimientos que requieran usar un dato varias veces. Para esto se propone el desarrollo de un modelo llamado SCOFI, que por sus siglas en inglés traduce Streaming Clasification based On Frequent Itemsets. Su diseño general presenta dos módulos funcionales: un módulo de selección y asociación y un módulo de clasificación. Para el primer módulo se propone el algoritmo Apriori+, que encuentra conjuntos de elementos frecuentes calculando el número de candidatos primos, cambiando así, la representación de los datos para obtener un problema más sencillo en el dominio de los números naturales. En el módulo de clasificación se usa una modificación del algoritmo M1 para construir el clasificador a partir de reglas de asociación. Finalmente, el modelo se aplica al análisis de clics generados en un sitio Web real. Para ello se emplea el conjunto de datos “Online retailer website clickstream analysis” de la KDD-Cup 2000 y se simula un ambiente en línea, con el fin de validar el modelo. / Abstract: In this document, a data mining model to process data streams is proposed. Dealing with data streams carries computational challenges since they cannot be stored or processed efficiently through procedures that use data several times because, data arrival rate and speed is variable and the volume is high. The proposed model is named SCOFI - Streaming Classification based On Frequent Item sets. Its general design relies on two functional modules: selection and association module and classification module. For the first module it is proposed the algorithm Apriori+. This algorithm finds frequent item sets calculating the amount of prime candidates; so that, it changes the data representation in order to get a simpler problem in the natural numbers domain. In the classification model it is used a modification of the M1 algorithm in order to build a classifier based on association rules. Finally, the model is applied to click stream analysis from real data. For this, the "Online retailer website click stream analysis" data set from KDD-Cup 2000 is used, and simulated an online environment for model validation.
Subject
Flujos de datos ; Minería de datos ; Análisis de clics / Data streams ; Data mining ; Clickstream analysis ;
URI
https://repositorio.unal.edu.co/handle/unal/11417
Collections
  • Departamento de Ingeniería de Sistemas e Industrial [563]

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesKnowledge AreasThis CollectionBy Issue DateAuthorsTitlesKnowledge Areas

My Account

LoginRegister

Statistics

View Google Analytics Statistics
Régimen Legal
Talento humano
Contratación
Ofertas de empleo
Rendición de cuentas
Concurso docente
Pago Virtual
Control interno
Calidad
Buzón de notificaciones
Correo institucional
Mapa del sitio
Redes Sociales
FAQ
Quejas y reclamos
Atención en línea
Encuesta
Contáctenos
Estadísticas
Glosario

Contacto página web:
Carrera 45 # 26-85
Edif. Uriel Gutiérrez
Bogotá D.C., ; Colombia
(+57 1) 316 5000

© Copyright 2014
Algunos derechos reservados.
mediosdigitales@unal.edu.co
Acerca de este sitio web

Actualización: 04/10/19

Orgullo UNOrgullo UNAgencia de noticiasAgencia de noticias
Trámites en líneaContaduría General de la República