Implementación computacional de modelos de procesos espaciales para análisis de redes sociales
Cargando...
Autores
Solano Velásquez, Jesús David
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
El modelamiento estadístico de las redes permite identificar su distribución de probabilidad, imputar datos faltantes y realizar predicciones sobre la formación de enlaces. Los
modelos latentes abordan el modelamiento desde una perspectiva marginal, incorporan
dependencias no condicionales por medio de efectos aleatorios. Un caso particular de los
modelos latentes es el modelo basado en procesos espaciales completamente Bayesiano que
soluciona los problemas de sobreajuste del modelo de espacio latente de distancia. En este
documento se realiza la implementación computacional del modelo y se realiza un estudio
de sus bondades de ajuste y bondades de predicción a través de redes sintéticas y reales.
El modelo tiene buenas cualidades para la replicación de las estadísticas observadas en
la red y la estimación de la superficie latente. Sin embargo, el poder predictivo, medido
a través del área bajo la curva (AUC por sus siglas en inglés) no supera el valor de 0.7.
También se presenta una forma alternativa de ajustar el modelo usando el algoritmo de
caso-control. El modelo basado en la log-verosimilitud estimada tiene una buena calidad
de bondad de ajuste. (Texto tomado de la fuente)
Abstract
Statistical modeling of networks makes it possible to identify their probability distribution, impute missing data and make predictions about link formation. Latent models
approach modeling from a marginal perspective, incorporating non-conditional dependencies through random effects. A particular case of latent models is the fully Bayesian spatial
process-based model that solves the overfitting problems of the latent distance space model.
In this paper the computational implementation of the model is performed and a study
of its goodness of fit and goodness of prediction through synthetic and real networks is
carried out. The model has good qualities for the replication of the statistics observed in
the network and the estimation of the latent surface. However, the predictive power, as
measured by the area under the curve (AUC), does not exceed 0.7. An alternative way of
fitting the model using the case-control algorithm is also presented. The model based on
the estimated log-likelihood has a good good goodness-of-fit quality.
Palabras clave propuestas
Descripción
ilustraciones, graficas