Implementación computacional de modelos de procesos espaciales para análisis de redes sociales
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2022-09-01Metadata
Show full item recordSummary
El modelamiento estadístico de las redes permite identificar su distribución de probabilidad, imputar datos faltantes y realizar predicciones sobre la formación de enlaces. Los modelos latentes abordan el modelamiento desde una perspectiva marginal, incorporan dependencias no condicionales por medio de efectos aleatorios. Un caso particular de los modelos latentes es el modelo basado en procesos espaciales completamente Bayesiano que soluciona los problemas de sobreajuste del modelo de espacio latente de distancia. En este documento se realiza la implementación computacional del modelo y se realiza un estudio de sus bondades de ajuste y bondades de predicción a través de redes sintéticas y reales. El modelo tiene buenas cualidades para la replicación de las estadísticas observadas en la red y la estimación de la superficie latente. Sin embargo, el poder predictivo, medido a través del área bajo la curva (AUC por sus siglas en inglés) no supera el valor de 0.7. También se presenta una forma alternativa de ajustar el modelo usando el algoritmo de caso-control. El modelo basado en la log-verosimilitud estimada tiene una buena calidad de bondad de ajuste. (Texto tomado de la fuente)Abstract
Statistical modeling of networks makes it possible to identify their probability distribution, impute missing data and make predictions about link formation. Latent models approach modeling from a marginal perspective, incorporating non-conditional dependencies through random effects. A particular case of latent models is the fully Bayesian spatial process-based model that solves the overfitting problems of the latent distance space model. In this paper the computational implementation of the model is performed and a study of its goodness of fit and goodness of prediction through synthetic and real networks is carried out. The model has good qualities for the replication of the statistics observed in the network and the estimation of the latent surface. However, the predictive power, as measured by the area under the curve (AUC), does not exceed 0.7. An alternative way of fitting the model using the case-control algorithm is also presented. The model based on the estimated log-likelihood has a good good goodness-of-fit quality.Keywords
Physical description
ilustraciones, graficas
Collections
