Analítica predictiva y desarrollo de un modelo cuantitativo para estudio y segmentación del mercado farmacéutico para patologías de alto costo
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2025-06-23Metadata
Show full item recordSummary
Actualmente, Colombia enfrenta importantes retos en su sistema de salud, especialmente en la gestión eficiente de los recursos, la cobertura y la administración de los prestadores de servicios. Dentro de este contexto, el sector farmacéutico, encargado de la comercialización de medicamentos, enfrenta desafíos específicos debido a la limitada cobertura del sistema y la falta de sistemas de información robustos. Para garantizar un acceso adecuado a las terapias según las necesidades de la población, surge la necesidad de analizar la información del mercado de medicamentos de alto costo y del sistema de salud colombiano, con el objetivo de respaldar la toma de decisiones de manera analítica y fundamentada. Este trabajo propone la aplicación de modelos de aprendizaje automático y técnicas de minería de datos para abordar dichas necesidades, centrándose en la construcción de un modelo de clusterización inspirado en la metodología RFM (Recency, Frequency, Monetary) (Hughes, 1996), adaptada al contexto del sector farmacéutico. Para ello, se ajustaron los parámetros clásicos del modelo RFM, reemplazando la dimensión de recencia por los días de inventario de cada cliente y frecuencia por variaciones en las compras, mientras que la dimensión valor monetario se mantuvo para representar el valor económico asociado. Esta adaptación permitió capturar mejor la dinámica de compra de los clientes en función de su estabilidad de inventario y su impacto financiero. Los resultados de la clasificación son el resultado de un proceso estructurado que inició con la recopilación y consolidación de una base de datos de 110,322 registros correspondientes a transacciones comerciales realizadas durante un año. Posteriormente, se realizó un proceso de pretratamiento de los datos, que incluyó la limpieza, normalización y transformación de las variables para garantizar su calidad y coherencia. A continuación, se emplearon técnicas de clusterización no supervisada para segmentar a los clientes en grupos homogéneos, utilizando los algoritmos K-Means, Gaussian Mixture Model (GMM) y Aglomerativo (Hierarchical Clustering). La validación de los modelos se realizó mediante la comparación de la métrica WCSS (Within-Cluster Sum of Squares) adaptada a las características de cada algoritmo, permitiendo seleccionar el modelo con la mejor cohesión interna. Como resultado, el algoritmo K-Means mostró el mejor desempeño, evidenciado por un menor valor de WCSS de 5.93, lo que garantiza una mayor compactación de los clusters y, por ende, una segmentación más precisa. Finalmente, el modelo entrenado permitió clasificar a los clientes en función de su comportamiento histórico de compra y predecir su posible evolución futura, facilitando la identificación de segmentos con diferentes perfiles de riesgo financiero. Esta clasificación ofrece una herramienta práctica para la toma de decisiones comerciales basadas en datos, permitiendo implementar estrategias diferenciadas para cada grupo y optimizar la gestión del mercado de medicamentos de alto costo en Colombia. La metodología desarrollada es escalable y puede adaptarse a otras patologías, consolidando así una solución replicable para distintos contextos dentro del sector farmacéutico. (Tomado de la fuente)Abstract
Currently, Colombia faces significant challenges in its healthcare system, particularly in the efficient management of resources, coverage, and the administration of healthcare service providers. Within this context, the pharmaceutical sector, responsible for the commercialization of medications, encounters specific challenges due to the system's limited coverage and the lack of robust information systems. To ensure adequate access to therapies according to the population's needs, there is a need to analyze information from the high-cost medication market and the Colombian healthcare system, aiming to support decision-making in an analytical and evidence-based manner. This study proposes the application of machine learning models and data mining techniques to address these needs, focusing on the development of a clustering model inspired by the RFM methodology (Recency, Frequency, Monetary) (Hughes, 1996), adapted to the pharmaceutical sector's context. For this purpose, the classic RFM parameters were adjusted by replacing the recency dimension with each client’s inventory days and the frequency dimension with variations in purchases, while the monetary value dimension was maintained to represent the associated economic value. This adaptation allowed for a better capture of customers' purchasing dynamics based on their inventory stability and financial impact. The classification results from a structured process that began with the collection and consolidation of a database with 110,322 records of commercial transactions carried out over one year. Subsequently, a data preprocessing phase was conducted, including data cleaning, normalization, and variable transformation to ensure quality and consistency. Next, unsupervised clustering techniques were employed to segment customers into homogeneous groups using the K-Means, Gaussian Mixture Model (GMM), and Agglomerative (Hierarchical Clustering) algorithms. The validation of the models was performed by comparing the WCSS (Within-Cluster Sum of Squares) metric, adapted to the characteristics of each algorithm, allowing the selection of the model with the highest internal cohesion. As a result, the K-Means algorithm demonstrated the best performance, evidenced by a lower WCSS value of 5.93, ensuring greater cluster compactness and, consequently, more precise segmentation. Finally, the trained model enabled the classification of customers based on their historical purchasing behavior and the prediction of their potential future evolution, facilitating the identification of segments with different financial risk profiles. This classification provides a practical tool for data-driven commercial decision-making, enabling differentiated strategies for each group and optimizing the management of the high-cost medication market in Colombia. The developed methodology is scalable and can be adapted to other pathologies, thus establishing a replicable solution for various contexts within the pharmaceutical sector.Keywords
Physical description
Ilustraciones, gráficos
Collections
