Atribución-NoComercial-SinDerivadas 4.0 InternacionalAugusto González, FabioBabativa Melgarejo, Diego Alejandro2022-02-172022-02-172021https://repositorio.unal.edu.co/handle/unal/81008ilustraciones, gráficas, tablasLa representación adecuada de los flujos de textos en un modelo de aprendizaje automático permite la acumulación efectiva de evidencia secuencial, donde los algoritmos toman la decisión de clasificación cuando hay suficiente certeza para determinar la existencia de cierto tipo de riesgo. Lo que resulta determinante en la detección temprana de trastornos mentales con tendencia al suicidio. Inspirado en lo anterior, el presente trabajo de investigación toma por objeto la realización de un modelo de aprendizaje automático efectivo en la detección de des ́ordenes psicológicos, como son la depresión, la anorexia y la autolesión; manifestados en los flujos de texto discriminados de publicaciones con caracterizaciones determinantes en la red social Reddit. El modelo establecido en esta tesis es entrenado por varios conjuntos de datos etiquetados por expertos del Conference and Labs of the Evaluation Forum (CLEF), dando lugar al establecimiento de una propuesta con menor n ́umero de escritos requeridos en la detección, sobresaliendo en la métrica ERDE y F1 en la identificación temprana de población con tendencia a la anorexia. (Texto tomado de la fuente)The adequate representation of text streams in a machine learning model allows the effective accumulation of sequential evidence, in which the algorithms make the classification decision when there is sufficient certainty to determine the existence of a certain type of risk. What is decisive in the early detection of mental disorders with a tendency to suicide. Inspired by the above, the present research work aims to carry out an effective machine learning model in the detection of psychological disorders, such as depression, anorexia and self-harm; mani- fested in the discriminated text streams of publications with decisive characterizations in the Reddit social network. The model established in this thesis is trained by several data sets labeled by experts from the Conference and Labs of the Evaluation Forum (CLEF), leading to the establishment of a proposal with a lower number of writings required in detection, excelling in the ERDE and F1 metrics in the early identification of a population with a tendency to anorexy.xiii, 85 páginasapplication/pdfspaDerechos reservados al autor, 2021http://creativecommons.org/licenses/by-nc-nd/4.0/000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadoresModelo de aprendizaje automático para la clasificación temprana de flujos de texto aplicado a la detección de desórdenes psicológicosTrabajo de grado - MaestríaUniversidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/info:eu-repo/semantics/openAccessAprendizaje automático (Inteligencia artificial)Machine learningEnfermedades mentalesMental illnessPsiquiatríaPsychiatryInteligencia artificial-Aplicaciones médicasArtificial intelligence - Medical applicationsDetección temprana de riesgoAnorexiaDepresiónAprendizaje automáticoAutolesiónERDELTPLatency-weigthed F1Early Risk detectionAnorexiaDepressionMachine LearningSelf-harmMachine learning model for early classification of text streams applied to early detection of psychological disorders