Neural networks that express multiple strategies in the video game StarCraft 2

dc.audienceEspecializadaspa
dc.contributor.advisorCabarcas Jaramillo, Danielspa
dc.contributor.authorGonzález Duque, Miguelspa
dc.date.accessioned2020-03-30T06:38:31Zspa
dc.date.available2020-03-30T06:38:31Zspa
dc.date.issued2019-10-03spa
dc.descriptionilustracionesspa
dc.description.abstractUsing neural networks and supervised learning, we have created models capable of solving problems at a superhuman level. Nevertheless, this training process results in models that learn policies that average the plethora of behaviors usually found in datasets. In this thesis we present and study the Behavioral Repetoires Imitation Learning (BRIL) technique. In BRIL, the user designs a behavior space, the user then projects this behavior space into low coordinates and uses these coordinates as input to the model. Upon deployment, the user can adjust the model to express a behavior by specifying fixed coordinates for these inputs. The main research question ponders on the relationship between the Dimension Reduction algorithm and how much the trained models are able to replicate behaviors. We study three different Dimensionality Reduction algorithms: Principal Component Analysis (PCA), Isometric Feature Mapping (Isomap) and Uniform Manifold Approximation and Projection (UMAP); we design and embed a behavior space in the video game StarCraft 2, we train different models for each embedding and we test the ability of each model to express multiple strategies. Results show that with BRIL we are able to train models that are able to express the multiple behaviors present in the dataset. The geometric structure these methods preserve induce different separations of behaviors, and these separations are reflected in the models' conducts. (Tomado de la fuente)spa
dc.description.abstractUsando redes neuronales y aprendizaje supervisado, hemos creado modelos capaces de solucionar problemas a nivel súperhumano. Sin embargo, el proceso de entrenamiento de estos modelos es tal que el resultado es una política que promedia todos los diferentes comportamientos presentes en el conjunto de datos. En esta tesis presentamos y estudiamos la técnica Aprendizaje por Imitación de Repertorios de Comportamiento (BRIL), la cual permite entrenar modelos que expresan múltiples comportamientos de forma ajustable. En BRIL, el usuario diseña un espacio de comportamientos, lo proyecta a bajas dimensiones y usa las coordenadas resultantes como entradas del modelo. Para poder expresar cierto comportamiento a la hora de desplegar la red, basta con fijar estas entradas a las coordenadas del respectivo comportamiento. La pregunta principal que investigamos es la relación entre el algoritmo de reducción de dimensionalidad y la capacidad de los modelos entrenados para replicar y expresar las estrategias representadas. Estudiamos tres algoritmos diferentes de reducción de dimensionalidad: Análisis de Componentes Principales (PCA), Mapeo de Características Isométrico (Isomap) y Aproximación y Proyección de Manifolds Uniformes (UMAP); diseñamos y proyectamos un espacio de comportamientos en el videojuego StarCraft 2, entrenamos diferentes modelos para cada embebimiento y probamos la capacidad de cada modelo de expresar múltiples estrategias. Los resultados muestran que, usando BRIL, logramos entrenar modelos que pueden expresar los múltiples comportamientos presentes en el conjunto de datos. La estructura geométrica preservada por cada método de reducción induce diferentes separaciones de los comportamientos, y estas separaciones se ven reflejadas en las conductas de los modelos. (Tomado de la fuente)spa
dc.description.degreelevelMaestríaspa
dc.format.extent70 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.eprintshttp://bdigital.unal.edu.co/74472/spa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/77095
dc.language.isoengspa
dc.publisher.departmentEscuela de Matemáticasspa
dc.publisher.editorUniversidad Nacional de Colombiaspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeMedellínspa
dc.publisher.programMaestría en Ciencias - Matemáticaspa
dc.relation.haspart51 Matemáticas / Mathematicsspa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Matemáticasspa
dc.relation.ispartofEscuela de Matemáticasspa
dc.relation.referencesGonzález Duque, Miguel (2019) Neural networks that express multiple strategies in the video game StarCraft 2. Maestría thesis, Universidad Nacional de Colombia, sede Medellín.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.proposalSupervised Learningspa
dc.subject.proposalDimensionality Reductionspa
dc.subject.proposalNeural Networksspa
dc.subject.proposalStarCraft 2spa
dc.subject.proposalBehavioral Repertoires Imitation Learningspa
dc.titleNeural networks that express multiple strategies in the video game StarCraft 2spa
dc.title.translatedRedes neuronales que expresan múltiples estrategias en el videojuego StarCraft 2.spa
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1053838200.2019.pdf
Tamaño:
4.87 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ciencias - Matemáticas