Extracción y análisis de información de accidentes de tránsito desde redes sociales

Miniatura

Autores

Suat Rojas, Nestor Eduardo

Director

Pedraza Bonilla, Cesar Augusto
Gutierrez Osorio, Camilo

Tipo de contenido

Trabajo de grado - Maestría

Idioma del documento

Español

Fecha de publicación

2021

Título de la revista

ISSN de la revista

Título del volumen

Documentos PDF

Resumen

La detección de accidentes de tránsito es una estrategia importante para que los gobiernos implementen políticas que reduzcan este fenómeno. Usualmente usan técnicas como procesamiento de imágenes, dispositivos RFID, y otras. La detección en redes sociales ha surgido como una alternativa de bajo costo. Sin embargo las redes sociales presentan varios retos y desafíos como uso de lenguaje informal y falta de ortografía. Este trabajo propone un método para extraer y analizar los datos de accidentes de tránsito desde Twitter. Cuatro fases componen el método. La primera fase establece los mecanismos para obtener datos. El segundo consiste en representar vectorialmente los mensajes y clasificarlos como accidentes de tránsito o no. La tercera usa técnicas de reconocimiento de entidades nombradas para la detección de ubicaciones. En la cuarta estas ubicaciones pasan por un geocoder que devuelve sus coordenadas geográficas. Aplicamos este método para la ciudad de Bogotá y comparamos los datos de Twitter con la fuente oficial de tránsito, las comparaciones muestran una influencia en Twitter sobre la zona comercial e industrial de la ciudad. Los resultados revelan la efectividad de los accidentes reportados en Twitter como información adicional y su uso debe considerarse como fuentes complementarias a los métodos de detección existentes. (Texto tomado de la fuente)

Abstract

The detection of traffic accidents is an important strategy for governments to implement policies that reduce this phenomenon. They usually use techniques like image processing, RFID devices, and others. Social media detection has emerged as a low-cost alternative. However, social media presents several challenges such as use of non-formal language and misspelling. This work proposes a method to extract and analyze traffic accident data from Twitter. The method is composed of four phases. The first phase establishes the mechanisms for obtaining data. The second consists of representing the messages in vectors and classif- ying them as traffic accidents or not. The third uses named entity recognition techniques for location detection. In the fourth, these locations go through a geocoder that returns their geographic coordinates. We apply this method for the city of Bogota and compare the data on Twitter with the official transit source, the comparisons show an influence on Twitter on the commercial and industrial area of the city. The results reveal the effectiveness of the accidents reported on Twitter as additional information and their use should be considered as complementary sources to the existing detection methods.

Descripción Física/Lógica/Digital

ilustraciones, gráficas, mapas, tablas

Palabras clave

Citación