Extracción y análisis de información de accidentes de tránsito desde redes sociales
Author
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2021Metadata
Show full item recordSummary
La detección de accidentes de tránsito es una estrategia importante para que los gobiernos implementen políticas que reduzcan este fenómeno. Usualmente usan técnicas como procesamiento de imágenes, dispositivos RFID, y otras. La detección en redes sociales ha surgido como una alternativa de bajo costo. Sin embargo las redes sociales presentan varios retos y desafíos como uso de lenguaje informal y falta de ortografía. Este trabajo propone un método para extraer y analizar los datos de accidentes de tránsito desde Twitter. Cuatro fases componen el método. La primera fase establece los mecanismos para obtener datos. El segundo consiste en representar vectorialmente los mensajes y clasificarlos como accidentes de tránsito o no. La tercera usa técnicas de reconocimiento de entidades nombradas para la detección de ubicaciones. En la cuarta estas ubicaciones pasan por un geocoder que devuelve sus coordenadas geográficas. Aplicamos este método para la ciudad de Bogotá y comparamos los datos de Twitter con la fuente oficial de tránsito, las comparaciones muestran una influencia en Twitter sobre la zona comercial e industrial de la ciudad. Los resultados revelan la efectividad de los accidentes reportados en Twitter como información adicional y su uso debe considerarse como fuentes complementarias a los métodos de detección existentes. (Texto tomado de la fuente)Abstract
The detection of traffic accidents is an important strategy for governments to implement policies that reduce this phenomenon. They usually use techniques like image processing, RFID devices, and others. Social media detection has emerged as a low-cost alternative. However, social media presents several challenges such as use of non-formal language and misspelling. This work proposes a method to extract and analyze traffic accident data from Twitter. The method is composed of four phases. The first phase establishes the mechanisms for obtaining data. The second consists of representing the messages in vectors and classif- ying them as traffic accidents or not. The third uses named entity recognition techniques for location detection. In the fourth, these locations go through a geocoder that returns their geographic coordinates. We apply this method for the city of Bogota and compare the data on Twitter with the official transit source, the comparisons show an influence on Twitter on the commercial and industrial area of the city. The results reveal the effectiveness of the accidents reported on Twitter as additional information and their use should be considered as complementary sources to the existing detection methods.Keywords
Sistemas de transporte inteligente ; Redes sociales ; Accidente de tránsito ; Sensores sociales ; Procesamiento de lenguaje natural ; Aprendizaje automático ; Minería de texto ; Reconocimiento de entidades nombradas ; Twitter ; intelligent transportation system ; Social media ; Traffic accident ; Social sensors ; Natural language processing ; Machine learning ; Text mining ; Named entity recognition ; Twitter ; Análisis de datos ; Data analysis ; Seguridad del transporte ; Transport safety ;
Physical description
ilustraciones, gráficas, mapas, tablas
Collections
