Herramientas de analítica visual para modelos de tópicos sobre colecciones de documentos

Loading...
Thumbnail Image
Date
2019
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
En el presente trabajo de tesis se exploran herramientas para la visualización de tópicos localizados espacialmente, sobre un corpus de documentos de robos de vehículos en Chile, en el contexto del proyecto Fondef ID 16I10222, denominado “Observatorio digital de delincuencia en Chile”, cuyo objetivo es consolidar la información recopilada por la Asociación de Aseguradoras de Chile (AACh) sobre robos de vehículos y con lo anterior realizar un sistema capaz de caracterizar los modi operandi de los delincuentes, así como su evolución, mediante técnicas de minería de datos. Debido a que las aseguradoras tienen datos con muchas dimensiones y carecen del conocimiento y capital humano para procesarlo, el aporte de este trabajo a la resolución de este problema es a través del estudio y desarrollo de herramientas que permitan la identificación de patrones de robos de vehículos, como por ejemplo los portonazos. La herramienta de analítica visual desarrollada permite analizar y descubrir patrones, usando métodos de aprendizaje de máquina no supervisado como modelos de tópicos, además visualizaciones interactivas para analítica visual. A partir de lo anterior se llevó a cabo la implementación de la herramienta con dos alternativas visuales: usando small multiples de gráficos de barras y por otra parte small multiples de gráficos de línea para representar series de tiempo. Ambas interfaces fueron sometidas a una evaluación con usuarios, donde se midió el desempeño en cuanto a tiempo, interacción y rendimiento de cada una al resolver múltiples tareas sobre tendencias, agregación y sobre información puntual. De la evaluación se descubrió que ambas interfaces estudiadas se obtienen un buen desempeño en cuanto a la resolución de las tareas propuestas, con excepción de la tarea enfocada en la comparación de distribuciones, donde la interfaz de barras logra un mejor desempeño, a costa de mayor número de interacciones.
Description
Tesis (Magíster en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2019
Keywords
Citation