Métodos de aprendizaje estadístico para predecir velocidades de buses y analizar el impacto de las variables explicativas.

Loading...
Thumbnail Image
Date
2017
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El creciente interés por generar Sistemas de Transporte Inteligente (ITS por sus siglas en inglés), ha incentivado la investigación en métodos para predecir velocidades o tiempos de viaje de los buses, factores que tienen un impacto positivo tanto para el usuario como para el operario. Al usuario no sólo lo ayuda a planificar mejor sus rutas, sino también a disminuir la ansiedad psicológica por desconocer las horas de pasada y llegada de buses. Por otro lado, al operario lo ayuda a tomar decisiones estratégicas, tales como optimizar el número de buses y la frecuencia de pasada por los paraderos. Los modelos de aprendizaje estadístico han logrado gran popularidad por sus buenos resultados, y por su capacidad para adaptarse fácilmente a los requerimientos del modelador. Es por ello que la literatura ha reportado trabajos relevantes en la predicción de velocidades y tiempos de viaje de los buses. Sin embargo, no hay consenso respecto a qué modelo es mejor, ya que estos dependen del tipo de datos con que se trabaja, y del lugar en que estos han sido recopilados. Este trabajo tiene dos objetivos. El primero es comparar el desempeño de tres modelos de aprendizaje estadístico (Regresión Lineal Múltiple, Máquinas de Soporte Vectorial y Redes Neuronales), y contrastarlos con dos modelos base o benchmark (de información histórica y en tiempo real). Para ello, se utilizan como caso de estudio tres servicios de buses de la ciudad de Santiago de Chile. El segundo objetivo busca determinar aquellas variables explicativas que son más o menos significativas al incluirlas en los modelos. Para tales efectos se trabajó con las variables velocidad de buses reportadas por GPS, características de la demanda de usuarios (subidas, bajadas y carga), infraestructura, y factores de entorno. En los tres servicios de buses, el modelo que tuvo mejores resultados en términos de la raíz del error cuadrático medio, es el de Redes Neuronales, seguido por el modelo de Regresión Lineal Múltiple, y luego por la Máquinas de Soporte Vectorial. En todos los casos, los modelos de aprendizaje estadístico superaron los modelos benchmark, con un desempeño que varía entre un 10% y un 25% en la disminución del error. Respecto a las variables explicativas involucradas, se encuentra que la utilización de la variable de velocidad tiene un impacto relevante, mientras que el resto de las variables analizadas solo disminuyen los errores en un 2%. Del análisis efectuado, pareciera que las variables de velocidad llevan implícitas, en su valor, el efecto de las otras variables de características de demanda de usuarios, infraestructura y factores de entorno.
Description
Tesis (Magíster en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2017
Keywords
Citation