Understanding natural language directions for robotic indoor navigation

Loading...
Thumbnail Image
Date
2021
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Los robots inteligentes son cada vez más necesarios en ambientes industriales, caseros, y de servicio. Una habilidad clave para su utilidad general es la de poder navegar en espacios de interior cotidianos según les sea instruido. Sin embargo, éste es un problema aún no resuelto en la robótica. Gracias a la revolución del aprendizaje profundo, las soluciones actuales utilizan redes neuronales profundas para aprovechar la información multimodal que un robot conoce de antemano, o que percibe mediante sensores. Los mapas, en particular, sirven para que un robot interprete correctamente instrucciones en lenguaje natural para navegar por un ambiente de interior, pues el mapa posee información útil de la topología del ambiente. Esta tesis propone modificaciones a una arquitectura de aprendizaje de máquina supervisado que traduce la instrucción de libre sintaxis usando la topología del mapa a una secuencia de comportamientos predefinidos de “alto nivel” semántico que el robot ejecutará. En particular, exploramos las técnicas multi-head attention y graph attention networks para lograr una mejor generalización sobre ambientes desconocidos comparado a la línea de base neuronal de tipo encoder-decoder. Nuestros experimentos demuestran que sí es posible mejorar las traducciones en ambientes nuevos, pero a expensas del desempeño en ambientes conocidos al entrenar. Se concluye que una regularización estructural puede ser útil como precedente, y se plantea como trabajo futuro mantener esta mejora sin disminuir el desempeño en ambientes conocidos.
Description
Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2021
Keywords
Citation