Menos datos y más vistas: Síntesis geométrica de vistas para mejorar la generalización en tareas de manipulación robótica
Loading...
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La eficiencia en el uso de datos sigue siendo un desafío critico en tareas de manipulación robótica, dado que la recopilación y anotación de datos de entrenamiento resulta costosa en tiempo y recursos. Trabajos previos han abordado este problema mediante distintas técnicas de aumento de datos, incluyendo perturbaciones sobre imágenes, métodos contrafactuales y enfoques basados en modelos generativos. No obstante, estos métodos no resuelven el problema fundamental de la generalización a nuevas perspectivas de cámara, ya que las políticas entrenadas desde puntos de vista fijos presentan caídas significativas en su desempeño cuando se evalúan desde nuevos ángulos. En este trabajo, proponemos una nueva técnica de síntesis de vistas, aprovechando imágenes de profundidad y reconstrucciones geométricas para generar vistas adicionales de trayectorias robóticas durante el entrenamiento, sirviendo de aumento espacial de datos. A diferencia de los enfoques previos basados en modelos generativos, nuestro método conserva la escala métrica y la geometría de la escena, asegurando observaciones físicamente consistentes. Al sintetizar múltiples vistas geométricamente consistentes a partir de una única trayectoria registrada, ampliamos de manera efectiva el conjunto de datos de entrenamiento sin necesidad de recolectar nuevas demostraciones. Los resultados experimentales muestran que las políticas entrenadas con nuestro enfoque logran una mejor generalización en diversas tareas de manipulación, en comparación con políticas entrenadas desde una o múltiples perspectivas, reduciendo considerablemente la dependencia de grandes volúmenes de datos. Este trabajo evidencia el potencial de la síntesis de vistas como una herramienta escalable y eficiente para avanzar en la eficiencia de datos en el aprendizaje robótico.
Description
Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2025.
Keywords
Manipulación robótica, Visión 3D, Eficiencia de datos
