Reconocimiento de acciones en videos mediante técnicas de composición jerárquicas

Loading...
Thumbnail Image
Date
2017
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El reconocimiento de acciones en secuencias de video corresponde a un problema desafiante debido a la alta variabilidad intra-clase que existe entre las instancias. La variabilidad se debe principalmente a movimientos de cámara, cambios de luminosidad y diferencias en resolución. Para atacar este problema, esta tesis propone un algoritmo de aprendizaje de máquina basado en técnicas jerárquicas, utilizando diccionarios visuales. El algoritmo utiliza dos niveles de jerarquía y evalúa dos métodos diferentes para el aprendizaje de diccionarios: k-means y sparse coding. Los resultados experimentales con dos bases de datos, UCF11 y Olympic Sports, muestran que el uso de un segundo nivel de jerarquía mejora la calidad de la clasificación de las secuencias, al concatenar los vectores descriptivos de ambos niveles. En ambas bases de datos, k-means entrega mejores resultados que sparse coding, al ser utilizado para el aprendizaje de diccionarios. La tasa de clasificación obtenida por el algoritmo en la base de datos UFC11 supera las tasas de clasificación de las metodologías del estado del arte.
Description
Tesis (Magíster en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2017
Keywords
Citation