Augmenting deep learning models using continual and meta learning strategies

dc.contributor.advisorSoto Arriaza, Álvaro Marcelo
dc.contributor.authorHurtado González, Julio Andrés
dc.contributor.otherPontificia Universidad Católica de Chile. Escuela de Ingeniería
dc.date.accessioned2022-03-08T15:23:32Z
dc.date.available2022-03-08T15:23:32Z
dc.date.issued2022
dc.descriptionTesis (Doctor en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2022
dc.description.abstractLos modelos de aprendizaje profundo son entrenados con conjuntos de datos finitos con una distribución fija, y se prueban en conjuntos que siguen la misma distribución. Este proceso difiere mucho de como aprendemos los humanos, donde nos enfrentamos a diferentes situaciones que debemos aprender a resolver continuamente. Los modelos de aprendizaje profundo no son capaces de adaptarse continuamente a nuevas tareas o situaciones. Cuando un modelo ya entrenado se enfrenta con una nueva tarea, debe ser re entrenado para adaptarse a los nuevos datos. Este entrenamiento modifica completamente los pesos del modelo para enfocarse en la nueva tarea, causando que el modelo olvide lo previamente aprendido. Este problema es conocido como olvido catastrófico, y es el responsable de que el rendimiento de tareas entrenadas previamente baje drásticamente. En esta tesis nos enfocamos en dos ideas para aliviar el problema del olvido. La primera idea es aprender pesos que favorezcan la transferencia de conocimiento entre tareas, lo que disminuye la necesidad de modificar los pesos del modelo, reduciendo el olvido. La segunda idea es facilitar la reutilización de los pesos del modelo, es decir, entregar herramientas al modelo para que una nueva tarea utilice la información ya adquirida y la complemente con aprendizaje de la propia tarea. Las dos grandes contribuciones de esta tesis consisten en dos métodos que utilizan estas ideas para aliviar el problema del olvido catastrófico en problemas de aprendizaje continuo. Estas contribuciones muestran que incentivar la reutilización de los pesos es un factor importante para reducir el olvido.
dc.format.extentx, 61 páginas
dc.fuente.origenAutoarchivo
dc.identifier.doi10.7764/tesisUC/ING/63319
dc.identifier.urihttps://doi.org/10.7764/tesisUC/ING/63319
dc.identifier.urihttps://repositorio.uc.cl/handle/11534/63319
dc.information.autorucEscuela de Ingeniería ; Soto Arriaza, Álvaro Marcelo ; S/I ; 73678
dc.information.autorucEscuela de Ingeniería ; Hurtado González, Julio Andrés ; S/I ; 249905
dc.language.isoen
dc.nota.accesoContenido completo
dc.rightsacceso abierto
dc.subject.ddc006.31
dc.subject.deweyCiencias de la computaciónes_ES
dc.subject.otherAprendizaje de máquinaes_ES
dc.subject.otherInteligencia artificiales_ES
dc.titleAugmenting deep learning models using continual and meta learning strategieses_ES
dc.typetesis doctoral
sipa.codpersvinculados73678
sipa.codpersvinculados249905
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tesis Julio Hurtado.pdf
Size:
578.7 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.98 KB
Format:
Item-specific license agreed upon to submission
Description: