Análisis de la sintaxis aprendida por BETO, un modelo de lenguaje en español basado en transformers

dc.contributor.advisorSoto Arriaza, Álvaro Marcelo
dc.contributor.authorQuiñones, Alejandro
dc.contributor.otherPontificia Universidad Católica de Chile. Escuela de Ingeniería
dc.date.accessioned2021-06-10T13:41:49Z
dc.date.available2021-06-10T13:41:49Z
dc.date.issued2021
dc.descriptionTesis (Magíster en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2021
dc.description.abstractAvances en la interpretabilidad y comprensión de modelos como BERT han sido de utilidad para el desarrollo de mejores herramientas, más seguras y comprensibles. Sin embargo, muchas explicaciones del funcionamiento del modelo son en base a capacidades lingüísticas aprendidas, significando que los resultados son solo aplicables para los modelos basados en el inglés. En esta tesis se estudian las capacidades sintácticas de BETO, la versión de BERT en español, desarrollando la comprensión del modelo. Se muestra que BETO posee capacidades sintácticas, incluso mayores que las de BERT, presentes en distintas heads del modelo. Además, se realizan estudios con respecto a las competencias, limitaciones y estructura de este conocimiento. Se encuentra que las activaciones del modelo se producen en patrones similares cuando se procesan relaciones parecidas. Se indica que la principal causa para que el modelo falle en reconocer relaciones sintácticas es cuando éstas se estructuran de manera poco común. Se muestra que el modelo posee parte del contexto sintáctico que falla en reconocer, sugiriendo un desacuerdo en la formación del árbol sintáctico con respecto a las anotaciones originales. También, la falta de conocimiento sintáctico del modelo podría significar una reducción en su rendimiento al evaluarlo en responder preguntas. Por último, se demuestra que heads con bajo conocimiento sintáctico logran un alto reconocimiento de la sintaxis cuando trabajan en conjunto, indicando la presencia de un conocimiento distribuido.
dc.format.extentxiii, 85 páginas
dc.fuente.origenAutoarchivo
dc.identifier.doi10.7764/tesisUC/ING/60582
dc.identifier.urihttps://doi.org/10.7764/tesisUC/ING/60582
dc.identifier.urihttps://repositorio.uc.cl/handle/11534/60582
dc.information.autorucEscuela de Ingeniería ; Soto Arriaza, Álvaro Marcelo ; 0000-0001-9378-397X ; 73678
dc.information.autorucEscuela de Ingeniería ; Quiñones, Alejandro ; S/I ; 232659
dc.language.isoes
dc.nota.accesoContenido completo
dc.rightsacceso abierto
dc.subject.ddc005.13
dc.subject.deweyCiencias de la computaciónes_ES
dc.subject.otherLenguajes de programación (Computadores electrónicos) - Sintaxises_ES
dc.titleAnálisis de la sintaxis aprendida por BETO, un modelo de lenguaje en español basado en transformerses_ES
dc.typetesis de maestría
sipa.codpersvinculados73678
sipa.codpersvinculados232659
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TESIS_AQuiñones_Firma Final.pdf
Size:
7.85 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.98 KB
Format:
Item-specific license agreed upon to submission
Description: