Expressiveness and complexity analysis of information extraction languages

dc.contributor.advisorRiveros Jaeger, Cristian
dc.contributor.authorMaturana Sanguineti, Francisco José
dc.contributor.otherPontificia Universidad Católica de Chile. Escuela de Ingeniería
dc.date.accessioned2018-01-30T15:12:58Z
dc.date.available2018-01-30T15:12:58Z
dc.date.issued2017
dc.descriptionTesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2017
dc.description.abstractLos lenguajes de Extracción de Información (EI) en base a reglas han recibido atención de parte de la comunidad de bases de datos últimamente, con varios lenguajes nuevos apareciendo en los últimos años. A pesar de que los sistemas de EI suelen procesar datos semi-estructurados, todos los lenguajes que se han propuesto hasta ahora están diseñados para producir relaciones y, por lo tanto, son incapaces de trabajar con información incompleta. Además, existe poco conocimiento acerca de cómo estas propuestas se comparan en términos de poder expresivo y complejidad. Para remediar esto, esta tesis estudia la expresividad y complejidad de distintos lenguajes de EI a través de un marco teórico unificador con soporte para información incompleta.Con este fin, se propone un lenguaje que generaliza otras propuestas anteriores y que utiliza funciones parciales (también llamadas mappings) en lugar de relaciones. Luego utilizamos este lenguaje general para comparar distintos métodos de EI definidos en el pasado y estudiar sus propiedades computacionales, tales como: enumeración de consultas, satisfacibilidad y equivalencia. Como se muestra, ninguno de los métodos propuestos domina a los otros, sin embargo, combinando ciertas características de distintos enfoques se puede obtener un lenguaje para EI que es expresivo, puede implementarse eficientemente y puede ser utilizado en la práctica.
dc.format.extentix, 94 hojas
dc.identifier.doi10.7764/tesisUC/ING/21495
dc.identifier.urihttps://doi.org/10.7764/tesisUC/ING/21495
dc.identifier.urihttps://repositorio.uc.cl/handle/11534/21495
dc.language.isoes
dc.nota.accesoContenido completo
dc.rightsacceso abierto
dc.subject.ddc000
dc.subject.deweyCiencias de la computaciónes_ES
dc.subject.otherMetadatos.es_ES
dc.subject.otherAdministración de bases de datos.es_ES
dc.titleExpressiveness and complexity analysis of information extraction languageses_ES
dc.typetesis de maestría
sipa.codpersvinculados131276
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
MaturanaSanguineti_FranciscoJose.pdf
Size:
684.46 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.31 KB
Format:
Item-specific license agreed upon to submission
Description: