A full probabilistic model for yes/no type crowdsourcing in multi-class classification

Saldías Fuentes, Belén Carolina

A full probabilistic model for yes/no type crowdsourcing in multi-class classification

dc.contributor.advisor	Pichara Baksai, Karim Elías
dc.contributor.author	Saldías Fuentes, Belén Carolina
dc.contributor.other	Pontificia Universidad Católica de Chile. Escuela de Ingeniería
dc.date.accessioned	2017-12-19T15:48:13Z
dc.date.available	2017-12-19T15:48:13Z
dc.date.issued	2017
dc.description	Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2017
dc.description.abstract	Crowdsourcing se ha convertido en una técnica ampliamente adoptada en escenarios donde los conjuntos de entrenamiento para modelos supervisados son escasos y difíciles de obtener. La mayoría de los modelos de crowdsourcing en la literatura asumen que los anotadores pueden proporcionar respuestas para preguntas completas, éstas se refieren a preguntarle a un anotador que discierna entre todas las clases posibles para un objeto. Desafortunadamente, ese discernimiento no siempre es fácil en escenarios realistas, pueden haber muchas clases donde se desconoce cómo diferenciarlas. En este trabajo, se propone un modelo probabilístico para un tipo más corto y fácil de preguntas. Estas preguntas más simples sólo requieren una respuesta del tipo “sí” o “no”. Este modelo estima una distribución posterior conjunta de matrices relacionadas con las confusiones y errores de los anotadores, además de la probabilidad posterior de la clase de cada objeto. La solución se lleva a cabo mediante inferencia aproximada, se usa en primer lugar muestreo de Monte Carlo y en segundo lugar el método de Inferencia Variacional como Caja Negra (BBVI). Para este último enfoque se provee la derivación de los gradientes necesarios para la aproximación del modelo. Se construyeron dos escenarios web reales de crowdsourcing, donde anotadores fueron invitados a participar. En el primer escenario se muestran series de tiempo astronómicas a ingenieros y astrónomos. El segundo escenario se basa en clasificación de animales mediante la observación de imágenes. Los resultados muestran que es posible lograr resultados comparables con la pregunta completa para clasificación en crowdsourcing. Además, se prueba que tomar muestras de cómo los anotadores se equivocan al responder preguntas es importante para la convergencia del modelo. Finalmente, se deja disponible para la comunidad los dos conjuntos de datos obtenidos desde los experimentos reales generados. Todo el código está públicamente disponible.
dc.format.extent	xii, 49 hojas
dc.identifier.doi	10.7764/tesisUC/ING/21364
dc.identifier.uri	https://doi.org/10.7764/tesisUC/ING/21364
dc.identifier.uri	https://repositorio.uc.cl/handle/11534/21364
dc.language.iso	es
dc.nota.acceso	Contenido completo
dc.rights	acceso abierto
dc.subject.ddc	370
dc.subject.dewey	Educación	es_ES
dc.subject.other	Aprendizaje de máquina.	es_ES
dc.subject.other	Computación humana.	es_ES
dc.title	A full probabilistic model for yes/no type crowdsourcing in multi-class classification	es_ES
dc.type	tesis de maestría
sipa.codpersvinculados	6541

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Saldías_Fuentes_Belén_Carolina.pdf
Size:: 1.09 MB
Format:: Adobe Portable Document Format
Description:

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.31 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

3.01 Tesis magíster