A full probabilistic model for yes/no type crowdsourcing in multi-class classification

dc.contributor.advisorPichara Baksai, Karim Elías
dc.contributor.authorSaldías Fuentes, Belén Carolina
dc.contributor.otherPontificia Universidad Católica de Chile. Escuela de Ingeniería
dc.date.accessioned2017-12-19T15:48:13Z
dc.date.available2017-12-19T15:48:13Z
dc.date.issued2017
dc.descriptionTesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2017
dc.description.abstractCrowdsourcing se ha convertido en una técnica ampliamente adoptada en escenarios donde los conjuntos de entrenamiento para modelos supervisados son escasos y difíciles de obtener. La mayoría de los modelos de crowdsourcing en la literatura asumen que los anotadores pueden proporcionar respuestas para preguntas completas, éstas se refieren a preguntarle a un anotador que discierna entre todas las clases posibles para un objeto. Desafortunadamente, ese discernimiento no siempre es fácil en escenarios realistas, pueden haber muchas clases donde se desconoce cómo diferenciarlas. En este trabajo, se propone un modelo probabilístico para un tipo más corto y fácil de preguntas. Estas preguntas más simples sólo requieren una respuesta del tipo “sí” o “no”. Este modelo estima una distribución posterior conjunta de matrices relacionadas con las confusiones y errores de los anotadores, además de la probabilidad posterior de la clase de cada objeto. La solución se lleva a cabo mediante inferencia aproximada, se usa en primer lugar muestreo de Monte Carlo y en segundo lugar el método de Inferencia Variacional como Caja Negra (BBVI). Para este último enfoque se provee la derivación de los gradientes necesarios para la aproximación del modelo. Se construyeron dos escenarios web reales de crowdsourcing, donde anotadores fueron invitados a participar. En el primer escenario se muestran series de tiempo astronómicas a ingenieros y astrónomos. El segundo escenario se basa en clasificación de animales mediante la observación de imágenes. Los resultados muestran que es posible lograr resultados comparables con la pregunta completa para clasificación en crowdsourcing. Además, se prueba que tomar muestras de cómo los anotadores se equivocan al responder preguntas es importante para la convergencia del modelo. Finalmente, se deja disponible para la comunidad los dos conjuntos de datos obtenidos desde los experimentos reales generados. Todo el código está públicamente disponible.
dc.format.extentxii, 49 hojas
dc.identifier.doi10.7764/tesisUC/ING/21364
dc.identifier.urihttps://doi.org/10.7764/tesisUC/ING/21364
dc.identifier.urihttps://repositorio.uc.cl/handle/11534/21364
dc.language.isoes
dc.nota.accesoContenido completo
dc.rightsacceso abierto
dc.subject.ddc370
dc.subject.deweyEducaciónes_ES
dc.subject.otherAprendizaje de máquina.es_ES
dc.subject.otherComputación humana.es_ES
dc.titleA full probabilistic model for yes/no type crowdsourcing in multi-class classificationes_ES
dc.typetesis de maestría
sipa.codpersvinculados6541
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Saldías_Fuentes_Belén_Carolina.pdf
Size:
1.09 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.31 KB
Format:
Item-specific license agreed upon to submission
Description: