Bringing order to the variable star zoo: the effectiveness of semi-supervised and unsupervised learning for classification

Loading...
Thumbnail Image
Date
2023
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La fluctuación del brillo de las fuentes en el cielo ocurre frecuentemente. Sus posibles causas son numerosas y se derivan de una amplia gama de procesos astrofísicos, lo que ofrece continuas oportunidades para el descubrimiento y el avance de la física. Las estrellas variables y fenómenos transientes han sido objeto de investigación astronómica durante décadas y nos han proporcionado diversas técnicas para determinar distancias, explorar el interior de las estrellas y calcular parámetros estelares. Los recientes surveys astronómicos a gran escala han logrado identificar millones de estrellas variables y transientes, lo que ha supuesto un avance significativo en nuestra comprensión de este campo. Sin embargo, esto tiene un costo importante: la gran dificultad de clasificar millones de estrellas variables mediante inspección visual. De hecho, la clasificación de las estrellas variables es un primer paso crucial para poner orden en sus diversas y a menudo dispares causas astrofísicas, lo que la convierte en una tarea vital y desafiante. En muchos campos de la astronomía y ciencias afines, la aplicación del aprendizaje de máquina ha facilitado la automatización de las tareas de clasificación. En particular, el aprendizaje supervisado se ha utilizado ampliamente para construir y ordenar catálogos de estrellas variables con gran éxito. Sin embargo, estos métodos requieren curvas de luz etiquetadas para aprender de ellas, pero obtenerlas puede ser complejo, tener errores de clasificación o sesgos en la selección. En esta tesis, contribuimos a mitigar este problema proponiendo el uso de métodos de aprendizaje semi-supervisado y no supervisado. En el Capítulo 1, examinamos exhaustivamente la literatura sobre el tema, comenzando con una perspectiva histórica sobre las estrellas variables y su importancia en la astronomía. A continuación, ofrecemos una visión general de los diversos tipos de fenómenos de variabilidad en astronomía y el progreso de los surveys astronómicos. Finalmente, revisamos los paradigmas fundamentales del aprendizaje automático y su aplicación a las estrellas variables y áreas relacionadas. En el Capítulo 2, presentamos y evaluamos nuestros novedosos métodos semi-supervisados y de agrupamiento para estrellas variables. El método semi-supervisado está diseñado para utilizar menos curvas de luz etiquetadas para la clasificación, en comparación con los métodos supervisados. El método de agrupamiento, por otro lado, está diseñado para explorar los datos e identificar grupos que puedan contener diferentes clases o sub-clases de estrellas variables. En el Capítulo 3, demostramos la aplicación de nuestro método de agrupamiento en el surveys VISTA Variables in the Vía Láctea, realizado en el infrarrojo cercano. En esta investigación preliminar, refinamos ciertos aspectos de nuestra metodología e identificamos una muestra fiable de estrellas variables en este survey. Finalmente, presentamos los resultados del análisis de agrupamiento, incluyendo ejemplos de curvas de luz y hallazgos adicionales.
Description
Tesis (Doctor of Philosophy in Astrophysics)--Pontificia Universidad Católica de Chile, 2023
Keywords
Citation