Deep embedding of sparse multi-band light curves with missing data

Loading...
Thumbnail Image
Date
2023
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Los telescopios, herramientas que los astrónomos usan para captar luz, han experimentado avances sin precedentes en potencia y automatización, presentando nuevos desafíos en el campo de la astronomía. El Vera C. Rubin Observatory Legacy Survey of Space and Time (Rubin/LSST) es un innovador telescopio de 8.4 metros destinado a revolucionar la astronomía al mapear todo el cielo del hemisferio sur cada tres días en seis filtros ópticos, generando 20 TB de datos y 10 millones de alertas cada noche, superando cualquier telescopio operando actualmente. Para manejar este inmenso volumen de datos y focalizar los esfuerzos de investigación, los sistemas de clasificación automatizados se han vuelto indispensables. Los algoritmos de aprendizaje automático, en particular el aprendizaje profundo, se han erigido como herramientas esenciales, permitiendo a los expertos concentrarse en tareas más exigentes. En esta tesis, presentamos algoritmos basados en aprendizaje profundo que aprenden automáticamente representaciones de curvas de luz para clasificación precisa y automática. Proponemos un método de clasificación supervisada basado en Redes Neuronales Recurrentes (RNNs), capaz de manejar series temporales muestreadas de forma irregular. Nuestros modelos se evalúan en tres conjuntos de datos reales de curvas de luz: OGLE-III, Gaia y WISE, compilados y publicados para la comunidad. Nuestro enfoque requiere un preprocesamiento mínimo de datos, exhibe un bajo costo computacional para actualizaciones con nuevas observaciones, y escala eficientemente a grandes conjuntos de datos. Los resultados demuestran que nuestra arquitectura propuesta logra un rendimiento comparable con los clasificadores basados en descriptores estadísticos, mejorando significativamente los tiempos de predicción. Para prepararnos para los datos de Rubin/LSST, extendemos el modelo de una sola banda creando un conjunto de RNNs capaz de manejar datos multibanda y cadencia no uniforme. El modelo puede aprender los comportamientos en cada banda y unificarlo en una única representación. Esta adaptabilidad permite inferencias sin requerir la curva de luz completa, acelerando el proceso. El modelo se prueba en tres conjuntos de datos reales de curvas de luz: Gaia, Pan-STARRS1 y ZTF, para demostrar su capacidad de generalizar en diferentes condiciones de observación. Además, nuestro modelo propuesto demuestra su versatilidad al realizar no solo clasificación sino también regresión de parámetros físicos como temperatura efectiva y radio. El modelo se destaca en escenarios con menos observaciones, convirtiéndolo en una herramienta prometedora para la clasificación temprana para el Rubin/LSST. En general, nuestros resultados resaltan la eficacia y flexibilidad de nuestro modelo, posicionándolo como una herramienta poderosa para futuras proyectos astronómicos.
Description
Tesis (Doctor in Engineering Sciences)--Pontificia Universidad Católica de Chile, 2023.
Keywords
Citation