Automatic identification of spectral lines

Loading...
Thumbnail Image
Date
2016
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La astronomía enfrenta nuevos desafíos en cuanto a cómo analizar big data, y por lo tanto, como buscar o predecir eventos/patrones de interés. Nuevas observaciones en regiones de longitudes de onda previamente inexploradas están disponibles gracias a instrumentos como el Atacama Large Millimeter Array (ALMA). Dada esta creciente cantidad de datos de alta resolución espectral, cualquier análisis no automatizado constituiría un esfuerzo más allá de la capacidad humana. Actualmente, la clasificación de líneas de emisión significa decidir si una línea de emisión pertenece a un isótopo específico. Esta clasificación es principalmente hecha comparando las líneas observadas con líneas de emisión de isótopos conocidas. Un algoritmo de clasificación automático reduciría dramáticamente los esfuerzos humanos para analizar datos espectrales, permitiendo a los astrónomos enfocar sus esfuerzos en análisis más detallados. En este trabajo, proponemos un algoritmo que utiliza un modelo sparse para representar el espectro y automáticamente clasificar líneas de emisión. Para esto, utilizamos conjuntos de datos de líneas espectrales para determinar un set de vectores base que represente la presencia de líneas de emisión teóricas. Luego, para clasificar líneas en un espectro dado, se minimiza la diferencia entre el espectro y una combinación lineal de los vectores base determinados. El output del modelo corresponde a un vector de probabilidad que representa la distribución de la predicción sobre un set de posibles isótopos. Realizamos pruebas de nuestro algoritmo con datos experimentales de Splatalogue y datos simulados del proyecto ASYDO. El resultado del análisis muestra que el algoritmo es capaz de identificar líneas de emisión con una precisión del 90% cuando ni blending ni casos hiperfinos están presentes. En tanto que la separación de longitud de onda entre líneas decrece (menor o igual que 1 MHz) la precisión baja a un 82%. El código fuente del algoritmo, los datos sintéticos y la lista de identificaciones sugerida están públicamente disponibles*.
Description
Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2016
Keywords
Citation