利用盖亚和机器学习更清晰地观察银河系
由波茨坦莱布尼茨天体物理研究所 (AIP) 和巴塞罗那大学宇宙科学研究所 (ICCUB) 领导的一组科学家使用一种新颖的机器学习模型以极其高效的方式处理盖亚任务观测到的 2.17 亿颗恒星的数据。
其结果与用于估计恒星参数的传统方法相比毫不逊色。这种新方法为绘制银河系星际消光和金属丰度等特征提供了令人兴奋的机会,有助于了解恒星种群和银河系的结构。
随着欧洲航天局盖亚太空任务第三次数据发布,天文学家获得了18亿颗恒星的改进测量数据,为研究银河系提供了大量数据。
然而,高效分析如此庞大的数据集却充满挑战。在这项研究中,研究人员探索了使用机器学习来利用盖亚的光谱数据估算恒星的关键特性。该模型在800 万颗恒星的高质量数据上进行了训练,并取得了可靠的预测,不确定性很小。
“底层技术被称为极端梯度增强树,可以以前所未有的效率估计恒星的精确特性,例如温度、化学成分和星际尘埃遮蔽。开发的机器学习模型 SHBoost 可以在单个 GPU 上四小时内完成其任务,包括模型训练和预测 - 这个过程以前需要两周时间和 3,000 个高性能处理器,”AIP 的 Arman Khalatyan 和这项研究的第一作者说。
“因此,机器学习方法显著减少了计算时间、能源消耗和二氧化碳排放量。”这是这种技术首次成功应用于所有类型的恒星。
该模型使用来自较小恒星调查的高质量光谱数据进行训练,然后将这些学习成果应用于 Gaia 的第三次大型数据发布 (DR3),仅使用光度和天体测量数据以及 Gaia 低分辨率 XP 光谱来提取关键恒星参数。
美国物理研究所的克里斯蒂娜·奇亚皮尼 (Cristina Chiappini) 表示:“在寻找可供进一步研究的良好候选者时,高质量的结果减少了对额外资源密集型光谱观测的需求,例如稀有金属贫乏或超金属丰富的恒星,这对于了解银河系形成的早期阶段至关重要。”
事实证明,这项技术对于未来使用多目标光谱进行观测的准备至关重要,例如 4MIDABLE-LR,这是对银河系盘和银河系凸起的大型调查,它将成为智利欧洲南方天文台 (ESO) 4MOST 项目的一部分。
“新模型方法提供了银河系整体化学成分的详尽地图,证实了年轻恒星和老恒星的分布。这些数据以巨大的统计能力显示了富含金属的恒星在星系内部区域(包括棒状结构和凸起部分)的集中度,”ICCUB 的 Friedrich Anders 补充道。
研究小组还利用该模型绘制了整个星系中年轻、大质量的热恒星,突出了遥远、研究不足的恒星形成区域。数据还表明,我们的银河系中存在许多“恒星空洞”,即几乎没有年轻恒星的区域。此外,数据还表明,星际尘埃的三维分布仍未得到很好的解决。
随着盖亚不断收集数据,机器学习模型快速、可持续地处理海量数据集的能力使其成为未来天文研究的重要工具。
该方法的成功证明了机器学习有可能彻底改变天文学和其他科学领域的大数据分析,同时促进更可持续的研究实践。