火星探测器上使用的算法帮助地球上的科学家以新的方式看待数据
美国宇航局在火星上的毅力号探测器上测试的一种新算法可能有助于更好地预测影响全球数百万人的飓风、野火和其他极端天气事件。
佐治亚理工学院博士生 Austin P. Wright 是介绍嵌套融合的论文的第一作者。新算法提高了科学家在火星表面寻找过去生命迹象的能力。
这项创新为 NASA 的 2020 年火星探测任务提供了支持。此外,其他领域处理大型重叠数据集的科学家也可以使用 Nested Fusion 的方法进行研究。
Wright 在2024 年国际知识发现和数据挖掘会议(KDD 2024)上展示了 Nested Fusion ,并获得了最佳论文奖亚军。该成果发表在期刊《第 30 届 ACM SIGKDD 知识发现和数据挖掘会议论文集》上。
“嵌套融合对许多不同领域的研究人员都非常有用,而不仅仅是 NASA 科学家,”赖特说。“该方法可以可视化复杂的数据集,而这些数据集在分析的初始探索阶段可能很难获得整体视图。”
嵌套融合将不同分辨率的数据集组合在一起,以生成单一的高分辨率视觉分布。使用这种方法,NASA 科学家可以更轻松地同时分析来自不同来源的多个数据集。这可以更快地研究火星表面的成分,以寻找以前生命的线索。
该算法展示了数据科学如何影响化学、生物学和地质学等传统科学领域。
此外,Wright 正在开发嵌套融合应用程序,以模拟不断变化的气候模式、动植物生命以及地球科学中的其他概念。相同的方法可以结合来自卫星图像、生物标记和气候数据的重叠数据集。
“用户已经将嵌套融合和类似算法扩展到地球科学领域,我们收到了非常积极的反馈,”在佐治亚理工学院研究机器学习(ML)的赖特说。
“互相关分析需要很长时间,而且在研究的初始阶段不会进行,因为那时模式会出现,并形成新的假设。嵌套融合可以让人们更早地发现这些模式。”
图片来源:第 30 届 ACM SIGKDD 知识发现与数据挖掘会议论文集(2024)。DOI:10.1145/3637528.3671596
赖特是PIXLISE的数据科学和机器学习负责人,PIXLISE 是 NASA JPL 的科学家用来研究火星毅力号探测器数据的软件。
毅力号使用行星 X 射线岩石化学仪 (PIXL) 收集火星表面矿物成分数据。PIXL 实现这一目标的两个主要工具是 X 射线荧光 (XRF) 光谱仪和多环境相机 (MCC)。
当 PIXL 扫描目标区域时,它会从组件中创建两个共线数据集。XRF 收集样本的精细元素组成。MCC 生成样本图像以收集视觉和物理细节,例如大小和形状。
单个 XRF 光谱对应每个扫描点的约 100 个 MCC 成像像素。每种工具的独特分辨率使得重叠数据层之间的映射具有挑战性。然而,Wright 和他的合作者设计了 Nested Fusion 来克服这一障碍。
除了推动数据科学的发展,嵌套融合还改善了 NASA 科学家的工作流程。使用该方法,一位科学家可以在几个小时内对样本的矿物成分做出初步估计。在使用嵌套融合之前,同样的任务需要不同仪器上的专家团队合作数天才能完成。
赖特说:“我认为我从这项工作中得到的最大教训之一是,始终将我的机器学习和数据科学问题建立在我们合作者的实际、具体的用例之上是很有价值的。”
“我从合作者那里了解到数据分析的哪些部分对他们来说很重要,以及他们面临的挑战。通过了解这些问题,我们可以发现形式化和框架化数据科学问题的新方法。”
Nested Fusion 荣获应用数据科学领域最佳论文亚军。会议的研究领域、研讨会和教程中还发表了数百篇其他论文。
赖特的导师斯科特·大卫多夫 (Scott Davidoff) 和波罗·周 (Polo Chau) 共同撰写了 Nested Fusion 论文。大卫多夫是美国宇航局喷气推进实验室的首席研究科学家。周是佐治亚理工学院计算科学与工程学院 (CSE) 的教授。
“我非常高兴这项工作获得了最佳论文亚军奖,”赖特说。“这种应用工作有时很难找到合适的学术归宿,因此找到欣赏这项工作的社区非常令人鼓舞。”