AI找星星，发现了50颗

　　图片来源@unsplash

　　文丨《亲爱的数据》出品，作者丨谭婧

　　找到”成千上万的候选行星，天文学家必须有能力将“真行星”与“假行星”分开。

　　考虑到许多天文学数据库的规模都大得惊人，区分并不是一件简单的事，但是，人工智能算法给此事带来前所未有的希望。

　　近日，英国华威大学的大卫·阿姆斯特朗博士（David Armstrong）领导的研究团队开发了一项新的机器学习算法，从美国航空航天局（NASA）的陈旧数据中，识别出太阳系外的行星。他们确认了 50 颗系外行星的存在，从海王星大小的气体巨行星到比地球还小的岩石世界，无所不包。

　　方法是，计算出每个行星的成为候选星球的概率。

　　历史上天文学家一般相信在太阳系以外存在着其它行星，然而它们的普遍程度和性质则是一个谜。直至 1990 年代人类才首次确认系外行星的存在，而自 2002 年起每年都有超过 20 个新发现的系外行星。

　　许多太阳系外行星调查都通过望远镜中的大量数据来搜索行星在望远镜与恒星之间通过的迹象，这就是所谓的过境。这会导致望远镜探测到的恒星发出明显的光线下降，但这也可能是由于来自背景物体的干扰，甚至相机中的微小误差所致。这些误报可以在行星验证过程中筛选出来。

　　华威大学（Warwick U）物理系和计算机科学系以及艾伦·图灵学院的研究人员建立了一种基于机器学习的算法，该算法可以在 NASA 的开普勒和 TESS 等望远镜任务发现的数千个候选行星的大样本中区分出真实的行星和虚假的行星。

　　AI 算法接受了识别真实行星的训练，使用了两大已确认的行星样本和现已退役的开普勒任务的误报。

　　然后，研究人员在开普勒尚未确认的候选行星数据集上使用了该算法，产生了 50 个新的确认行星，其中第一个将通过机器学习进行验证。以前的机器学习技术只对候选行星进行排序，但从未自行确定候选行星是否是真正行星的概率，而这是行星验证的必要步骤。

　　通过确认这 50 颗行星是真实存在的，天文学家现在可以优先利用专门的望远镜对它们进行进一步的观察。

　　《亲爱的数据》出品

　　英国华威大学物理系的大卫·阿姆斯特朗博士说：“我们开发的算法可以让我们挑选 50 个候选行星进行行星验证，并将它们升级为真正的行星。”我们希望将这项技术应用于当前和未来的 TESS 和 PLATO 等任务中的大量候选样本。

　　天文学家有两种方法探测太阳系外的行星。一种是径向速度方法，它用来监测恒星是否有行星引力引起的小反运动。第二种是更敏感的技术，也是凌日系外行星巡天卫星和开普勒采用的技术，它主要依靠宿主星的亮度变化。

　　问题是，第二种方法产生了大量恒星的亮度数据，其中许多恒星不会有可见的系外行星。

　　于是，人工智能上场了。

阿姆斯特朗博士的学校个人网页上介绍：“我的兴趣之一是将机器学习技术应用于天体物理学问题。与计算机科学部门合作，将最新的机器学习技术应用于太阳系外行星。”

　　论文中也强调：“我们的算法模型只要短短几秒就能对数千个肉眼看不见的候选行星进行识别，确认其是否真的是行星。我们现在不仅能说哪些候选行星‘更可能’是行星，而是可以用确切的数据说明这种可能性有多大：如果候选天体是‘假行星’的可能性小于1％，就可以被确认为是真正的行星。”

　　《亲爱的数据》出品

　　阿姆斯特朗博士，谈道：“就行星验证而言，之前没有人使用过机器学习技术。机器学习已经被用于对候选行星进行排名，但从来没有在概率框架中使用过，而概率框架是你真正验证一颗行星所需要的。我们现在可以说出精确的统计可能性，而不是说哪些候选者更有可能是行星。如果一个候选行星的假阳性概率小于1%，它就被认为是经过验证的行星。”

　　华威大学的计算机科学系副主任、阿兰·图灵研究所（Alan Turing Institute）研究员 Theo Damoulas 博士说：

　　《亲爱的数据》出品

“机器学习，尤其适合这样一个激动人心的问题。

在天体物理学中，需要整合先验知识-阿姆斯特朗博士等专家和量化预测的不确定性。一个典型的例子，当额外的计算复杂性的概率方法取得显著的回报。一旦建立和训练好，该算法比现有的技术更快，而且可以完全自动化，这使得它非常适合分析在当前调查中观察到的潜在的数千个候选行星。

　　阿姆斯特朗博士补充说：“到目前为止，几乎 30% 的已知行星仅用一种方法就被验证了，这并不理想。仅仅因为这个原因，开发新的验证方法是可取的。但机器学习也能让我们做得非常快，更快地确定候选人的优先级。”

　　《亲爱的数据》出品

　　研究人员认为，它应该是未来用来验证行星的工具之一。

　　根据新的研究，在所有确认的系外行星中，大约有三分之一是用单一的分析方法确认的，这并不理想。科学家们用已确认身份的系外行星数据和“假行星”的数据来训练神经网络（一种人工智能算法），这样能在新的数据中识别出那些明显的迹象（信号）。

　　新技术比以前的技术更快，可以自动化，并且可以通过进一步的”训练”加以改进效果。

阿姆斯特朗博士说：“我们仍然需要花时间训练算法，但一旦训练完成，在未来的候选人中应用它就会变得容易得多。你也可以结合新的发现来逐步改进它。像 TESS 这样的调查预计会有成千上万的行星候选行星，能够一致地分析它们是很理想的。像这样快速、自动化的系统可以让我们用更少的步骤验证行星，让我们做得更有效率。”

　　论文《利用机器学习验证系外行星：50 颗新验证的开普勒行星》发表在《皇家天文学会月刊》上。阿姆斯特朗博士的研究得到了英国研究与创新部门科学技术设施委员会(STFC)通过 Ernest Rutherford 奖学金的支持。

　　GitHub 上也有不少天文学软件包，比如，allesfitter，用于对光度和 RV 数据进行建模。它可以容纳多个系外行星，多星系统、星点、恒星耀斑和各种噪声模型。

　　《亲爱的数据》出品

　　尽管取得了突破，但是，该算法仍处于早期阶段。在陈旧数据中找到错失的金子，提高了人类探索未知宇宙世界的效率。验证行星的新工具问世了，新老方法共同为系外行星探索出力。

AI找星星，发现了50颗

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复