程序员也是天文学家?利用机器学习寻找行星

2017年12月25日 由 xiaoshan.xiang 发表 481199 0
几千年来,人们一直仰望星空,记录观察报告,发现行星运行轨迹。早期天文学家通过夜空中看似不规则的运动,发现其中的行星,希腊人称之为“planētai,”或“流浪者”。几个世纪的研究帮助人们了解地球和太阳系中其他恒星围绕太阳运行的轨迹。

今天,借助望远镜光学、太空飞行、数码相机和计算机等技术的帮助,我们有可能将我们的理解扩展到太阳系之外,并探测其他恒星周围的行星。研究这些被称为系外行星的行星有助于人类对宇宙进行深层次的探索。外面还有什么?还有其他的行星和太阳系吗?

尽管技术可以帮助搜索,但发现系外行星并不容易。相比他们的宿主恒星,行星的光芒非常小和黑暗,就像探照灯旁边飞着的萤火虫一样,难以发现…远在数千英里之外。但是在机器学习的帮助下,我们最近取得了一些进展。

天体物理学家寻找太阳系外行星的主要方法之一是通过同时使用自动软件和人工分析NASA开普勒任务的大量数据。开普勒观测了大约20万颗恒星,历时4年,每30分钟拍摄一次,创造了大约140亿个数据点。这140亿个数据点转化为大约2千万亿可能的行星轨道!即使对于最强大的计算机来说,如此大量的信息分析也是一个非常费时费力的过程。为了使这个过程更快更有效,我们转向机器学习。

机器学习

当一颗绕轨道的行星阻挡了一些光线时,恒星的测量亮度会略有下降。开普勒太空望远镜观测了20万颗恒星的亮度,4年来一直在寻找这些由凌日行星造成的特征信号。


机器学习是教授计算机识别模式的方法,它在理解大量数据方面特别有用。核心观点是让计算机以实例来学习,而不是用特定的规则来编程。

我是一个对空间感兴趣的谷歌人工智能研究员,花费20%的时间在这项工作上(Google有可以有20%的时间内处理自己感兴趣的事情)。在这个过程中,我联系了来自UT Austin的天体物理学家Andrew,合作。我们把这项技术应用到天空中,并教机器学习系统如何识别遥远恒星周围的行星。

使用超过15000个标记开普勒信号的数据集,我们创建了一个TensorFlow模型来区分行星和非行星。为了做到这一点,它必须识别由实际行星引起的模式,而不是由其他物体如星斑和双星所引起的模式。当我们用以前从未见过的信号测试我们的模型时,它正确地识别出哪些信号是行星,哪些信号不是,正确率达到96%。所以我们知道它成功了!
开普勒90i是已发现的第8围绕开普勒90恒星运行的行星,成为我们已知的第一个8星系统。

用我们的工作模型,我们拍摄了恒星,用它来寻找开普勒数据中的新行星。为了缩小搜索范围,我们研究了已知的670颗恒星,其中包括已知的两个或更多的系外行星。在此过程中,我们发现了两个新的行星:开普勒80g和开普勒90i。值得注意的是,开普勒90i是第8颗环绕开普勒90恒星运行的行星,这使它成为了除我们自己之外的第一个已知的8行星系统。

机器学习

我们使用了15,000个标记的开普勒信号来训练我们的机器学习模型来识别行星信号。我们用这个模型在670颗恒星的数据中寻找新的行星,并且发现了之前搜索中漏掉的两个行星。


关于我们新发现的星球的一些有趣的事实:它比地球大30%,表面温度大约800°F,不适合人类生存。它的运行周期是14天,这意味着你每两周就会有一个生日。

开普勒90是我们已知的第一个8星系统。在这个系统中,行星围绕着他们的恒星运行,而开普勒90i每14天运行一次。(请注意,行星的大小和距恒星距离都不同。)


到目前为止,我们用模型搜索了20万颗恒星中的670颗。在开普勒数据中可能还有许多未发现的系外行星,新的想法和机器学习等技术将有助于在未来的许多年里推动天体的发现。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消