华人博士用强化学习回收了SpaceX火箭_

华人博士用强化学习回收了SpaceX火箭

2021-11-16 16:43:43 量子位

A+ A-

马斯克旗下的SpaceX可以说带火了“火箭回收”这一话题。这不，连粉丝们都已经开始摩拳擦掌，用自己的方式挑战起了这个技术难题。例如一位来自密歇根大学的华人博士，就用强化学习试了一把回收火箭！

访问：

阿里云11.11上云狂欢节活动大厅

博雯发自凹非寺

他根据现实中的星舰10号一通进行模拟，还真在虚拟环境中稳稳地完成了悬停和着陆！

这个项目迅速在Reddit上引发了大批网友们的关注：

那么，他是如何实现的呢？

给火箭回收设立“奖励机制”

要在模拟环境中回收火箭，那么大一只构造复杂的火箭肯定是不能直接抱来用的。

于是，这位SpaceX的铁杆粉丝首先基于气缸动力学，将火箭简化为一个二维平面上的刚体：

这个火箭的底部安装有推力矢量发动机，能够提供不同方向的可调的推力值（0.2g，1.0g和2.0g）；同时，火箭喷嘴上还增加了一个角速度约束，最大转速为30°/秒。

火箭模型所受到的空气阻力则设定为与速度成正比。

现在，这个模型的一些基本属性就能够以下面两个集合来表示：

动作空间：发动机离散控制信号的集合，包括推力加速度和喷嘴角速度

状态空间：由火箭位置、速度、角度、角速度、喷管角度和仿真时间组成的集合

而“火箭回收”这一流程，则被分为了悬停和着陆两个任务。

在悬停任务中，火箭模型需要遵循这样一种奖励机制：

火箭与预定目标点的距离：距离越近，奖励越大；

火箭体的角度：火箭应该尽可能保持竖直

着陆任务则基于星舰10号的基本参数，将火箭模型的初始速度设置为-50米/秒，方向设置为90°（水平方向），着陆燃烧高度设置为离地面500米。

△星舰10号发射和着陆的合成图像

火箭模型在着陆时同样需要遵循这样一种“奖励机制”：

当着陆速度小于安全阈值，并且角度接近竖直0°时，就会受到最大的“奖励”，也会被认为是一次成功的着陆。

总体而言，这是一个基于策略的参与者-评判者的模型。

接下来就是进行训练：

最终，在经历了 20000次的训练后，火箭模型在悬停和着陆两个任务上都实现了较好的效果：

最终，模型得到了很好的收敛效果：

而这枚模拟环境中的伪·星舰10号，也就像开头展示的那张动图一样，学会了腹部着陆，稳稳地落地了。

下一步：增加燃料变量

这一项目一经发出，就引来了红迪众多网友的围观和称赞。

有人觉得用强化学习来解决传统任务非常有趣，因为它具有更好的鲁棒性。

作者也在下方回复表示：现实中恶劣的环境条件可以成为环境制约因素，而强化学习则能在一个统一的框架内解决这些问题。

不过在称赞之余，也有网友提出了最直接的这样一个问题：

既然我们已经可以使用经典控制方法找到这些任务的最优解，那为啥SpaceX之前没人做？

下方有人解答到：这或许是因为之前的数字控制系统、传感器等技术并不成熟，采用新方法就意味着要重新设计火箭的关键部分。

这也就是控制系统层面之外的“工程类的问题”，而SpaceX正是在这些相关领域中做了改进。

而那些较为传统保守的航天航空工业则会使用使用凸优化（Convexification）来解决火箭着陆问题。

也就是评论区有人贴出的这篇论文中提到的方法：

不少评论也为开发者提供了下一步开发的新思路，比如这条评论建议将“剩余燃料”也作为一个变量，模型燃料的减少或耗尽也是现实中的一个重要影响因素。

作者欣然接受了这一建议：是很容易添加的有趣设置，安排！

密歇根大学华人博士

开发者已经为这一项目建立了一个网站，在主页他这样介绍到：

这是我的第一个强化学习项目，所以，我希望通过这些“低水平代码”尽可能地从头实现包括环境、火箭动力学和强化学习agent在内的所有内容。

作者叫Zhengxia Zou，是一位来自密歇根大学博士，主要研究计算机视觉、遥感、自动驾驶等领域。

他的论文曾被 ICCV 2021、CVPR 2021等多个顶会收录：

下载链接：

https://github.com/jiupinjia/rocket-recycling

项目主页：

https://jiupinjia.github.io/rocket-recycling/

参考链接：

https://www.reddit.com/r/MachineLearning/comments/qt2tws/pr_rocketrecycling_with_reinforcement_learning/

责任编辑：bH_03116

关键词：人物华人博士用强化学习回收了SpaceX火箭 cnBeta

点击查看全文(剩余0%)

华人博士用强化学习回收了SpaceX火箭

相关新闻

新疆洛浦： 支部共建 堡垒共筑

2022年全球未来科技创新合作大会将于6月28-29日在京举行

南航北方分公司护送援吉湖北医疗队回家

沈河区：有序推进项目复工 逐步恢复生产活力

筑牢安全防线 护佑生命之光——锦州收治的葫芦岛新冠肺炎患者全部“清零”纪实

沈阳市皇姑区开展“皇姑有礼 助创业促消费惠民生”活动

“壮美广西—广西品牌天下行”地铁专列首发

甘肃兰州：七里河区税务局营造有序优质税收营商环境

阿拉丁集团与新疆乌鲁木齐天山区政府、天山文旅签署战略合作协议，共同助力新疆文旅高质量创新发展

新疆巴州中级人民法院召开知识产权保护新闻发布会 助力营造巴州法治化市场化营商环境

当“高大上”的知识产权碰到“接地气”的拌面米粉大盘鸡--记新疆克拉玛依市中级人民法院知识产权宣传周系列活动之进汇嘉滨河商圈

江西省工信厅实施“八大改革攻坚行动”推进工信领域改革走深走实

文艺范儿患者吐心声：春风送我离九院 满怀信心把家还

郑州市九院荥阳医院医养结合示范点项目迎调研

济源职业技术学院与济源投资集团和交投集团签署战略合作框架协议

丰台区开设核酸检测点位1065个 步行15分钟可达

2002年至今福建累计植树造林3949万亩 森林覆盖率连续43年居全国首位

金鼎安全公布年报 净利润增长达378.54%

顶级翻译技术支持顶级峰会：有道为博鳌亚洲论坛提供AI同传翻译

真情服务 从心出发 南京证券投资者教育基地：用心守护投资者“钱袋子”

暴雨无情人有情 河南西峡县灾后关怀暖人心

免申即享“六税两费” 南阳市卧龙区小微企业乐享春雨

河南沁阳：未雨绸缪清淤 确保安全度汛

开封示范区路边蔷薇花海惹人醉 成为新兴网红打卡地

河南温县建立“52100”机制，提能力转作风为发展增势赋能

靠前保障抚民心 开封祥符区万隆乡打通红薯苗运销“最后一公里”

开封示范区杏花营街道多举措全力抓好“五一”假期安全生产工作

河南通许县高新区全面开展智能编码试点工作

河南淮滨干群齐动员 共创美丽新家园

河南尉氏县发展蔬菜种植 让致富路上“葱”满希望

开封示范区张湾社区“花”开致富路为乡村振兴奠定基础

义马市财政局：开展新闻写作培训 提升宣传工作水平

尉氏县大桥乡推行“村规民约”机制 打造“共谋”“共管”“共评”新格局

巩义市财政局：稳中求进 进中求质 强化非税收入管理

尉氏县门楼任乡纪委“四举措”加强村干部监督管理

中牟县自然资源和规划局不动产登记中心： 加强党建引领 提升工作实效

中牟县自然资源和规划局：开展文明实践宣传活动

南召县举办2022年知识产权质押融资入园惠企宣讲暨政银企合作交流会

焦作马村区有关领导集中调研乡村振兴工作

郑州五十七中教育集团与郑州一中教育集团举行合作办学签约仪式

发挥平台优势 中国建筑“云筑网”助力建筑行业供应链保障

濮阳市获省级生态补偿奖励金1635万元

健全干部廉政档案 通许县邸阁乡纪委切实把好廉洁从政关

南召县市场监管局：知识产权进校园 保护意识记心间

巩义市会计机构代理记账许可证书实现即时发放

通许县教体局：召开“能力作风建设年”活动推进会

鹤壁市网络文明建设推进会暨网络文明实践月活动启动仪式举行

郑州市九院为河南援沪医务工作者开展线上心理讲座

河南正式启用全国统一式样《重点物资运输车辆通行证》

河南省在全国率先推行农民工工资保证金保函替代制度

郑州市九院召开新技术新项目和省级备案类技术审查会议

请查收 五一假期出行攻略看这里

4月29日20时起 河南省社会保障信息系统暂停服务

郑州市九院喜获“郑州市卒中急救地图”授牌

河南：四部门联合发文 规范农村供水价格管理 禁止变相提升水价

河南今年一季度重点民生实事办得咋样？通报来了

潘粤明王鸥首次合作出演家装搭档

马振霞亚运选拔夺双冠 切阳什姐赛季首秀摘金 中国竞走国内国际两开花

羽毛球——亚锦赛：翁泓阳晋级正赛

三部门：到2022年末IPv6活跃用户数达到7亿

内乡县财政局：举办粮食系统会计业务专题培训班

淇县税务局：“云”上春风送税宣 税法知识润童心

南阳市卧龙区陆营镇召开财税工作推进会

新能源汽车驶入千家万户，充电桩却被挡在小区门外——个人充电桩卡在“最后一公里”，如何破题？

郑州经贸学院访企拓岗促就业

受骨骼启发 科学家开发出具有可调整刚度的轻质材料

调查：大多数住院新冠患者在出院一年后仍觉得身体没有完全康复

火星可能有过几代生命 但都灭绝了

Relativity对Launcher 3D打印火箭的E-2引擎开展了点火测试

大型强子对撞机再次重启探索“第五种自然力”

戴假牙可能会营养不良

汝州农商银行：开展“喜迎二十大 永远跟党走 奋进新征程”主题教育实践活动

商水农商银行：召开服务明查暨内训师工作会议

汝阳县市场监管局：召开县城大型集体聚餐单位疫情防控行政约谈会

周口市市场监管局：开展知识产权宣传活动

许昌市市场监督管理局魏都区分局：知识产权宣传进企业 服务企业零距离

郸城县市场监管局：督导检查城区沿街餐饮店疫情防控和病媒生物防制工作

郑州航空港经济综合实验区税务部门：税惠加持 助力企业实现行业领跑

新疆洛浦：支部共建堡垒共筑

沈河区：有序推进项目复工逐步恢复生产活力

筑牢安全防线护佑生命之光——锦州收治的葫芦岛新冠肺炎患者全部“清零”纪实

沈阳市皇姑区开展“皇姑有礼助创业促消费惠民生”活动

新疆巴州中级人民法院召开知识产权保护新闻发布会助力营造巴州法治化市场化营商环境

文艺范儿患者吐心声：春风送我离九院满怀信心把家还

丰台区开设核酸检测点位1065个步行15分钟可达

2002年至今福建累计植树造林3949万亩森林覆盖率连续43年居全国首位

金鼎安全公布年报净利润增长达378.54%

真情服务从心出发南京证券投资者教育基地：用心守护投资者“钱袋子”

暴雨无情人有情河南西峡县灾后关怀暖人心

河南沁阳：未雨绸缪清淤确保安全度汛

开封示范区路边蔷薇花海惹人醉成为新兴网红打卡地

靠前保障抚民心开封祥符区万隆乡打通红薯苗运销“最后一公里”

河南淮滨干群齐动员共创美丽新家园

河南尉氏县发展蔬菜种植让致富路上“葱”满希望

义马市财政局：开展新闻写作培训提升宣传工作水平

尉氏县大桥乡推行“村规民约”机制打造“共谋”“共管”“共评”新格局

巩义市财政局：稳中求进进中求质强化非税收入管理

中牟县自然资源和规划局不动产登记中心：加强党建引领提升工作实效

发挥平台优势中国建筑“云筑网”助力建筑行业供应链保障

健全干部廉政档案通许县邸阁乡纪委切实把好廉洁从政关

南召县市场监管局：知识产权进校园保护意识记心间

请查收五一假期出行攻略看这里

4月29日20时起河南省社会保障信息系统暂停服务

河南：四部门联合发文规范农村供水价格管理禁止变相提升水价

马振霞亚运选拔夺双冠切阳什姐赛季首秀摘金中国竞走国内国际两开花

淇县税务局：“云”上春风送税宣税法知识润童心

受骨骼启发科学家开发出具有可调整刚度的轻质材料

火星可能有过几代生命但都灭绝了

汝州农商银行：开展“喜迎二十大永远跟党走奋进新征程”主题教育实践活动

许昌市市场监督管理局魏都区分局：知识产权宣传进企业服务企业零距离

郑州航空港经济综合实验区税务部门：税惠加持助力企业实现行业领跑

河南省陈州高级中学：劳动教育进课堂技能实践助成长

丰富业务资质助力实体经济：财达证券20年实现营业收入271.36亿元

银税互动再升级助力缓解小微企业融资难

文化赋能特色产业搭建宁夏与世界的桥梁

云南安宁：聚焦文化建设提升群众获得感

31省份新增本土确诊病例1908例新增本土无症状感染者15816例

积极践行“双碳”战略金茂智慧能源助力长沙等城市实现绿色低碳高质量发展

疫情防控不力江西上饶万年县8名干部被立案处理

美国法官裁定特朗普蔑视法庭罪每天罚款1万美元

强化监督促提升尉氏县邢庄乡纪委跟进工作抓落实

马斯克440亿美元收购推特未来可能会有何种变化？

安徽新增本土确诊病例1例新增本土无症状感染者10例

研究：为避免性食同类雄性蜘蛛在交配后迅速将自己弹射出去

俄科研人员发明新型水泥板可用于替代刨花板

濮阳市市场监管局全力当好“企业服务员” 站位全局促发展真情助企解难题

平顶山市新华区市场监管局：加强食品安全监管防范食品安全风险

郑州市财政局：创新管理模式管好用活“钱袋子”

新乡市凤泉区财政局：服务企业送温暖营商环境再升级

新版《河南省防汛应急预案》发布后首次启动应急响应并成功应对此轮强降水（防汛备汛积极应对）

农发行孟津县支行：组织开展“共享阅读传递书香”读书分享会