这个羽毛一样的机器人能在漫漫大海找到污染源-五号时光网

麻省理工学院和伍兹霍尔海洋研究所（whoi）的研究人员发明了一种自主机器人系统，它能有效地在广阔、未经勘探的水域中发现最有科学意义但却很难找到的采样点。

环境科学家通常对在环境中最有趣的位置或“最大值”处收集样本感兴趣。一个例子可能是化学品泄漏的来源，该化学品的浓度最高，并且大部分不受外部因素破坏。但是最大值可以使得研究人员能拿到想要测量的任何可量化值，例如水深或暴露于空气中的珊瑚礁部分。

部署最大搜索机器人的努力受到效率和精度问题的困扰。通常，机器人会像割草机一样来回移动以覆盖一个区域，这很费时，而且会收集许多无趣的样本。一些机器人感知并跟随高浓度的轨迹到达泄漏源但他们可能会被误导例如，化学物质会被困在远离源头的缝隙中并积聚起来，机器人可能会将这些高浓度的区域识别为源头，但其实离这里还很远。

成功的探索

在国际智能机器人系统（IROS）会议上发表的一篇论文中，研究人员描述了“羽状物”这一系统，使自主移动机器人能够更快速、更有效地将一个最大值归零。PLUMES机器人利用概率技术来预测哪些路径可能导致最大值，同时导航障碍物、移动电流和其他变量。当它收集样本时，它衡量它所学的知识，以确定是继续沿着一条有希望的道路前进，还是搜索可能藏有更多有价值样本的未知领域。

重要的是，PLUMES机器人到达目的地时不会被困在那些棘手的高浓度区域。”这很重要，因为很容易认为你找到了黄金，但实际上你找到了傻瓜的黄金，”第一作者之一、计算机科学与人工智能实验室（CSAIL）和麻省理工-世界卫生组织联合项目的博士生维多利亚·普雷斯顿说。

研究人员建造了一艘以羽毛为动力的机器人船，它成功地探测到巴巴多斯贝拉尔群岛边缘珊瑚礁中暴露最深的珊瑚头。也就是说，它位于最浅的地方，这对研究太阳照射对珊瑚生物的影响很有帮助。在100个模拟试验中，在不同的水下环境中，虚拟PLUMES机器人还在分配的时间帧一致地收集七到八倍的最大值，样本比传统的覆盖方法确实多很多。

合著者第一作者Genevieve Flaspohler博士说：“我们的PLUMES机器人是先找到最需要探索的，然后迅速集中于收集有价值的样本。”。与普雷斯顿和弗莱斯波勒一起发表论文的还有：世界卫生组织应用海洋物理与工程系的科学家安娜p.m.米歇尔和约格什·吉尔达尔；以及美国航空航天学院和航空航天系的教授尼古拉斯·罗伊。

浏览漏洞探索权衡

PLUMES机器人的一个关键点是运用各种技术，从概率到推理，在利用对环境的了解和探索可能更有价值的未知领域之间，找到一个众所周知的复杂折衷方案。

Flaspohler说：“最大限度的寻求最大的挑战是让机器人能够平衡从已经知道的高浓度的地方开发信息，探索未知的地方。”如果机器人探索太多，它就不会收集到足够多的有价值的样本。如果它不够探索，它可能完全错过最大值。”

进入到一个新的环境中，他们发明的这个PLUMES机器人使用一个称为高斯过程的概率统计模型来预测环境变量，如化学浓度，并估计传感不确定性，然后，PLUMES机器人可以走的可能路径的分布，并使用估计值和不确定性来根据每条路径允许机器人探索和利用的程度对其进行排序。

首先，PLUMES机器人会选择随机探索环境的路径。但是，每个样本都提供了有关周围环境中目标值的新信息，例如化学物质浓度最高或深度最浅的点。高斯过程模型利用这些数据来缩小机器人从给定位置到具有更高值位置的样本的可能路径。PLUMES机器人使用一种新的目标函数，常用于机器学习，以最大限度地获得奖励，以调用机器人是否应该利用过去的知识或探索新的领域。

“估算”路径

在哪里收集下一个样本，取决于系统从当前位置“产生估算”所有可能的未来行为的能力。为此，它利用了Monte Carlo树搜索（MCTS）的改进版本，MCTS是一种为掌握围棋和国际象棋等复杂游戏的人工智能系统提供动力而推广的路径规划技术。

MCTS使用一个决策树-一个连接节点和线路的地图来模拟一条路径，或者一系列的移动，以达到最终的胜利动作但在游戏中，可能路径的空间是有限的。在未知环境中，随着动态的实时变化，空间实际上是无限的，使得规划变得极其困难研究人员设计了“连续观测MCT”，它利用高斯过程和新的目标函数来搜索这个庞大的空间中可能存在的真实路径。

这个MCTS决策树的根从一个“信念”节点开始，这是机器人可以立即采取的下一步该节点包含机器人在该点之前的整个动作和观察历史然后，系统将树从根扩展到新的行和节点，查看导致探索和未探索区域的未来操作的几个步骤。

然后，系统根据从以前的观察中学习到的一些模式，模拟如果从每个新生成的节点中抽取一个样本会发生什么。根据最终模拟节点的值，整个路径将获得一个奖励分数，较高的值将等于更有希望的操作。所有路径的奖励分数都回滚到根节点。机器人选择得分最高的路径，迈出一步，收集一个真实的样本然后，利用真实数据更新高斯过程模型，重复“幻觉”过程。

“只要系统继续产生幻觉，认为世界上看不见的地方可能有更高的价值，它就必须继续探索，”Flaspohler说。当它最终收敛在一个点上时，它估计是最大值，因为它不能沿着路径幻觉一个更高的值，于是它停止探索。

现在，研究人员正与WHOI的科学家合作，使用羽流驱动的机器人来定位火山地点的化学羽流，并研究北极融化的沿海河口的甲烷释放科学家们对释放到大气中的化学气体的来源很感兴趣，但这些测试地点可以跨越数百平方英里。

普雷斯顿说：“他们可以（利用PLUMES机器人）花更少的时间探索这个巨大的区域，真正集中精力收集有科学价值的样本。”