反盗猎!
在我们做完轮渡项目后,就去各个地方演讲介绍我们的工作。其中有一次是在世界银行,当时听演讲的一个观众比较了解野生动物保护工作,然后就和我们提到说,你们的这个工作好像跟护林员在保护区里面进行巡逻有一点类似。
我们意识到,或许我们的工作可以应用到更广泛的领域当中。因此我们开始和一些动物保护组织的人接触,看看我们的工作能否帮到他们。
从他们那里我们了解到,世界上有很多地方有盗猎的现象。盗猎者会放置一些陷阱、猎套,等着动物上钩,然后去卖掉动物的肉,或者是更有价值的,比如象牙、犀牛角这一类的动物制品来获利。
往往这样的盗猎行为会非常严重地影响比如大象、老虎、犀牛这些物种,而这些物种的损失可能会进一步影响整个生态系统,所以反盗猎的工作非常重要。
在保护区里面,一般会有护林员巡逻,去清理这些猎套。但是护林员比较少,而猎套又很便宜,也容易制作,到处都可以放,所以盗猎现象还是很严重,我们就想要帮助他们制定一些更好的巡逻策略。
在决定做这个项目之后,我们也跟多个动物保护组织的人聊过,在和WCS野生动物保护协会聊的时候,他们就说乌干达那边有一些国家公园有比较完整的数据,可以跟我们合作。于是,我们就选取了乌干达伊丽莎白国家公园作为第一个研究地点。
一开始,我们想直接套用保护轮渡的那一套解决方案,因为感觉这两个问题都是防御者对攻击者的问题,只是在反盗猎中,攻击者变成了这些盗猎者。
但是很快我们就意识到,这两个问题其实有本质的不同。在保护轮渡的问题里面,很幸运的是,我们考虑的这种攻击还没有真正发生过,因为这样的一次攻击成本巨大,一旦成功它的影响也巨大。
所以攻击者会花大量的时间和精力去了解巡逻方案,并且去设计一个最佳的攻击策略。他会提前定好今天的哪个时间攻击哪艘船,不会根据观察到的海上的信息临时改变他的攻击策略。
用博弈论的术语来说,在这个问题中,我们可以假设他们是完全理性的。而且这是最极端也是最差的情况,如果他们不完全理性,最后的结果只会对我们更好。
但是在反盗猎的这个问题当中,制作猎套的成本大概就十块钱人民币,盗猎者们并不需要花那么多时间和精力去进行计算在哪一个点放猎套预期收益最大,他们会非常频繁地在各种地方下猎套,想放哪里就放哪里。所以盗猎者的行为模式也就更加地复杂,我们不能假设他们是完全理性的。
当我们想要阻止盗猎行为时,我们首先要能够预估他们的行为模型。这就是为什么在这个问题里面,我们需要引进机器学习,从实际的数据当中去学习和预测盗猎者的行为模型。
乌干达当地给我们提供了大概12年的巡逻数据,从中我们可以提取一些特征,比如说护林员往年在不同地方花费的巡逻时间。
然后我们还分析了当地的一些地理相关的信息,提取了一些可能会影响盗猎者行为的特征,比如说不同地点的海拔,动物的密度分布,还有跟村庄的距离等等,因为这些特征也会影响盗猎者的行为。
比如如果一个地方离村庄太近的话,它的野生动物可能就比较少,如果距离太远的话,对于盗猎者来说,他跑到那个地方去需要花的时间和精力就太大了,所以到村庄的距离是一个很容易会影响盗猎者决策的因素。
除此之外,我们还会对以往的数据进行标注,看看每一个网格点上是否有存在过猎套,或者是有过盗猎行为。
▲ 将地图分成1km*1km的网格
这里我们就遇到了一个困难,因为我们发现绝大多数的数据点上是没有找到猎套的,只有在非常少的数据点上被标记了一些盗猎的行为——这些数据量是不足以支撑一个很复杂的模型的。
▲ 红色点代表发现过盗猎行为
并且我们的数据来源是护林员巡护当中发现的一些东西,标注上其实有一些主观的不确定性。
如果他们发现了一些猎套,那么我们可以很肯定地说这个地方有盗猎行为。但如果他们没有在某个地方发现猎套,这难道就意味着那个地方真的不存在盗猎行为吗?并不是的。
所以这也给我们的机器学习工作带来一些困难。为了应对这些数据性的挑战,我们把整个公园分成了几个区域块,然后根据每个区域拥有的数据量的大小,采用不同的机器学习模型,对它们的盗猎风险进行预测。
最后,得到了一个盗猎风险的热度图,这个热度图上更红的地方就代表着我们预测的盗猎风险更高。
▲ 为保护当地数据信息,上图仅为结果示意图,并非真实的预测结果。
当我们把这个预测结果与他们以往的巡逻路线去作对比的时候,就发现有一些我们预测出来的中高风险的盗猎区域,在以前是很少被巡逻到的。那么这些预测到底准不准呢?
我们和当地的护林员合作,请他们去做了一个月的实地测试。在这一个月当中,当地的巡护人员去了这两个方框所在的地方。
这两个地方都是我们预测出来有盗猎风险,但是在以往的巡逻中很少涉足的地方,请他们去看看在这里是否会找到一些猎套。
于是在这一个月中,他们发现了19次人类活动的痕迹,还发现了已经被猎杀的大象,以及多个已经生效的,或者是还没有被部署好的羚羊猎套和大象猎套。
我们从这个视频当中也可以看到,其实找猎套并不是一件特别容易的事情,如果你没有经验的话,很可能你走过那个地方,但却什么都找不到。
值得一提的是,如果我们把这一个月的数据跟以往的数据进行对比,可以看到它超过了91%的历史月份,而且找到猎套的次数远远高于平均历史数据。
因此我们就考虑说,或许可以做一个更长期的实地测试,于是当地护林人员又进行了一次八个月的实地测试。
在这次测试当中,护林人员巡逻了超过450公里。他们选取了27个区域,其中有5个被预测出来的高风险区域,22个被预测出的低风险区域。
在这个过程中他们发现,被预测为高风险的区域里面,每公里找到的猎套数量是十倍于低风险区域的。
所以可以说用我们的模型能够比较好的预测出高风险区域和低风险区域,可以作为给当地巡护人员的重要参考。
在这之后我又通过邮件联系了世界自然基金会(WWF)在中国东北的办公室,然后发现盗猎问题在我们中国东北这一块也是比较严重的。
因为东北这边的地理信息数据没有乌干达那边那么充足,所以这一次我们从卫星图片上提取了一些地理信息,
并通过向护林员发放问卷的方式收集了一些额外信息,来弥补当地地理信息数据不足这一难题。之后结合多个机器学习模型,得到了这样一个盗猎风险的预测结果。
2017年时,我正好有机会回国,所以这一次我去东北和我们的合作者一起参与了实地测试。
当时我们走了两天,第一天的时候什么都没有发现,第二天开始的时候,依然没有发现什么东西。合作者当时和我说,方博士,你这个算法好像不太行呀,预测出来的结果可能并不是你想得那么好。
但是过了20分钟以后,我们到了一个地方,在这个地方我们找到了20多个猎套,数量比他们平时能找到的猎套数量要多很多。
▲ 方飞及团队在东北进行了两次实地测验。2017年10月的实地测验找到了22个猎套,2019年12月的实地测验找到了42个猎套。
除了找猎套以外,我们也尝试着像类似之前给轮渡设计巡逻船路线的方式,给护林员们也规划了一些巡逻路线。
比如2015年,我们曾经给马来西亚那边的一个保护区提交了一组巡护方案,但是他们的反馈却是——这个巡护方案完全没有办法用。
我们一开始也不是特别能够理解为什么,于是他们就邀请我们去马来西亚进行实地考察。去了那边之后发现,确实是没有办法按照我们的路线走——因为那个地方的地形实在是太复杂了。
我们当天在保护区里面走了大概8个小时,这之中你可以看到有时候要上山,有的时候要沿着河在水里面走,我当时整个裤子都湿掉了,走起来真是挺麻烦的。 所以在我们提交的模型下,告诉他们从这个网格点走到隔壁的网格点,在实际当中很可能是非常非常难走的。
于是我们就根据这个地势的实际复杂情况,修正了巡逻路线的设计,在这个区域中找到了一些比较好走的能够直行的巡逻路线。

在这样的修正之后,巡护人员的确可以更好地按照巡逻路线执行了,而且他们在这个巡护过程中又找到了数量可观的人类活动和动物活动的痕迹,
再一次说明这种基于人工智能的巡护方案设计是有价值的,是可以给当地的巡护人员提供参考的。
整体来讲,我们这个项目叫做PAWS(Protection Assistant for Wildlife Security)。它首先是通过机器学习给这个地方的盗猎人员进行行为的建模,然后再基于博弈论去进行路线的规划,再进一步考虑当地复杂的地形进行具体的路线设计,
当我们把这个路线推荐给巡逻人员以后,巡逻人员可以进一步收集盗猎的数据,然后把这些新的数据返回来去优化我们的模型。
除了前面的工作以外,我们在防止盗猎的整个链条上还有很多值得去做的事情。比如我们可以想一下盗猎者为什么会盗猎?因为他们可以获得很多利润,即使被抓住受到的惩罚也不是很大,那我们是不是可以想办法从源头上去阻止盗猎?
此外,我们可不可以去发动当地的居民一起帮忙解决盗猎?但是当居民给巡逻人员提供线索时,我们需要怎么样去分辨和合理利用他们的线索呢?关于这些问题,我们也都在进行研究。
在轮渡保护、反盗猎这两个问题中,其实都是一个防御者和攻击者的模型,但在很多其他的领域中,我们往往会遇到比这个更加复杂的多人交互的情形。这时我们也可以不局限于计算博弈论,而可以考虑用多智能体系统和机器学习相结合来解决更多的问题。
|