找回密码
 注册
搜索
查看: 390|回复: 0

[百家杂谈] 气候问题就是数据问题

[复制链接]
发表于 2018-9-13 04:40 PM | 显示全部楼层 |阅读模式


气候问题就是数据问题

2018-09-11  黑爪  大家

导读

那些庞大的巨兽般散发着热量的服务器厂房,并非导致环境恶化的敌人。时至今日,计算机已经是我们能够利用的最高效武器,来抵御环境的恶化。




九月的第二个周末,有数十万人在欧洲各地走上街头游行,抗议各国政客因在环保方面的不作为而引发的全球性环境危机,为将在旧金山召开的全球气候行动峰会拉开了序幕。

九月第二个周末横跨欧洲的示威拉开旧金山全球气候行动峰会的序幕九月第二个周末横跨欧洲的示威拉开旧金山全球气候行动峰会的序幕

为什么会有这样规模的抗议,是什么引发了大多数人如此强烈的危机意识?日前腾讯·大家所刊发的一篇英国学者罗杰·克劳利的文章《感受热浪》是很好的一个总结。文中关于数据中心的讲述,可以从另一个角度来稍作分析。数据中心的能耗和温控问题非常严峻,业界也早有共识。数字技术、科技巨头是否通过数据绑架了社会,进而威胁到人类文明的根基,不是我这篇文章要讨论的目的。数字化生存之前的日子,是否真如俗话说的“good old days”那般美好?每个人有不同的看法,但有一点可以肯定,我们回不去了。那么立足于现实,气候问题已经是数据问题!

话题既是从数据中心说起,那就先看看数据中心的近况,以谷歌为例。

上个月,2018年8月,“数据中心知识”网站刊登了一篇文章《谷歌正在切换至自驾驭数据中心管理系统》,报道谷歌数据中心的最新进展,刷新了我们2015年初对谷歌“基于AI的建议引擎”的数据中心温控系统的认知:它从提出建议,然后人工调节,升级至自动调节。

谷歌芬兰数据中心的冷却设备谷歌芬兰数据中心的冷却设备

举个例,大多数的数据中心操作人员并不认为台风预警期是进行温控微调以获得零星节能效果的好时机,这是很自然的反应,这个时期的优先级是什么?自然是加固系统,以求不被台风搞断电。

但AI算法不一样,它就是被设计来寻找每一个可能省掉每一度电的机会,然而它并不将外界气候作为参数。在来自美国中西部一个数据中心的最新情况汇编中,AI对系统的调控起初让管理人员觉得匪夷所思,乱来。但经过仔细考察,AI所进行的每一个细微调控,在当时特定的参数环境下,都令人叹服。导致严重的风暴例如台风的气候条件,往往会形成气压和温度的戏剧性变化,这些在复杂的数据中心制冷系统中都是需要对参数进行调节的重要因素,在这种时候软件可以通过微校准来获得极细微的收效。然而,这样的微调是一个持续、实时的过程,人工不可能做到,并且人力的耗费和每一次调节的收效之间的比例也并不高效,与此同时,持续和实时的累积效应却又是巨大的。令业界惊叹的40%能耗节省报道,仰仗的正是DeepMind AI团队所开发的智能温控系统,它考察包括室外温度、气压、湿球温度、干球温度、露点、数据中心负载、热空气出口的服务器背部气压等21个变量,以达到实时优化数据中心PUE(Power Usage Effectiveness,数据中心设备能耗)的目的。

AI与气候模型AI与气候模型

经过这么一段时期人工智能知识的普及,我们普通人也大致理解了,所谓“智能”,它是通过一个叫“学习”的过程来得以达成,而“学习”这一打磨人工智能的智商的过程所用到的材料,正是数据。也就是说,服务器的每一次运转,提供给智能体的数据越充分,它变得更高效而聪明的机会就更大。

从这个简单的例子,我们依稀感到,那些庞大的巨兽般散发着热量的服务器厂房,并非导致环境恶化的敌人。时至今日,计算机已经是我们能够利用的最高效武器,来抵御环境的恶化。

2016年发生了772起气候灾害,是1980年的三倍;20%的现有物种在面临灭绝的边缘,到2100年这个数字可能达到50%。即便全球所有的国家都遵循巴黎气候协定,到2100年,全球平均温度将上升3摄氏度。我们显然不能把地球的未来交给上面通过一个例子得来的“依稀”感觉,我们得认真看一看AI在这件事上究竟能怎么帮我们。

2018年1月世界经济论坛发表的有关未来的环境和自然资源报告《整合人工智能来维护地球》将AI称为影响环境的游戏改变者,列举了与气候和环境相关的例证,比如,印度的农民在AI的协助下,将豆子的产量提高了30%,AI所做的是,提供播种前准备土地、施肥以及选择播种日期的信息。而挪威电网则利用AI生成了更灵活的自动配置,集成了更多可再生能源……所以,如今研究气候,归根结底已经变成研究大数据。随着观测卫星越来越多,研究气候变暖的科学家们缺乏的不是数据,而是利用这些数据的工具。

他们很显然转向AI求助,机器学习的本性与环境科学十分匹配:运行一次高精准率的气候模型所产生的数据是PB级别的,PB有多大?1PB大约是1000个TB,而英国气象局所保存的气象数据大约有45个PB,并且以每天0.085PB的速度在增加,由此产生了一个新的交叉学科,叫“气象信息学”(climate informatics)。去年《自然》杂志上一篇文章提到:环境领域至少有三个方面证明得益于这一新学科在AI应用上的发展。首先,利用极端气候事件数据训练出来的机器学习算法,成功识别了热带台风与大气河流,后者常常为局部地区带来灾难性降水,且很难人工预测。其次,AI还被用于分析政府间气候变化专门委员会IPCC用来调研气候变化的几十个模型之间的优劣,算法将每一个模型所得出的独立结果赋予权重后再集成起来,所得到的分析结果远远好过单独的模型。再次,气象学家越来越多地利用AI来预测风暴持续时间。

然而,令这些专门致力于环境研究的科学家们真正担心的,不是数据中心的服务器散发出的热量,而是AI像个黑盒子,它表现优异,但你不知道它究竟是怎么学出来的,在我们更了解它之前,我们不敢彻底去信任它。

回到谷歌数据中心,针对类似问题,他们有个护栏机制。有人半开玩笑地说,如果你就告诉机器,去,将PUE优化了,因为PUE是总能耗与IT设备能耗间的一个比率,它很可能就把所有服务器给你关了。当然,以数据科学安身立命的谷歌工程师,与环境科学家在对AI的信任程度上是截然不同的。谷歌的策略是慢慢来,慢慢训练,但“我们绝对相信它”。气象学家不一样,他们更倾向于利用AI来帮助测试他们所创建的气候模型,需要一个建模的指路明星,机器学习是最好的工具。

到2100年时,我们需要把墙修到多高才能抵御海水的入侵?下一个十年的热浪将会比现在糟糕多少倍?2030年的北极海运路线会是什么样?我们依然没有答案。在人类现有的认知情况下,AI最有可能是出路。连商业企业最怕的绿色和平组织也承认,没有回头路。能做的只是加大研究力度,并且在能源使用方面对企业进行跟进监督,鼓励“干净点击”(clicking clean)的“绿色互联网”竞赛。最后来感受下,大佬企业们谁最绿。

清洁点击2017年度报告清洁点击2017年度报告
搜索引擎圈比绿搜索引擎圈比绿

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|www.hutong9.net

GMT-5, 2024-3-28 08:46 AM , Processed in 0.043905 second(s), 14 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表