发现病毒
荆门病毒的发现非常有戏剧性。在2010年以前,我主要是做狂犬病和出血热研究的。2009年,在湖北、河南交界的地方出现了一种新发传染病,有的人叫发热伴血小板减少综合征,我们叫它淮阳山出血热,当时我们认为它就是一种出血热。在这个病毒出现后,很多人做了一年也没有做出来任何结果。
因为要做淮阳山病毒的流行病学调查,我们在湖北的荆门地区采集了一些蜱虫样本,用做布尼亚病毒的体系(淮阳山病毒属于布尼亚病毒的一种),突然测出了两个基因,这两个基因和黄病毒的NS3、NS5两个基因比较相似。
我说黄病毒大家可能不太熟悉,常见的像乙型脑炎病毒、寨卡病毒、丙肝病毒,还有登革热病毒等,这一类的病毒就是黄病毒。
我们钓出了这两个序列,也把这个病毒分离出来了,在电镜下可以看到这个病毒相比黄病毒直径更大。
我们就试图看能不能确定这个病毒的全基因组。但这个病毒熬了我三年多,我们始终依据黄病毒的基因组进行序列扩增,利用已知来发现未知病毒。然而三年多的时间怎么也做不出来,再延长序列也延长不了。
我想在座的有一点分子生物学背景的人会知道,用现有的分子生物学办法,只要是比较接近的病毒,完全是可以把它的基因组拿出来的,但我们花了三年多的时间,就是做不出来。
负责它的博士后来都快哭了,他说张老师,做这个三年多了,结果我一篇文章发不出来,我也要评职称,我怎么办?
我也在苦思冥想,这个病毒真的是黄病毒吗?我们已经试了所有的办法,都不行。那该怎么办?我就在想,是不是这个病毒根本就不是像黄病毒这样不分节段的病毒,会不会是像流感、布尼亚病毒一样,它的基因组是分节段的?
2013年的7月21日,那是一个礼拜天。那天下午5点多的时候,我叫了两个博士研究生过来,我说今天晚上你们吃完饭以后帮我做一件事,把这两个序列好好分析一下,看看这两个序列是不是具备了分节段病毒的结构生物学特征。
那天晚上我也在,我们一直熬到12点,左分析右分析,推敲来推敲去。对我来说,过去二十年,我是没有周末的,几乎没有节假日,年初二我是在办公室、在实验室的。
所以你们在网上查查看,跟着张永振读研究生是非常苦的,一般人忍受不了,说我太苛刻了。但是每个人都是一个脑袋两只手,科学上我们本身就落后,做科研不这样做,哪有弯道超车啊?
到了12点的时候,他们俩告诉我说,张老师,你说对了,这个病毒,我们拿到的两个序列已经具备了分节段病毒的基因组结构特征。这两个节段已经全了,再想扩,再想把它连起来是不可能的事情。
那其他的序列在哪儿呢?我们也用了高通量测序的方法,还是找不到和黄病毒比较接近的病毒序列,也找不到类似的片段,那怎么办?这个时候就是考验认识能力的问题了。
我们把整个数据库里面的序列挨个翻遍,又找到了两个片段,它们和我们已经拿到的两个片段在文库里的丰度比较接近,我们又进一步下功夫,看看这两个序列是否具备病毒的结构特征。
结果这么一分析,发现我们拿到的这两个序列也具备了分节段病毒的基因组结构特征,但是和所有已知的病毒之间没有任何关系,就是说在2013年,我们拿到这两个序列的时候,和基因银行(Genbank,一个开放获取的序列数据库)里面所有的序列比对,发现它们比对不上任何病毒序列。
那么这个问题又来了,你敢判断它是一个病毒吗?如果我今天判断说这是个病毒,能经得起历史的检验吗?到了明年、后年,再过几年,如果美国人说这根本不是病毒,不就出了一个世界笑话了吗?我们不能再发生中国人在“非典”过程中冠状病毒和衣原体之间这样的错误。
所以我们非常慎重,对这个病毒反反复复做了大量的工作,把那两个节段的每个碱基、每个结构特征都去比对,最后我们确认,后面找到的这两个节段就是病毒的基因组。
到此为止,我们把这个病毒基因组的4个节段全部做出来了。一般RNA病毒的基因组大小是1.1万个碱基左右,我们发现加起来后也是符合的,荆门病毒就这样被破解出来了。
做这项研究时我没什么名气,只敢把这个结果投给了美国科学院院报(PNAS)。美国科学院那帮人还是很厉害的,马上意识到这个病毒非常重要。
为什么重要呢?因为病毒的基因组是否分节段、分几个节段,一直是病毒分类的一个规则,比如流感病毒八个节段,布尼亚病毒三个节段,沙粒病毒两个节段,这是这些病毒科一直以来的区分标准。
从进化生物学的角度来看,分节段的病毒与不分节段的病毒之间,到底是不是有关联?这是从它们被发现以后就一直困扰着全世界病毒学家、遗传学家的问题。荆门病毒是世界上发现的第一个能把这两类病毒联系起来的病毒,在它们之间搭建了一个桥梁。
所以一个月以后,PNAS发出来了。同时Nature Review Microbiology邀请了英国剑桥大学桑格研究所的科学家专门发了一篇评论文章,高度评价了荆门病毒的科学意义。我很喜欢他们给我们配的这幅插图。
▲ 图源:(Nat Rev Microbiol, 2014)
这幅插图的意思非常清晰明了,就是说在病毒起源进化的过程中,有两类病毒,一类病毒朝着黑夜去了,一类病毒朝着白天去了。我们发现的病毒在哪呢?在起点上。所以你想,这个事重要不重要?
一年以后,让我们更加高兴的是,在《病毒学原理》这本最经典的教科书2015年版第64页,讲述有关病毒基因组分节段以及不分节段之间这个重要的过程时,用了不到一页的图文来讲述荆门病毒发现的故事以及科学意义。到2020年第5版再版的时候,又是在这个位置上,同样在讲这个故事。
我们这个故事对研究生物的整个起源进化提供了新的思路,所以教科书才会连续地去讲这个故事。在大学本科教材中,特别是自然科学这一块,国际权威的教科书里面可以出现中国人的研究故事。
所以到现在为止,我认为这是最让我激动的一个成果,我心里面觉得这是我对科学上最大的一个贡献,如果这算是一个贡献的话。
后来发现,荆门病毒的宿主还是比较广泛的。我们发现了这个病毒就相当于捅破了这层窗户纸。其实在南美、北美、欧洲包括非洲,荆门病毒都存在。
更重要的是,无论是在我们国家,还是在欧洲,都已经发现荆门病毒这类病毒可以引起人的疾病,虽然它没有引起像新冠这样的大流行,但是它也能引起疾病,也需要我们高度关注它。
荆门病毒是在节肢动物中发现的,所以当我们发现它以后,认识到了节肢动物里面原来有这么多稀奇古怪的东西。做科学当然就希望可以进一步往里面走,所以我们又做了更多的节肢动物。
在我们国家,从陆地到江河湖泊海洋这些地方,包括蜻蜓、蚂蚁等等,我们到处去抓,到处去找,和伙伴们一起找了各种各样的节肢动物,有四个纲70多种。于是在2014年的时候,我们又发现了112种全新的病毒。
▲ 充满病毒的昆虫(Nat Rev Microbiol,2015)
另外我们的结果也发现,节肢动物在整个病毒的进化过程中间起到了非常重要的作用。同期配发的一篇文章评论我们的时候说到,节肢动物可能是病毒进化的心脏。无论是植物病毒还是动物病毒,节肢动物在它们的整个传播过程中都发挥了非常重要的作用。
在这些病毒里面,我们又发现了一类非常重要的病毒。
这个病毒的发现也非常有意思。我们首先是在新疆发现它的,然后又发现它在长江中下游地区、春秋战国时期被称为楚国的地方广泛地存在,因此我们就把它命名为楚病毒。
大家听到这个名字是什么样的感觉呢?特别是新冠出来以后,好像用一个地方去命名、用我们历史上春秋战国这些名字去命名,是不是对中国人的侮辱?我个人理解不是这样的,因为在2010年以前的新病毒目录里面,我们中国的贡献是零,没有中国人发现的新病毒。
我们发现的这些病毒,特别是一些非常重要的病毒,我的理解是,要体现出中华民族在这个学科的贡献,在这个领域里面能让别人记住——哦,原来这些病毒是中国人发现的。
我认为同一个病毒有可能在中国发现,也有可能在美国发现,只是谁最先发现的问题,命名只是一个符号。100年以后、200年以后,也许到时候会觉得,“哦,这个名字还不错”,让别人可以记住。
那这个楚病毒特殊在哪呢?这个树状图中都是负链RNA病毒,红色那一块,是包括流感病毒、沙粒病毒在内的分节段的病毒;另外绿色那一块,包括埃博拉病毒、狂犬病毒、麻疹病毒,这类病毒基因组都是不分节段的。
▲ (eLife,2015)
蓝色区域就是楚病毒的位置。原来所有负链RNA病毒它们没有办法连起来,而当楚病毒发现以后,就把它们连起来了,就像荆门病毒一样。
对楚病毒探索更多后,我们发现更奇特的是,楚病毒里面既有分节段的,又有不分节段的,无论是否分节段,病毒都呈现出了环状的基因组结构。
我可以告诉大家,在发现这个病毒之前,唯一一个被发现的环状RNA病毒是丁肝病毒,但它是一个不完整的病毒,只有和乙肝混合感染的时候才可以存在。而楚病毒是被发现的第一个可以自我复制的环状RNA病毒,它是一个完整的病毒。
在我们发现了楚病毒以后,世界上其他国家和地区也发现了这个病毒,包括在中国新疆,并且发现它可能也会引起人类疾病。它也是到目前为止全世界发现的病毒中基因组最复杂多样的。所以在国际舞台上,这个故事也非常被重视。
70种节肢动物就发现了100多种病毒,那么我们就想解决一个更大的问题了。动物在分类的过程中间可以分成两个大类,一类叫脊椎动物,包括哺乳动物、鸟类等;还有一类叫无脊椎动物,包括像蜱、蚊子这些节肢动物在内。
以前世界上主要是在研究鸟类和哺乳类动物携带的病毒,当然也有人研究蚊子,不过很少。然而世界上其实95%是无脊椎动物,所以我们就在想,如果可以把这一类动物的病毒研究得比较透彻,是不是可以对RNA病毒圈能有一个更为清晰的认识呢?
那我们就开始做这个事。我们又在全国很多江海湖泊,包括南海、钓鱼岛、黄海、东海这些地方,采样了200多种无脊椎动物,然后从中发现了1445种全新RNA病毒的存在。
楚病毒是用春秋战国命名的,于是我们又用“秦燕韩赵魏”命名了这些重要的病毒。我们可以看到这张图,就很有意思了。
灰色的部分是已知的病毒,红色的部分是我们发现的病毒。那么大家可以看出,一个是我们发现了很多病毒,同时,就像考古过程中间产生的断代一样,我们发现的这些重要病毒把这些空白点连接上了。
我们原来认为,不同的科属目之间,病毒是孤立的。然而当这些空白点被填上以后,呈现出它们在进化上是连续的。
这就牵扯到了病毒在整个生物学里面定位的问题。就像我们说所有的动物都有一个共同的祖先,那么动物可以分成一个生物域。但是如果整个病毒没有一个共同的祖先,大家就认为它可能起源得比较晚,甚至是从细胞退化来的东西。
所以我们这些工作,无形中对于认识病毒起到了很大的作用,甚至说改变了人们对病毒原有的一些认识。
除去无脊椎动物,我们也采样了很多特别低等的脊椎动物,从中又发现了200多种病毒。
有意思的是,这200多种病毒中有像埃博拉类病毒、沙粒类病毒、汉坦类病毒等,这些原来我们认为只有在哺乳动物里携带的病毒,在海洋鱼类中也发现了。虽然相似性差了一点,但是整个基因组在结构特征上完全一致。
这也就意味着,病毒的起源进化具有漫长的历史。生命起源于海洋,然后病毒不断向陆地扩散,随着它的宿主动物的改变,进一步去繁衍、去演化,形成现在的多样性。
前面证明了所有的RNA病毒是有一个共同祖先的,它们具有长期的进化历史。我们想解决的第三个问题是:无论动物、植物还是人,我们生活的土壤里、环境中有病毒吗?
抱着这个疑问,从2016年开始,我们在全国16个省区,包括黄岩岛,南海深海的底泥,中国的新疆、黑龙江等地方,当然也包括尤其重要的武汉,武汉市内及周边地区和浙江这些地方,我们都采样了大量的环境样本。
我们在这里面发现了大量已知的RNA病毒,同时又发现了2700多种全新的RNA病毒,它们分布在62个病毒科中。
我能多告诉大家一句话,在这里面我们并没有发现过新冠病毒,就是说在2019年以前,我们没有在中国包括武汉在内的环境里面、家养动物的粪便里面或者水里面发现过新冠病毒,中国在2019年以前是没有SARS-CoV-2的。当然这是一个敏感的话题,我这里不去做过多的解释。
这里面可以体现出另外一个东西,就是说在自然界中,病毒无处不在。包括陆地、水生环境中,它是整个大自然中不可或缺的一个组成部分,这些病毒绝大部分可能和疾病一点关系都没有,但却对整个生物圈的持续发展以及生态的平衡发挥非常重要的作用。
同时在我们人体的基因组里面,也有不少相似的病毒序列,它在整个生命过程中也许扮演的不是疾病的角色,反而对维持健康可能是非常有利的。所以我们要理解,相当一部分病毒是不致病的,和病之间是一个不等号的关系,病毒不等于病。
虽然我们已经发现了这么多病毒,但是就像我刚才讲的,自然界有100多万种节肢动物,如果一种节肢动物携带一种病毒的话,自然界病毒的数量至少就有100多万种。
如果一个细胞生物携带10种病毒的话,自然界整个生物圈里面,可能病毒的数量可以达到以亿级为单位。虽然中间大部分病毒不会致病,问题是也肯定会出现致病的病毒,那我们要怎么去理解,怎么去认识它?
到2022年8月为止,人类确认的病毒也只有10434种,我们对病毒的理解仍旧是不完整的,我们由此构建的病毒学知识体系仍然是有偏差的、碎片化的。我们做的这些工作也进一步证明了病毒是整个生命科学中间的暗物质。