为了实现全基因组测序,研究团队使用Illumina NovaSeq 6000平台,为这49万名参与者生成了平均覆盖率为32.5倍深度的基因组数据,即每个碱基平均被检测到32次以上。在数据分析中,研究者使用了生物信息学平台DRAGEN,并发现相比于传统方法,该平台能够在更短时间内完成大规模基因组比对与变异检测,同时保持高精确度。例如,通过DRAGEN的分析工具,可靠结构变异的数量比使用旧版工具的数据集增加了约三倍。
在对764种疾病结局(ICD-10,国际疾病分类第十版)和71种定量性状的分析中,研究者发现了3万多个显著关联信号,其中近4千个只能通过全基因组测序检出。例如,FOXE3罕见移码突变显著增加白内障风险。此外,研究者发现了超过一万个常染色体基因存在功能缺失变异携带者,其中千余个基因甚至有多名纯合子个体。
进一步的全表型关联研究(PheWAS)表明,全基因组测序能检测到更多罕见变异携带者, 例如常染色体隐性多囊肾病相关基因PKHD1。而在罕见非编码区(UTR) 变异分析中,还发现了 63 条显著表型关联,其中与汉族人群肾结石风险相关的信号得到证实。