全基因组单核苷酸变异数据库建立
发布日期:2019-11-26
中国科学院上海营养与健康研究所/马普计算生物学研究所徐书华团队新近建立的全基因组单核苷酸变异数据库(PGG.SNV),收集了超过20万个基因组,涵盖了800多个现存人类族群和来源于古DNA研究的100多个已消亡人类族群,有助于更深入解析人类基因组变异的功能、表型效应,对我国及周边国家人群的进化遗传和医学研究具有重要价值。相关研究论文日前在线发表在国际学术刊物《基因组学与应用生物学》上。
徐书华团队通过全基因组深度测序技术,收集、整合公共人类基因组数据,获得2.5亿以上人类单核苷酸变异,进行了变异频率、基因多样性、群体分化、功能效应、进化保守性、自然选择信号、连锁不平衡等方面的解析和注释,对人类孟德尔遗传疾病关联变异的频率进行了分析。研究发现,7%的此前报道的罕见病风险变异在很多人群中处于高频状态,提示疾病分析中突变的稀有性不是确定该变异与疾病关联的金标准;孟德尔疾病突变在不同族群中频率存在差别,表明不同族群的遗传负荷存在差异。
研究中,科研人员还将PGG.SNV数据库与目前广泛使用的gnomAD数据库进行了比较,认为由西方学者主导的gnomAD数据库未能很好地代表人类族群的多样性。近一半的基因组来自西方人群,遗传多样性最高的非洲人群的基因组仅占9%,缺乏代表性亚洲人群的数据。尤其是当研究对象为特定的亚洲人群时,gnomAD数据库的实际应用价值有限。
(来源:健康报网)