热点新闻
深度分析 2999 名中国人基因,中科院发布“女娲”数据集:中国人专属,填补国际研究空白
admin2021-11-29 05:37
293人已围观
简介深度分析 2999 名中国人基因,中科院发布“女娲”数据集:中国人专属,填补国际研究空白
11 月 28 日消息,遗传变异图谱是研究人群演化史、医学遗传学、基因型-表型关联的基础。此前,大多数全基因组测序相关研究主要集中在欧洲血统人群。已有研究表明,罕见和低频的变异往往特定于人群或样本,尤其是与疾病相关的变异。针对特定人群的基因组数据可以为全基因组关联研究、区域适应性研究、用药指导等提供更准确的参考。
据中科院生物物理所消息,单倍型参考面板可基于大型人群队列中已知的单倍型信息,对来源于相对稀疏的基因变异芯片或低覆盖率测序样本中缺失的基因型进行推演,是促进全基因组关联研究 (genome-wide association study, GWAS) 有意义且具有成本效益的方法。此前缺乏中国人群特异的参考面板,其他参考面板对中国人群特异的变异推演效果较差,从而导致 GWAS 中遗漏潜在的表型相关变异。
中国人群全基因组测序资源和单倍型参考面板的缺乏阻碍了世界上最大人群的遗传学与精准医学研究。为此,中国科学院院士、中科院生物物理研究所研究员徐涛团队,研究员何顺民团队合作,在 Cell Reports 上在线发表了题为 NyuWa Genome Resource: A Deep Whole Genome Sequencing-Based Variation Profile and Reference Panel for the Chinese Population 的文章,介绍该团队关于 "女娲"(NyuWa)中国人群基因组资源库的工作,提供针对中国人群的遗传变异图谱与参考面板基因型推演服务,旨在促进中国人群的遗传学与医学研究。
研究团队分析了 2,999 个中国人的全基因组深度测序数据(26.2X),并以“女娲(NyuWa)”命名。基于 NyuWa 数据资源,研究构建了包含 7106 万 SNPs 和 819 万 InDels 的中国人群遗传变异图谱(图 1),并对其进行全面注释。
▲ 图 1.NyuWa 全基因组测序资源的变异数量
相比其它人群队列,NyuWa 数据集包含 2501 万新变异,其中包括 14.9 万非同义变异、10.1 万有害变异、11493 个编码和非编码基因的功能丧失变异、636 个癌症相关基因的蛋白截短变异。大量新变异表明,在以往遗传研究中,中国人群的变异代表性不足,NyuWa 基因组资源则填补了这一空缺。此外,根据临床相关数据库的注释,研究在 NyuWa 中发现了 1,140 个致病变异,以及药物基因组学相关位点(图 2A)和癌症风险位点(图 2B)上中国人群与世界其他人群的变异频率差异。这些发现有助于中国人群精准医学研究,可能促进新的遗传学和医学进展。
▲ 图 2.NyuWa 中的药物基因组学位点(A)与癌症风险基因座(B)变异
为汉族人群构建一个完整的、大队列的、高质量的参考面板,对汉族的遗传学与医学研究具有参考价值。基于 NyuWa 数据资源,科研人员构建了包含 5804 个单倍型和 1926 万变异的单倍型参考面板,其中 325 万变异未包含在其它参考面板中,这些 NyuWa 参考面板特有变异可能会在未来关联研究中带来新发现,是首个数千人级别公开可用的中国人群特异的单倍型参考面板。
为评估 NyuWa 参考面板的基因型推演性能,科研人员使用来自人类基因组多样性计划(the Human Genome Diversity Project, HGDP)的亚洲各个人群芯片基因分型数据和高覆盖率 WGS 数据作为测试数据集。与其他参考面板相比,NyuWa 参考面板将汉族人群基因型推演的错误率降低了 30%-51%,在大多数其他东亚和东北亚人群中也有优异表现(图 3A-D)。研究进一步比较了不同等位基因频率的推算结果和实际基因型之间的相关性,NyuWa 参考面板性能在汉族的所有等位基因频率区间中均具有绝对优势(图 3E)。
▲ 图 3.NyuWa 参考面板对汉族基因型推演具有最佳性能
此外,NyuWa 参考面板与千人基因组 (1KGP3) 面板的结合进一步提高了亚洲人群的基因型推演效果。考虑到南北方汉族遗传差异,科研人员将 NyuWa 参考面板中的样本分为北方和南方子集,使用子集样本分别构建北方和南方汉族的参考面板,通过基因型推演的模拟测试,证明以 NyuWa 的人群规模,一个南北整合的参考面板对中国北方人和南方人均适用(图 4)。
▲ 图 4.南北方汉族测试数据集的基因型推演错误率
综上,基于中国人群的大型队列深度 WGS 数据,研究构建了中国人群的遗传变异图谱和首个数千人级别公开可用的中国人群单倍型参考面板,将所有结果整合为中国人群基因组资源库 NyuWa(图 5),有助于中国和亚洲人群的遗传学和精准医学研究。
▲ 图 5.NyuWa 资源库
了解到,当前有关医学基因组学的知识和指南主要来自以欧洲人群为主的遗传和基因组资源,可能遗漏有关非欧洲人群的遗传信息。亚洲人群起源、迁徙和融合历史悠久而复杂,使得其遗传多样性研究面临挑战和机遇。针对中国人群的全基因组测序工作,对于扩充世界人群遗传资源多样性、提高中国人群医学研究准确性十分必要,有助于深入了解亚洲人群结构与人群历史,并对寻找复杂疾病遗传因素的研究设计以及人口健康指导具有参考价值。

微信公众号
很赞哦!(0)
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们

点击排行

标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著