汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠( 二 )


下图是与 TOPMed、gnomAD、dbSNP 和 1KGP 数据库相比 , ChinaMAP 中识别出的已知和新型 SNP 的数目和等位基因频谱 。
汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠
本文插图

汉族可分成 7 个亚群
该研究表明 , 汉族人群可分成 7 个亚群 , 不同地域的变异特征与人口迁徙相关 。
如下图所示 , 汉族人群可分成 7 个亚群:北方汉族(北京、天津、河南、河北、山东、辽宁、吉林、黑龙江、山西) , 西北汉族(甘肃、陕西) , 东部汉族(江苏、浙江、上海、安徽) , 中部汉族(湖北) , 南方汉族(贵州、四川、重庆、湖南、云南、江西) , 东南汉族(福建)和岭南汉族(广东、广西) 。
汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠
本文插图

另一方面 , 藏族、彝族、蒙古族、苗族、壮族有独特的人群聚类 , 满族和北方汉族相近 , 回族和西北、北方汉族相近 。
值得一提的是 , 不同地域的变异特征与历史上的人口迁徙相关 。 例如 , 西北地区(甘肃省)河西走廊地区是丝绸之路、古代人口迁徙的重要地区 , 因此有更多的个体变异特征 。
少数民族(藏族 , 蒙古族和回族)的平均个体变异水平高于平均 , 而苗族个体的变异水平总体下降 。
不难看出 , 基因组分析揭示了地理区域中多民族人口的遗传特征及其多样性、复杂性 。
日本与中国北方汉族人群聚类完全重叠
就遗传特征而言 , 中国人与非洲差距最大 , 日本与中国北方汉族人群聚类完全重叠 。
如下图所示 , 中国人的遗传特征与欧洲、非洲、南亚、拉丁美洲人口之间存在着巨大的差异 。 Fst 取值范围为[0,1] , 最大值 1 表示完全分化;最小值 0 意味着不同地方群体遗传结构完全一致 , 没有分化 。
汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠
本文插图

其中 , 非洲人口和中国人口显示出最大的遗传距离(MSL , 塞拉利昂 , Fst = 0.15; ESN , 尼日利亚 , Fst = 0.15; YRI , 尼日利亚 , Fst = 0.149) 。
同为东亚血统的中国、日本、越南人口的遗传特征非常相似(JPT , 日本 , Fst = 0.007;KHV , 越南 , Fst = 0.005) 。
汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠
本文插图

另外 , 研究者在成分分析中发现 , 日本人群与中国北方汉族人群聚类完全重叠(日本为红点部分) 。
汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠
本文插图

可见 , 研究成果提供了汉族和少数民族的精确遗传结构 , 揭示了中国人口的基因组多样性和分布 。
中国人得糖尿病和肥胖的风险不同于欧美
研究人员进行了多基因风险评分(PRS) , 包括个体遗传风险估计、点单变体关联分析和稀有变体关联分析序列内核关联检验(SKAT) 。
实际上 , 2 型糖尿病和肥胖都是很常见的代谢性疾病 , 因此团队也对二者进行了多基因风险评分 。
在对 2 型糖尿病进行的多基因风险评分中 , 研究团队将评分、年龄和血糖值以三维的形式进行显示 。
汉族最大规模!中国人基因库研究首发,日本与中国北方汉族人群聚类完全重叠
本文插图

多基因风险评分表明 , 2 型糖尿病高风险和低风险的个体之间存在非常显著的血糖差异 , 高风险个体随着年龄的增长 , 空腹(FBG)和餐后 2 小时血糖(2h-PBG)都显著高于中风险和低风险者 。
而在对体重指数 BMI 进行的分析中 , 研究团队发现了东亚人的特异性 CADM2 基因位点 。
雷锋网了解到 , CADM2 此前经动物研究证实可参与调节体重和能量稳态 。


推荐阅读