Keywords: 嵌合现象, 精子嵌合变异, 等位基因比例, 新发变异, 综述
Genomic mosaicism arising from mosaic variants is a phenomenon that describes the presence of a cell or cell populations with different genome compositions from the germline cells of an individual. It comprises all types of genetic variants. A large proportion of childhood genetic disorders are defined as being de novo, meaning that the disease-causing mutations are only detected in the proband, not in any of the parents. Population studies show that 80% of the de novo mutations arise from the paternal haplotype, that is, from paternal sperm mosaicism. This review provides a summary of the types and detection strategies of sperm mosaicism. In addition, it provides discussions on how recent studies demonstrated that genomic mosaic mutations in parents, especially those in the paternal sperms, could be inherited by the offspring and cause childhood disorders. According to the previous findings of the author's research team, sperm mosaicism derived from early embryogenesis and primordial germ cell stages can explain 5% to 20% of the de novo mutations related to clinical phenotypes and can serve as an important predictor of both rare and complex disorders. Sperm mosaicism shows great potential for clinical genetic diagnosis and consultations. Based on the published literature, the author suggests that, large-scale screening for de novo sperm mosaic mutations and population-based genetic screening should be conducted in future studies, which will greatly enhance the risk assessment in the offspring and effectively improve the genetic health at the population level. Implementation of direct sperm detection for de novo mutations will significantly increase the efficiency of the stratification of patient cohorts and improve recurrence risk assessment for future births. Future research in the field should be focused on the impact of environmental and lifestyle factors on the health of the offspring through sperms and their modeling of mutation signatures. In addition, targeted in vitro modeling of sperm mutations will also be a promising direction.
Keywords: Mosaicism, Sperm mosaicism, Allelic fraction, de novo variant, Review
1. 精子嵌合变异与后代新生变异的关系
嵌合现象指同一个体不同细胞群体、不同组织和器官表现不同的差异[1],这些差异长期以来便被不同研究者报道,被认为由遗传或表观遗传因素决定[2-3]。遗传嵌合现象按照个体内的嵌合细胞是否来源于同一受精卵可分为同源嵌合(mosaicism)和异源嵌合(chimerism)[4],如无特殊说明,本文所述的精子嵌合主要指同源嵌合现象。导致嵌合现象的遗传变异被称为嵌合变异(mosaic variants)。嵌合变异在类型上包含单核苷酸变异[5]、插入缺失[6]等影响少数核苷酸序列的变异和结构变异[7]、拷贝数目变异[8]、转座原件[9]、染色体变异[10]等影响大量核苷酸和基因组片段的变异。
新生或新发(de novo)变异指通过常规临床检测方法,在父母中未发现有遗传性变异(germline variant)但能在后代中检测出的变异[11-12]。新发变异是很多人类遗传疾病的遗传病因,例如Marfan综合征(先天性中胚层发育不良)[13],Alport综合征(遗传性肾炎)[14],结节性硬化症[15],Dravet综合征(婴儿严重肌阵挛性癫痫)[16]等孟德尔疾病和智力障碍[17]、孤独症谱系障碍[18]、先天性心脏病[19]等复杂疾病。新发变异与人类遗传学上传统认知的杂合和纯合变异不同,被认为主要存在于配子或在胚胎发生时产生[20]。笔者等最近提出,理论上所有物种的新生遗传变异最初都以嵌合变异的形式出现,这些变异是物种演化的重要驱动力[21]。
随着高通量测序以及其他检测手段的普及[22],大规模人类家系基因组和遗传分析发现子代中高达80%的新生单碱基变异和短插入缺失变异来源于父方的染色单体[23],并且变异数量与父亲生育时年龄呈显著正相关[24-26]。作为男性唯一能够传递给后代的遗传物质[27],精子被认为是新生变异的主要来源[28], 虽然有学者认为母方的修复也可能是此现象的来源[29]。很多新生变异未在双亲体细胞样本中检测到[30],因此精子嵌合变异理应是这些致病新生变异最主要的来源[21]。
2. 按发生时间分类的精子嵌合变异
表 1. Sperm mosaic variant categorized by the time of origin.
Sperm mosaic variant categorized by the time of origin
Time of variant | Detectable tissue | Age-related | Natural selection |
Prezygotic | Sperm and soma | No | No |
Early embryonic | Sperm and soma | No | No |
SSC development | Sperm and germline cells |
Partially related | Yes |
Sperm formation and storage |
Sperm | Yes | Yes |
2.1. 来源于合子生成前的精子嵌合变异
虽然已有研究报道嵌合现象主要发生在受精之后,但仍有少数的研究表明在特定组织中有嵌合变异发生在合子生成前[31-32],笔者等提出自然选择和回复变异可以导致相应变异存在于包括大量精子群体在内的特定组织或不同的体细胞、生殖细胞中[31, 33]。
2.2. 来源于极早期胚胎发育的精子嵌合变异
胚胎干细胞在原始生殖细胞决定前产生的嵌合变异最终会同时存在于精子和体细胞中[21]。当携带变异的细胞在各个组织中比例足够高时,常规外周血检测即可检测出,对多胚层来源组织的检测如果均发现嵌合变异,则精子中就有可能存在这些变异[34]。笔者在小范围人群利用全基因组直接检测结果表明,这些变异不会随年龄增长而增多[30, 35]。
2.3. 来源于原始生殖细胞发育时期的精子嵌合变异
原始生殖腺细胞(PGC)及其母细胞、精原干细胞(SSC)、或精原细胞在原始生殖细胞决定后产生的变异,因最初的原始生殖细胞数目较少,虽然仍存在较高比例可检测出的嵌合变异,但不能在除精子外的其他样本中检测到。我们的前期研究证实了早期原始生殖细胞数目至少为6个,在精子中嵌合变异比例可高达15%[35]。随干细胞所产生的子代细胞逐渐减少,这些变异影响的精子数目呈指数下降,或受到选择作用因而比例上升[36],这些变异中的一部分会因年龄增长或环境暴露、生活 习惯而增加[25, 37]。
2.4. 来源于精子形成和储存过程中产生的精子嵌合变异
3. 精子嵌合变异的检测
对于源于单个精子的单条DNA分子,可以使用双链校正的分子标记法[61]或者单链重复校正的单分子测序法[62]进行单分子层面的变异检测,其检测灵敏度接近理论极限(每单倍体基因组错误率1/1010 ~ 1/109),但每条分子需要额外测序量进行校正[40]。
4. 利用精子嵌合变异追溯遗传变异来源
大量研究报道表明,当一个家庭中两名或以上后代携带相同的COL1A2[63]、HUMARA[64]、ACTN4[65]、CHD7[66]、NOD2[67]、NFIX[68]等上百个基因上的新生变异时,这些变异大概率来源于父方染色体,即来源于精子嵌合变异。本研究组和其他研究者在多种不同的疾病中发现,多达5%~20%的临床表型相关的新生变异可在父亲的精子中检测为嵌合变异,其中多数是极早期胚胎发育期产生的变异[33-34, 69-80],变异等位基因所占比例可高达40%。此比例远高于这些疾病在人群中的随机发病率,显示出精子嵌合变异对人群中变异来源的追溯能力和对人群的分层效应。
针对复杂疾病的特定单基因亚型如孤独症,本研究团队发现高达20%的新生变异可能源于可检测的早期胚胎发育或生殖干细胞来源的精子嵌合变异[30]。我们建立的首个非癌症嵌合变异数据库提示,理论上,所有可以由新生变异导致的疾病中都有一定比例来源于精子嵌合变异[81],目前已经有一些大规模研究在不同人群中针对不同变异研究其来源于双亲嵌合变异的比例[49, 82-83],其中大部分来源于精子嵌合变异。对精子嵌合变异的定量和建模有助于理解导致人类疾病变异变的分布模式,推进遗传诊断的进步[28, 84]。
5. 利用精子嵌合变异预测再发风险
再发风险指同样的(疾病)患儿表型在健康父母家系中再次出现的比例,例如,对于常染色体隐性遗传病,假设外显率100%,家系中出现一位先证者后,家系内再发风险为25%(50%×50%)[85]。基于临床的大规模经验的数据表明,在携带新生变异的患儿家庭中约有1%~2%的再发风险[76, 86-88]。但在上述父亲精子嵌合变异导致新生变异的家系中,家庭内的变异再发风险由变异等位基因所占的比例决定,我们的研究发现该比例可能会远远大于1%[30, 34],变异可能产生于极早期胚胎干细胞或原始生殖干细胞中[35]。
我们的前期研究表明大部分精子嵌合变异为中性变异[35],但如果这些干细胞类群中获得了一些特殊类型的受正选择的变异〔如RAS-MAPK通路相关疾病(RASopathies)变异[89]〕,会形成增殖优势,进而增加携带这些变异的精子的比例,在人群水平导致变异携带者的睾丸癌患病率升高[90]、后代先天性肿瘤或相关疾病患病率增加[91],称为精原选择/自私选择[37]。目前国际上已经有一些在人群中通过精子嵌合变异研究新生变异再发风险的报道[86] ,为临床检测和遗传咨询提供了新的思路。
6. 精子嵌合变异的非直接遗传影响
7. 讨论与展望
* * *
利益冲突 作者声明不存在利益冲突
Declaration of Conflicting Interests The author declares no competing interests.
