罕见突变是指最小等位基因频率小于1%的基因组DNA序列改变,包括单个碱基改变的点突变(如同义、错义和无义突变等)和长度小于1Kb的DNA片段的插入、缺失和重排等。其中无义、移码和剪切位点的突变由于可能会导致蛋白质截短、基因功能异常而被称为可能对基因有破坏性的突变。发生在编码区的突变可能造成氨基酸的改变,影响蛋白质的结构和功能,进而导致疾病的发生。位于非编码区的突变,尤其是位于启动子区、增强子区等重要功能位置的突变,可能通过调控基因的转录、剪切等过程造成基因表达异常,参与疾病的病理过程。
1.单基因检测
(1)Rett综合征
Rett综合征是一种严重影响儿童精神运动发育的疾病,属于神经发育障碍类疾病。患病率为1/15000-1/10000,主要见于女性,呈进行性智力下降和运动功能障碍,伴有孤独症表现,语言障碍,刻板行为,手脚失用,共济失调,严重影响儿童的健康生长发育。自1~3岁时起,表现为发育迅速倒退伴激惹现象,手的失用与刻板动作,惊厥,孤独症表现,语言丧失。2~10岁时起,持续数月至数年,表现为严重的智力倒退或明显的智力低下,孤独症表现改善。惊厥,典型的手的刻板动作,明显的共济失调,躯体失用,反射亢进,肢体僵硬。10岁以上,持续数年,表现为上、下运动神经元受累的体征,进行性脊柱侧凸,肌肉废用,肌体僵硬,双足萎缩,失去独立行走的能力,生长迟缓,不能理解和运用语言。大多数Rett综合征患者能存活到成年,但无法生活自理。
Rett综合征是由于基因突变所导致的,约 95% 的患儿由位于 X 染色体长臂上的甲基 CpG 结合蛋白 2 (methyl CpG binding protein 2, MECP2)基因突变所导致。MECP2基因在我们人体内广泛存在,主要在我们神经系统内进行表达,该基因调控中枢神经系统成熟及学习及记忆等功能具有重要作用,当MECP2发生基因突变功能丧失后,就会导致中枢神经系统成熟障碍,产生一系列中枢神经系统症状。Rett综合征并不全是由MECP2基因所引起,一些不典型或变异型的Rett与其他基因突变有关。
(2)脆性X综合征
脆性X染色体综合征是一种不完全外显性X连锁显性遗传病,其致病基因为FMR1,在神经细胞和睾丸精原细胞中高表达,具有选择性RNA结合功能。FMR1基因的5´非编码区第1外显子内含有CGG三核苷酸重复序列,CGG重复数目异常是导致本征主要原因(约为95%),患病男孩的CGG重复数超过200,而健康人的此CGG重复数在52以下。基因内的点突变或1~2个碱基的缺失也可导致本征发生(约<5%)。
既往多采用脆性X染色体分析进行检查。采用低叶酸、低胸苷的培养基加氟尿嘧啶脱氧核苷、甲氨蝶呤等药物可诱导X脆性部位表达,一般有3%~5%以上的细胞表达脆性X染色体为阳性。
目前主要采用CGG三联体重复序列DNA分析,应用聚合酶链反应扩增DNA片段,选择限制性内切酶,经凝胶电泳分析,确定重复序列长度进行诊断,可用于产前诊断和携带者的检测。由于脆性X智力低下基因(FMR1)5非翻译区遗传不稳定的(CGG)n三核苷酸重复序列,(CGG)n在正常人中约为8~50拷贝,而在正常男性传递者和女性携带者增多到52~200拷贝,同时相邻的CpG岛未被甲基化,称为前突变(premutation)。前突变者无或只有轻微症状。女性携带者的CGG区不稳定,在向后代传递过程中拷贝数逐代递增(即动态突变),以致在男性患者和脆性部位高表达的女性中,CGG重复数目达到200~1000拷贝,相邻的CpG岛也被甲基化,称为全突变(fullmutation)。几乎所有患者不表达或只有低表达FMR1 的mRNA,从而出现临床症状。
家系分析时,要特别注意本病前突变的传递方式。表型正常的男性传递者的前突变基因传递给女儿时,重复片段不变或减少,而无临床症状的前突变女性携带者在传递给下一代时,重复数目明显增加,后代可出现男性患者。通常前突变发生动态扩增为全突变的概率约80%,前突变的重复数目越多,女性配子减数分裂过程中动态扩增的可能性越大,即越容易产生全突变。这一规则在产前诊断和遗传咨询中非常重要。
(3)结节性硬化
结节性硬化症是一种常染色体显性遗传的神经皮肤综合征,发病率约为1/6000,男女之比为2:1。该病可出现脑、皮肤、周围神经、肾等多器官受累,典型临床表现为面部皮脂腺瘤、癫痫发作和智能减退、孤独症样表现。多于儿童期发病。
皮肤损害特征是口鼻三角区皮脂腺瘤,对称蝶形分布,呈淡红色或红褐色,为针尖至蚕豆大小的坚硬蜡样丘疹,按之稍褪色。90%在4岁前出现,随年龄增长而增大,很少累及上唇。神经系统损害如癫痫为本病的主要神经症状,发病率占70%~90%,早自婴幼儿期开始,发作形式多样。智能减退多进行性加重,伴有情绪不稳、行为幼稚、易冲动和思维紊乱等精神症状,智能减退者几乎都有癫痫发作,早发癫痫者易出现智能减退,癫痫发作伴高峰节律异常脑电图者常有严重的智能障碍,部分患者可表现为孤独症。还可出现其他器官损害,其中肾血管平滑肌脂肪瘤(AML)和肾囊肿是最常见的肾脏病变。47%~67%患者可出现心脏横纹肌瘤,该肿瘤一般在新生儿期最大,可引起心力衰竭,是本病婴儿期最重要的死亡原因,产前超声最早能在妊娠22周时发现肿瘤,提示患TSC的可能为50%。
头颅CT或MRI平扫可见室管膜下脑室边缘及大脑皮层表面多个结节状稍低或等密度病灶,部分结节可显示高密度钙化,为双侧多发性,增强扫描显示结节则更清楚。皮层和小脑的结节有确诊意义。
家族性病例约占三分之一,即由父母一方遗传而来突变的TSC1或TSC2基因;散发病例约占三分之二,即出生时患者携带新突变的TSC1或TSC2基因,并无家族成员患病。家族性患者TSC1突变较为多见,而散发性患者TSC2突变较常见。
2.全基因组/外显子组测序
基于高通量测序的靶向测序,全外显子组测序甚至全基因组测序在精神疾病的分子诊断上有很好的应用,有助于发现拷贝数变异(CNV)、突变及小片段的插入缺失。临床医生需要结合患者的临床症状及可能的突变类型来选择相应的检测技术,结合实验室分子诊断结果,识别疾病,以利后续治疗和病程管理。
目前,基于高通量测序的检测方法有三种:靶向捕获测序、外显组测序(WES)和全基因组测序(WGS)。WGS是对全基因组DNA序列进行测序,检测范围全面。人类基因组共有3 GB,WGS价格高且数据量极大,一般30 X的数据量在100 GB/样,难以分析处理。因此产生了捕获测序,通过探针将感兴趣的区域从基因组其他部分分离出来进行测序,这样可以极大的减少测序量从而降低成本,目前在临床分子诊断中应用较多的是靶向测序和WES。
靶向捕获测序是选择关注的区域设计特异性捕获方法,进而进行测序。基因组内的一些重复区域,高GC含量区是无法通过基于短片段高通量测序这样的技术检测出的。靶向测序探针是根据经验和文献设计的,捕获疾病相关基因;检测区域小,价格低,且分析简单。此外捕获测序对捕获的等位基因存在偏向性,当所捕获的区域存在与探针差异较大的突变时,可能会捕获欠佳而漏检。目前也有第三方检测公司都提供如智力障碍、癫痫的靶向测序检测,供临床选择,但靶向捕获测序只能测到探针区域基因,无法找出探针以外的新智障基因上的突变。
WES是对全部外显子组进行捕获,继而结合高通量测序方法,有助于发现影响编码氨基酸的突变,导致基因所编码的蛋白质发生异常,进而参与疾病的发生。全外显子组测序技术并非完美,虽然它能够检测“所有”编码区的突变、小的插入缺失以及CNV,但是基因组内的大部分非编码区未检测,并且也存在捕获偏向性,因此也存在也存在假阴性的问题。
全基因组测序是在提取基因组DNA后,随机打断,电泳回收所需长度的DNA片段(0.2~5KB),加上接头, 进行DNA簇(Cluster)制备,最后进行测序。然后对测得的序列组装、拼接,进而和参考基因组序列进行比对。组装效果与测序深度与覆盖度、测序质量等有关。全基因组测序可以检测编码区和非编码区的序列,有助于发现位于调控区的突变和小片段插入缺失。全基因组数据量巨大,对于数据分析能力和算法要求较高,尚未用于临床检测。随着数据分析能力的提升及测序价格的降低,WGS有助于发现更多突变位点及插入缺失,有望在今后的研究中进一步应用。
全外显子组测序和全基因组测序的结果均需要用传统Sanger测序法进行验证,检测到的突变位点和小片段插入缺失与疾病的关系,及其可能的致病机制尚需要进一步深入研究。