
伯豪生物出品
染色体上开放区域与对应转录因子或其他调控蛋白的结合直接影响细胞内基因复制和转录行为的发生。精确地在基因组上鉴定这些特定开放的DNA区域对于发掘基因组调控元件至关重要。失去了核小体保护的DNA序列,相比于缠绕在核小体上的DNA序列具有更高的活性,更容易被核酸酶、转座酶或物理化学手段切割或打断,形成长短不一的DNA片段。因此,目前研究染色质可及性主要通过酶解或者超声处理的方法对开放区域的DNA进行片段化处理。目前研究染色质可及性的方法主要有以下四种:MNase-seq、DNase-seq、FAIRE-seq和ATAC-seq,其中MNase-seq是通过对核小体保护的DNA测序,从而间接反映染色质可及性的方法,其他三种均为对检测染色质上的开放区域,直接反应染色质的可及性。

MNase-seq微球菌核酸酶(Micrococal nuclease, MNase)是来源于金黄色葡萄球菌分泌的一种核酸酶,同时具备核酸外切酶和内切酶活性。从上世纪70年代开始,MNase就被应用到染色质结构的研究中。MNase优先对裸露的DNA或核小体之间起连接作用的DNA进行切割和消化,在对DNA的两条链依次进行内切后,形成双链末端,并从末端向片段的中心位置逐个切下碱基对,直到遇到核小体或DNA结合蛋白等阻滞物。

在MNase-seq的建库实验中,细胞的染色质预先使用甲醛固定后,再用过量MNase处理,获得单个核小体组蛋白上缠绕的DNA,最后进行二代测序分析。标准的MNase-seq主要用于对核小体片段(~147bp)的测序,限制了核小体之外非组蛋白在DNA结合位点的分析[3]。总的来说MNase-seq是一种优秀的检测全基因组核小体分布和评估转录因子结合的方法,可用于多种类型的细胞。然而,如果要在不同实验中得到较好的可重复性和可比性,MNase-seq需要大量的细胞,并需要严格的酶解条件。DNase-seq脱氧核糖核酸酶I(DNase I)是一种核酸内切酶,被人的基因DNASE1编码,可以非特异性的对双链DNA进行切割。DNase I 敏感的位点在基因组学和染色质的研究中被认为是具有开放的,可接近的染色质的特征[4]。低浓度的DNase I可以切割基因组上非核小体占据的开放区域,这些区域被称为是DNase I敏感位点。鉴定DHSs的传统方法主要是末端标记的Southern Blotting, 包含多个费时费力的步骤。二代测序技术的出现,使得在全基因组上高效地,特异的鉴定DHSs成为可能。目前,DNase已经成为检测染色质可及性的“金标准”[4]。在ENCODE联盟中,DNase广泛的应用于细胞特异性染色质可及性分析及细胞染色质可及性与基因表达的关系研究中。DHSs中转录因子的结合也会阻止DNase对DNA的切割,从而可以在单碱基水平观察到转录因子的占据情况。由于DNase I 在切割DNA时具有一定的偏好性,DNase-seq用于转录因子印记检测的分析可靠性受到了一定的质疑。同时,实验的操作需要多步的样品准备和酶滴定。对于不同的细胞类型或者细胞用量,DNase的浓度也需要做出调整[2]。

总的来说,DNase-seq在确定基因组上活性的调控元件方面表现可靠、强大,不需要其他表观遗传研究的先验性信息。但对转录因子的印记分析的可靠性需要深入研究。FARIE-seq甲醛辅助的调控元件的分离(Formaldehyde-Assisted Isolation of Regulatory Elements, FAIRE)是一种直接检测无核小体占据的DNA序列的方法。 其原理是,缠绕有DNA的核小体和无核小体结合的DNA,在苯酚和氯仿中的溶解度不同。缠绕有DNA的核小体分布于两相交界处,而无核小体的DNA分布于亲水相中。在ENCODE工程中,FAIRE-seq被广泛的应用于鉴定人源的不同细胞系中活化的调控元件和用于比较正常细胞和疾病状态下的细胞中染色体的可及性差异。总的来说,FAIRE直接富集了活化染色质的区域,可直接应用于任何类型的细胞或组织,对细胞的起始状态无要求。此外,FAIRE克服了MNase和DNase I切割DNA的序列偏好性。但是,成功FAIRE-seq对于甲醛的固定效率具有很高的依赖性。FAIRE-seq相比于其他染色质可及性分析手段最主要的问题是信噪比过低,过高的背景信号对数据的分析解读产生非常大的干扰[5]。ATAC-seqATAC-seq(Assay for Transposase-Accessible Chromatin using sequencing)是2013年由美国的Stanford大学William Greenleaf开发的检测开放染色质的方法,主要依赖于Tn5转座酶对片段化DNA和整合入活化的调控区域的高敏感性。

转座子本质上是一段可移动的DNA片段,该片段在基因组中可不必借助于DNA同源系列就可移动。细菌转座子大概分为插入序列、可转移噬菌体复合转座子以及TnA转座子家族等不同类型。Tn5是一种最早在E.coli中发现的细菌转座子,是一段含有若干抗性基因和编码转座酶基因的DNA片段,属于复合转座子的一种。Tn5序列全长5,818bp,由编码博来霉素、链霉素和新霉素的核心序列以及两条倒置的IS50序列组成。两条倒置的IS50序列同源性很高。在IS50中,存在19bp的外末端OE和内末端IE两个倒置末端。研究发现,此倒置末端是转座过程中发挥重要作用转座酶的作用位点。右侧插入序列IS50R能够编码53kDa的Tn5转座酶,同时还可以编码一个48kDa的转座阻遏蛋白Inh。Tn5转座子是IS4家族的转座子,IS4家族划分为几个亚组,其中IS50所在亚组含有19种转座元件。Tn5转座酶识别DNA片段两侧19bp的ME(mosaic end)序列。转座事件发生时,两个转座酶(Tnp)分子结合到Tn5转座子的OE末端,形成两个Tnp-OE复合体,随后两个复合体通过Tnp的C末端相互作用进行联会,形成Tn5转座复合体,此时Tnp产生切割DNA的活性[7]。在ATAC-seq中,500~50,000个未固定的细胞核被Tn5转座酶标记上测序接头。由于核小体的空间位阻效应,Tn5转座酶携带测序接头主要插入整合到染色质的开放区域,经PCR扩增后,进行双端二代测序。ATAC-seq建库过程简单快捷,所需细胞数目少,而且可以在很高的分辨率下解释染色质结构。同时,建库过程也不包含任何的片段长度筛选,可以同时检测开放的DNA区域和被核小体占据的区域。据悉,我国伯豪生物自主研发的临床样本保存液完美实现样本处理后任何时间、从任何地点寄送至实验室;累计制备30余种组织类型的单细胞样本,细胞活力平均90%以上。


本文介绍了染色质可及性研究的四种主要方法:MNase-seq、DNase-seq、FAIRE-seq和ATAC-seq。MNase-seq通过检测核小体分布间接反映染色质状态,DNase-seq已成为检测染色质可及性的标准,FAIRE-seq直接富集活化染色质区域,而ATAC-seq利用Tn5转座酶高效检测开放染色质。每种方法都有其优缺点和适用场景。

2269

被折叠的 条评论
为什么被折叠?



