
在做课题写机制、讲故事的环节,可能常常会卡在一个问题上,有些不在启动子区域的远端调控信号,到底管的是哪个基因?为什么有的突变/重排会让那个基因异常表达?线性基因组上隔着几十上百kb的两个位点,在细胞核里可能正好折叠到一起,Hi-C做的就是把这种空间上谁挨着谁的关系测出来,让我们可以把结构变化和功能结果接上线。
但是同样是Hi-C,为什么有人能发高分文章?差别往往不在测了多少数据,而在故事主线设计得好不好,一开始有没有想清楚故事怎么讲。Hi-C的数据本身只是一张谁和谁在空间上挨着的互作图。真正打动审稿人的是能不能把这张图和基因表达、表型、疾病串成一条因果链。下面一起把动物/医学方向最容易展开的四类课题,逐一拆成可以照搬的设计思路,快速梳理一下课题适不适合做Hi-C、该怎么设计。
一、一分钟看懂:Hi-C能看到什么
Hi-C把整个基因组在细胞核里的折叠方式拍成一张互作热图。从大到小,它能解析四个层级的结构:
-
染色体区域:细胞核内不同的染色体占据不同的空间区域,是染色质三维空间结构的最宏观划分,决定了染色体在细胞核内的空间分布。
-
A/B区室:染色质的活跃区(A)和沉默区(B)。一个基因从B区转到A区,往往伴随表达升高。
-
TAD(拓扑关联结构域):基因组的调控小区。TAD边界一旦被破坏,原本互不打扰的基因和增强子可能就串门了。
-
Loop(染色质环):把远端增强子和启动子拉到一起的那根绳子,是enhancer–promoter调控的直接证据。
Hi-C给结构变化,RNA-seq给功能结果,ATAC / H3K27ac给调控元件证据,三者连起来,机制故事才立得住。

图 染色质三维层级结构示意图(Matharu et al, 2015)。
二、哪些课题最适合上Hi-C
下面这些场景在动物和医学方向中最常见。

三、怎么设计方案
如果只是染色体级基因组组装,一个Hi-C样本就可能足够。但在动物/医学调控机制研究中,单做Hi-C往往只能说明结构有变化,很难证明这种变化与基因表达、调控元件或疾病表型有关。因此调控类课题更推荐按照研究问题—样本分组—结构尺度—配套组学—验证方式的顺序设计。
01
先确认:最想看到哪一层结构?
-
只想看大尺度活跃/抑制染色质区域:重点关注A/B compartment。
-
想看局部调控域是否被重塑:重点关注TAD、TAD boundary、insulation score。
-
想看远端增强子是否连接目标基因:重点关注loop、E-P interaction,但普通Hi-C往往需要更高深度,可以考虑用升级技术。
-
想研究肿瘤结构变异:需要把WGS/long-read/SNP-array的SV breakpoints与Hi-C/HiChIP异常互作叠加分析。
02
样本设计
-
发育/分化类:建议覆盖3–5个关键阶段,越能体现动态变化,文章逻辑越清楚。
-
疾病/处理类:建议至少包含对照组和疾病/处理组;如果条件允许,可增加时间梯度、恢复组或治疗组。
-
因子扰动类:必须有明确扰动材料,如WT vs KO/敲低/降解/突变/过表达。
-
差异/动态分析建议每组至少2次生物学重复;RNA-seq通常建议样本数更充分。
03
配套组学


图 Hi-C workflow/overview流程图(Prakrutiuday, Wikimedia Commons, CC BY-SA 4.0)。
四、最容易展开的4条文章主线
下面几种思路是更容易和现有RNA-seq、ATAC-seq、ChIP-seq数据衔接的Hi-C应用范式。
01 课题一 结构变异/癌症重排:增强子劫持的经典叙事
这是医学方向最容易出彩、审稿人最买账的一类。核心问题是基因组里那个易位、缺失或复杂重排,为什么会让某个癌基因突然高表达?
故事主线
增强子劫持(Enhancer Hijacking)
1 结构变异(易位/缺失/倒位)改变了线性基因组
↓
2 破坏了原有的TAD边界,或者产生了全新的互作(neo-loop)
↓
3 一个原本够不着的远端强增强子,被劫持来驱动目标癌基因
↓
4 癌基因异常高表达
↓
5 推动肿瘤发生/进展/耐药——落到表型和临床意义
方案怎么设计

范式参考
Nature Communications一项研究用H3K27ac HiChIP分析了34个癌细胞系,系统识别增强子来源,发现多个细胞系存在跨染色体的增强子劫持,并锁定了MYC、NOTCH1、CCND1、ETV1等癌基因相关事件。这类一个结构变异 → 一个癌基因被激活的清晰因果,正是高分文章的标配叙事(Perlman et al, 2024)。
02 课题二 找远端调控元件:把GWAS/ATAC信号落到靶基因
比如GWAS找到一个非编码区风险位点,ATAC标出一片开放染色质,H3K27ac圈了几个增强子,但它们到底调控哪个基因?线性距离上最近的基因,往往并不是真正的靶基因。Hi-C类技术就是用来回答这个问题的。
故事主线
远端调控元件 → 靶基因
1 已有信号:GWAS风险位点/ATAC开放区/ H3K27ac增强子,但靶基因未知
↓
2 用 Hi-C/Micro-C/HiChIP/Capture-C看这个位点在空间上和谁互作
↓
3 一条enhancer–promoter loop把调控元件和某个远端基因连起来
↓
4 RNA-seq证实:扰动这个元件,靶基因表达随之改变
↓
5 CRISPR删除增强子 / 双荧光报告,做功能验证,坐实因果
方案怎么设计

03 课题三 发育/分化/疾病进程:动态重塑的图谱叙事
研究胚胎发育、干细胞分化、免疫细胞活化、肿瘤进展……这类课题的魅力在于动态:基因表达在不同阶段此起彼伏,而背后是三维结构在悄悄重塑。
故事主线
阶段特异表达 ← 三维结构重塑
1 在不同阶段/状态取样,发现一批阶段特异表达的关键基因
↓
2 比较各阶段的Hi-C,发现伴随出现A/B 区室转换、TAD边界重塑、loop变化
↓
3 把结构变化和表达变化在时间轴上对齐
↓
4 锁定关键基因/调控元件,讲清结构如何驱动命运决定
方案怎么设计
(1)覆盖足够的阶段。发育/分化建议取3–5个关键阶段,让结构变化形成趋势。
(2)绑定RNA-seq。每个阶段的Hi-C都要配RNA-seq,结构和表达一一对应才能讲因果。
(3)加一层调控证据。强烈建议加ATAC-seq或H3K27ac,补上调控元件这一环,故事更完整。
——故事模板:随着(发育/分化/疾病进展),某关键基因表达逐步升高,且伴随它从B区室转入A区室/新的enhancer–promoter loop形成 /所在TAD边界重塑,三维结构重塑是其表达激活的基础。
04 课题四 调控因子扰动:直接证明是谁在塑造结构
某个转录因子 / 结构蛋白,到底是不是三维结构的塑造者?
故事主线
扰动因子 → 结构改变 → 表达改变
1 准备扰动材料:野生型vs敲除/敲低/降解/突变
↓
2 做Hi-C/Micro-C,看TAD、loop、E-P互作是否塌陷或改变
↓
3 配RNA-seq看哪些基因的表达随之改变
↓
4 用ChIP-seq/CUT&Tag看该因子的结合位点与结构变化是否吻合
↓
5 回答:它主要塑造哪一层结构(区室/TAD/loop)
方案怎么设计
(1)必须有扰动材料。没有WT vs扰动的对比,就只能猜而不能证。
(2)精细互作优先Micro-C。研究CTCF、cohesin等对精细loop / E-P互作的影响时,普通Hi-C捕获能力有限,Micro-C更合适。
范式参考
Nature Genetics一项研究用高分辨率Micro-C,在细胞中急性降解CTCF、cohesin、WAPL、YY1,发现结构性loop和TAD被显著扰动,但多数enhancer–promoter互作和转录在短时间内仍维持,说明不同结构层级由不同因子主导。这种拆掉一个零件看哪里塌的设计,是机制研究的范本(Hsieh et al, 2021)。
参考文献
[1] Perlman B S, Burget N, Zhou Y, et al. Enhancer-promoter hubs organize transcriptional networks promoting oncogenesis and drug resistance[J]. Nature communications, 2024, 15(1): 8070.
[2] Hsieh T H S, Cattoglio C, Slobodyanyuk E, et al. Enhancer–promoter interactions and transcription are largely maintained upon acute loss of CTCF, cohesin, WAPL or YY1[J]. Nature genetics, 2022, 54(12): 1919-1932.
[3] Matharu N, Ahituv N. Minor loops in major folds: enhancer–promoter looping, chromatin restructuring, and their association with transcriptional regulation and disease[J]. PLoS genetics, 2015, 11(12): e1005640.

538

被折叠的 条评论
为什么被折叠?



