广州市黄埔区学大道揽月路广州企业孵化器B座402
电话:020-85625352
手机:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
核内RBP控制染色体活性和基因的转录
日期:2020-03-04 标签:RBP
转录控制和染色质活性总体上涉及到调节性RNA招募特定的RNA结合蛋白(RBP)的作用。尽管其中涉及多个RBP,但仍不清楚RBP如何直接作用于染色质。作者进行大规模的RBP ChIP-seq分析,揭示了人类基因组中活跃的染色质区域中广泛存在的RBP。像转录因子(TFs)一样,RBP对基因组中的热点,尤其是基因启动子,也表现出强烈的偏好,因为它们的关联经常与转录输出相关。聚类揭示了TF和RBP之间广泛的关联,例如YY1(已知的RNA依赖性TF)和RBM25(参与剪接调控的RBP)。最后通过HI-C和CHIA-PET分析RBM25的消耗对所有YY1依赖的活性,包括染色质结合,DNA环化和转录。
图1.核RNA结合蛋白普遍存在于基因启动子中,许多通过与特定转录因子的功能相互作用直接参与转录。
1、 通过ChIP-Seq分析RBP-染色质互作特征:启动子是RBP结合的热点
为了广泛研究RBP在染色质水平上的潜在功能,作者根据其细胞核定位、先前的研究结果、结合结构域和功能类别等等条件,分别对HepG2和K562细胞中的58和45个RBP进行了系统的ChIP-seq分析,根据分析发现大部分的RBP表现出与染色质的广泛而特异性的相互作用(图1A)。在大多数情况下,RBP在HepG2和K562细胞中均表现出强结合力,结合ENCODE注释的染色质状态和DNase I超敏位点发现RBP偏爱开放的染色质区域,并且通常为CTCF结合位点和CpG岛,所有与染色质相关的RBP普遍偏爱基因启动子,而不同的RBP表现出对不同启动子的偏好,一些特定的启动子被多个RBP结合(图1B)。同时RBP-染色质互作倾向于与活性组蛋白修饰(例如,H3K27ac,H3K4me3和H3K36me3)呈正相关,而与抑制性H3K9me3标记负相关(图1C)。总体而言,在显示出可检测的染色质结合的RBP中30%–40%的具有生化活性的染色质区域至少与一个RBP结合(图1D)。
为了全面表征单个RBP的结合偏好,作者将每个RBP的ChIP-seq峰分配给了7个带有ENCODE注释的基因组片段,并评估了这些片段中每个RBP的峰的相对分布(图1E)。这些数据清楚地表明,活性启动子是RBP的热点。各个RBP对每种基因组分割类型的相对贡献如图1E相对气泡大小所示,相对于其他RBP,HNRNPK是阻遏区的主要RBP。相反,AGO2在HepG2细胞的转录区域富集。有趣的是,三个RBP XRCC5,HNRNPL和RBM25似乎比其他RBP更普遍地与启动子和增强子相连。
图2.染色质相关RBP的一般特征
(A)通过ChIP-seq在HepG2和K562细胞中调查的RBP概述。深蓝色,符合ENCODE标准的高质量数据;浅蓝色,ChIP-seq数据,符合所有其他ENCODE标准;灰色,IP后无信号富集,尽管通过蛋白质印迹检测到有效IP;白色,未经调查。
(B)一个典型的基因组区域,红色和橙色突出显示的ChromHMM片段分别对应于启动子和增强子。
(C)Circos图显示了集体RBP-染色质相互作用,DNase I超敏检测到的开放染色质区域和HepG2细胞中关键组蛋白修饰事件之间的关系。
(D)HepG2和K562细胞中与染色质相关的RBP覆盖单个组蛋白修饰事件,以及与至少一种生化活性相关的所有染色质区域的累积覆盖率(红线)。
(E)RBP在HepG2细胞中特定状态的ENCODE注释的基因组分段中的占有率。R,抑制区域; PF,启动子侧翼区; T,转录区; CTCF,CTCF结合位点; WE,弱效增强剂; E,增强剂; TSS,转录起始位点/启动子。
2、不同启动子类型上的RBP-染色体互作模式
启动子是RBP-染色质相互作用的主要位置,作者进一步研究单个RBP的启动子结合情况。发现RBP共同优先结合用H3K4me3和H3K27me3标记的二价启动子以及单独H3K4me3修饰的活性启动子和CpG,不同的是在HepG2细胞中,二价基因比仅H3K4me3基因更为普遍,在K562细胞中则相反(图2A),这表明染色质相关的RBP可能积极参与细胞类型特异性基因表达程序。关于在不同类别基因的启动子,相对于蛋白质编码和lncRNA基因的启动子,四个RBP(即RBM22,PRPF4,HNRNPUL1和SNRNP70)在小RNA基因的启动子上表现出额外的富集(图2B)。此外,PRPF4在tRNA基因启动子上高度富集,SNRNP70在小核仁RNA(snoRNA)基因启动子上高富集(图2C)。
图4D表示了RBP ChIP-seq峰相对于转录起始位点(TSS)的位置,尽管所有RBP在TSS的两侧均显示结合,但出现三类明显的RBP-染色质相互作用:(1)上游TSS(即RBM25),(2)以TSS为中心(即,GTF2F1)和(3)下游TSS(即RBFOX2),第三类代表两种细胞类型中的大多数RBP(图2D)。 GTF2F1以TSS为中心的结合模式很可能反映出其作为核心转录机制的一部分的功能,暗示具有类似关联模式的其他RBP可能具有相关功能。大多数RBP与TSS下游序列的关联表明,许多RBP可能以新生的RNA依赖性方式与染色质相互作用。
图3.不同启动子类别上的RBP-染色质互作模式
(A)通过序列背景(带有或不带有CpG岛)或组蛋白修饰特征(例如以H3K4me3和H3K27me3信号标记的二价启动子)分离的启动子亚组的总体RBP偏好性,仅包含H3K4me3或H3K27me3信号的启动子。正确:相对丰富的关键。
(B)在不同类别的基因启动子上各个RBP的相对占用频率。
(C)相对于背景分布,六类小RNA基因启动子之间的RBP ChIP-seq峰分布。
(D)TSS周围的复合RBP绑定信号。 RBP根据信号最大值与TSS的相对位置进行排序。
3、启动子相关的RBP在不同水平的基因表达中的作用
由于RBP与基因启动子的联系紧密,作者接下来通过检测每个RBP-启动子互作与基因转录之间的关系,通过RNA-seq比较了每个RBP敲除之前和之后基因表达的变化。在敲除之前,大多数RBP-启动子互作与靶基因的转录活性相关(图3A,左),在敲除后,几乎所有RBP都影响基因表达(图3A,中间),这些RBP中至少有六个对转录有直接影响(图3A,右)。为了确定诱导的基因表达是否与其启动子结合相关,作者进一步计算了每个RBP的优势比,这六个RBP均显示出明显的优势比(> 1,p <0.05),表明这些RBP直接参与转录控制(图3B)。另外,作者在GRO-seq和RNA-seq信号之间进行了比较,观察到在稳态下转录相对于RNA水平的总体变化的三种不同模式:对于HNRNPLL,在敲除后观察到RNA-seq和GRO-seq之间几乎没有一致性(图3C,顶部),表明该RBP可能独立调节转录和转录后事件。对于RBM25有正相关,表明RBM25介导的转录在稳态下可能有助于RNA水平(图3C,中间)。相反,检测到与XRCC5呈负相关(图3C,底部)。
由于启动子结合可能会指导下游RNA加工事件,例如RNA稳定性,输出或翻译。为此,作者进行HepG2细胞中的细胞分级测序(CeFra-seq)和RBP敲低诱导的剪接变化(通过“剪接百分比”或“ PSI),确定与RBP染色质结合活性相关的功能性。观察到mRNA的核保留与在基因启动子处检测到的RBP数量成反比(图3D),编码和非编码基因均是如此。另外还发现,不同的RBP对这种效果的贡献不同(图3E)。特别是,RBM25的启动子缔合活性最能预测核保留(图3F)。
图4. RBP-启动子相互作用与基因表达之间的相关性
(A)RBP与启动子结合的概率与GRO-seq鉴定的靶基因转录活性之间的相关性(左); RNA-seq(中),GRO-seq(右)对单个RBP敲低的反应。
(B)由GRO-seq确定的RBP占用的启动子与非占用启动子相比的转录反应的几率。
(C)敲低三个代表性RBP时,RNA-seq和GRO-seq分析的基因表达变化之间的比较。
(D)其启动子被不同的RBP占据的每组基因的RNA核保留指数(核/(核+胞质))的分布。
(E)由随机森林算法确定的变量重要性,以评估每个变量的预测能力,显示了前十个RBP。
(F)具有或不具有RBM25结合在其启动子上的证据的基因的RNA核保留分布
4、 人类基因组中RBP和TF的互作网络
为了了解RPB可能如何影响转录,RBP-染色质互作如何与特定的TF相互协调。作者将RBP ChIP-seq数据与TF的ChIP-seq数据进行了整合,并通过使用新开发的非负矩阵分解(NMF)方法分析了它们的共共结合。通过分析找到了17个最佳组号(图4A)。根据ENCODE注释,这些因子组中的每一个都显示出对不同基因组区域的特定偏好(图4B)。已知CTCF,RAD21和SMC3这3种蛋白在介导长距离基因组相互作用中相互协作,分析发现这些蛋白质都主要位于HepG2细胞中富含CTCF的基因组片段中(图4B),这与已知的一致。当前分析的RBP可以其中一组(第10组)仅由RBP组成(图4C),每组中的多个因素都在蛋白质水平上发生物理相互作用(图4C中的蓝色边缘)。通过根据人类基因组HOT区域中峰的比例对RBP进行排名并将其分为四个升四分位数,发现第4组中超过一半的RBP与各种TF一起排在了前四分位数中,包括PRPF4, SRSF4等(图4D)。因此,与TF一样,RBP也显示出对人类基因组中HOT区的高度偏好。
在互作网络分析中,TF YY1分为两个独立的联合组:第9组,包含多个TF和RBP NONO,是参与RNA加工,DNA修复和重组的多功能核蛋白;第13组,由YY1,XRCC5和RBM25(图4C)组成,已知前两者彼此互作。YY1基因组结合位点在HepG2细胞中也表现出RBM25结合(图4E,上图),鉴于最近发现YY1似乎以依赖RNA的方式与DNA相互作用,RBM25可能以细胞类型特异性方式在调节YY1的转录功能中发挥作用。为了探索这种可能性作者分别分析了RBM25和YY1结合图谱与TSS周围的YY1结合基序分布的关系(图4E,底部),观察到核心YY1结合基序在YY1和RBM25共结合的启动子区域富集或单独的YY1结合,但不是单独的RBM25结合,表明核心YY1结合基序介导YY1结合。
图5. HepG2细胞中与染色质相关的RBP和TF的综合分析
(A)通过NMF推断的系数矩阵将染色质相关的RBP和TF分为17组。
(B)由单个NMF组(左)覆盖和注释总的顺式调控元件(CRE,在图1E中定义)。未注释的区域。右侧显示了每个组所占的不同CRE的分数。
(C)代表NMF隔离的团体。蓝线,由GeneMANIA注释的每个组中成员之间的已知物理相作用。
(D)RBP与HOT区域的优先关联。基于RBP在HOT启动子区域中的相对结合,它们被分为四个四分位数(灰色系)。 y轴:落入HOT区域的总峰的百分比。
(E)顶部:Rep25,XRCC5和YY1在HepG2细胞中的共定位。韦恩图的每个部分被进一步量化为每个RBP的峰的百分比,基于此可计算出单独的成对共定位。下图:相对于YY1,RBM25和YY1结合峰的核心YY1结合基序的分布。
5、YY1和RBM25的转录功能集团
为了追踪RBM25在介导YY1依赖性转录中的潜在功能,作者首先验证了RNA依赖性YY1在染色质上的结合。我们从ENCODE数据中选择了多个在HepG2细胞中显示YY1结合峰的基因启动子,并用5,6dichloro-1-β-D-核呋喃糖基-苯并咪唑阻止转录然后对YY1和RBM25进行了ChIP-qPCR,在DRB处理后,所有靶基因座上的YY1和RBM25结合都减弱了,在DRB洗脱后恢复了(图5A,5B)。接下来通过coIP 实验验证YY1和RBM25形成复合物(图5C)。siRNA介导的YY1或RBM25耗竭对每种蛋白质的特异性敲除作用,但对非靶向蛋白质却没有作用(图5D)。细胞的GRO-seq分析结果显示出高度可重复的模式:在每种情况下均鉴定出大量上调或下调的基因,如图5E所示。GRO-seq信号的倍数变化(FC)之间的比较显示YY1和RBM25敲低诱导的基因表达之间存在一致性。由于每种因子的敲低都会导致大量基因的下调和上调,因此在通常受影响的基因中,绝大多数上调和下调的基因在相同方向上受到影响(图5G)。此外,RBM25或YY1敲低的基因上调和下调都与它们的启动子关联,如在所有成对比较中均具有很高的比值比(图5H)。
图6(A+B) YY1和RBM25在HepG2细胞(A和B)中对基因表达的共调控ChIP-qPCR分析了DRB处理后和DRB洗脱后结合在代表性靶基因启动子上的YY1(A)和RBM25(B)。
(C)RBM25和YY1的相互coIP。
(D)RBM25或YY1的有效敲低而不影响其他蛋白质。
(E)在两个代表性基因位点上的RBM25和YY1 ChIP-seq谱图,一个通过GRO-seq确定,一个用于上调(左)基因,一个用于下调(右)基因。
(F)对RBM25和YY1敲低的转录反应的整体比较。标明了倍数变化(FC)的斯皮尔曼相关系数(SCC)。
(G)在耗尽了RBM25或YY1的HepG2细胞中差异表达的基因的重叠。彩色框和线型分别表示由RBM25(实线)或YY1(虚线)调节的向上(红色框)或向下(蓝色框)基因表达事件。
(H)靶基因启动子处的RBM25和YY1结合与通过比值比确定的诱导基因表达正相关。
6、RBM25调节YY1介导的长距离基因组相互作用。
为了了解YY1和RBM25协调结合和调控转录的机制,首先在以YY1和RBM25为靶标的启动子的同一面板上进行ChIP-qPCR,发现RBM25敲低显着降低了所有六个靶基因上的YY1结合(图6A),但反之则没有(图6B)。这些结果表明RBM25首先作用于那些靶启动子,这是随后的YY1结合所必需的。为了获得对此的整体证据,作者分别在耗尽RBM25之前和之后对YY1进行了ChIP-seq,在耗尽YY1之前和之后对RBM25进行了ChIP-seq,大多数(即使不是全部)YY1结合事件在RBM25耗尽后减少,但是RBM25 ChIP-seq信号在YY1耗尽后基本上保持不变(图6C)。对启动子,增强子和CTCF结合位点上的RBM25 ChIP-seq信号的元基因分析表明,RBM25 ChIP-seq信号对YY1耗尽基本不敏感(图6D)。YY1 ChIP-seq信号在RBM25相关的基因组位点更为普遍,而RBM25的耗尽显着减弱了所有三类DNA元件上的YY1结合(图6E)。统计分析表明,与没有RBM25关联的证据相比,YY1结合中的FC对RBM25占据的基因组位点的影响更大(图6F)。这些数据表明,RBM25是在HepG2细胞中有效靶向全基因组的YY1所必需的。
那么RBM25如何调节此类YY1介导的基因组互作。作者在敲除RBM25之前和之后在HepG2细胞上进行了BL-Hi-C测序和双末端标签测序(ChIA- PET)。发现,RBM25敲减诱导的启动子锚定PET的整体变化略有减少(图6G),这可能反映了RBM25耗竭对转录的直接和间接影响。使用类似于然后在处理来自YY1缺失的mESC的HiChIP数据时的严格性,并着眼于显着差异的启动子-增强子相互作用的变化。发现,与启动子/增强子(PE)连接的PET在人类基因组中所有带注释的启动子之间在两个方向上都显示出相似的变化(图6H)。与共结合的启动子和增强子相比,单独与YY1结合的启动子和增强子显示出更弱的变化(图6H)。总体而言,这些数据通过调节YY1募集和YY1介导的基因组相互作用证明了RBM25在YY1依赖性转录中的作用。
图7.人类基因组中的RBM25依赖性YY1结合
(A和B)敲除其他因子后,YY1(A)和RBM25(B)与代表性靶基因启动子结合的ChIP-qPCR分析。
(C)具有代表性的基因组位点,显示下调的YY1结合(ChIP-seq)和YY1介导的染色质环化(BL-Hi-C),以及下(上)-/上(下)调控的基因表达数字:敲除RBM25时通过GRO-seq在个别条件下测得的表达水平。阴影区域突出显示了靶基因启动子(绿色)与其增强子(蓝色)之间相互作用的降低。
(D和E)RBM25(D)或YY1(E)启动子(左),增强子(中间)和CTCF结合位点(右)上ChIP-seq信号的有基因分析,有或没有YY1(D)或RBM25(E)绑定以及YY1(D)或RBM25(E)敲除之前(蓝色)或之后(红色)。
(F)RBM25耗竭对所有基因组位点上有或没有RBM25占用证据的YY1结合的影响的统计分析。
(G)使用所有带注释的启动子作为锚点,将RBM25敲低后归一化PETs频率的log2倍变化相对于对照样品中归一化PETs频率作图。突出显示了与YY1结合的启动子,其相互作用显着增加(红色)或减少(蓝色)。
(H)基因启动子分为四个不同的类别,并分别分析了在RBM25敲除之前和之后,它们与活性增强子的相互作用。归一化PET频率的log2倍变化的分布显示为箱线图(请参见“方法详细信息”)。 P,启动子; E,增强剂。核内RBP控制染色体活性和基因的转录