H3K27ac:与染色质开放和基因表达相关的组蛋白修饰 (h3k27ac)

引言
组蛋白修饰是一种表观遗传调控机制,它通过改变组蛋白的化学结构来调节基因表达和染色质结构。H3K27ac是组蛋白H3上的赖氨酸27位点发生的乙酰化修饰,它广泛存在于真核生物中,并且与一系列重要的生物学过程相关。
H3K27ac与染色质开放
H3K27ac是一种表征染色质开放性的标志。它通常富集在启动子区域和增强子区域,这些区域是基因转录的起始位点和调节位点。H3K27ac可以吸引多种染色质重塑因子和转录因子,从而促进染色质开放,使其更易于转录因子和其他转录机器的结合。
H3K27ac的乙酰化通常是由乙酰化转移酶(HATs)催化的。已知参与H3K27ac修饰的HATs包括CBP、p300和PCAF。这些HATs在激活的启动子和增强子区域中具有高活性,从而导致H3K27ac的积累和染色质开放。
H3K27ac与基因表达
H3K27ac与基因表达密切相关。它通常与活性基因的启动子和增强子区域相关,并且与转录水平的增加相关。H3K27ac可以促进转录起始复合物的组装和RNA聚合酶II的招募,从而促进基因转录。
一些研究表明,H3K27ac修饰可以调控基因表达的时空特异性。例如,在分化过程中,H3K27ac在某些基因的启动子区域中获得,从而启动这些基因的转录并建立特定的细胞命运。
H3K27ac的调节
H3K27ac的修饰受到各种机制的严格调节。除了HATs之外,组蛋白去乙酰化酶(HDACs)也可以介导H3K27ac的去乙酰化,从而关闭染色质并抑制基因表达。H3K27ac修饰的调节对于维持染色质结构和基因表达的动态平衡至关重要。
H3K27ac修饰的定位也受到转录因子和非编码RNA的调控。某些转录因子可以招募HATs或HDACs到特定基因区域,从而影响H3K27ac的修饰水平和基因表达活性。
在疾病中的作用
H3K27ac修饰的变化与多种疾病相关,包括癌症、神经退行性疾病和发育障碍。在癌症中,异常的H3K27ac修饰模式已与肿瘤抑制基因的沉默和致癌基因的激活有关。
在神经退行性疾病中,H3K27ac修饰的丧失与认知功能下降有关。例如,在阿尔茨海默病中,H3K27ac在记忆相关基因的启动子区域中减少,导致这些基因表达降低和记忆障碍。
结论
H3K27ac是一种重要的组蛋白修饰,与染色质开放、基因表达和生物学功能的广泛方面相关。对H3K27ac修饰的调控机制和在疾病中的作用的持续研究将有助于我们理解基因调控和治疗相关疾病的复杂性。
iSTARR-seq
iSTARR-seq是南方科技大学牛见龙博士于2020年10月21在bioRxiv上发表的文章中提出的一种STARR-seq的改进方法。
南方科技大学牛见龙博士于2020年10月21在bioRxiv上发表的文章中指出:STARR-seq在拟南芥(a . thaliana)细胞中存在严重的系统错误,大量的自转录本(STs)在逆转录过程中丢失,因为这些STs在检测序列时被选择性聚腺苷酸化位点alternative polyadenylation site (APAS)聚腺苷酸化。作者利用专门设计的引物解决了这一问题,并恢复了与PAS使用无关的自转录序列,并将这一改进技术称为iSTARR-seq,该技术适用于自转录self-transcripts (STs) 量化。
作者使用iSTARR-seq方法在拟南芥内源性基因组位点中发现了活性增强子和静止增强子。与传统的STARR-seq鉴定的增强子不同,iSTARR-seq鉴定的增强子在基因5′端和3′端近端高度富集,其表观遗传状态与基因表达水平相关。
STARR-seq目前广泛应用于增强子活性检测。但传统的STARR-seq的准确性严重依赖于从报告基因reporter gene启动子开始的自转录mRNA的完全恢复。
在质粒构建过程中,polyadenylation site(PAS)被添加到报告基因的后端,由于这个是设计好的PAS用来给自转录self-transcripts (STs) 做聚腺苷酸化polyadenylation 的,称之为“DPAS”。但是,可能存在alternative另外的 polyadenylation site(PAS)在检测DNA序列中,也是受到了enhancer的潜在影响,称之为“APAS”。APAS在STARR-seq中是不会被检测到的。
为了避免潜在增强子信号丢失,作者重新设计了反转录引物(在原来的反转录引物前添加了N6T18(即NNNNNNTTTTTTTTTTTTTTTTTTT序列)),并称这种方法为: “iSTARR-seq。(图2.1)
图2.1 STARR-seq 改进。Box a 传统的STARR-seq构建方法。Box b iSTARR-seq 构建方法。
STARR-seq和iSTARR-seq的质粒建库的结果是相似的,因为二者的转染过程是一致的。不同于质粒建库结果,iSTARR-seq的cDNA片段明显较短。
图2.2 STARR-seq和iSTARR-seq建库差异。
将总体自转录total self-transcripts(tSTs)按照反转录引物的不同分为两类,DPAS polyadenylated后的STs称为“dSTs” ;APAS polyadenylated后的STs称为“aSTs”。
在拟南芥中鉴定出来了13,424个aSTs区域(占tSTs的61%),大多数aSTs区域都比对到了拟南芥基因组,这表明在STARR-seq中确实丢失了aSTs信息。
图2.3 比较STARR-seq和iSTARR-seq的增强子鉴定结果。
STARR-seq和iSTARR-seq的分别鉴定的增强子为15,862个和4956个,其中共有的增强子数目为2161个,而大多数STARR-seq鉴定的增强子不同于iSTARR-seq(13,701, 86.4%)(图2.3a)。iSTARR-seq特有的增强子的 aSTs 比例显著高于STARR-seq特有增强子以及共有增强子,且STARR-seq特有增强子的 aSTs 比例是最低的(图2.3b)。STARR-seq结果中73.2%的增强子分布在CDS区域,而iSTARR-seq结果中增强子分布在CDS区域只占41.6%。在拟南芥基因组中,aST与iSTARR-seq增强子和APASs同样富集于相同的基因组区域(图2.3d)。iSTARR-seq增强子的活性与其体外RT-PCR定量活性之间存在良好的相关性(图2.3f, Pearson相关性,r=0.8082)。这些结果表明,STARR-seq实验中由于大量aST的丢失,许多STARR-seq鉴定的增强子可能是假阳性的,同时,由于aST的丢失,有相当多的增强子也无法被识别。
与STARR-seq增强子的分布模式不同,iSTARR-seq增强子在转录起始位点(TSSs)和转录终止位点(TTSs)附近两个区域的表达量过高(图2.3g),在5 和3 UTR的基因两端富集(图2.3d),与此同时,在基因体内gene bodies的表现略显不足(图2.3g)。
拟南芥中的增强子通常伴随高表达水平的基因(图2.4a)。邻近增强子的6518个基因的显著高表达(图2.4b)。S1T1组(5 TSS和3 TTS都有增强子)基因表达低于S0T1组(只有3 TSS有增强子),S1T0组(只有5 TSS有增强子)基因表达高于S0T1组,S0T0组(增强子均不在5 TSS和3 TTS区域)基因表达高于S0T1组(图2.4c)。这表明增强子在基因5′或3′末端的位置可能以某种方式影响基因转录的调控。GO富集显示:高表达量(FPKM>=10)的基因主要富集在代谢过程;中等表达量(1<=FPKM<10)的基因主要富集在mRNA代谢和分解代谢过程;上述两类基因大多为管家基因,分布在各种不同的细胞中。低表达量(0<=FPKM<1)的基因主要富集在发育及繁殖过程,如传粉、花粉管发育及生长。
图2.4 增强子与基因表达的关系
iSTARR-seq鉴定的增强子可能在其内源性基因组位点上携带不同的表观遗传标记。为了表征增强子的表观遗传状态,我们收集了的叶片细胞染色质可及性、RNAPII结合、DNA甲基化和组蛋白修饰的数据集。增强子大多可被dnase和Tn5酶消化,被RNAPII富集;H3K4me1缺少增强子,而H3K4me3则富集增强子; H3K27ac、H3K9ac、H3K36ac 、 H3K56ac均有增强子富集(图2.5a)。根据增强子与表观遗传标记的关系可以将增强子分为4类(图2.5b)。
4类增强子在基因组区域中显示出显著不同的分布模式(图2.5c),以及相对于TSS和TTS的不同距离(图2.5d)。同时,4类增强子的表达量高低也存在明显差异,增强子Cluster1中主要为高表达量基因组(FPKM>=10),增强子Cluster1中主要为不表达量基因组(图2.5 e/f)。
图2.5 拟南芥增强子的表观遗传状态
增强子DNA为转录因子提供了平台,通过DAP-seq检测转录因子结合位点(TFBS)。STARR-seq和iSTARR-seq的增强子大多数都与TFBS上显著富集,但STARR-seq的增强子几乎都在较低水平上富集(图2.6 a)。4类增强子的TFBS富集差异很大(图2.6 b-e),TFBSs最明显地富集于增强子cluster1和增强子cluster2,与增强子cluster3相似,增强子cluster4在大多数TFBS检查中不富集。cluster3与高水平的基因表达密切相关(图2.5d),但缺乏最活跃的组蛋白修饰(图2.5b),这些表明cluster3可能通过一种不太明确的机制发挥作用,或可能通过基因环(gene looping,一个三维结构,有效地促进了RNAPII的回收利用)。cluster4在重复序列中过度表达(图2.5 c),其中已知的转录因子结合位点可能没有在非重复序列中富集。另一种可能是,许多发育或分化特异性TFBSs尚未被很好地表征,因此本研究未进行分析。
图2.6 增强子与43种TFBS的相互关系
iSTARR-seq鉴定的增强子在结合不同类型转录因子的存在不同潜力。这些差异编码在DNA序列中,决定了需要招募哪些转录因子。转录因子的时间和空间特异性表达为分化和发育过程中控制基因表达的复杂机制增加了另一层复杂性。
All raw data are deposited in the sequence read archive under the accession number GSE and are accessible with secure token etqxquucrbcbxcj. All raw data are also available under the accession number of CRA at.
Code Availability Custom codes are available at参考文献:
----------------------------------------------------------------------------------------------------------------------------------I am a line!-----------------------------------------------------------------------------------------
五羟色胺化修饰组蛋白属于哪种修饰方式
组蛋白修饰详情乙酰化乙酰化是最早发现的影响转录调控的组蛋白修饰之一,因此目前研究的最多。 乙酰化使 从核小体伸出 的 N-末端组蛋白尾部的赖氨酸残基带负电荷,这些负电荷会排斥带负电荷的 DNA,导致染色质结构 松弛。 开放的染色质构象允许转录因子结合并显著增加基因表达 (Roth et al., 2001)。 组蛋白乙酰化参与细胞周期调控、细胞增殖和凋亡,并在调节细胞分化、DNA 复制和修复、核输入和 神经元抑制等多种细胞过程中发挥重要作用。 组蛋白乙酰化的平衡失调与肿瘤发生和癌症进展有关。 酶调节 乙酰基被组蛋白乙酰转移酶 (HAT) 添加到组蛋白 H3 和 H4 的赖氨酸残基上,并被去乙酰化酶 (HDAC) 除去。 组蛋白乙酰化主要靶向启动子区域,称为启动子局部乙酰化。 例如,组蛋白 H3(H3K9ac 和 H3K27ac)上 K9 和 K27 的乙酰化通常与活性基因的增强子和启动子有关。 转录基因中也发现了 低水平的整体乙酰化,但其功能尚不清楚。 甲基化 组蛋白 H3 和 H4 的赖氨酸或精氨酸残基被甲基化,对转录有不同的影响。 精氨酸甲基化可以促进转 录激活 (Greer et al., 2012),而赖氨酸甲基化则同时涉足转录激活和抑制,具体取决于甲基化位点。 这 种灵活性可以解释为甲基化不会改变组蛋白电荷,也不会直接影响组蛋白-DNA 相互作用,与乙酰化不同。 赖氨酸可以单甲基化、双甲基化或三甲基化,从而为每个甲基化位点提供进一步的功能多样性。 例如, 组蛋白 H3 K4 (H3K4me1 和 H3K4me3)上的单甲基化和三甲基化都是活化标志物,但是也有着特殊 的细微差别:H3K4me1 通常会标记转录增强子,而 H3K4me3 则标记基因启动子。 同时,K36 (H3K36me3) 的三甲基化是与基因转录区域相关的活化标志物。 相反,组蛋白 H3 K9 和 K27 (H3K9me3 和 H3K27me3) 上的三甲基化是具有独特功能的抑制信号: H3K27me3 是控制胚胎干细胞中发育调控因子(包括 Hox 和 Sox 基因)的启动子区域的一个临时信 号。 同时,H3K9me3 是在具有串联重复结构的基因贫乏染色体区域形成异染色质的永久信号,如卫星 重复序列、端粒和近着丝粒区。 它也标记反转录转座子和特定的锌指基因家族 (KRAB-ZFPs)。 这两个 标记均在失活的 X 染色体上发现,其中,H3K27me3 位于基因间和沉默的编码区,H3K9me3 主要位 于活性基因的编码区。 酶调节 组蛋白甲基化是一种可以通过多次细胞分裂而仍然保持的稳定标记,多年来一直被认为不可逆。 但是, 最新研究发现,它是一个主动调控和可逆的过程。 甲基化:组蛋白甲基转移酶 (HMTs) 赖氨酸 包含 SET 结构域(组蛋白尾部) 包含非 SET 结构域(组蛋白核心) 精氨酸 PRMT(蛋白质精氨酸甲基转移酶)家族 去甲基化:组蛋白脱甲基酶类 赖氨酸 KDM1/LSD1(赖氨酸特异性脱甲基酶 1) JmjC(包含 Jumonji 域) 精氨酸 PAD4/PADI4 磷酸化 组蛋白磷酸化是细胞分裂、转录调控和 DNA 损伤修复过程中染色体浓缩的关键中间步骤 (Rossetto et al., 2012, Kschonsak et al., 2015)。 与乙酰化和甲基化不同,组蛋白磷酸化建立了其他组蛋白修饰之间的 相互作用,并充当效应蛋白的平台,导致下游级联事件。 磷酸化发生在所有核心组蛋白上,并且对每一个核心组蛋白都有不同的作用。 组蛋白 H3 在丝氨酸 10 和 28 上的磷酸化,以及组蛋白 H2A 在 T120 上的磷酸化参与了染色质致密化以及有丝分裂过程中 染色质结构和功能的调节。 这些是细胞周期和细胞生长的重要标志,在真核生物中得以保留。 S139 处 H2AX 的磷酸化(产生 γH2AX)作为 DNA 损伤修复蛋白的招募点 (Lowndes et al., 2005, Pinto et al., 2010),是 DNA 双链断裂后最早发生的事件之一。 目前对 H2B 磷酸化的研究还不够深入,但发现 H2B 磷酸化可促进凋亡相关的染色质浓缩、DNA 断裂和细胞死亡 (Füllgrabe et al., 2010)。 泛素化 所有组蛋白核心蛋白都可以被泛素化,但 H2A 和 H2B 是最常见的,也是细胞核中泛素化程度最高的 两种蛋白 (Cao et al., 2012)。 组蛋白泛素化在 DNA 损伤反应中起核心作用。 在 DNA 双链断裂位点发现了组蛋白 H2A、H2B 和 H2AX 的单泛素化。 最常见的形式是 H2A 上 K119 和 H2B 上 K123(酵母)/K120(脊椎动物)的单泛素化。 H2A 单泛素化与基因沉默有关,而 H2B 与转录激活有关。 多聚泛素化较少见,但在 DNA 修复中也很重要。 H2A 和 H2AX 在 K63 上的多聚泛素化为 DNA 修 复蛋白(如 RAP80)提供了一个识别位点。 酶调节 与其他组蛋白修饰一样,H2A 和 H2B 的单泛素化具有可逆性,并受到组蛋白泛素连接酶和去泛素化 酶的严密调控。 单泛素化H2A:多梳蛋白家族H2B:Bre1(酵母)及其同系物 RNF20/RNF40(哺乳动物)多聚泛素化H2A/H2AX K63:RNF8/RNF168 组蛋白修饰快速参考指南 最常见的组蛋白修饰及发现位置: 组蛋白修饰功能 位点H3K4me1活化增强子 H3K4me3活化启动子 H3K36me3活化基因体 H3K79me2活化基因体 H3K9Ac 活化 增强子、启动子 H3K27Ac 活化 增强子、启动子 H4K16Ac活化重复序列 H3K27me3阻遏 启动子,基因富集区域 H3K9me3阻遏 卫星重复序列、端粒、近着丝粒区 γ 复制DNA 双链断裂 H3S10PDNA 复制有丝分裂染色体 通过 ChIP 研究组蛋白修饰ChIP 使用抗体来分离蛋白质或目标修饰,以及它所结合的 DNA(图 5)。 然后对 DNA 进行测序,并 将其定位到基因组,以确定蛋白质或修饰的位置和丰度。 图 2:组蛋白修饰 ChIP。 抗体直接结合到修饰的组蛋白尾部。 免疫沉淀和 DNA 纯化可以分离和鉴定修饰所占据的基 因组区域。 在 ChIP 实验中利用靶向特定组蛋白和组蛋白修饰的抗体可以揭示 高级染色质结构的特定位置,例如 H3K9me3 标记异染色质和卫星重复序列 活跃或沉默基因和遗传程序的特定位置,例如 AH3K9ac 标记基因激活 诸如启动子和增强子等遗传元件的特定位置,例如基因富集区域的 H3K27me3 标记启动子、 H3K4me1 标记活性增强子 如果知晓组蛋白修饰的功能,ChIP 就可以识别具有这种组蛋白修饰标记的特定基因和区域,及其在整 个基因组中的对应功能。 然后可以进一步检测这些基因和区域在生物学过程中的作用。 例如,针对 H3K4me1,使用 ChIP 可以揭示整个基因组中活性增强子的位置和序列,并指明目的基因和遗传程序。 或者,如果不知道组蛋白修饰的功能,ChIP 可以识别具有这一特定修饰的序列、基因和位置,然后利 用这些信息来推断修饰的功能。 这种技术是解码许多组蛋白密码的关键,并且在探究新发现的修饰(如 泛素化)和其他新标记的功能方面也具备一定的价值。 组蛋白修饰酶:writers 和 erasers组蛋白修饰是通过特定的酶以动态方式从组蛋白中添加和去除的(表 1)。 这些 writers 和 erasers 之间的平衡决定了哪些标记存在于组蛋白上,以及处于什么水平,最终控制特定的遗传程序及其编排的细胞 过程处于开启还是关闭状态。 表 1:组蛋白 writers 和 erasers 的主要类别。 修饰WritersErasers乙酰化组蛋白乙酰转移酶 (HATs)组蛋白去乙酰化酶 (HDAC)甲基化组蛋白甲基转移酶(HMTs/KMTs)和蛋白精氨酸甲基转移酶 (PRMTs)赖氨酸去甲基酶 (KDMs)磷酸化激酶类磷酸酶类识别修饰途径和起作用的特定 writers 和 erasers 可以揭示 。 更深层次的相关细胞通路、遗传程序和生理效应研究。 例如,组蛋白去乙酰化酶 (HDACs) 激活免 疫发育通路,而组蛋白乙酰转移酶 (HATs) 在分化和增殖中发挥关键作用。 由于 writers 和 erasers 失衡所导致的遗传程序和相应的疾病过程改变。 表征这些失衡和涉及的特定 酶可以为为人们了解从癌症到自身免疫性疾病的病理学提供重要见解。 新的药物靶点和治疗策略。 一旦发现失衡,就可以开发药物来影响这些酶的活性并纠正失衡,为 医学上至今难以攻克的疾病提供新的治疗策略。 例如,许多 HDAC 抑制剂正在开发中,作为对抗 癌症和炎症性疾病(如关节炎和 I 型糖尿病)的新型药物。 对于药物开发活动,根据对 writers 和 erasers 活性的影响,很容易筛选到相应的化合物。 表征组蛋白甲基化通路 一般来说,开发组蛋白甲基转移酶 (HMT) 检测试剂盒充满挑战;大多数检测试剂盒存在几个缺点,原 因出在检测试剂盒的设计上。 典型 HMT 检测试剂盒用 3H-SAM 作甲基供体,并将 S-腺苷高半胱氨 酸 (SAH) 测定为甲基化反应的一般副产物。 但是,这需要 处理放射性物质 较高的灵敏度,以克服甲基供体 SAM 的低 kcat(转化数通常 < 1 min-1)和 Km 值 预先纯化酶/蛋白复合物,以评估特定 HMTs 的活性 比色或荧光检测简便,无放射性与核提取物或纯化蛋白的相容性(检测试剂盒对目标修饰具有特异性) 3 小时内即可提供数据 表征去甲基酶活性 组蛋白去甲基化酶活性检测试剂盒通常测定甲醛(去甲基作用的副产物)的形成。 因此,易受洗涤剂、 巯基和一系列离子的干扰。 与甲基化检测试剂盒类似,这些检测试剂盒对任何去甲基化酶都没有特异性,只能用纯化的蛋白进行检测。 组蛋白去甲基化酶检测试剂盒通过直接测定去甲基化产物的形成来规避这些问题,可确保: 组蛋白去甲基化酶检测试剂盒通过直接测定去甲基化产物的形成来规避这些问题,可确保:灵敏度比基于甲醛的检测试剂盒更高(20 - 1,000 倍) 无硫醇、洗涤剂或离子干扰的更准确的数据 与核提取物或纯化蛋白的相容性(得益于该检测试剂盒对目标修饰的特异性) 测定广泛物种(包括哺乳动物细胞/组织、植物和细菌)的去甲基化酶活性 具有简单比色或荧光读数的快速微孔板版本 3 小时内即可提供数据 表征组蛋白乙酰化通路 提供可分析总体活性以及 H4 特异性的 HAT 活性的试剂盒。 这些检测试剂盒可以检测 HAT 催化乙酰基从乙酰辅酶 a 供体转移到组蛋白肽的过程,该过程会生成乙酰化肽和 CoA-SH。 然后通过 比色法或荧光法测定 CoA-SH 副产物: 比色法 - CoA-SH 作为生成 NADH 的必需辅酶,与可溶性四唑染料反应生成可通过分光光度法 检测的产物。 比色法是动力学研究的理想选择,支持连续检测。 荧光法 - CoA-SH 与显色剂和探针反应生成可通过荧光检测的产物。 表征组蛋白去乙酰化酶活性 根据功能和 DNA 序列相似性,HDAC 蛋白可分为四大类(I 类、IIA 类、IIB 类、III 类、IV 类)。 I 类、IIA 类和 IIB 类被视为“经典”HDAC,其活性被曲古抑菌素 A (TSA) 抑制,而 III 类是 NAD + 依赖性蛋白家族 (sirtuins-SIRTs),不受 TSA 影响。 由于 IV 类仅与其他类存在 DNA 序列相似性, 因此被单独视为非典型类。 这些类别中的每一类都与不同的细胞程序相关,可以用不同的荧光法进行单独测定。 例如,SIRT 通常 与癌症和神经系统疾病相关。 检测 SIRT 活性,或发现影响 SIRT 活性的药物,可能有望找到这些疾 病的新型诊断或治疗策略。 荧光法使用的是乙酰化肽底物,该底物的氨基端和羧基端有荧光基团和淬灭基团。 底物一旦去乙酰化, 就会被肽酶裂解,将荧光基团从淬灭剂中释放出来。 随后荧光团荧光强度的增加与去乙酰化酶活性成正比。
多组学高分文献6-可治性前列腺癌的蛋白质组学表型图谱
期刊:Cancer Cell;影响因子:26.602 发表单位:多伦多大学等对肿瘤组织进行多级分析可以改善生物标志物的性能。 来自多伦多大学和加州大学洛杉矶分校等的科学家创建了有史以来第一个中度风险的前列腺癌的完整蛋白质组学图谱资源,研究于2019年3月发表在《Cancer Cell》上。 通过结合基因组、表观基因组、转录组学和蛋白质组学,研究人员表征了76例前列腺癌患者的肿瘤景观,并提供了一系列有关其癌症完整生物学的重要见解,包括: (1)建立前列腺癌的基因组亚型的发现集中在五种蛋白质组学亚型上,它们本身与临床结果有关。 (2)发现ETS融合基因是前列腺肿瘤中最常见的突变,它以明显不同的方式干扰蛋白质组和转录组,特别是影响代谢途径。 (3)RNA丰度的发现仅解释了前列腺癌蛋白质水平变异的10%,但存在广泛的反式效应网络,这些网络会聚在特定的功能途径上。 (4)包含基因组和蛋白质组学特征的生物标志物的发现明显优于仅包含任一分子特征的生物标志物。 一旦得到验证,该资源可能通过为医生和研究人员提供更精确的生物标记物来更有效地对患者进行分层,从而有助于改善局部前列腺癌患者的治疗。 作者建议,前列腺癌蛋白质组受到基因组、表观基因组、转录组和转录后失调的复杂相互作用的影响,沿中心法则进行数据集成不仅可以提供更深的生物学见解,而且可以开发性能更强的多组份生物标志物。 基因组测序已鉴定出导致前列腺癌侵袭性的复发性突变,然而基因组、表观基因组和转录组失调对肿瘤蛋白质组的影响仍然知之甚少。 本研究分析了76个局限性、中度风险的前列腺癌的基因组、表观基因组、转录组和蛋白质组。 研究发现前列腺癌的基因组亚型集中在五种蛋白质组亚型上,具有不同的临床轨迹。 ETS融合是前列腺肿瘤中最常见的变化,会影响蛋白质组和转录组中的不同基因和途径。 整体上,mRNA丰度变化仅解释了蛋白质丰度变异性的约10%。 将基因组或表观基因组特征与蛋白质组学特征相结合的预后生物标志物明显优于由单一数据类型组成的生物标志物。 局部前列腺癌的综合蛋白质组学分析; 整合中枢信条的各个层次(DNA→RNA→蛋白质); ETS融合对转录组和蛋白质组的影响不同; 结合基因组学和蛋白质组学可以提高生物标志物的性能。 研究收集了76例临床患者,包括散发性、局限性和初治性中度前列腺癌,进行拷贝数畸变微阵列(CNA)、全基因组测序、甲基化的表观修饰、组蛋白H3K27Ac ChIP-Seq评估顺式调控元件、RNA-Seq和质谱分别对转录组和蛋白组的定量。 为了解原发性局部前列腺癌的整体蛋白质组学模式,进行亚型分析确定了四类蛋白质簇(即P1、P2、P3和P4)和五类患者(即C1、C2、C3、C4和C5)亚组。 蛋白质簇P1和P3富含免疫相关基因的产物,P2和P4中未检测到明显富集的途径。 患者亚组C2和C3与生化复发率有关。 基因组改变百分比(PGA)是侵略性疾病的生物标志物,与421种蛋白质丰度相关,包括参与Wnt信号传导的蛋白质FZD7和去泛素酶USP11。 肿瘤大小与8种蛋白质相关,而侵袭性导管内癌/筛状结构亚病理的存在与7种蛋白质相关。 对蛋白质组的最强影响之一是ETS基因融合体,这是前列腺癌中最常见的体细胞畸变。 作者期望利用多种组学汇聚的方法,研究ETS融合基因在各个组学层面的影响变化。 作者研究了与ETS基因融合状态显著相关的245个mRNA和68个蛋白,总体变化具有很好的相关性。 对于某些单个基因,mRNA和蛋白质丰度差异很大。 扩展到了甲基化水平分析组蛋白状态(H3K27Ac)和拷贝数变异,仅单基因ARHGDIB在蛋白质、mRNA、甲基化和乙酰化水平上与ETS基因融合相关。 630个基因显示出与ETS基因融合相关的甲基化差异,124个基因显示出H3K27乙酰化差异。 这些相互作用不能完全解释与ETS相关的蛋白质和mRNA之间的适度重叠,强调了转录组后调控因子的重要性。 为了解RNA和蛋白质功能推断的相似性,作者分别在CNA、甲基化、H3K27Ac,RNA丰度和蛋白质丰度水平上对ETS融合相关基因进行途径分析,多种基因组机制可以将ETS相关的转录组与ETS相关的蛋白质组区分开。 包括与羧酸代谢相关的基因在mRNA、蛋白质和甲基化水平上富集,证实了ERG融合与脂质代谢之间的联系。 与ETS基因融合体相关的mRNA和蛋白质富集了与细胞内和细胞外囊泡相关的基因。 mRNA水平上,细胞迁移、肌动蛋白结合和磷脂结合的富集,而蛋白质水平上溶酶体更丰富。 前列腺癌是由拷贝数变异(CNA)而非单核苷酸变体驱动的肿瘤。 CNA调控mRNA和蛋白质丰度的分析中,顺式和反式作用均显示RNA比蛋白质对CNA更相关。 具有较大反式作用的基因包括CMAS(一种免疫相关基因)、ATAD1(一种与ATPase活性有关的基因)和MINPP1(一种已知与癌症有关的基因),它们在CNA和RNA水平上均与不良预后相关。 并非所有基因都以相同的频率受CNA反式影响,突显了特定体细胞突变与随后的转录组和蛋白质组失调之间的相互联系。 作者计算了前列腺癌研究中五类分子数据之间的相互信息(MI),以量化从癌症基因组到蛋白质组的复杂信息流。 CNA、甲基化状态与蛋白质的结合比与mRNA丰度的结合更为紧密。 跨基因组区域的最高互信息位于H3K27Ac和RNA之间,而最低值介于CNA和甲基化之间,这可能表明表观基因组特征起着重要作用。 为了确定生物分子对之间的调节关系是否可以区分基因的特定功能组,作者还通过共识聚类并确定了六个亚组。 MI6亚组的特征在于具有较高CNA-H3K27Ac、CNA蛋白、CNA-RNA和CNA-甲基化关联的基因,并且富含与细胞对应激反应相关的基因,表明调控网络紧密。 MI1带有具有强H3K27Ac-蛋白质、RNA-蛋白质和甲基化-蛋白质关联的基因,富含细胞外外泌体。 关注前列腺癌中的已知癌症相关基因时,TGM2和AKT1的甲基化和蛋白质丰度之间检测到强烈的关联,NDRG3和PTEN的CNA均显示相对较高的百分比差异,KLK3 通常和RNA、蛋白质丰度或甲基化单变量相关。 这些数据提供了信息从遗传、体细胞基因组、表观基因组和转录组流向蛋白质组的复杂方式的详细图谱。 最后,为了评估蛋白质组学分析原发性前列腺肿瘤的潜在临床重要性,作者量化了具有明确治疗意义的局部治疗后每个基因与疾病复发的关联。 将时间用于生化复发(BCR)作为结果,这反映了血清PSA水平的升高,这可能会触发挽救疗法的实施。 使用Cox比例风险模型,评估了蛋白质丰度的危害比与来自mRNA丰度的危害比之间存在弱相关性,蛋白质的危害比动态范围比mRNA更广,表明复杂的调节回路、翻译失调、翻译后修饰或转录后过程参与了侵略性疾病的发展。 本研究对局限性前列腺癌的蛋白基因组学表型进行了详细的阐述,实现了围绕中心法则进行的多种组学数据的整合分析,并利用信息学手段明确了前列腺癌中遗传信息的流动过程。 本研究的许多结果,如基因组、转录组和蛋白组学结果的不一致性等对前列腺癌的基础和临床研究具有良好的指导意义。 与其他数据类型相比,蛋白质组学生物标志物的临床潜力很高,多模式生物标志物的性能始终优于单个数据类型,突出应在多层面实现单个肿瘤中的准确分析。