文章|2020年10分+纯生信文章带你领略Nature子刊之驱动突变文章套路( 二 )
这表明,非编码突变可能会改变某些样本的基因,使其具有周期性编码或结构变异。PID-N基因的非编码基因得分显著高于非PID-N基因。绝大多数PID-N基因与PCAWG驱动因素和功能解释工作组分析不同(图2b),只有三个基因相同:TERT, HES1和TOB1。在这三个基因中,只有TERT在CGC数据库中被记录为已知的癌症基因。因此,作者对通路和网络分析的共识程序显著增强了PCAWG驱动因素和功能解释工作组结果中的显著突变因素。
文章图片
▲ Fig.2b
文章图片
▲ Fig.2d
总的来说,PID-C和PID-N基因在PCAWG驱动因素和功能解释工作组分析中发现了另外121个基因,包括90个新的可能的非编码驱动因素。此外,绝大多数PID-N基因与PID-C基因不同,仅有5个基因相同:CTNNB1、DDX3X、SF3B1、TGFBR2、TP53。虽然这表明编码和非编码驱动突变发生在很大程度上不同的癌症基因集合中,但这两种类型的突变影响着许多相同的标志性癌症进程背后的基因。
2.非编码突变对基因表达的影响
非编码突变可能通过改变转录因子结合位点或其他类型的调控位点发挥作用。
因此,作者评估了PID-N基因的非编码突变是否与同一基因的cis表达变化有关。我们发现,在可以利用RNA-Seq数据检测的90个PID-N基因中,有5个(FDR < 0.3)的cis表达相关性显著(图3)。发现其他四个PID-N基因:TP53、TLE4、TCF4和DUSP22的cis表达相关性显著(图3、补充图10)。
文章图片
▲ Fig.3
接下来,作者对6种不同肿瘤类型的TP53启动子突变的6个肿瘤进行分析,TP53表达明显降低(图3a)。TP53启动子甲基化和表达之间的联系之前已经被研究过,突变样本的减少表达与TP53作为肿瘤抑制基因的众所周知的作用是一致的。PCAWG驱动因素和功能解释的研究也描述了一致的表达变化。TLE4是一种转录辅助抑制因子,在三个具有TLE4启动子突变的肝-肝癌肿瘤中分析,TLE4表达明显减少(图3b)。在三个TCF4启动子突变的肺鳞癌中,TCF4显著低表达(图3c)。DUSP22编码一种磷酸酶信号蛋白,最近被认为是淋巴细胞中的肿瘤抑制因子,DUSP22表达同样显著降低。在5例肺腺瘤患者中,存在DUSP22 3′UTR突变且明显过表达;在三个肺腺瘤患者中存在DUSP22 5 ' UTR突变,然而这些UTR突变是相互排斥的。
虽然这些基因表达相关性为一类PID-N基因提供支持,但突变的变异等位基因频率和基因的拷贝数是基因表达的附加协变量。这些协变量在作者发现的相关性中没有发挥作用,拷贝数的变化不影响上述五个PID- N基因的表达相关性。
此外,出现相关基因表达变化的PID-N基因数量少,可以解释为PID-N基因突变的样本数量少,表达数据在不同肿瘤类型间的可用性不均匀,以及启动子区域的序列覆盖率降低等。这些问题进一步减少了非编码突变和RNA表达的样本数量,限制了cis基因表达相关性分析的能力。
3.编码和非编码突变的模块化
在确定了编码突变、非编码突变或两种突变组合改变的特定蛋白质-蛋白质互作亚网络和生物通路后。作者又发现PID-C基因间的交互作用显著增加,以及PID-C和PID-N基因间的互作显著增加。
证明了物理层面的蛋白-蛋白互作网络中编码和非编码突变之间的相互作用。涉及PI-C和PI-N基因的互作子网络组织为五个生物学过程:核心驱动、染色质组织、细胞增殖、发育和RNA剪接(图4a)。
文章图片
▲ Fig.4a
由于PID-C和PID-N基因之间的分子相互作用被用作通路和网络方法的信号,因此作者预计PID-C和PID-N基因之间的分子相互作用频率较高,这些相互作用的组织说明了单个子网络中编码和非编码突变的相对贡献。接下来作者使用g:Profiler web server进一步表征了PID-C和PID-N中富集的分子通路。并将模块和PID基因分成四个生物过程:染色质组织、细胞增殖、发育和RNA剪接(图4b).、
文章图片
▲ Fig.4b
同样,模式规范过程也受到编码和非编码突变的影响,包括PI-N基因ASCL1、SUFU和RELN以及PI-C基因ATM和SMAD4。在这些情况下,非编码突变补充了破坏这些通路的编码突变,覆盖了更多的患者。并且作者惊喜的发现RNA剪接途径主要受到非编码突变的影响。根据PCAWG驱动程序的单一元素测试和功能解释工作组分析,这些PI-N基因均未发生显著突变。由于进一步的分析中没有发现剪接相关的PI-N基因非编码突变和表达改变之间存在显著的顺式关联,因此作者继续探索这些基因非编码突变和其他基因表达之间的潜在反式效应。最终确定了三个集群的RNA剪接基因突变(C1, C2, C3;图5a, b)使用跨这些途径的差异表达模式的分级聚类。
除了上述模块,我们还发现转录因子在PI-C和PI-N基因中都有很好的表达。共有9个PI-C基因是转录因子(ARHGAP35、ARID2、FOXA1、GATA3、NFE2L2、SMAD4、SOX9、TCF7L2、TP53);19个PI-N基因为转录因子(ASCL1、BHLHE40、ESRRG、HES1、HNF1A、HNF1B、HOXA10、HOXB5、KLF4、MEF2C、MYC、NFE2、NR2F1、SOX2、SOX4、TCF4、TP53、ZNF521、ZNF595;FDR= 4.1×10"/>
推荐阅读
- 山东|探索青年学生助力乡村振兴新模式,2020年“清华学子山东行”圆满收官
- |《我的女友是机器人》首曝花絮,辛芷蕾包贝尔搞怪
- 【地评线】安全开学,精细化防控
- 【地评线】京彩好评:改革不停顿开放不止步是最好的纪念
- 【地评线】安全开学,精细化防控|【地评线】安全开学,精细化防控
- 外交部回应安倍晋三宣布辞职:祝愿他早日康复
- 标准地图|2020年标准地图发布, 一点都不能错!
- 2020|青岛银行公布2020年中期业绩: 资产总额超4405亿元 持续稳健增长
- 2020|扩散周知!自然资源部:2020年标准地图发布
- 外交部|外交部回应安倍晋三宣布辞职:祝愿他早日康复
