张亿乐 卞尔保 程梦 张正伟 黄克兵 陈杰 岳小宇 赵兵*
( 安徽医科大学第二附属医院神经外科;安徽合肥230601)
【摘要】 目的 通过生物信息学分析筛选出与胶质瘤患者生存相关的lncRNA,并预测其作为ceRNA可能调控的靶基因及相关信号通路。方法 通过GEO挖掘胶质瘤中差异表达的lncRNA,再对这些差异表达的lncRNA进行生存分析,然后通过miRcode等数据库联合分析找到与差异 lncRNA 表达相关的 mRNA 和信号通路,最后通过基因富集分析了解其功能。结果 通过 GEO筛选出 23 个在胶质瘤中差异表达的 lncRNA,经过GEPIA分析发现其中MIR7-3HG和 RFPL1S 表达下调,且与患者总体生存率和无病生存率相关。进一步靶基因预测,发现RFPL1S可预测出23个靶miRNA 和952个靶mRNA; 对这些mRNA进行基因富集分析,发现其富集于多条经典肿瘤相关通路。结论 通过多个数据库联合生物信息学分析筛选出与胶质瘤生存相关的 lncRNA RFPL1S,对了解胶质瘤的发生机制及预后评估提供了潜在靶点。
【关键词】 胶质瘤; 长链非编码RNA; 生物标志物
脑胶质瘤是常见颅内恶性肿瘤,目前其主要治疗手段包括手术、放疗、化疗等,治疗手段较为局限预后较差。在分子层面上研究胶质瘤发生、发展的机制,寻找潜在的诊断和治疗靶点是当前的研究热点[1]。研究表明,lnc RNA可能通过与mRNA竞争miRNA靶点参与调控胶质瘤发生、发展相关的信号通路,进而影响胶质瘤的转归[2]。
本研究通过对3个胶质瘤相关的数据库:GSE19728、GSE21354、GSE103229中差异表达基因交叉比对得到23个在胶质瘤中差异表达的lncRNA,通过GEPIA进行基因表达分析和生存分析筛选出2个与胶质瘤患者生存率相关的lncRNA,并预测了其靶点miRNA和靶点mRNA,通过功能富集分析初步预测了其中一个lncRNA可能的功能,为胶质瘤的诊治提供了潜在的靶点[3]。
1.方法
1.1 Geo数据库数据挖掘 以“lncRNA” 和“胶质瘤”为关键词在GEO中进行检索,发现3个胶质瘤相关的数据库:GSE19728、GSE21354、GSE103229,应用GEO2R进行差异表达分析,,筛选完成后应用VENNY2.1对差异表达分析结果取交集。
1.2基因表达分析与生存分析 应用GEPIA对1.1中获取的差异表达基因进行基因表达分析和生存分析,了解其在正常组织和胶质瘤中的表达量及其与患者生存率之间的关系。
1.3 靶miRNA预测 从miRcode数据库下载miRNA家族数据,应用Perl软件进行比对,找出1.2中筛选出的lncRNA的靶miRNA。
1.4 ceRNA预测 从miRDB、miRTarBase、TargetScan等数据库下载靶mRNA数据,应用Perl进行比对,预测1.3中所得miRNA的mRNA靶点,应用Cytoscape进行可视化展示。
1.5 功能及通路分析 使用R 3.6.2,对1.4中预测所得mRNA注释后进行GO分析和KEGG分析,了解其功能。
2. 结果
2.1 胶质瘤中差异 lncRNA 的筛选 从 3个数据库GSE19728、GSE21354、GSE103229中分别筛选出胶质瘤相关差异表达 lncRNA。应用VENNY2.1对这3个数据库中差异表达 lncRNA取交集后发现共有23个lncRNA在三个数据库中均有显著的差异表达,(如图1-A所示)。
图1-A.对3个GEO数据库所筛选出的差异lncRNA取交集,共获得23个差异表达lncRNA,在3个数据库中均有差异差异表达。
2.2 lncRNA MIR7-3HG 和 lncRNA RFPL1S与胶质瘤患者生存率相关 通过GEPIA在线对TCGA数据库中胶质瘤患者进行分析,共筛选出2个在胶质瘤中表达下调的差异 lncRNA,MIR7-3HG 和RFPL1S,在胶质瘤组织中表达显著降低;生存分析提示其表达水平越高,患者生存率越高( 见图 2A ~ 2H) 。
图2: A~B: MIR7-3HG在LGG和GBM中均表现出在肿瘤组织的低表达,相比较于正常组织具有显著差异; C~D: MIR7-3HG表达较高的患者总体生存率和无病生存率较高;E~F: RFPL1S在LGG和GBM中均表现出在肿瘤组织的低表达,相比较于正常组织具有显著差异; G~H: RFPL1S表达较高的患者总体生存率和无病生存率较高
2.3 靶基因预测及ceRNA网络构建 应用miRcode对MIR7-3HG和 RFPL1S进行对比分析预测其靶miRNA。并通过miRDB、miRTarBase、TargetScan交叉比对筛选ceRNA。MIR7-3HG靶miRNA过少,予以舍弃,RFPL1S共筛选出23个靶miRNA和952个靶mRNA,应用Cytoscape 3.6.1可视化如图3.所示。
图3. RFPL1S的ceRNA网络关系,图中四边形为lncRNA,三角形为miRNA,圆点为mRNA。
2.4 功能富集分析 使用软件R 3.6.2对预测所得mRNA进行GO和KEGG分析。GO分析结果显示,靶点mRNA所富集的通路集中于分子功能,最显著的结果包括核心启动子结合、转录因子活性、转录抑制活性等。KEGG分析结果显示,靶点mRNA所富集较为显著的通路包括MAPK信号通路、PI3K-Akt信号通路等,这些通路已有研究证实在胶质瘤的发生和转归过程中起到了重要作用。( 见图 4) 。
图4.靶点mRNA富集分析结果。
3. 讨论
胶质瘤的是最常见的神经系统恶性肿瘤,由于其新生血管丰富、生长迅速,极具浸润性且和正常组织间界限不清,手术难以全切极易复发,患者确诊后预后较差。[4]目前胶质瘤的治疗手段有限,主要包括手术切除辅以术后放、化疗等,但其治疗效果不甚理想。近年来,许多团队都试图在分子水平上甄别出有助于阐明胶质瘤发生和转归机制的生物标志以进行精确诊断和精准治疗[1]。
lncRNA是不具有编码蛋白质的功能且长度超过200个碱基对的RNA,众多研究已证明lncRNA涉及多种肿瘤恶性行为的调控[5-8]。ceRNA 的提出赋予了非编码RNA 新的生物学功能, ceRNA 竞争性结合 miRNA, 降低 miRNA 对靶基因 mRNA 的抑制作用,形成复杂的 ceRNA 调控网络,参与包括肿瘤发生发展在内的一系列生物学过程[8-10]。随着对 lnc RNA 认识的不断加深, lnc RNA 被证实在胶质瘤基因表达中扮演着不可或缺的调控作用, 并且在胶质瘤的发生发展中起着重要作用。然而,目前关于 lncRNA 在胶质瘤中的作用机制仍有待进一步探索[11]。
本研究中我们通过多数据库联合分析筛选出一个具有23个靶miRNA和952个靶mRNA的lncRNA RFPL1S,并通过GO和KEGG分析预测了其靶基因可能的作用通路。RFPL1S在肿瘤中的作用尚未见诸报道,其与胶质瘤患者的总体生存率和无病生存率相关,且其靶mRNA功能富集分析提示其在多条经典肿瘤通路上都有富集,故其可能是胶质瘤的新型预后生物标志物甚至治疗靶点。
总的来说,本研究通过生物信息学的方法对RFPL1S在胶质瘤中的作用进行了初步挖掘,为胶质瘤的诊断和治疗提供了潜在的新的靶点。但由于本研究并未进行试验,该结果仍需进一步试验予以验证。
参考文献
[1] Feng E, Liang T, Wang X, et al. Correlation of alteration of HLA-F expression and clinical characterization in 593 brain glioma samples[J]. J Neuroinflammation, 2019,16(1):33. DOI: 10.1186/s12974-019-1418-3.
[2] Dang Y, Wei X, Xue L, et al. Long Non-Coding RNA in Glioma: Target miRNA and Signaling Pathways[J]. Clin Lab, 2018,64(6):887-894. DOI: 10.7754/Clin.Lab.2018.180107.
[3] Gusyatiner O, Hegi ME. Glioma epigenetics: From subclassification to novel treatment options[J]. Semin Cancer Biol, 2018,51:50-58. DOI: 10.1016/j.semcancer.2017.11.010.
[4] 张大鹏, 杨艳辉. LncRNA NR2F2-AS1靶向抑制miR-129-5p调控胶质瘤细胞增殖和凋亡的机制研究[J].中国医药生物技术,2020,15(03):277-283.
[5] Xing Q, Huang Y, Wu Y, et al. Integrated analysis of differentially expressed profiles and construction of a competing endogenous long non-coding RNA network in renal cell carcinoma[J]. PeerJ, 2018,6:e5124. DOI: 10.7717/peerj.5124.
[6] Zhang Z, Qian W, Wang S, et al. Analysis of lncRNA-Associated ceRNA Network Reveals Potential lncRNA Biomarkers in Human Colon Adenocarcinoma[J]. Cell Physiol Biochem, 2018,49(5):1778-1791. DOI: 10.1159/000493623.
[7] Li F, Huang C, Li Q, et al. Construction and Comprehensive Analysis for Dysregulated Long Non-Coding RNA (lncRNA)-Associated Competing Endogenous RNA (ceRNA) Network in Gastric Cancer[J]. Med Sci Monit, 2018,24:37-49. DOI: 10.12659/msm.905410.
[8] Xu N, Wu YP, Yin HB, et al. Molecular network-based identification of competing endogenous RNAs and mRNA signatures that predict survival in prostate cancer[J]. J Transl Med, 2018,16(1):274. DOI: 10.1186/s12967-018-1637-x.
[9] Yu D, Ruan X, Huang J, et al. Comprehensive Analysis of Competitive Endogenous RNAs Network, Being Associated With Esophageal Squamous Cell Carcinoma and Its Emerging Role in Head and Neck Squamous Cell Carcinoma[J]. Front Oncol, 2019,9:1474. DOI: 10.3389/fonc.2019.01474.
[10] Fang XN, Yin M, Li H, et al. Comprehensive analysis of competitive endogenous RNAs network associated with head and neck squamous cell carcinoma[J]. Sci Rep, 2018,8(1):10544. DOI: 10.1038/s41598-018-28957-y.
[11] Peng Z, Liu C, Wu M. New insights into long noncoding RNAs and their roles in glioma[J]. Mol Cancer, 2018,17(1):61. DOI: 10.1186/s12943-018-0812-2.
作者简介: 张亿乐,男,硕士研究生;
赵兵,男,主任医师,博士生导师,责任作者,E-mail:aydzhb@126.com