胡恩渊1 宋先旭2 向婷3
1牡丹江医学院 黑龙江牡丹江 157000 2牡丹江医学院第二附属医院肝胆外科 黑龙江牡丹江 157000 3牡丹江医学院 黑龙江牡丹江 157000
摘要:目的 通过TCGA数据库找出在胃癌中差异表达的LncRNA,建立能可靠预测胃癌OS的预后诺模图。方法 通过生物信息技术找出胃癌中差异表达的lncRNA,进一步筛选出与OS明显相关的lncRNA,联合年龄、TNM分期等临床特征,得出预测胃癌OS可靠的预后诺模图。结果 通过生物信息学分析的出四个与胃癌患者OS明显相关的lncRNA,其中 AL034397.3对患者有保护作用,FAM83A-AS1,LINC00519和IER3-AS1与年龄、TNM分期等临床特征联合,的出一个可靠的预后诺模图。三个lncRNA的联合检测的准确性高于TNM分期,AUC=0.809。结论 利用临床危险因素,我们开发了基于lncRNA特征的列线图,其表现优于单独的分子特征或临床因素来进行预后预测。
关键词:lncRNA;胃癌;OS
在全球范围内,胃癌的发病率和死亡率在肿瘤中位居第5位和低3位,每年有约10万例的新发病例的死亡病例[1]。在我国,胃癌的发病率的死亡率在恶性肿瘤中达到第2位和第3位[2]。对于胃癌患者预后的预测主要通过TNM分期进行,但是该指标具有一定的局限性,不能给与不同的患者以个性化的预测和指导意见。
1 材料和方法
1.1从TCGA数据库(https: //portal.gdc.cancer )中下载531位GC患者和63位正常
人的RNA表达谱和临床数据,并用Ensemble参考数据库(ftp://ftp.ensemble.org/pub/release93/gtf/homo_sapiens )进行注释,随后将RNA。使用“ DESeq2”软件包检测GC样品和对照组样品之间的DEL和DEM。将P值<0.01且log2的绝对值>2的lncRNA定义为DEL。DEM同理。
1.2仅当DEL的P值<0.05且表达和预后具有逻辑一致性的时候才认为是与OS相关的
lcnRNA候选物。将没有明确临床特征的患者排除后,获得了471位GC患者,并随机非配234位患者作为“主要数据集”,且两个数据集的患者之间在临床特征上没有明显的差异(表1)。进一步计算了AIC来估计该数据集的相对质量,选择出具有最低AIC的最佳拟合预测模型。
1.3选择出最合适和OS 相关的lncRNA之后,应用多变量的CPHP分析,计算出主要数
据集中每个lncRNA的系数。在此基础上构建出一个风险评估公式,公式如下:
使用来自主要数据集的中位风险评分作为临界值,通过分层分析来评估lncRNA和OS之间的
关联是否独立于TNM分期和其他的临床风险。绘制出时间依赖性ROC曲线和每个数据集中三年
和五年的AUC值,进一步评估lncRNA的预后评价性能。
1.4通过对471位GC患者的单因素和多因素CPHR分析,测试了常规的临床危险因素和
基于lncRNA的特征。然后使用“ rms” 软件包建立预后列线图。用Cindex和校准曲线评估 了列线图的能力,以比较非事件和事件或模型预测的OS和实际OS的概率[5]。
1.5使用皮尔逊相关性测试评估了三个与OS相关的lncRNA和DEM的共表达。为了减少
假阳性,当获得 正相关系数> 0.3时,我们仅选择共表达的OS相关lncRNA/DEM对进行进一步的富集分析。
2结果
1.1对531位GC患者和63位正常人的RNA表达谱进行比较,分析得出4661个差异
表达的Mrna(DEM)和1167个lncRNA(DEL),P值<0.01且log2的绝对值>2。
我们使用Akaike信息准则(AIC)来避免过度拟合。在主要数据集中为每位GC患者计算了基于三个lncRNA的风险评分。使用中位风险评分作为临界值,OS状态和9个lncRNA表达谱的分布如图2a所示。该热图显示,所有9种高风险lncRNA均以更高的水平表达,其中AL034397.3,FAM83A-AS1,LINC00519、IER3-AS1和AL034397.3具有统计学意义(表2)。
Kaplan-Meier曲线分析清楚地表明,高风险组的预后要比低风险组差(P = 9.2171-11,对数秩检验)(图2b)。随后,我们使用主要数据集建立了时间相关的接收器工作特性(ROC)曲线。如图2c所示,三个IncRNA信号的时间依赖性ROC曲线(AUC)下的面积在三年时达到0.713(95%置信区间[CI] = 0.593-0.814),而在五年时达到0.686(95%CI = 0.563)。
临床风险因素(如TNM分期和年龄)仍是GC患者OS的重要预测指标。因此,我们将这些传统的危险因素与我们选中的三个lncRNA标记相结合,以开发出一种有效的定量OS预测方法。我们发现,除了三个lncRNA特征外,年龄(≥65vs. <65)和TNM阶段(III-IV vs. I-II)与OS显着相关(所有P <0.05)(图3) 。
我们从多变量CPHR分析中排除了肿瘤分期,淋巴结转移和远处转移。最终,根据临床判断和统计学意义,我们开发了一种以三个lncRNA特征的列线图。我们使用该列线图来预测GC患者的三年和五年生存期(图4)。
为了比较不同预后因素的预测敏感性和特异性,我们使用了时间依赖性的ROC曲线。如图5所示,所有的预测指标中,联合三个lncRNA的预测准确性最高,AUC=0.809;肿瘤的分级、性别以及TNM分期都影响GC患者的生存率。
为了推论三个lncRNA标记在GC肿瘤发生和发展中的潜在功能,我们对基因本体论(GO)术语和与基因表达共同表达的mRNA的《京都议定书》的基因和基因组百科全书(KEGG)进行了功能富集分析。471个GC样品中与OS相关的lncRNA。这些GO术语主要富含糖胺聚糖结合,细胞外基质结合和细胞外结构组织(图6a)。在KEGG途径富集分析中发现了相似的结果(图6b)。
a
讨论
在本研究中,我们提出的预后诺模图的预测性能优于3-lncRNA信号、传统TNM分期或单独年龄的预测性能。该客观概率量表应使患者和临床医生易于理解并在临床实践中使用。
我们的列线图的一个优点是它的简单性。我们基于三lncRNA签名的列线图依赖于常规可用变量,包括遗传差异(三lncRNA),组织病理学特征(TNM阶段)和基线人口统计学因素(年龄)。因此,临床医生可以轻松估计结果并为单个GC患者做出决策[6]。对于临床应用而言,最有吸引力的生物标记物是可以为患者提供准确的预后,将患者分为不同的风险组从而帮助临床医生选择最有效治疗方法的生物标记物。
总之,我们确定了GC患者改变的lncRNA表达模式,并确定了可以有效将患者分为不同风险组的lncRNA标记。重要的是,通过将这种特征与常规临床危险因素(TNM阶段和年龄)相结合,我们开发了一种基于3lncRNA特征的诺模图,可以准确预测GC患者的三年和五年OS。诺模图的预后表现优于传统的TNM分期或年龄。因此,我们提供了可靠的预后诺模图,以帮助对GC患者进行个性化管理。
参考文献
[1]. Erratum: Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries.[J]. CA: a cancer journal for clinicians,2020,70(4).
[2]Wanqing Chen PhD, MD,Rongshou Zheng MPH,Peter D. Baade PhD,Siwei Zhang BMedSc,Hongmei Zeng PhD, MD,Freddie Bray PhD,Ahmedin Jemal DVM, PhD,Xue Qin Yu PhD, MPH,Jie He MD. Cancer statistics in China, 2015[J]. CA: A Cancer Journal for Clinicians,2016,66(2).
[3]Rouprêt M, Babjuk M, Compérat E, Zigeuner R, Sylvester RJ, Burger
M, Cowan NC, Gontero P, Van Rhijn BW, Mostafid AH, Palou J, Shariat SF. European Association of Urology Guidelines on Upper Urinary Tract Urothelial Carcinoma: 2017 Update. Eur Urol. 2018; 73:111–22. https://doi.org/10.1016/j.eururo.2017.07.036 PMID:28867446
[4]Zehnder P, Studer UE, Daneshmand S, Birkh?user FD, Skinner EC,
Roth B, Miranda G, Burkhard FC, Cai J, Skinner DG, Thalmann GN, Gill IS. Outcomes of radical cystectomy with extended lymphadenectomy alone in patients with lymph node-positive bladder cancer who are unfit for or who decline adjuvant chemotherapy. BJU Int. 2014; 113:554–60. https://doi.org/10.1111/bju.12520 PMID:24131453
[5]Rinn JL, Chang HY. Genome regulation by long noncoding RNAs. Annu Rev Biochem. 2012; 81:145–66. https://doi.org/10.1146/annurev-biochem-051410- 092902 PMID:22663078
[6]Morris KV, Mattick JS. The rise of regulatory RNA. Nat Rev Genet.
2014; 15:423–37. https://doi.org/10.1038/nrg3722 PMID:24776770