李纯璞1,朱刚2,于鑫1,李道胜3,高健伟1,郭冬梅4
1.泰安市中心医院骨科,山东 泰安271000;
2.泰山区人民医院外科,山东 泰安271000;
3.3. 泰安市中心医院病理科,山东 泰安271000;
4.4. 泰安市中心医院血液内科,山东 泰安 271000)
摘要:目的 采用综合生物信息学方法构建骨肉瘤患者预后预测模型。 方法 从国际公开的数据库收集骨肉瘤转录组原始数据。采用R语言分析基因表达量与预后关系。筛选预后相关基因表达水平构建风险模型。结果 筛选9个基因预测模型。结论 构建的预后风险预测模型可预测骨肉瘤患者预后。
骨肉瘤是高度恶性骨肿瘤。尽管治疗策略近年来有较好进展。骨肉瘤发展的分子机制及预测因素仍不清楚[1, 2]。骨肉瘤患者预后的预测并不清楚。迫切需要一种新的预后预测系统准确预测的骨肉瘤患者的生存期。
1 材料与方法
1.1 基础数据搜集及初步分析
从国际公开的骨肉瘤数据库下载转录组测序数据及相关临床信息。采用R语言分析基因表达量与预后关系, P<0.05的基因表达量与骨肉瘤患者生存预后相关。
1.2 预后相关mRNA模型的构建
基于患者临床信息,利用R统计软件筛选生存相关基因,建立预后相关基因模型。
1.3 统计学分析
数据分析使用R 3.6.2统计软件。我们研究与预后相关的基因表达的预测模型和骨肉瘤患者的临床特征的关系。采用Cox进行单因素与多因素统计分析,判断其相关性。利用Kaplan-Meier法绘制生存曲线计算生存率。P<0.05为有统计学差异。
2 结 果
2.1 筛选骨肉瘤预后相关基因及预后风险评分模型的构建
采用R语言包对各基因表达量与患者预后关系进行分析,最后得到9个与骨肉瘤患者预后有关的基因(CCNL1、FATE1、DUSP18、RBMXL1、MYC、RAD23A、CORT、VEGFA 、C3orf14)。根据预后回归系数和表达量构建预后风险预测模型。取风险系数中位值,分成高、低风险组,并进行生存分析计算骨肉瘤患者生存率,发现风险系数高的高风险患者总生存期明显低于系数低的低风险患者组。高、低表达组差异有统计学意义(P <0.01)。构建模型5年生存率的AUC值>0.9,该模型预测效果良好。
2.2 预后模型及预后相关因素分析
在GEO数据集中对该风险模型进行进一步预后相关因素的分析。多因素Cox分析结果显示模型风险系数(P = 0.001,HR = 1.31,95%CI = 1.14-1.49)与生存独立相关。以上结果表明,本模型风险系数是骨肉瘤预后的独立预测因子,高风险系数可预测预后不良。
3 讨 论
骨肉瘤是青少年最常见的恶性原发性骨肿瘤类型,早期易发生远处转移,预后差[3]。分子预后标志物的探索可进一步提高预后预测的准确性,进而凭借标准化检测定量的预后标志物进行骨肉瘤患者预后的预测。本研究建立一个新的预后评估模型。该预测模型基于公开骨肉瘤数据库9个基因表达水平,将有助于临床医生判断每个患者的预后。本研究中建立的模型是来自多个数据库的综合分析,也具有很高的可靠性。
参考文献:
[1] Li C, Guo D, Tang B, et al. Notch1 is associated with the multidrug resistance of hypoxic osteosarcoma by regulating MRP1 gene expression[J]. Neoplasma, 2016,63(5):734-42.
[2] Luo T, Yi X, Si W. Identification of miRNA and genes involving in osteosarcoma by comprehensive analysis of microRNA and copy number variation data[J]. Oncol Lett, 2017,14(5):5427-5433.
[3] Lindsey BA, Markel JE, Kleinerman ES. Osteosarcoma Overview[J]. Rheumatol Ther, 2017,4(1):25-43.