基于基因表达谱分析的胃癌诊断及预后相关长链非编码RNA谱识别及鉴定
作者: |
1范志远,
1刘炳亚,
1朱正伦,
1严超,
1刘文韬,
1燕敏
1 上海交通大学医学院附属瑞金医院,上海 200025 |
通讯: | |
DOI: | 10.3978/j.issn.2095-6959.2015.06.S092 |
摘要
目的:筛选可靠的胃癌诊断及预后相关长链非编码RNA(lncRNA)谱,建立基于lncRNA谱的胃癌预后风险评分系统。方法:下载4个已发表的胃癌cDNA芯片数据集,对训练集GSE63089采用6种不同分类器筛选得到胃癌相关lncRNA谱,十字交叉验证及ROC曲线评估其诊断价值。在测试集(GSE27342,GSE38749和GSE50710)中验证模型的稳定性。经随机森林算法进一步筛选得到胃癌预后相关lncRNA,基于此建立胃癌风险评分,进而与性别、年龄等参数行单因素及多因素Cox回归。GSEA分析揭示胃癌预后相关lncRNA 的生物学功能。最后,通过7株胃癌细胞株、胃上皮永生化细胞株GES-1及30对胃癌组织以qRT-PCR法检测胃癌预后相关lncRNA在体内外的表达水平及对胃癌的诊断能力。结果:经训练集GSE63089筛选,得到35个具诊断胃癌价值的lncRNA;十字交叉验证显示6种分类器基于35个lncRNA诊断胃癌的准确率分别为90%、87%、89%、88%、89%和92%; 3种线性分类器(CC、DLDA和SVM)ROC曲线的AUC分别为0.957,0.961和0.986。验证集中诊断胃癌的准确率同样可达70~100%,证明模型的稳定性。随机森林算法进一步筛选出5 个与胃癌预后相关的lncRNA(AK001094、AK024171、AK093735、BC003519和NR_003573),基于其表达值建立胃癌预后风险评分。该评分系统对预后判断的AUC值为0.732;单因素及多因素分析发现,风险评分是胃癌预后的独立风险因素[单因素分析,HR=2.718,95% CI, 1.452~5.090];多因素分析,HR=5.249,95% CI, 1.718-16.034]。GSEA分析显示,5个lncRNA主要参与细胞粘附等信号通路。体内外实验验证发现,AK093735、BC003519及NR_003573在胃癌中表达上调(P<0.05),而AK001094、AK024171则表达下调(P<0.05),与芯片结果一致;5个lncRNA诊断胃癌的AUC值分别为0.693、0.745、0.896、0.769和0.845, 5者联合诊断的AUC值为0.958。结论:LncRNA谱可以作为胃癌诊断及预后的可靠标志物,但其具体生物学机制尚待进一步研究证实。
关键词:
长链非编码RNA
胃癌诊断
胃癌预后
风险评分
DOI: 10.3978/j.issn.2095-6959.2015.06.S092