大数据预测结直肠癌预后
本次课程讲述的文章是《Experimentally Derived Metastasis Gene Expression Profile Predicts Recurrence and Death in Patients With Colon Cancer》,文章中数据更偏重于临床,文中包含了 244 个样本,而这些数据并没有进行生物信息学的挖掘,但是得到的结论很有价值。
本文首先做的是小鼠的动物模型 ( 6 张表达谱芯片),通过芯片数据得到 300 个差异基因 (人类同源性基因,保证与后面临床数据保持一致),接下来使用 55 例训练数据集筛出 34 个与复发相关的基因,再根据 34 个基因的表达值判断病人复发的风险,最后 177 例验证数据集得出对于不同的结直肠癌分期预后情况不同。、
本次课程主要使用文中同批数据 (177 例验证数据集) 进行挖掘,能否得到其他有用信息。
肿瘤分期情况
举个例子,通过临床分期,来找到相应基因。经过初步分析,得到了 5000 多个差异基因,而这是很难获得有用的基因。将这些基因经过趋势分析后再做网络图,打开网络图,加上标签、减少数量、放大后来看,结合数据和图,找到重要的基因。详细内容请查看视频。
课程中,孙教授会对大家的问题进行解答,详细情况请大家查看视频。
学员问题节选:
1、芯片数据中差异基因有的上调,有的下调,如何挑选?
2、筛选差异基因时,一般 2 倍 300 个,4 倍 30 多个,能否 6 被进一步缩小范围?
3、如何是关注的基因排名靠前?
4、检测到的差异基因没有通路在 KEGG 涉及到,怎么办?
5、他人芯片结果,我分析后可以用于论文发表吗?
6、怎么搜索与自己芯片类似的芯片?
详细内容请点击视频:http://college.gcbi.com.cn/silu/651.jhtml
GCBI 学院每周四晚 8 点在线直播肿瘤基因大数据挖掘的课程,提供相关课题设计思路、研究思路,生物信息学分析方法介绍、精彩文章解读以及数据重新挖掘等内容,不断提升生物医学科研人员在基因研究领域的技能。
点击链接进入 GCBI 学院报名听课,http://college.gcbi.com.cn/html/index.html。