WGCNA结合ceRNA发4分+的SCI,这到底是什么神操作?

关注精彩内容,要先点击这里哦~

最近,才与大家分享了ceRNA分析神器——LnCeVar,详情点击LnCeVar:高逼格的lncRNA相关ceRNA分析神器,便发现这篇4分+的SCI,既然与它邂逅,那就来看看作者到底搞了什么神操作?
说他神操作吧,主要是小编个人觉得虽然前几年WGCNA看起来挺高端的,但目前不管是在IF 10分+还是1分+的的生信文章中常常都能看到WGCNA的影子,甚至中文期刊也开始大面积引进,所以这篇WGCNA结合ceRNA发4分+的SCI还是挺厉害的!

                                             


下面我们就看看作者是怎么搞事情的!


1、数据的下载和预处理


使用R软件的TCGAbiolinks包下载TCGA乳腺癌的LncRNA,mRNA和miRNA表达谱,研究对象入组标准是
(a)数据集中有癌变组织和相应的正常组织配对;
(b)有随访时间。

2、加权共表达网络的构建和关键模块的识别


作者从112对对的样本中选择了表达水平在TOP 5000中的lncRNA,mRNA和miRNA。利用”WGCNA包”,将这些基因,lncRNA和miRNA的表达谱用于构建基因共表达网络。最终确认了lncRNA / mRNA和miRNA共表达网络中的β值分别为10(下图A)和6(下图B)。
分别绘制lncRNA/mRNA与模块相关性的热图(下图A);miRNA与模块相关性的热图(下图B)。从图中可以看出,在lncRNA / mRNA和miRNA共表达网络中分别生成了23个模块和5个模块,通过皮尔逊相关系数来识别乳腺癌模块和临床信息(即正常或肿瘤)之间的相关性。Green模块与lncRNA/mRNA共表达网络相关的肿瘤样本显示出最强的正相关性(0.63);Blue模块与miRNAs共表达网络相关的肿瘤样本呈正相关(0.29)。根据WGCNA的结果,最相关的模块是lncRNA/mRNA中的Green模块,miRNA中的Blue模块。而module eigengenes (MEs) 可以代表特定模块中的所有基因。因此使用这两个模块中的所有mRNA,lncRNA和miRNA进行分析,以构建ceRNA网络。


那么模块是怎么聚类的呢?主要是根据动态剪切法确定基因模块,对模块进行聚类分析,将距离较近的模块合并为新的模块。作者对于lncRNA/mRNA的剪切高度为0.25,miRNA的剪切高度为0.2,将各个模块聚类整合,最终对lncRNA/mRNA和miRNA进行了聚类。(小编个人觉得,可能文中这个图放在上图之前更合适,毕竟是先聚类出模块,再计算模块与肿瘤样本的相关性)


3、CeRNA网络的创建与分析


(a)lncRNA-miRNA的预测:miRcode(http://www.mircode.org/)数据库。

结果:对最相关模块中的lncRNA和miRNA进行预测,共预测出257个lncRNA-miRNA对,包含52个lncRNA(4个上调和44个下调)和17个miRNA。
(b)miRNA-mRNA的预测: 
starBase v2.0(http://starbase.sysu.edu.cn)在线工具。然后是三个在线数据库TargetScan(http://www.targetscan.org/),miRDB(http://www.mirdb.org/miRDB/)和miRTarBase(http://mirtarbase.mbc.nctu)。将各个数据库结果求交集,以确保获得更可靠的结果。
结果:17个miRNA的靶基因预测,得到1162对miRNA-mRNA对,靶基因mRNA 966个。
(c)lncRNA-miRNA-mRNA ceRNA网络的构建:Cytoscape 3.7.0软件用于基于lncRNA-miRNA和miRNA-mRNA对构建和可视化ceRNA网络。


4、GO和KEGG富集分析


使用DAVID网站对ceRNA中的mRNA进行GO和KEGG富集分析(DAVID分析方法可见本公众号推文——DAVID&Metascape:专注于基因功能注释和富集通路分析的网站),使用R软件中的“GOplot包”可视化富集分析的结果。


5、生存分析


使用R语言的“survival包”进行生存分析,在52个lncRNA中,Kaplan-Meier法分析发现5个lncRNA(AL117190.1,COL4A2-AS1,LINC00184,MEG3和MIR22HG)与乳腺癌的预后相关。



文章思路总结:



1.从TCGA数据库下载乳腺癌的LncRNA,mRNA和miRNA表达谱;

2.筛选TOP 5000的lncRNA,TOP 5000的mRNA和所有miRNA,以进行加权基因共表达网络分析。利用皮尔逊相关系数确定乳腺癌模块与临床信息之间的相关性。

3.确定最相关的模块,模块中的eigengenes (MEs)在已知数据库中进行lncRNA-miRNA对和miRNA-mRNA对的预测,用以构建乳腺癌的ceRNA网络,Cytoscape软件进行可视化。

4.对ceRNA网络中的miRNA的靶基因进行GO和KEGG富集分析。

5.Kaplan-Meier法进行生存分析,筛选ceRNA网络中与乳腺癌预后相关的lncRNA。

简单的TCGA数据下载,不需要高端的算法,最主要是好的idea,WGCNA结合ceRNA分析发了4分+。这就是作者的神操作,学会了吗?

原文获取方式,后台回复关键词:WGCNA

生信发文助手

生信分析服务请加微信:keyan-zhishi2



生信发文助手原创文章,

未经许可, 严禁转载


多点好看,少点脱发

抢沙发

  • QQ号
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

登录

忘记密码 ?

切换登录

注册