芯片数据、注释文件临床信息下载全攻略

芯片数据、注释文件临床信息下载全攻略

数据下载实用手册。
上期课程已经详细讲解了GEO数据库的具体检索方法,解决了巧妇难为无米之炊的难题。那么本期课程作为《生信体系课-上篇》中的“挑”字段位第一模块的收官之课,则针对检索出的数据,重点讲解芯片数据、注释文件以及临床信息的下载方法。01

课程先是按照不同数据的网页,为大家讲解GEO数据库中的Series页面数据下载、Samples页面数据下载以及Platforms页面数据下载。
1.Series页面数据下载
在Series页面,我们的重点是看懂研究内容和芯片实验的具体方法、分组,然后下载表达矩阵,寻找每位受试者或样本的临床信息,特别是肿瘤的生存数据,其他疾病的金指标等等。
在具体阐述了Series页面每一个栏目的具体信息后,可下拉页面至下载数据的界面。值得注意的是,不是所有数据都能用GEO2R工具进行分析,对于不能使用GEO2R分析的数据, “Analyze with GEO2R”按钮不会显示;这种情况,需要下载数据自行分析。数据下载后,就需要对数据进行具体分析,而分析的前提就是要对该数据代表的意义了如指掌,否则,到手的数据就成为了无字天书,又何谈后续的数据挖掘呢?

因此,课程也对所下载的数据进行了一一解读,如SOFT文件解读和Series Matrix文件解读,可避免学员们深陷于数据海洋中而茫然无措。
2.Samples页面数据下载
在这个页面,我们要注意研究者是使用什么方法做质量控制的,比如标准化(normalization)、转值(transformation)、背景矫正(backgroud correction)、质控(quality control)。随后课程也详细介绍了该页面中每个栏目的具体涵义,并重点讲解了该页面数据下载的方法。3.Platforms页面数据下载Platforms页面的文件类型和Series页面的文件类型相似。比如SOFT和MINiML,我们同样不建议下载这类文件使用;txt注释文件表格:类似Series_Matrix文件,正是我们需要的精华文件,Annotation SOFT table:注释信息和txt注释文件表格基本一样。02

其次,课程也总结了几个主要芯片平台注释文件下载策略,帮助大家解决注释文件的寻找和下载问题;03

最后课程亦分享了GEO数据库中寻找临床信息的策略,包括DAVID数据库Gene ID Conversion工具、GEO2R工具、文献附件和Samples页面,每一个策略课程都有着事无巨细的讲解和对注意事项的提醒,有助于寻找芯片数据的临床信息。

《生信全书》–上册2020立一个flag“我一定要掌握它!”扫码领100元优惠,仅限15人哦!??????往期《生信体系课-上篇》课程:

段位一/模块01:芯片数据来源与下载
1.《生信全书》正式上线,生信研究逻辑思维初尝鲜2. 基因芯片基础知识全解析,提升BUFF满点
3. 两大检索技巧,让GEO数据挖掘垂手可得

赞(0)
未经允许不得转载:第一SCI网 » 芯片数据、注释文件临床信息下载全攻略

评论 抢沙发

评论前必须登录!