我与生信动物遗传育种分析之源来如此

我与生信|动物遗传育种分析之源来如此

之前有看到一位94岁的奶奶说,“你活得越长啊,最后能想起来的事情就只剩下那些让你心跳和感动的瞬间了”不仅生活,数据分析亦是如此开始一套流程最终让你印象深刻并记住的就是其中的试错部分
就讲一讲我是如何开始这个方向的吧!
本科毕业后因为试验基地需要去学习实验动物表型数据的测定工作,在此期间导师告诉我先想一想自己日后科研的大方向。初到基地,当时的状况让我觉得可能不外乎动物生产相关吧,现在想起基地那三个月的碌碌无为,满是因为没有好好钻研准备带来的后悔。在这里给即将步入研究生生活的师弟们一点建议吧:

一定要想明白自己为什么读研?否则以前的内心的不甘遗憾仍会重演。
我相信应该有很多师弟跟我一样,复试之后无所事事,不清楚自己擅长/喜欢什么。那此时我的建议是:
多与专业/课题组师兄们交流,了解他们的研究生生活、研究方向以及对专业的看法。(询问师兄师姐是非常有效的方法,多多少少他们都会给你一些经验、建议);
多和导师交流,他们一定会给你建议;
专业课自主学习,如果本科基础知识不扎实,一定要在这段时间找网上资源巩固强化;
提前阅读专业文献,了解学术前沿,明白大家都在做什么、怎么做,在这里不要因为没接触过外文文献而不敢去读(打破思维的墙)。
要是能重来 我要选李白!

入学,“源”来如此。

九月上旬,导师突然给了我一篇文章与群体数量遗传有关的文献,“如果没有想好的话,先试试这个方向吧!”开始阅读文章可用无从下手或是云里雾里等词汇来形容,虽说本科期间开设了动物数量遗传学课程,但当时课时少、自己不上心,导致这样的结果。文章里的公式、数据模型、专业词汇以及数据生物学意义,在当时就是一座难啃的大山。或许是我对啃掉这座大山的笃定,让我自信地认为我可以选择这个方向,并在这个领域可以走的更远。后面遍寻资源,找到了更加全面、基础的专业工具书并过了一篇,然后开始准备重现学习。当然这段啃大山的过程也让我对动物遗传育种数据分析有更大的兴趣。

之后,导师给我推荐了一位该方向的博士师兄,并让我有不懂的可以找他学习。在他的讲解我大概知道了我的薄弱点及需要学习的技能。就拿一个育种值计算来讲,动物个体的遗传效应,固定环境效应(日粮/性别等)和某性状遗传力的计算这些基础中的基础以及后面的性状线性模型建立、育种值计算,与生物统计和动物群体数量遗传学密不可分,所以这些基础知识的掌握程度决定了你的计算理解能力。开始在中国mooc上重新啃“线代”、“概率论与数理统计”这两门课,慢慢的理解了一些数量遗传中的模型与算法的推导。当学完这两门基础课后,对于数据意义的理解豁然开朗,也更有兴趣继续看继续探究下去。

理解掌握算法之后就是计算这一重要流程,掌握一门语言是关键,而R语言在统计分析方面的优势以及在遗传育种数据分析中的应用也已普及,于是开始我的R语言学习之路。我这个零基础的小白,刚开始一直在纠结跟哪个书籍/视频学习,考虑如何背代码。在走弯路的同时,同门都在如火如荼地开始实验、分析数据或是写文章。一筹莫展之际,博士师兄和同门开始注意到我,给予我帮助并慢慢找到了适合自己的正确学习方式。当时师兄给我推荐的《R语言的编程艺术》让我受益匪浅,一定要去实施,去自己敲代码,“一万行代码”是必要条件。

疫情期间,我开始真正实施,开始使用付费包ASReml,阅读CSDN里的博文(比如有“育种数据值放飞自我”),理解代码然后计算。理论学习的时候你一定想不到你会遇到来自各领域且数量较多的问题。每当遇到问题,一定要思考从源头一步一步的解决,首先看这个代码是否出错,然后开始思考自己的模型,再是自己的数据,一定要注意每一个细小的点等等,至于以后的试错经历等等,我还会继续分享出来。另外数据处理之前一定要明确处理思路,如果没有相关包,从线性模型的固定因子、随机因子(加性效应)和观测值(一定要查验数据值),到构建矩阵、构建模型每一步前期也可以完全用语言来解决。

希望可以遇见更多做这方面研究的同龄人,我不善言辞,有问题大家可以找我一起讨论学习。今天就聊到这,谢谢大家!

部分图片来源网络,侵删

赞(0)
未经允许不得转载:第一SCI网 » 我与生信动物遗传育种分析之源来如此

评论 抢沙发

评论前必须登录!