2014年1月18日星期六

序列组装后的生物信息学分析

对一种真菌的基因组测序研究或许能够回答下面的问题:
为什么一种真菌能够成为病原物,而另外一种能够成为一种杀虫剂。
同样的,对水稻或者其它工程菌的测序或许也能回答下面的问题:
为什么有的水稻穗大粒多,高产,而另外一种水稻穗小粒少,低产。

下一代的测序技术(SOLiD, 454 and Genome Analyzer System)使得对真菌进行快速的测序成为可能,
在得到测序数据后,主要要进行后续的数据处理和分析:

第一步:
对序列进行组装,如果是重测序,可以用MAQ进行组装;
如果是对新物种进行(de novo)测序,用velvet进行组装.

第二步:
对组装后得到的Scaffold进行全基因组基因注释:
包括:基因组组分分析;编码基因预测;重复序列注释;Non-coding RNA基因注释;Micro RNA基因注释;tRNA基因注释;假基因(Pseudogene)注释等.
常用到的编码基因用到的软件有:
Augustus: http://augustus.gobics.de/
Fgenesh: http://www.softberry.com/
Genemark: http://exon.biology.gatech.edu/

第三步:
对预测的基因进行功能(Gene Ontology,调控Motif,Pathway等)注释:
可以使用的软件有:InterproScan,SignalP,SMURF

第四步:
比较基因组和分子进化分析:
如快速进化(rapid evolution)分析,共线性分析(Synteny Block),基因家族分析等;

常用的进化树分析软件:

MEGA:http://www.megasoftware.net/

与真菌相关的基因家族如:
P450:

http://p450.riceblast.snu.ac.kr

http://drnelson.utmem.edu/CytochromeP450.html

主要的真菌测序机构:

http://www.genolevures.org/

http://www.broadinstitute.org

http://www.jgi.doe.gov/

http://www.sanger.ac.uk/

参考文献:

http://www.aikexue.org/?p=327

http://www.igenomics.com.cn:7001/ajgene/jsp/ajweb/News.jsp?cid=20100811100636137145546254428108

原文来自:http://blog.sina.com.cn/s/blog_4af3f0d20100fq6v.html

没有评论 :

发表评论