2014年1月19日星期日

蛋白质预测分析

物理性质预测: 
Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemass http://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://ftp.virginia.edu/pub/fasta/ SAPShttp://ulrec3.unil.ch/software/SAPS_form.html

基于组成的蛋白质识别预测 
AACompIdent http://expaxy.hcuge.ch/ch2d/aacompi.html AACompSim http://expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http://www.embl-heidelberg.de/prs.html 

二级结构和折叠类预测
nnpredict http://www.cmpharm.ucsf.edu/~nomi/nnpredictPredictprotein http://www.embl-heidelberg.de/predictprotein/SOPMA http://www.ibcp.fr/predict.htmlSSPRED http://www.embl-heidelberg.de/sspred/ssprd_info.html

图解ClustalX多序列比对

软件简介:
  CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。
  序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。

主要功能:
  你可以剪切、粘贴序列以更改比对的顺序;
  你可以选择序列子集进行比对;
  你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;
  可执行比对质量分析,低分值片段或异常残基将以高亮显示。

2014年1月18日星期六

核酸序列预测分析的基本思路

当我们得到一个DNA序列时,一般都需要对该片段进行分析,确定它的功能区域,寻找调控区域、编码区域,预测其编码蛋白,这些就是我们研究DNA序列的目的。 

核酸序列的预测就是在核酸序列中寻找基因,找出基因的位置及功能位点,以及标记已知的序列模式等过程。在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持: 
1、一般而言,在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现; 
2、如果某段DNA片段的假想产物与某个已知的蛋白质或其它基因的产物具有较高序列相似性的话,那么这个DNA片段就非常可能属于外显子片段; 
3、在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DNA是蛋白质编码区的有力证据; 

序列组装后的生物信息学分析

对一种真菌的基因组测序研究或许能够回答下面的问题:
为什么一种真菌能够成为病原物,而另外一种能够成为一种杀虫剂。
同样的,对水稻或者其它工程菌的测序或许也能回答下面的问题:
为什么有的水稻穗大粒多,高产,而另外一种水稻穗小粒少,低产。

下一代的测序技术(SOLiD, 454 and Genome Analyzer System)使得对真菌进行快速的测序成为可能,
在得到测序数据后,主要要进行后续的数据处理和分析:

第一步:
对序列进行组装,如果是重测序,可以用MAQ进行组装;
如果是对新物种进行(de novo)测序,用velvet进行组装.

第二步:
对组装后得到的Scaffold进行全基因组基因注释:
包括:基因组组分分析;编码基因预测;重复序列注释;Non-coding RNA基因注释;Micro RNA基因注释;tRNA基因注释;假基因(Pseudogene)注释等.

生物信息学分析实例

ORF预测的可靠性检验
设计引物:Primer Premier 5.0评估引物质量:Oligo 6.65 Oligonucleotide Properties Calculator
NCBI
blast 2 SEQUENCES程序
 http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi

核苷酸序列=>氨基酸序列
制作密码子用法表
蛋白质理化性质分析
在线分析
ExPasy服务器上的ProtParam http://us.expasy.org/tools/protparam.html 

2014年1月2日星期四

生物信息可视化软件汇总

        在处理二代测序数据上,布朗(Broad )研究所开发了许多优秀的软件,这是它的一个软件中心:(http://www.broadinstitute.org/scientific-community/software),其中Integrative Genomics Viewer (IGV)http://www.broadinstitute.org/software/igv/home)是一个用于数据可视化的软件。它直接读取由短片段序列比对基因组的bam文件,可以阅览所有短序列上的SNP。
         对于许多进一步加工后的数据,比对SNP文件、INDEL文件和可变剪切的GFF文件,chip-seq数据,UCSC(http://genome.ucsc.edu/)是一个非常实用的在线网站,但是它包含的基因组还相对有限。GBrowse(http://gmod.org/wiki/Gbrowse)是一个可供拥有服务器的实验室自主搭建基因组在线浏览的平台。

2014年1月1日星期三

生物信息学相关网站

生物信息学与生物计算http://bioinformatics.weizmann.ac.il/ 
     这是生物信息学和生物计算学的网站,由Weizmann科学研究所,生物服务部和Crown人类基因组学中心支持。研究领域主要涵盖序列分析,蛋白质组学和基因组学等。该网站提供了数据库,电子论坛,教育,新闻,软件,招聘启事等。该网站还提供了相关链接,包括欧洲分子生物学以色列国家网点,以色列国家基因组基础设施实验室以及国际生物信息学合作中心。 

生物信息学专题http://www.biosino.org/bioinformatics/bioinfo.htm 
     中国科学院上海生命科学研究院生物信息中心的网站中的生物信息学专题提供与生物信息学有关的新闻信息,生物信息学文献的介绍(包括的课题例如:鉴别肿瘤的亚型,

14大常用生物学软件简介

1. Oligo 6是目前使用最为广泛的一款引物设计软件,除了可以简单快捷地完成各种引物和探针的设计与分析外,还具有很多其他同类软件所不具有的高级功能: a) 已知一个PCR引物的序列,搜寻和设计另一个引物的序列。b) 按照不同的物种对MM子的偏好性设计简并引物。 c) 对环型DNA片段,设计反向PCR引物。d) 设计多重PCR引物。e) LCR反应设计探针,以检测某个突变是否出现。f) 分析和评价用其他途径设计的引物是否合理。 g) 同源序列查找,并根据同源区设计引物。h) 增强了的引物/探针搜寻手段。设计引物过程中,可以“Lock”每个参数,如Tm值范围和引物3’端的稳定性等。 i) 以多种形式存储结果;支持多用户,每个用户可保存自己的特殊设置。 
 网址: http://www.oligo.net/ 

各类生物信息学软件简介

一、基因芯片
1、基因芯片综合分析软件。ArrayVision 7.0 一种功能强大的商业版基因芯片分析软件,不仅可以进行图像分析,还可以进行数据处理,方便protocol的管理功能强大,商业版正式版:6900美元。
Arraypro 4.0 Media Cybernetics公司的产品,该公司的gelpro, imagepro一直以精确成为同类产品中的佼佼者,相信arraypro也不会差。
phoretix™ Array Nonlinear Dynamics公司的基因片综合分析软件。
J-express 挪威Bergen大学编写,是一个用JAVA语言写的应用程序,界面清晰漂亮,用来分析微矩阵(microarray)实验获得的基因表达数据,需要下载安装JAVA运行环境JRE1.2后(5.1M)后,才能运行。


2、基因芯片阅读图像分析软件ScanAlyze 2.44 ,斯坦福的基因芯片基因芯片阅读软件,进行微矩阵荧光图像分析,包括半自动定义格栅与像素点分析。输出为分隔的文本格式,可很容易地转化为任何数据库。

生物信息学中的基因序列分析软件

摘 要:近年来,随着人类基因组计划的实施,极大的推动了生物信息学的发展。随之而来的大量核酸和蛋白质数据的积累及分析这些数据中所蕴涵的生物学意义成为生物学的主要任务。这样,大量的基因组数据不得不借助生物信息学技术进行自动分析和处理,如利用开放阅读框架(Open Reading Fram)检测算法自动寻找基因组dna序列中的基因;对蛋白质、核苷酸数据库进行类似性检索或同源性检索等[1]。相应的,生物信息学各个领域中的软件层出不穷,已广泛用于基因序列数据的获取、处理、分析和管理,并得到不断的改进和完善。本文研究观察了一些本地计算机上运行的基因序列处理、分析软件,目的在于帮助生物学研究者选择最有效的基因序列分析工具。

生物信息学札记-樊龙江(浙大)

本材料可通过下列网址获得:
http://ibi.zju.edu.cn/bioinplant/

                                                  
前言

第一版
这份材料是我学习和讲授生物信息学课程时的备课笔记,材料大多是根据当时收集的一些外文资料翻译编辑而成。学生在学习过程中经常要求我给他们提供一些中文的讲义或材料,这促使我把我的这份笔记整理并放到网上,供大家参考。要提醒使用者的是,这份材料仅是根据我对生物信息学的一些浮浅的认识整理而成,其中的错误和偏颇只能请读者自鉴了。

20016
                          

生命科学不容错过的几款App

最近,Biotechniques杂志介绍了一些简单实用的App和网站,现在各位学霸可以随时随地进行科研了。从分子克隆到qPCR,从线虫到质粒,都在你的掌握之中。
这款多功能软件是分子克隆的好帮手,提供了实验设计和进行所需的基本工具,可以帮你摸索实验条件,选择合适的限制性内切酶和感受态细胞等等。软件由Life Technologies公司提供,适用于iPhone/iPad
这是一本在线教材,可以帮助用户为特定研究选择合适的统计学工具。此外该教材还提供了详细的指引,以便用户能够正确使用统计学工具,并正确解读统计学结果。
该软件展示了线虫C. elegans3D模型,该模型包含各细胞的详细信息,支持放大、旋转和翻转等功能,适用于iPhone/iPad

microRNA靶基因预测常用软件介绍

认为RNA仅是DNA与蛋白质之间的过渡的时代已经终结,microRNA的发现使科研界再次聚焦RNA。
microRNA(miRNA)是一类长22 nt左右的内源非编码小RNA,广泛存在于动物、植物和病毒等物种中。1993年,Lee等人首先在秀丽线虫体内发现了首个miRNA lin-4,进一步研究表明,lin-4 RNA通过与lin-14基因3′ UTR特异性结合降低LIN-14蛋白的表达水平。miRNA基因通常位于基因间或内含子区域,由RNA聚合酶转录产生pri-miRNApri-miRNA具有帽子结构和多聚腺苷酸尾巴,pri-miRNA在核酸酶Drosha作用下切割生成70nt左右的pre-miRNA,核酸酶Dicer切割pre-miRNA最终生成22nt左右的miRNA单链分子。成熟的miRNA分子与Argonaute等蛋白形成RNA诱导的沉默复合体(RISC)抑制靶基因表达。

miRNA研究中常用的软件和数据库资源

(1) miRbase:众所周知的microRNA基因注释数据库。目前miRBase只提供了microRNA的靶标的预测软件的链接(如:PicTar)。 网址:http://mirbase.org/index.shtml
(2) starBase:一个高通量实验数据CLIP-Seq(或称为HITS-CLIP)和mRNA降解组测序数据支持的microRNA靶标数据库,整合和构建多个流行的靶标预测软件的交集和调控关系。网址:http://starbase.sysu.edu.cn/
(3) Tarbase:一个收集已被实验验证的microRNA靶标数据库。网址:http://microrna.gr/tarbase/
(4) miRecords:一个整合的microRNA靶标数据库。整合多个靶标预测软件的调控关系。网址:http://mirecords.biolead.org/
(5) targetScan: 基于靶mRNA序列的进化保守等特征搜寻动物的microRNA靶基因。是预测microRNA靶标假阳性率较低的软件。而且是microRNA领域大牛Bartel实验室开发的。网址:http://www.targetscan.org/

疾病相关microRNA研究策略及方法

近年来,研究还发现,miRNA分子同已知的循环核酸(DNARNA)一样,广泛存在于正常人和不同种病人的血清和血浆中,并且随着生理状况、疾病的类型和病程的不同而表达异常。随着循环miRNA的发现,人们对miRNA的兴趣日增,这么好的疾病诊断和预防标志物,岂能错过?但是如何开展miRNA研究呢?一般来说,通常是先开展miRNA表达谱分析,筛选出与特定生物学过程相关的miRNA。之后是miRNA靶基因验证并通过miRNA的过表达和沉默,进行miRNA的功能分析。
miRNA表达谱分析
miRNA分离纯化
包括经典的Trizol法提取总RNA和众多的商业化kit,比如miRNeasy Mini Kit – Qiagen, mirVana – AmbionPureLink® miRNA Isolation Kit - Life TechnologiesmirPremier - SigmaHigh Pure miRNA Isolation Kit - Roche ,各有优劣,可根据样品类型选择。
RNA浓度纯度分析

microRNA相关的数据库与预测、分析软件

miRBase: http://www.mirbase.orgmiRBase序列数据库是一个提供包括已发表的miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一。miRBase提供便捷的网上查询服务,允许用户使用关键词或序列在线搜索已知的miRNA和靶标信息。

miRecords: http://mirecords.biolead.org/动物 miRNA的靶相互作用的数据库, 包括人工收集实验验证的, 预测的 miRNA的靶目标. 靶标预测工具DIANA-microT, MicroInspector, miRanda, MirTarget2, miTarget, NBmiRTar, PicTar, PITA, RNA22, RNAhybrid, and TargetScan/TargertScanS.

PMRD: http://bioinformatics.cau.edu.cn/PMRD/PMRD是一个关于植物microRNA数据库,包括了microRNA序列和它们的靶基因、二级结构、表达谱、基因组搜索等等,并且该数据库尝试着整合大量的关于植物microRNA的数据。