2014年1月19日星期日

图解ClustalX多序列比对

软件简介:
  CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。
  序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。

主要功能:
  你可以剪切、粘贴序列以更改比对的顺序;
  你可以选择序列子集进行比对;
  你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;
  可执行比对质量分析,低分值片段或异常残基将以高亮显示。
原理:

序列同源性分析是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;
Clustal是一个单机版的基于渐进比对的多序列比对工具,由Higgins D.G.等开发。有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,clustalx等。
CLUSTAL是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。

操作:

官方下载地址:http://www.clustal.org/download/current/

1、打开程序

如下图所示:



2、Load Sequnce, 载入序列

如下图所示:




3、选择序列文件,FASTA格式的

如下图所示:



4、用文本编辑器察看FASTA序列文件内容,这里用的是记事本,推荐用EditPlus或者Ultraedit

如下图所示:



5、序列Load进去之后

如下图所示:




6、Do Complete Alignment, 通常情况下直接选这个即可,无须修改比对参数(可以根据分析要求设置相对的比对参数。通常情况下,我们可以使用默认参数。比对参数主要有六个,分别是Reset New Gaps before Alignment(比对前重置新的空位参数),Reset All Gaps before Alignment(比对前重置所有空位参数),Pairwise Alignment Parameters(两两序列比对参数),Multiple Alignment Parameters(多重序列比对参数),Protein Gap Parameters(蛋白空位参数),Secondary structure Parameters(二级结构参数))

如下图所示:



7、点Do Complete Alignment之后弹出的文件对话框,.dnd的是输出的指导树文件,.aln的是序列比对结果,它们都是纯文本文件

如下图所示:


点“ALIGN”之后开始等待,如果序列不多,很快就可以算完,如果数据很多,可能要等一段时间,这时候可以用眼睛盯着ClustalX的状态栏,那里会有程序运行状态和现在正在比对那两条序列的提示信息,看看可以消磨时间。。。

8、比对结束之后,我们可以看到这个结果

如下图所示:



9、这时候我们可以发现ClustalX已经生成了.dnd和.aln两个文件,仍然用文本编辑器打开来看,这时.aln文件,这个文件可以用Mega2做进一步的bootstrap进化树分析

如下图所示:



10、这是.dnd文件(指导树)

如下图所示:



11、可以用Treeview打开dnd文件,看上去就像这样子

如下图所示:





12. 后续分析:
  1)Clustalx比对生成的结果可读性不是太好,一般需要专业的序列着色软件处理,如Boxshade、ESPript,这两个工具都是在线进行,其中Boxshade图解教程详见本Blog日志。
Boxshade在线网址:http://www.ch.embnet.org/software/BOX_form.html
ESPript在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi

  2)转换ALN文件,进一步构建系统发育树,转换格式依不同软件而有所不同,如在PHYLIP分析前需要将ALN格式转换为PHY格式方可...
p2008678626.png 

注意事项
1)dnd是向导树文件,可以用TreeViews软件查看树图。注意:向导树不是系统发育树。
2)多重比对文件推荐要求为规范的FASTA格式,文件扩展名不限,格式大致如下:
>RGDV_BAA02676
MSRQAWIETSALIECISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_ABC75537
MSRQAWIETSALIECISEYGTKCSFCHLWVIMSFIAVFGRYYTVN
>RGDV_AAO64253
MSRQAWIETSALIERISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_AAY14576
 Clustalw的使用()
第一步:按屏幕提示选择1,输入序列文件
注意:请把你需要比对的多条序列合并为一条,放在一个文件中
Clustal的使用总结(Clustalx+Clustalw)(原理、操作,下载地址,很详细)
第二步:选择保存文件的形式,按提示选择,你会的!
第三步:参数设置好后,按Enter返回主界面,开始比对!
Clustal的使用总结(Clustalx+Clustalw)(原理、操作,下载地址,很详细)
EBI提供的在线clustalw服务
可以在这里得到更多关于clustal的帮助:

没有评论 :

发表评论