MUMmer是一个快速比对两个基因组序列的软件。在一个普通的linux机器上,比对两个3~4Mb的基因组所需要的时间只要30秒不到。其余还有很多功能将在下面详细说明。
MUMmer的主页为http://www.tigr.org/software/mummer/,只要填写好一个licenes,就可以免费下载该软件。安装是将下载的MUMmer2.13.tar.gz解压缩,进入解压缩目录后,键入make install,就完成安装,如果有报错信息,则根据报错信息对Makefile进行修改。
根据不同的情况,MUMmer有不同的程序进行比对,下面将一一说明
run-mummer1.csh
用法 run-mummer1.csh <seq 1> <seq 2> <tag>
seq1 是一条fasta格式的序列
seq2 是另一条fasta格式的序列
tag 是输出的文件名,输出有tag.out tag.align tag.gaps
该程序是最适合用在两个高度相似的基因组,并且没有很多的重排的片断
run-mummer2.csh
用法 run-mummer2.csh <reference> <query> <prefix>
refercence 是参考序列
query 是比对序列
prefix 是输出名字
输出文件有
- <prefix>.out 列出比对上的位置和长度
- <prefix>.gaps 列出了比对结果中的gap分布
- <prefix>.errorsgaps 列出了上面gap分布结果中可能错误的gap
- <prefix>.align 和.gaps文件相似,多了gap前后的位置和gap长度的比率
该程序是在mummer1的基础上改进了算法,增加了比对上的序列聚类的功能,适合有一定重排情况的序列之间的比对
nucmer
用法: nucmer [options] <reference> <query>
reference 参考序列
query 比对序列
options 参数太多,无法在这里一一说明,可以参考MUMmer目录下的doc文档
该程序最大的特点是支持多序列对多序列比对,适合差异较大的序列之间的比对
promer
用法: promer [options] <reference> <query>
reference 参考序列
query 比对序列
options 参数太多,无法在这里一一说明,可以参考MUMmer目录下的doc文档
该程序是多序列对多序列进行6个相位比对
运行下面两步,直接运行即可,路径已经设好
mummerplot
mummerplot <prefix>.out -p <plot prefix>"
gnuplot <plot prefix>.gp"
需要图示结果的话,需要安装gnuplot
原文来自:http://lwzhanghz.blog.163.com/blog/static/1368263692013128104648/