用Amos软件包里面的minimus2合并454和Illumina/Solexa拼接得到的contig

用罗氏454测序得到的序列用newbler拼接的效果最好,而用短序列拼接软件velvet拼接效果很差,所以不能将454的原始reads和Illumina产生的reads合到一起后用velvet进行拼接。在用newbler和velvet分别拼接454和Illumina的reads得到contigs之后,我们就需要将两者的contig再合并起来,得到更好的拼接结果。这里就介绍一个简单易用的软件minimus2。 minimus2是amos拼接软件包里面的一个组件,它的功能就是将两组contig进行合并,延伸contig的长度,减少contig的数量。Amos是A Modular, Open-Source whole genome assembler的缩写,致力于打造成一个拼接软件的基础软件系统。minimus2用的是基于nucmer overlap检测的算法,速度上比Smith-Waterman hash-overlap的算法要快,下面就介绍一下用法。 首先当然是下载amos软件包进行安装,下载地址为:http://sourceforge.net/projects/amos/files/ 安装啥的就不说了,根据说明来就行。安装完成之后,minimus2软件位于amos安装文件夹下的bin里面。在运行minimus2之前首先要准备好文件,比如现在有s1.fa和s2.fa两组包含contig的文件,首先要知道里面包含的contig数目,针对fasta格式,用 grep -c “^>” s1.fa s2.fa  命令得到,比如分别为100和200个contig。 然后用cat命令合并到一个文件: cat s1.fa s2.fa >s1_s2.fa 再用amos里面的另一个软件toAmos转换成Amos格式,这个软件也位于bin文件夹下面 ./toAmos -s s1_s2.fa -o s1_s2.afg 这里的-s是指输入的为fasta格式。 然后就可以运行minimus2了 minimus2的运行参数为:  minimus2 prefix \ -D REFCOUNT=n \ # Number of sequences is the first set -D OVERLAP=n \ # Minimum overlap (Default 40bp) -D CONSERR=f […]

应用于第二代测序技术的生物信息学工具[zz]

刚才闲逛发现了这篇被多家博客转载的文章,来自于SEQanswer,总结地比较全面,不过已经比较老了,随便看看~ Integrated solutions * CLCbio Genomics Workbench – de novo and reference assembly of Sanger, Roche FLX, Illumina, Helicos, and SOLiD data. Commercial next-gen-seq software that extends the CLCbio Main Workbench software. Includes SNP detection, CHiP-seq, browser and other features. Commercial. Windows, Mac OS X and Linux. * Galaxy – Galaxy = interactive and reproducible […]

序列拼接软件velvet 1.0.14发布

这个版本主要是修正了几个bug,加了一些小功能: 1、重新加入了每个标准输出信息的时间戳; 2、在帮助增添了对于k-mer长度的说明; 3、捕获写文件时发生的错误; 4、修正文件访问权限; 5、消除编译时的警告和错误; 6、修正一个死循环的bug; 7、修正一个内存溢出问题; 8、加入-clean和-very_clean参数,-clean选项会清除Graph和Graph2之外的文件,-very_clean选项会清除所有文件。

新一代测序技术组装拼接软件velvet使用简介

目前用于新一代的测序的主要仪器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它们都能高通量的测序,产生大量的测序结果,接下来就要对序列进行拼接,用于拼接的软件也有很多,比如velvet、soap、abyss、maq等,454的还有专门的newbler。平时用velvet比较多,就简单介绍一下。 velvet对短序列的拼接效果比较好,所以多用于对Illumina等产生的短序列片段进行组装拼接。下面以Illumina的GAII产生的结果为例进行说明。