这个版本主要是修正了几个bug,加了一些小功能:
1、重新加入了每个标准输出信息的时间戳;
2、在帮助增添了对于k-mer长度的说明;
3、捕获写文件时发生的错误;
4、修正文件访问权限;
5、消除编译时的警告和错误;
6、修正一个死循环的bug;
7、修正一个内存溢出问题;
8、加入-clean和-very_clean参数,-clean选项会清除Graph和Graph2之外的文件,-very_clean选项会清除所有文件。
这个版本主要是修正了几个bug,加了一些小功能:
1、重新加入了每个标准输出信息的时间戳;
2、在帮助增添了对于k-mer长度的说明;
3、捕获写文件时发生的错误;
4、修正文件访问权限;
5、消除编译时的警告和错误;
6、修正一个死循环的bug;
7、修正一个内存溢出问题;
8、加入-clean和-very_clean参数,-clean选项会清除Graph和Graph2之外的文件,-very_clean选项会清除所有文件。
你好,我最近在学Velvet,但是参数设置上很多地方不明白,能回信告诉我你的联系方式么?希望能互相交流下。
@Jason:
有什么问题可以在这里提出,建议你先仔细看一遍manual~
你有没有试过用已知基因组序列物种的测序数据来做denovo assembly,然后将得到的contig与该物种的参考序列去比对?我分别用velvet和soap denovo对GA上机标准品phiX的测序数据做了denovo assembly,将得到的contig与phiX的序列比较,contig的大小与参考序列的大小差不多(都是5.4k),但是很多片段比对不上。
组装前已经filter了低质量的read,得到了60M高质量的(quality Q>30) percent>60的数据,相对于5.4k的参考序列,覆盖率肯定是足够的了,虽然读长较短(trim到了25bp),也不是paired-end文库,但是read depth够深了,所以不是很能理解为什么比对不上。
@Jason:
我没有用phiX测试过这个情况,不太清楚phiX序列是怎么样的。
你试过直接用reads去跟reference比对吗?有多少不能比对上呢,如果reads能比上那就是拼接效果不好,如果reads有很多比不上,说明测序有问题。
恩,确实,可能是这次的数据质量不高,我再去SRA下个E.coli的数据试试。
我想问下你组装时的流程是怎么样的?怎样才能知道组装的结果是可信的呢?
@Jason: 拼接流程应该跟你一样的,先低质量过滤,然后用velvet拼接。组装结果的可信度就是你对这个软件的信任程度了,现在的deno assembly没有完全准确拼接的软件,基本上也不可能出现,只能是相信它给的结果,如果有reference可以对比着看一下。
Leave a Reply
You must be logged in to post a comment.