nucleotide blast(blastn)中空位罚分gap costs的计算方法

为什么要把这个看上去很简单的问题写下来呢,因为里面有些地方很容易引起误解,写下来给大家一个参考。

首先,blastn中默认的linear的罚分是如何计算的?所谓linear线性罚分,就是gap中每个碱基都扣相同的分数,那么到底是扣几分呢?我没有找到官方的说法,但是通过我的试验,我得出的结论是每个gap中的每个碱基扣2.5分,得到一个总分后还要四舍五入一下,于是1个碱基空位扣3分,两个扣5分,三个扣8分,以此类推。

其次,选择其他gap costs选项时,比如“existence 5 extension 2”,存在一个空位扣5分,每个延伸扣2分。一开始我想当然地认为是空位扣分后每个延伸是从第二个空位碱基开始算的,那么单个碱基的空位应该是扣5分,但是实际情况却是空位延伸罚分是从第一个碱基开始算的,单个碱基的空位就要扣5+2分,两个碱基的空位是5+2*2,n个碱基的空位就要扣5+n*2了。

最后,没有了~

Leave a comment