Godaddy冬日$1.49优惠码(2011年1月-2月)

  • 优惠内容: Register or transfer any available .COM, .US, .MOBI, .BIZ, .NET, .ORG, .CA, .CO.UK and .IN domain for just $1.49!*
  • 优惠码: winter149
  • 有效期: expiring after 10,000 redemptions or at 11:59 PM on February 16, 2011 (whichever comes first)
  • 支付方式: 信用卡或者支票,不支持支付宝

SPECIAL OFFER! $1.49* DOMAIN NAME!

Register or transfer any available .COM, .US, .MOBI, .BIZ, .NET, .ORG, .CA, .CO.UK and .IN domain for just $1.49!*
Applies to the first year only of new or transfer registrations. This offer may not be used for renewals, bulk registrations, premium domains or Sunrise/Landrush domain registrations. Limited to one order per customer, expiring after 10,000 redemptions or at 11:59 PM on February 16, 2011 (whichever comes first). Discount will be reflected in your shopping cart; cannot be used in conjunction with any other offer or promotion. Customers may not use gift cards, PayPal® or AliPay to redeem this offer.
* Plus ICANN fee of 18 cents per domain year when applicable.

Your discount will be applied in your shopping cart.

用Amos软件包里面的minimus2合并454和Illumina/Solexa拼接得到的contig

用罗氏454测序得到的序列用newbler拼接的效果最好,而用短序列拼接软件velvet拼接效果很差,所以不能将454的原始reads和Illumina产生的reads合到一起后用velvet进行拼接。在用newbler和velvet分别拼接454和Illumina的reads得到contigs之后,我们就需要将两者的contig再合并起来,得到更好的拼接结果。这里就介绍一个简单易用的软件minimus2。

minimus2是amos拼接软件包里面的一个组件,它的功能就是将两组contig进行合并,延伸contig的长度,减少contig的数量。Amos是A Modular, Open-Source whole genome assembler的缩写,致力于打造成一个拼接软件的基础软件系统。minimus2用的是基于nucmer overlap检测的算法,速度上比Smith-Waterman hash-overlap的算法要快,下面就介绍一下用法。

首先当然是下载amos软件包进行安装,下载地址为:http://sourceforge.net/projects/amos/files/

安装啥的就不说了,根据说明来就行。安装完成之后,minimus2软件位于amos安装文件夹下的bin里面。在运行minimus2之前首先要准备好文件,比如现在有s1.fa和s2.fa两组包含contig的文件,首先要知道里面包含的contig数目,针对fasta格式,用

grep -c "^>" s1.fa s2.fa  命令得到,比如分别为100和200个contig。

然后用cat命令合并到一个文件:

cat s1.fa s2.fa >s1_s2.fa

再用amos里面的另一个软件toAmos转换成Amos格式,这个软件也位于bin文件夹下面

./toAmos -s s1_s2.fa -o s1_s2.afg
这里的-s是指输入的为fasta格式。

然后就可以运行minimus2了

minimus2的运行参数为:

 minimus2 prefix  \
   -D REFCOUNT=n  \  # Number of sequences is the first set
   -D OVERLAP=n   \  # Minimum overlap (Default 40bp)
   -D CONSERR=f   \  # Maximum consensus error (0..1) (Def 0.06)
   -D MINID=n     \  # Minimum overlap %id for align. (Def 94)
   -D MAXTRIM=n      # Maximum sequence trimming length (Def 20bp)
最简单的命令为:
./minimus2 s1_s2 -D REFCOUNT=100

这里只要告诉文件名(不要后缀)和作为参考序列的第一组contig的数目就可以了。会生成一堆以s1_s2开头的文件,其中s1_s2.fasta就是合并之后得到的contig文件。

大功告成!

蛋疼的live mesh,重回dropbox怀抱

自从dropbox被gfw宠幸之后,我开始使用live mesh,用着感觉还可以,没想到的是微软推出了live mesh 2011之后宣布不再支持win xp系统,而从某一天开始我xp上的客户端也再也没法登陆了。今天在另一台电脑上安装上了live essentials 2011套装,想再感受下live mesh 2011,更蛋疼的事情发生了,2011版的mesh同步的是skydrive syncd folders,而不是原先的mesh文件夹了,于是所有文件还得重新同步。。。于是打算把mesh打入冷宫了,回到xp的电脑上,重新打开了dropbox客户端,把一些重要的文件丢进去备份了。客官大概要问dropbox不是被和谐了吗,不过有修改hosts大法可以继续使用dropbox客户端,往hosts文件中添加以下内容:

174.36.30.67    dropbox.com
174.36.30.71     www.dropbox.com
75.101.129.115   dl.dropbox.com
75.101.159.151 dl-web.dropbox.com
174.36.30.67      forums.dropbox.com

这样修改之后客户端就可以正常使用了,不过网站还是偶尔才能打开。同时就发一下dropbox的邀请链接增加点容量,通过邀请注册可以增加256M的初始容量,如何访问网站只能你自己想办法了:

https://www.dropbox.com/referrals/NTE3NTAwNzI5?src=global0

不过dropbox只能同步一个文件夹的问题也有点麻烦,只能用来同步一些重要和及时的东西,于是也把SugarSync从电脑中唤醒了,因为它可以自定义同步的文件夹,这个还没有被gfw宠幸,就用来同步些乱七八糟的文件夹,它的起始容量有5G,比dropbox的大方多了。不过高的资源占用和慢的传输速度还是很难忍受,就偶尔开一下吧。也放一个邀请:

https://www.sugarsync.com/referral?rf=deoimykhk2m86

牢骚就到这吧~

应用于第二代测序技术的生物信息学工具[zz]

刚才闲逛发现了这篇被多家博客转载的文章,来自于SEQanswer,总结地比较全面,不过已经比较老了,随便看看~

Integrated solutions
* CLCbio Genomics Workbench – de novo and reference assembly of Sanger, Roche FLX, Illumina, Helicos, and SOLiD data. Commercial next-gen-seq software that extends the CLCbio Main Workbench software. Includes SNP detection, CHiP-seq, browser and other features. Commercial. Windows, Mac OS X and Linux.
* Galaxy – Galaxy = interactive and reproducible genomics. A job webportal.
* Genomatix – Integrated Solutions for Next Generation Sequencing data analysis.
* JMP Genomics – Next gen visualization and statistics tool from SAS. They are working with NCGR to refine this tool and produce others.
* NextGENe – de novo and reference assembly of Illumina, SOLiD and Roche FLX data. Uses a novel Condensation Assembly Tool approach where reads are joined via “anchors” into mini-contigs before assembly. Includes SNP detection, CHiP-seq, browser and other features. Commercial. Win or MacOS.
* SeqMan Genome Analyser – Software for Next Generation sequence assembly of Illumina, Roche FLX and Sanger data integrating with Lasergene Sequence Analysis software for additional analysis and visualization capabilities. Can use a hybrid templated/de novo approach. Commercial. Win or Mac OS X.
* SHORE – SHORE, for Short Read, is a mapping and analysis pipeline for short DNA sequences produced on a Illumina Genome Analyzer. A suite created by the 1001 Genomes project. Source for POSIX.
* SlimSearch – Fledgling commercial product. Continue reading “应用于第二代测序技术的生物信息学工具[zz]”

用WP-PostViews插件显示wordpress每篇文章的浏览次数

先从插件管理那边找到WP-PostViews,进行安装。安装完成之后在widgets那边就有了一个WP-PostViews的一个浏览排行组件。如果想要让每篇文章显示浏览次数,就修改模板首页(index.php)和内容页(single.php),在appearance那里的editor里面找到Main Index Template (index.php),我想把浏览次数放在评论数之后,于是找到<?php comments_popup_link(__(‘No Comments’), __(‘1 Comment’), __(‘% Comments’)); ?>,在后面插入<?php if(function_exists(‘the_views’)) { the_views(); } ?>,文件的内容由于模板的不同会有所不一样,这个要自己去了解一下。在Single Post(single.php)中也同样找到合适的位置插入<?php if(function_exists('the_views')) { the_views(); } ?>。还可以显示页面的浏览次数,只要同样修改Page Template (page.php)就可以了。

得分矩阵PAM与BLOSUM的比较与区别

  对于蛋白质序列,计分矩阵主要用于记录在做序列比对时两个相对应的残基的相似度,一旦这个矩阵定义好了以后,比对程式就可以利用这个矩阵,尽量将相似的残基排在一起,以达到最好的比对。
  得分矩阵主要有两种,第一种就是PAM(Point Accepted Multation),另一种就是BLOSUM。
1、PAM矩阵(Point Accepted Mutation)
   基于进化的点突变模型,如果两种氨基酸替换频繁,说明自然界接受这种替换,那么这对氨基酸替换得分就高。一个PAM就是一个进化的变异单位, 即1%的氨基酸改变,但这并不意味100次PAM后,每个氨基酸都发生变化,因为其中一些位置可能会经过多次突变,甚至可能会变回到原来的氨基酸。
PAM矩阵的制作步骤:
  构建序列相似(大于85%)的比对
  计算氨基酸 j 的相对突变率mj(j被其它氨基酸替换的次数)
  针对每个氨基酸对 i 和 j , 计算 j 被 i 替换次数
  替换次数除以相对突变率(mj)
  利用每个氨基酸出现的频度对j 进行标准化
  取常用对数,得到PAM-1(i, j)
  将PAM-1自乘N次,可以得到PAM-N。

  这种矩阵的缺点是一旦PAM1的矩阵有效地误 差,那么自乘250后得到的PAM250矩阵的误差就会变得很大。如,PAM120矩阵用于比较相距120个PAM单位的序列。
一个PAM-N矩阵元素(i,j)的值:
反应两个相距N个PAM单位的序列中第i种氨基酸替换第j种氨基酸的频率。
针对不同的进化距离采用PAM 矩阵
序列相似度 = 40%       50%       60% 
                   |              |              |
打分矩阵 = PAM120 PAM80 PAM60
PAM250 → 14% – 27% 
2、BLOSUM 矩阵
此矩阵与PAM矩阵的不同之处在于:
(1)用于产生矩阵的蛋白质家族及多肽链数目,BLOSUM比PAM大约多20倍。  
(2)PAM:家族内成员相比,然后把所有家族中对某种氨基酸的比较结果加和在一起,产生“取代”数据(PAM-1 );PAM-1自乘n次,得PAM-n。
BLOSUM:首先寻找氨基酸模式,即有意义的一段氨基酸片断(如一个结构域及其相邻的两小段氨基酸序列) 
,分别比较相同的氨基酸模式之间氨基酸的保守性(某种氨基酸对另一种氨基酸的取代数据),然后,以所有 60%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM60;以所有80%保守性的氨基酸模式之间的比 较数据为根据,产生BLOSUM80。 
(3)PAM-n中,n 越小,表示氨基酸变异的可能性越小;相似的序列之间比较应该选用n值小的矩阵,不太相似 的序列之间比较应该选用n值大的矩阵。PAM-250用于约20%相同序列之间的比较。BLOSUM-n中,n越小,表示氨基酸相似的可能性越小;相似的序列之间比较应该选用 n 值大的矩阵,不太相似的序列之间比较应该选 用n值小的矩阵。BLOSUM-62用来比较62%相似度的序列,BLOSUM-80用来比较80%左右的序列。

序列拼接软件velvet 1.0.14发布

这个版本主要是修正了几个bug,加了一些小功能:

1、重新加入了每个标准输出信息的时间戳;

2、在帮助增添了对于k-mer长度的说明;

3、捕获写文件时发生的错误;

4、修正文件访问权限;

5、消除编译时的警告和错误;

6、修正一个死循环的bug;

7、修正一个内存溢出问题;

8、加入-clean和-very_clean参数,-clean选项会清除Graph和Graph2之外的文件,-very_clean选项会清除所有文件。