丁丁博客 – Page 5 – Look for Myself

Godaddy冬日$1.49优惠码（2011年1月-2月）

优惠内容: Register or transfer any available .COM, .US, .MOBI, .BIZ, .NET, .ORG, .CA, .CO.UK and .IN domain for just $1.49!*
优惠码: winter149
有效期: expiring after 10,000 redemptions or at 11:59 PM on February 16, 2011 (whichever comes first)
支付方式: 信用卡或者支票,不支持支付宝

SPECIAL OFFER! $1.49* DOMAIN NAME!

Register or transfer any available .COM, .US, .MOBI, .BIZ, .NET, .ORG, .CA, .CO.UK and .IN domain for just $1.49!*
Applies to the first year only of new or transfer registrations. This offer may not be used for renewals, bulk registrations, premium domains or Sunrise/Landrush domain registrations. Limited to one order per customer, expiring after 10,000 redemptions or at 11:59 PM on February 16, 2011 (whichever comes first). Discount will be reflected in your shopping cart; cannot be used in conjunction with any other offer or promotion. Customers may not use gift cards, PayPal® or AliPay to redeem this offer.
* Plus ICANN fee of 18 cents per domain year when applicable.

Your discount will be applied in your shopping cart.

用Amos软件包里面的minimus2合并454和Illumina/Solexa拼接得到的contig

用罗氏454测序得到的序列用newbler拼接的效果最好，而用短序列拼接软件velvet拼接效果很差，所以不能将454的原始reads和Illumina产生的reads合到一起后用velvet进行拼接。在用newbler和velvet分别拼接454和Illumina的reads得到contigs之后，我们就需要将两者的contig再合并起来，得到更好的拼接结果。这里就介绍一个简单易用的软件minimus2。

minimus2是amos拼接软件包里面的一个组件，它的功能就是将两组contig进行合并，延伸contig的长度，减少contig的数量。Amos是A Modular, Open-Source whole genome assembler的缩写，致力于打造成一个拼接软件的基础软件系统。minimus2用的是基于nucmer overlap检测的算法，速度上比Smith-Waterman hash-overlap的算法要快，下面就介绍一下用法。

首先当然是下载amos软件包进行安装，下载地址为：http://sourceforge.net/projects/amos/files/

安装啥的就不说了，根据说明来就行。安装完成之后，minimus2软件位于amos安装文件夹下的bin里面。在运行minimus2之前首先要准备好文件，比如现在有s1.fa和s2.fa两组包含contig的文件，首先要知道里面包含的contig数目，针对fasta格式，用

grep -c "^>" s1.fa s2.fa  命令得到，比如分别为100和200个contig。

然后用cat命令合并到一个文件：

cat s1.fa s2.fa >s1_s2.fa

再用amos里面的另一个软件toAmos转换成Amos格式，这个软件也位于bin文件夹下面

./toAmos -s s1_s2.fa -o s1_s2.afg
这里的-s是指输入的为fasta格式。

然后就可以运行minimus2了

minimus2的运行参数为：

 minimus2 prefix  \
   -D REFCOUNT=n  \  # Number of sequences is the first set
   -D OVERLAP=n   \  # Minimum overlap (Default 40bp)
   -D CONSERR=f   \  # Maximum consensus error (0..1) (Def 0.06)
   -D MINID=n     \  # Minimum overlap %id for align. (Def 94)
   -D MAXTRIM=n      # Maximum sequence trimming length (Def 20bp)
最简单的命令为：
./minimus2 s1_s2 -D REFCOUNT=100

这里只要告诉文件名（不要后缀）和作为参考序列的第一组contig的数目就可以了。会生成一堆以s1_s2开头的文件，其中s1_s2.fasta就是合并之后得到的contig文件。

大功告成！

Godaddy最新com转移注册优惠码（2010年12月）

Godaddy最新com转移注册优惠码：holiday99

优惠内容: 注册或者转移任何.com域名只需0.99刀.
过期时间: 10,000 redemptions或者on December 13, 2010(美国时间)

2012年12月14日验证可用~

更快的优惠可以到我友情链接的包子那边蹲点~

蛋疼的live mesh，重回dropbox怀抱

自从dropbox被gfw宠幸之后，我开始使用live mesh,用着感觉还可以，没想到的是微软推出了live mesh 2011之后宣布不再支持win xp系统，而从某一天开始我xp上的客户端也再也没法登陆了。今天在另一台电脑上安装上了live essentials 2011套装，想再感受下live mesh 2011，更蛋疼的事情发生了，2011版的mesh同步的是skydrive syncd folders，而不是原先的mesh文件夹了，于是所有文件还得重新同步。。。于是打算把mesh打入冷宫了，回到xp的电脑上，重新打开了dropbox客户端，把一些重要的文件丢进去备份了。客官大概要问dropbox不是被和谐了吗，不过有修改hosts大法可以继续使用dropbox客户端，往hosts文件中添加以下内容：

174.36.30.67    dropbox.com
174.36.30.71     www.dropbox.com
75.101.129.115   dl.dropbox.com
75.101.159.151 dl-web.dropbox.com
174.36.30.67      forums.dropbox.com

这样修改之后客户端就可以正常使用了，不过网站还是偶尔才能打开。同时就发一下dropbox的邀请链接增加点容量,通过邀请注册可以增加256M的初始容量，如何访问网站只能你自己想办法了：

https://www.dropbox.com/referrals/NTE3NTAwNzI5?src=global0

不过dropbox只能同步一个文件夹的问题也有点麻烦，只能用来同步一些重要和及时的东西，于是也把SugarSync从电脑中唤醒了，因为它可以自定义同步的文件夹，这个还没有被gfw宠幸，就用来同步些乱七八糟的文件夹，它的起始容量有5G，比dropbox的大方多了。不过高的资源占用和慢的传输速度还是很难忍受，就偶尔开一下吧。也放一个邀请：

https://www.sugarsync.com/referral?rf=deoimykhk2m86

牢骚就到这吧~

应用于第二代测序技术的生物信息学工具[zz]

刚才闲逛发现了这篇被多家博客转载的文章，来自于SEQanswer，总结地比较全面，不过已经比较老了，随便看看~

Integrated solutions
* CLCbio Genomics Workbench – de novo and reference assembly of Sanger, Roche FLX, Illumina, Helicos, and SOLiD data. Commercial next-gen-seq software that extends the CLCbio Main Workbench software. Includes SNP detection, CHiP-seq, browser and other features. Commercial. Windows, Mac OS X and Linux.
* Galaxy – Galaxy = interactive and reproducible genomics. A job webportal.
* Genomatix – Integrated Solutions for Next Generation Sequencing data analysis.
* JMP Genomics – Next gen visualization and statistics tool from SAS. They are working with NCGR to refine this tool and produce others.
* NextGENe – de novo and reference assembly of Illumina, SOLiD and Roche FLX data. Uses a novel Condensation Assembly Tool approach where reads are joined via “anchors” into mini-contigs before assembly. Includes SNP detection, CHiP-seq, browser and other features. Commercial. Win or MacOS.
* SeqMan Genome Analyser – Software for Next Generation sequence assembly of Illumina, Roche FLX and Sanger data integrating with Lasergene Sequence Analysis software for additional analysis and visualization capabilities. Can use a hybrid templated/de novo approach. Commercial. Win or Mac OS X.
* SHORE – SHORE, for Short Read, is a mapping and analysis pipeline for short DNA sequences produced on a Illumina Genome Analyzer. A suite created by the 1001 Genomes project. Source for POSIX.
* SlimSearch – Fledgling commercial product. Continue reading “应用于第二代测序技术的生物信息学工具[zz]”

用WP-PostViews插件显示wordpress每篇文章的浏览次数

先从插件管理那边找到WP-PostViews，进行安装。安装完成之后在widgets那边就有了一个WP-PostViews的一个浏览排行组件。如果想要让每篇文章显示浏览次数，就修改模板首页(index.php)和内容页(single.php)，在appearance那里的editor里面找到Main Index Template (index.php)，我想把浏览次数放在评论数之后，于是找到<?php comments_popup_link(__(‘No Comments’), __(‘1 Comment’), __(‘% Comments’)); ?>，在后面插入<?php if(function_exists(‘the_views’)) { the_views(); } ?>，文件的内容由于模板的不同会有所不一样，这个要自己去了解一下。在Single Post(single.php)中也同样找到合适的位置插入<?php if(function_exists('the_views')) { the_views(); } ?>。还可以显示页面的浏览次数，只要同样修改Page Template (page.php)就可以了。

gnome mplayer 报错“无法打开 VDPAU backend libvdpau_nvidia.so: cannot open shared object file: No such file or directory”的解决办法

选择菜单“编辑”->“首选项”
“播放器”面板当中“视频输出:”设置为“xv”即可解决

得分矩阵PAM与BLOSUM的比较与区别

对于蛋白质序列，计分矩阵主要用于记录在做序列比对时两个相对应的残基的相似度，一旦这个矩阵定义好了以后，比对程式就可以利用这个矩阵，尽量将相似的残基排在一起，以达到最好的比对。
得分矩阵主要有两种，第一种就是PAM（Point Accepted Multation)，另一种就是BLOSUM。
1、PAM矩阵（Point Accepted Mutation）
基于进化的点突变模型，如果两种氨基酸替换频繁，说明自然界接受这种替换，那么这对氨基酸替换得分就高。一个PAM就是一个进化的变异单位, 即1%的氨基酸改变，但这并不意味100次PAM后，每个氨基酸都发生变化，因为其中一些位置可能会经过多次突变，甚至可能会变回到原来的氨基酸。
PAM矩阵的制作步骤：
构建序列相似（大于85％）的比对
计算氨基酸 j 的相对突变率mj（j被其它氨基酸替换的次数）
针对每个氨基酸对 i 和 j , 计算 j 被 i 替换次数
替换次数除以相对突变率（mj）
利用每个氨基酸出现的频度对j 进行标准化
取常用对数，得到PAM-1(i, j)
将PAM-1自乘N次，可以得到PAM-N。

这种矩阵的缺点是一旦PAM1的矩阵有效地误差，那么自乘250后得到的PAM250矩阵的误差就会变得很大。如，PAM120矩阵用于比较相距120个PAM单位的序列。
一个PAM-N矩阵元素（i，j）的值：
反应两个相距N个PAM单位的序列中第i种氨基酸替换第j种氨基酸的频率。
针对不同的进化距离采用PAM 矩阵
序列相似度 = 40% 50% 60%
| | |
打分矩阵 = PAM120 PAM80 PAM60
PAM250 → 14% – 27%
2、BLOSUM 矩阵
此矩阵与PAM矩阵的不同之处在于：
（1）用于产生矩阵的蛋白质家族及多肽链数目，BLOSUM比PAM大约多20倍。　
（2）PAM：家族内成员相比，然后把所有家族中对某种氨基酸的比较结果加和在一起，产生“取代”数据（PAM-1 ）；PAM-1自乘n次，得PAM-n。
BLOSUM：首先寻找氨基酸模式，即有意义的一段氨基酸片断（如一个结构域及其相邻的两小段氨基酸序列）
，分别比较相同的氨基酸模式之间氨基酸的保守性（某种氨基酸对另一种氨基酸的取代数据），然后，以所有 60％保守性的氨基酸模式之间的比较数据为根据，产生BLOSUM60；以所有80％保守性的氨基酸模式之间的比较数据为根据，产生BLOSUM80。
（3）PAM-n中，n 越小，表示氨基酸变异的可能性越小；相似的序列之间比较应该选用n值小的矩阵，不太相似的序列之间比较应该选用n值大的矩阵。PAM-250用于约20%相同序列之间的比较。BLOSUM-n中，n越小，表示氨基酸相似的可能性越小；相似的序列之间比较应该选用 n 值大的矩阵，不太相似的序列之间比较应该选用n值小的矩阵。BLOSUM-62用来比较62％相似度的序列，BLOSUM-80用来比较80％左右的序列。

万圣节的礼物：Godaddy域名注册转移$1优惠码(2010年10月28-11月27)

优惠码：scaryone

优惠范围及幅度：注册或者转移.COM, .US, .MOBI, .BIZ, .NET, .ORG, .CA, .CO.UK, .IN域名仅需$1.00

截止日期：10000个名额或者2010.11.27

付款方式：信用卡、支票

序列拼接软件velvet 1.0.14发布

这个版本主要是修正了几个bug，加了一些小功能：

1、重新加入了每个标准输出信息的时间戳；

2、在帮助增添了对于k-mer长度的说明；

3、捕获写文件时发生的错误；

4、修正文件访问权限；

5、消除编译时的警告和错误；

6、修正一个死循环的bug；

7、修正一个内存溢出问题；

8、加入-clean和-very_clean参数，-clean选项会清除Graph和Graph2之外的文件，-very_clean选项会清除所有文件。