SHRiMP - SHort Read Mapping Package
SHRiMP2はリファレンスゲノムに対してリードをマッピングするためのソフトウエアです。
SHRiMP2の特徴として
- 入力ファイルはFasta
- 出力ファイルはSAM
- letter space (Illumina/Solexa)とcolour space (AB SOLiD)の両方のリードをサポート
- pair-end情報を利用するペアマッピングモード
- SMPプロセッサの能力をフルに利用する並列計算
SHRiMP2はリードをゲノムにマッピングするために2つの技術を利用します。
まずはじめに、それぞれのリードのマッピング場所の候補を見つけるためにq-gram
filtering技術を使います。
次に見つかった候補を標準的な(Smith-Waterman)アルゴリズムによって徹底的に調査します。それによって、ミスマッチ(SNPs)、micro-indels、crossovers(カラースペースのシーケンシングエラー)を正確に同定することができます。
SHRiMP2はまず高い感度を第一目標としてきましたが、妥当なスピードを得るために
検出感度: SHRiMP2は1つのSNPと大きさが5bpまでの1つのindelをもつ、4% per-base error でシーケンスされた50bpのカラースペースリードをマッピングした時に94.4%の適合率(precision)と78.6%の再現率(recall)を得ることができます。
スピード: SHRiMP2は1つの3.0GHzCPUで16GBのRAMをもつ計算機を利用した時に、36bpのカラースペースリードをヒトゲノムに対して一時間に160,000リードマッピングすることができます。また、pair-end情報を利用すると、速度は2倍になります。
SHRiMP2は並列に計算を行うため、16GBのRAMをもつ2 quad-core CPUの計算機を4台利用した場合、4x2x4=32倍の速度でマッピングすることができます。
更新履歴
- SHRiMP_2_0_1 26-Jun-2010
- SHRiMP_2_0_0 12-May-2010
- SHRiMP_1_3_2 30-Jan-2010
- SHRiMP_1_3_1 24-Nov-2009
- SHRiMP_1_3_0 06-Oct-2009
最終更新:2010年07月09日 03:43