SHRiMP2

SHRiMP - SHort Read Mapping Package



SHRiMP2はリファレンスゲノムに対してリードをマッピングするためのソフトウエアです。

SHRiMP2の特徴として
  • 入力ファイルはFasta
  • 出力ファイルはSAM
  • letter space (Illumina/Solexa)とcolour space (AB SOLiD)の両方のリードをサポート
  • pair-end情報を利用するペアマッピングモード
  • SMPプロセッサの能力をフルに利用する並列計算

SHRiMP2はリードをゲノムにマッピングするために2つの技術を利用します。
まずはじめに、それぞれのリードのマッピング場所の候補を見つけるためにq-gram
filtering技術を使います。
次に見つかった候補を標準的な(Smith-Waterman)アルゴリズムによって徹底的に調査します。それによって、ミスマッチ(SNPs)、micro-indels、crossovers(カラースペースのシーケンシングエラー)を正確に同定することができます。

SHRiMP2はまず高い感度を第一目標としてきましたが、妥当なスピードを得るために

検出感度: SHRiMP2は1つのSNPと大きさが5bpまでの1つのindelをもつ、4% per-base error でシーケンスされた50bpのカラースペースリードをマッピングした時に94.4%の適合率(precision)と78.6%の再現率(recall)を得ることができます。

スピード: SHRiMP2は1つの3.0GHzCPUで16GBのRAMをもつ計算機を利用した時に、36bpのカラースペースリードをヒトゲノムに対して一時間に160,000リードマッピングすることができます。また、pair-end情報を利用すると、速度は2倍になります。
SHRiMP2は並列に計算を行うため、16GBのRAMをもつ2 quad-core CPUの計算機を4台利用した場合、4x2x4=32倍の速度でマッピングすることができます。

更新履歴

  • SHRiMP_2_0_1 26-Jun-2010
  • SHRiMP_2_0_0 12-May-2010
  • SHRiMP_1_3_2 30-Jan-2010
  • SHRiMP_1_3_1 24-Nov-2009
  • SHRiMP_1_3_0 06-Oct-2009
最終更新:2010年07月09日 03:43