Introduction
-
LDの強い領域ではハプロタイプの多様性が低いことが知られている
-
haplotype tagSNPsによる効率的なtaggingが期待できる
-
tagSNPsの使用は、完全に相関したマーカーでない限り、検出力の低下を伴う
-
linkage scan、association mappingでは次の疾患においてMHC領域に強いシグナルを発している
-
自己免疫疾患:T1DM、MS、SLE
-
感染症:マラリア、AIDS
-
MHCについてのSNPを用いたLDパターン構造の報告が出てきている
-
recombination hotspotが、HLA-DNA、BRD2 (RING3)、HLA-DQB1、TAP2遺伝子内に報告された。
-
200kbセグメントごとにhot spotがあるとする報告もある
-
これらはMHC全体の密なSNPマップを使用したわけではない
-
dbSNP121では、本領域のSNPは>36,000である
-
50%以上は、complete resequencingにより発見された
-
Phase 2.1、McVeanらの方法によりhotspotを予測し、そのうち90%はLD breaksと一致した。
Material and Methods
-
DNAサンプル、ジェノタイピング
-
dbSNP121のMHC 4.46Mbの領域(Chr6, 28918812-33377873)から3,892SNPsを抽出した。
-
選択基準は、>500bpのスペーシングがありIllumina Golden Gateにおいてデザインがあるものである。
-
サンプルは、190のCEPHトリオから180
-
820のマーカーについては、HapMapとWalsh et al. (2003)のデータがある。
-
quality check:よくわからない。わかるものとしては:
-
親子trioのinheritance testを行い、2つ以上のdiscrepant callsがある場合は除外した
-
PEDCHECKとPEDSTATSにより、Mendelian inconsistenciesとなるものを除外した。genotype confidence scoreは0.25にセットした。
-
<80%のpossible genotypesでもHW χ2>10であったり、ヘテロ接合体が0であるものを除外。
-
結果、3122のSNPsがさらなる解析にまわった。
-
うち787SNPsはnonpolymorphicであるか、MAF<5%であった。これらはランダムではなく、variation desertがあるように思われた(図1、黒矢印)
-
MassEXTEND assayとSequenomのmass spectrometryが同じ結果を返したので、genotyping problemではないと考えられる。
-
HLA-A, HLA-B, HLA-C, HLA-DQB, HLA-DRB1という多型性の高い遺伝子周囲ではfailure rateが高く、この領域には別のタイピング法が必要であると思われた。
-
MAF>5%である2335SNPs (1SNP/1.9kb) がさらなる解析に回った。
-
LDの推定
-
D'とr2を使用した。
-
nonrecombinant haplotypesはMerlinに由来した。
-
LDのdecayを物理的距離の関数としてプロットした。
-
decay ratesとは距離Sによって区切られるセグメント内の全てのマーカーのr2、D'の平均値である。
-
LDパターンはGOLDsurferプログラムによって可視化した。
最終更新:2007年06月19日 16:18