予算内で最適な形質マッピング・ジェノタイピングツールを選択するためのガイド

現在、利用可能なゲノムツールは急速なペースで開発され続けており、すべての異なるテクノロジーとその様々な長所と短所を把握するには時間がかかります。ターゲットに対する分子育種アプローチでは、ジェノタイピング技術は強力なツールです。従って、科学者はジェノタイピングによるアプローチが成功する可能性と、望ましい結果を得るためのコストを比較検討しなければなりません。そのため、形質マッピングにはどのような技術が適しているのかという質問をよく受けます。


形質マッピング
形質マッピングの実験には、大きく分けて下の2つの要素が必要です。
1.  計測可能で遺伝する一貫した形質
2.  集団に存在する多様性を代表するシーケンスデータを生成するジェノタイピング技術

トウモロコシからアライグマ、マツに至るまで、それぞれのゲノムは、形質、遺伝子型両方のニーズをかなえるには困難が伴います。しかし、どのジェノタイピング技術が自分のプロジェクトに最も適しているか、どうやって知ることができるでしょうか?それはゲノムのサイズ、反復領域の量、倍数性レベルなど様々な要因によりますが、価格と効果の両方が最大の要因となることは明らかです。母集団の大きさに関しては、数百のサンプルが使用されることが多く、ジェノタイピング技術には、それほど高くないコストで多くの遺伝的多様性を捉えることが要求されます。

形質マッピングワークフローの概要

  WGS nGBS/ddRAD SNPアレイ アンプリコンシーケンシング ローカスハイブリダイゼーション ハイブリダイゼーションキャプチャ
技術 全ゲノムシーケンシング(NGS) 制限酵素ベースのGBS*(NGSリード) ターゲットジェノタイピング アンプリコンシーケンシングによるターゲットGBS*(NGS) プローブハイブリダイゼーションによるターゲットGBS*(NGS) in-solutionハイブリダイゼーションキャプチャによるターゲットGBS*(NGS)
技術的アプリケーション ゲノム探索 ターゲットジェノタイピング ゲノム探索とターゲットジェノタイピング ターゲットジェノタイピング ターゲットジェノタイピング ターゲットジェノタイピング
コスト $$$ $$ $$$ $ $ $$$
マーカー数上限 全ゲノム 数千~数万(探索とジェノタイピング) 全ゲノム 数千(ジェノタイピング) 数万(ジェノタイピング) 数十万(ジェノタイピング)
最小サンプル数 12** 48** ・既存アレイ:中~少
・新規アレイ:多~
12 384** 96**
必要なDNAの品質 中~高品質 中~高品質 低~高品質 低~高品質 中~高品質 中~高品質
納期 8-12週間** 6-8週間** システムによる 24時間*** 6週間** 6-8週間**

*GBS: Genotyping By Sequencing
**Biosearch Technologies社サービスの場合
***Amp-Seqワークフローの場合


全ゲノムシーケンシング

全ゲノムシーケンシング(Whole Genome Sequencing, WGS) はゲノムの多くをカバーし、シーケンスのコストが下がるにつれて、素晴らしいソリューションになり得ます。しかし、ゲノムサイズが大きい場合、シーケンスコストが全ゲノムを調べるメリットを上回ることがよくあります。反復領域が大きな比率を占め、コード領域は不十分になります。多倍体の場合、各リードはゲノムの異なるコピーからのものとなり、事実上、シーケンス量を必要とし、コストが増加します。したがって、ゲノムのターゲットを絞る、または減少させることが望ましい場合があります。

  • 長所:少サンプル容量でゲノム全体にわたってSNPを探索できる
  • 短所:低い深度での正確性、反復配列へのリードのバイアス、サンプル当たりのコスト

nGBS/ddRAD
nGBSやddRAD、Diversity Array Displacement (DArT)法では、単一あるいは複数の制限酵素を使用することで、データを効果的に目的の領域に偏らせることができます。ゲノムのどこかで1-5,000のSNPsが得られるので、集団の遺伝的多様性を網羅するために10万ものSNPsを必要としないグループにとっては素晴らしいツールとなります。トウモロコシやジャガイモなど、ヘテロ接合性が時に不足する種でこの手法の恩恵を受けることが多いですが、変化の激しい作物を含むほとんどのゲノムにも適用できます。SNPがバッチごとにどの程度一貫してコールされるかにもよりますが、ゲノミックセレクションのような研究にも利用できます。
  • landing_page_image_corn (1) (1)長所:リファレンスゲノムが必要ない、サンプル当たりのコストが低い、タンパク質コード遺伝子へのバイアス、少サンプル量
  • 短所:生物種によってはSNPコールのためのパイプラインの構築が難しい



SNPアレイ
SNPアレイは、多くの理由から現在でも日常的に使用されている最も古いジェノタイピング手法の一つです。WGSプロジェクトを通じて同定された特定のSNPに対して、アレル特異的プローブを用いてマイクロアレイとして製造されます。DNAサンプルがマイクロアレイにアプライされると、プローブと相補的な領域とハイブリダイズすることにより、対象のアレルが存在するか否かを蛍光シグナルが中継します。ターゲットが固定されているため、研究者はデータセットを比較することができ、結果として形質マッピング用のSNPを比較することができます。特定のSNPを持つ形質は、有用な情報を豊富に持つアレイがいくつかの種に存在するため、誰でも利用することができます。例えば、ウシの親系統アレイは、固定的な育種ニーズを持つウシのブリーダーに適切な情報を返すので魅力的です。SNPアレイは多くの場合、サンプルの必要量が少なく、高価なシーケンサーなしで実施可能です。しかし、ターゲットが固定されており、製造費用の高さや納期の長さが、分子育種の限界を押し広げようとする多くのグループにとって障壁となっています。最初にチップ上にデザインされていない別のアレルは、かなりの量の遺伝子型の欠落をもたらす可能性があります。アレイの中には長い歴史を持つものもありますが、より近代的な技術に取って代わられて廃止されたものもあり、再作成が必要なSNPsで育種家を窮地に陥れる可能性があります。
  • 利点:少サンプル容量、データの解釈が容易、コミュニティによって選択されたターゲットが利用可能
  • 欠点:ターゲットが変えられない、変えるには費用と時間がかかる

アンプリコンベースターゲットGBS
アンプリコンベースのターゲットGBSは、最大数千のマーカーのパネル開発を可能にするターゲットジェノタイピングソリューションです。スループット、ワークフローの簡素化、コストが、アンプリコンベースのターゲットリシーケンスを使用する一般的な理由です。アンプリコンケミストリーに基づき、1日あたり数万サンプルを処理し、シーケンスすることができます。ワークフローがシンプルなため、時間とコストの効率が重要な要件である場合の主要なソリューションとなります。アンプリコンベースのターゲットリシーケンスでは、ターゲティングオリゴパネルの開発が必要で、他の方法よりも時間がかかることがあります。データの質に関しては、ゲノムの複雑さと必要なターゲットマーカーの種類に大きく依存します。濃縮ベースの方法がゲノムの複雑性によく適応するのに対し、アンプリコンベースの方法はトウモロコシやダイズのような種で優れています。さらに、このような作物では一般的に広範なリファレンスゲノムシーケンシングが行われているため、ゲノム選抜のようなアプリケーションに必要なマーカー密度が低くなる傾向があります。コムギのような複雑なゲノムでも、生成されたデータは参照ゲノムに95%以上マップされることが確認されています。オンターゲット率とコール率については、同等の品質スコアが得られています。データの質と量を数%でも向上させることは、育種プログラムにおける系統選抜の迅速性と信頼性の程度に影響を与えます。複雑な形質のマッピングや選抜を行う場合、時間とコストの節約は非常に重要です。

ブリーダーにとってこれはどのような違いがあるのでしょうか?エンドポイント・ジェノタイピングと同じ時間枠で、シーケンスベースのデータと組み合わせて前進させる系統を選択する能力により、Amp-Seqはハイスループットなゲノム選抜の実施におけるゲームチェンジャーとなります。アンプリコンベースのターゲットGBSによるマーカーの統合とコスト効率は、ブリーダーが育種プログラムの早い段階で重要な決定を下す機会を提供し、これは、ゲノム選抜の適用が現実のものとなって以来、育種界が熱望してきたアイデアです。
  • 利点:Cow_and_calf_organic_shapeコスト対効果に優れる。ターゲットGBSの方法の中では最もサンプル当たりのコストが低く、最高のスループットを示し、数万サンプルのスクリーニングが24時間で可能で、シンプルなワークフロー、かつ自動化が可能
  • 欠点:マーカー数が数千に限られる、施設内での処理にはハイスループットNGS装置へのアクセスが必要
ローカスハイブリダイゼーション
ローカスハイブリダイゼーションは新しい技術で、増幅ラウンドを繰り返すことに関連するバイアスを避けるために、PCRに代わってオリゴ伸長を技術として使用します。この結果、高いデータリターン、シーケンス開始位置と終了位置の正確さ、さらに高度に自動化されたラボでの10万SNPへのスケーラビリティ(ハイスループット・ジェノタイピング)が実現します。500bpのローカスごとにSNPをコールするディスカバリーモードで実行すると、ローカスごとに複数のSNPがコールされる作物もあります。例えば、ジャガイモやブルーベリーのような高度に倍数化した種では、22,000のローカスから20万以上のSNPが得られます。この技術では、合計25,000のローカスをターゲットにすることができ、これはゲノム全体に均等に配置された合計12.5 Mbpの領域をカバーします。ターゲットジェノタイピングではシーケンシング領域の総量が制限されるため、データは平均100×深度が得られ、正確なSNPがコールされます。カバレッジが極めて高い生物種では、より少ないシーケンスリードを割り当てることができるため、シーケンスコストが低くなります。また、このシステムはプローブベースであるため、新しい形質やマーカーが発見されると、既存のプローブセットに新しいターゲットを追加することができます。
  • 利点:再現性の高いデータセット、育種コミュニティがターゲットを選択可能、ハイスループット、容易にプローブセットをアップデート可能
  • 欠点:リファレンスゲノム情報が必要、DNAを精製する必要がある、年間384サンプル以上に対応

ハイブリダイゼーションキャプチャ
ハイブリダイゼーションキャプチャは、PCRの代わりにRNAプローブベースのケミストリーがハイブリダイゼーション技術と組み合わされ、ターゲットとプローブ配列間のミスマッチをより多く許容するため、ゲノムターゲットの選択に最も柔軟性があります。例えば、他の技術では目的の特定の遺伝子や領域からのデータリターンは99%以上得られることが多いですが、リードの多くがターゲット外の領域から得られているため、反応全体の効率はかなり低くなります。これらのプローブセットは、10 Mbpまでのほぼすべての配列をカバーすることができ、どのような情報をシーケンスするかをこれまでになくコントロールすることができます。特定の遺伝子やプロモーター領域のみが必要な場合、Capture-Seqでしかできないことがあります。リードを目的のローカスにマッピングすると、得られたデータセットは非常に一貫性があり、共同研究を行う研究者やSNPデータを比較したい研究者にとって理想的な選択肢となります。米国およびその他の国では、いくつかのコンソーシアムアプローチが存在します。例えば、樹木ゲノムは自然界で観察されるゲノムの中でも最大級のものであり、目的の表現型データを示すまでに何年もかかることがあります。ハイブリダイゼーションキャプチャを利用することで、反復エレメントからのリードを大幅に削減すると同時に、タンパク質をコードする遺伝子に寄与する注目すべき領域にリードを集中させることができます。その結果、形質マッピング実験の精度が向上し、別の集団のジェノタイピングに多くの費用と時間を費やす必要性が減少します。
  • 利点:ターゲットの選択が極めてカスタマイズしやすい、容易にプローブセットをアップデート可能、欠損データが少ない、育種コミュニティがターゲットを選択可能
  • 欠点:労働集約的、RNAプローブケミストリーによりサンプル当たりのコストが高い、96サンプル以上に対応

ジェノタイピングツールを選択する
landing_page_image_potato全体として、ジェノタイピングツールは個別の事情により選択されることが多く、価格や実用性以上の理由があります。サービス、歴史、品質、経験などはすべて決定において特に重要な部分であり、無視すべきではありません。企業では納期が重視され、学術界では、より多くのサポートを必要とする学生が卒業していくという事情があります。Biosearch Technologiesでは、価格以上の価値を提供することを誇りとしています。「情熱」「好奇心」「誠実さ」「輝き」「尊敬」という私たちの価値観は、科学をお客様のために役立てようとする従業員のコミットメントと献身を表しています。


関連情報: ジェノタイピングのトータルソリューション