イルミナシーケンスは、次世代シーケンシング法の一つで、「シーケンシング・バイ・シンセシス」法とも呼ばれています。
イルミナシーケンスは、数百万個のフラグメントを並行して処理することに関与しています。
イルミナシーケンスのワークフローに関わる4つの基本ステップは、ライブラリ調製、クラスタ生成、シーケンス、データ解析であり、この記事でさらに詳しく説明されています。
イルミナシーケンスとは?
イルミナシーケンス、またはSBS(sequencing-by-synthesis)技術は、世界で最も広く使用されている次世代シーケンサー技術です。
世界のシーケンシングデータの90%以上がイルミナシーケンシングによって生成されています。
もともとは、ケンブリッジ大学のShankar BalasubramanianとDavid Klenermanによって開発されました。
彼らは1998年にSolexaという会社を設立しました。
その後、2007年にイルミナがSolexaを買収し、元の技術を急速に改良した。
したがって、Solexa/Illuminaシーケンス法とも呼ばれる。
イルミナシーケンスの最大の利点は、エラーのないリードを高い収率で得られることである。
イルミナシーケンスのしくみ
イルミナシーケンスに関わる4つのステップを以下に説明します。
ステップ1. ライブラリーの調製
- トランスポザーゼによる200~600塩基対の短鎖DNAへのタグ付け(タグメンテーション)と、その短鎖DNAの3′および5′末端へのアダプターのライゲーションを同時に行い、シークエンスライブラリーを作製する。
- さらに、シークエンスプライマー結合部位、インデックス、フローセルオリゴと相補的な領域などのモチーフを、減圧増幅法により両側のアダプターに付加する。タグ付けとモチーフの付加を図1に示す。
図1:タグ付けとモチーフの追加
ステップ2.クラスタージェネレーション
- 調製したシーケンシングライブラリーを変性させ、フローセルにロードし、クラスターを生成する。クラスター生成では、シーケンシングライブラリー中の各フラグメントが等温増幅される。フローセルは、レーンを含むガラスで構成されています。各レーンは2種類のオリゴヌクレオチドでコーティングされている。1種類は追加モチーフの5′領域に相補的であり、もう1種類は調製したライブラリーの追加モチーフの3′領域に相補的です。したがって、これらのオリゴは、シークエンスライブラリー中のDNAの対応する領域に結合する。図2に、2種類のオリゴを用いたフローセルを示す。シーケンシングライブラリーの5′領域に結合するオリゴはピンク色で、3′領域に結合するオリゴは緑色で表示されている。
図2: フローセル
- 一本鎖のシークエンシングライブラリーがオリゴに結合すると、DNAポリメラーゼにより相補鎖が生成される。その後、生成した2本鎖DNAを変性させ、元の鎖を洗浄する。
- 断片のクローン増幅は、ブリッジ増幅により行われる。この過程で、鎖はフローセル上の2種類目のオリゴの上に折り重なる。その後、ポリメラーゼが2本鎖のブリッジを合成する。ブリッジの変性により、フローセル上のオリゴに順鎖と逆鎖の2本のDNA鎖ができる。
- ブリッジ増幅を何度も繰り返すことにより、クローン増幅で数百万個のあらゆる種類のフラグメントのクラスターを同時にシークエンスライブラリーに取得する。図3にクローン増幅の様子を示す。
図3:クローン増幅の様子
- 逆鎖を洗浄し、順鎖のみをフローセルに残す。順鎖は3′末端が遊離しており、不要なプライミングを防ぐためにブロックされている。
ステップ3. 配列決定
逆配列の最初の読み出し
- シーケンシングは、最初のシーケンシングプライマーの伸長から始まります。イルミナシーケンス法では、デオキシリボース糖の3′位にターミネーターを含む修飾dNTPsを使用します。また、これらのdNTPは異なる色で蛍光標識されています。
- 各相補的ヌクレオチドを添加した後、フローセル内のクラスターを観察し、蛍光を発するかどうかを確認する。
- 発光を確認した後、蛍光色素を洗浄することができます。
- その後、糖の3′位のターミネーター基が水酸基によって再生され、成長している鎖に2つ目のdNTPを加えることができるようになる。この工程はsequencing-by-synthesisと呼ばれている。図4にシークエンシング・バイ・シンセシスの様子を示す。
図4: シーケンシング・バイ・シンセシス (Sequencing-by-Synthesis)
- 合成が終了すると、逆配列の最初のリードが得られ、シークエンス産物が洗い流される。
インデックス1 読み
- その後、index 1プライマーをクラスターにハイブリダイズさせ、同様にsequencing-by-synthesisで2回目のリードを生成する。シークエンス産物は洗浄される。
インデックス 2 読み
- その後、クラスターの3′末端を脱保護し、フローセル上の2種類目のオリゴとハイブリダイゼーションさせる(緑色)。これにより、index2領域の配列が得られる。配列決定産物は洗浄される。
順方向配列の2回目の読み出し
- 2種類目のオリゴはポリメラーゼによって伸長され、2本鎖のブリッジが形成される。ブリッジは変性され、その3′末端はブロックされる。順方向鎖は洗い流される。
- 2回目のシーケンシングプライマーのハイブリダイゼーションと伸長により、順方向配列の2回目のリードがsequencing-by-synthesisで得られる。
ステップ4.データ解析
- シーケンシングにより得られた数十億のリードは、インデックス配列をもとにグループ化される。
- その後、類似したリードを持つ配列をクラスタリングする。
- フォワードリードとリバースリードをペアリングし、連続した配列を形成する。
- ペアとなった配列により、曖昧なアラインメントを解消することができる。
- 連続した配列は、バリアント同定のために参照ゲノムにアラインメントされます。
次のビデオは、イルミナシーケンスの完全なプロセスを説明しています。
結論
イルミナシーケンスは、次世代シーケンシング法です。
イルミナシーケンスでは、200~600塩基対の長さのDNA断片からなるシーケンスライブラリーを調製することができる。
イルミナシーケンスでは、ライブラリ調製、クラスタ生成、シーケンシング、データ解析の4つのステップを経て、シーケンシングが行われます。
イルミナシーケンスでは、高精度のシーケンスリードが得られるため、世界で広く利用されているシーケンシング手法です。