主な違い – BLASTとFASTAの違い
BLASTとFASTAは、過剰な配列類似性に基づいて、相同なDNA配列やタンパク質を同定する類似性検索プログラムです。
2つのDNA配列やアミノ酸配列の過剰な類似性は、共通の祖先-相同性に起因するものです。
最も効果的な類似性検索は、DNA配列ではなく、タンパク質のアミノ酸配列を比較することである。
BLASTとFASTAは、2つの配列を比較するためにスコアリング戦略を使用し、配列間の類似性について高精度の統計的推定値を提供します。
BLASTとFASTAの主な違いは、BLASTはギャップがなく局所的に最適な配列のアライメントを見つけることが主であるのに対し、FASTAはあまり似ていない配列間の類似性を見つけることが主である点です。
主な対象分野
- BLASTとは
– 定義、プログラム、使用方法 - FASTAとは
– 定義、プログラム、使用方法 - BLASTとFASTAの類似点とは?
– 共通の特徴 - BLASTとFASTAの違いは何か
– 主な違いの比較
主要な用語 BLAST、FASTA、DNA、ヌクレオチド、タンパク質、アミノ酸、相同性、類似性、期待値
BLASTとFASTAの違い – 比較まとめBLASTとは?
BLASTはBasic Local Alignment Search Toolの略です。
NCBI(National Center for Biotechnology Information)サイトに登録されている配列とクエリ配列との類似性を検索します。
寄託されている配列との相同性から、クエリ配列に含まれる推定遺伝子を検出することができる。
BLASTは、2つの配列間の局所的な類似領域を高速に同定できるため、バイオインフォマティクスツールとして普及している。
BLASTは、2つの配列間の一致数を推定する期待値を計算します。
配列のローカルアライメントを利用する。
NCBI BLASTのウェブインタフェースはこちらです。
図1:NCBI BLAST ウェブインタフェース
異なるBLAST検索
BLASTプログラム|クエリーとデータベース|||BLASTN(核酸BLAST | |
BLASTN(ヌクレオチド BLAST):クエリ(ヌクレオチド)、データベース(ヌクレオチド)。 | |
BLASTP(タンパク質BLAST)|クエリ – タンパク質、データベース – タンパク質 | |
BLASTX|クエリ:翻訳済みヌクレオチド、データベース:タンパク質 | |
TBLASTN|クエリ – タンパク質, データベース – 翻訳ヌクレオチド | |
TBLASTX|クエリ-翻訳済みヌクレオチド, データベース-翻訳済みヌクレオチド |
FASTAとは
FASTAとは、DNAやタンパク質の配列間の類似性を検索するための配列アライメントツールの一つです。
クエリー配列をkタプルと呼ばれる配列パターンや単語に分解し、そのkタプルに対してターゲット配列を検索することで、両者の類似性を探します。
FASTAは類似性検索に適したツールです。
配列の類似性を見つける場合、まずBLAST検索を行い、その後FASTAで検索を行うのが最適な方法です。
FASTAファイル形式は、BLASTなど他の配列アライメントツールの入力メソッドとして広く使われています。
FASTAのWebインターフェースは、EBI(European Bioinformatics Institute)で公開されており、こちらで確認することができます。
図2: FASTA ウェブインタフェース
FASTAプログラム
FASTAプログラム|説明|||FASTA | |
FASTA|タンパク質-タンパク質配列比較、ヌクレオチド-ヌクレオチド配列比較。 | |
FASTX, FASTY|ヌクレオチドとタンパク質の配列比較。 | |
SSEARCH|タンパク質-タンパク質、ヌクレオチド-ヌクレオチド配列のローカルアライメント|GGSEARCH:タンパク質-タンパク質、ヌクレオチド-ヌクレオチド配列のグローバルアライメント | |
GGSEARCH|タンパク質-タンパク質、ヌクレオチド-ヌクレオチド配列のグローバルアライメント。 | |
GLSEARCH|クエリのグローバルアライメントとデータベースの配列のローカルアライメントを行う。 |
BLASTとFASTAの類似性
-
BLASTとFASTAは、DNAやタンパク質の配列を既存のDNAやタンパク質のデータベースと比較するための機能を提供する配列比較プログラムです。
-
BLASTとFASTAはどちらも高速かつ高精度なバイオインフォマティクスツールです。
-
両者ともペアワイズ配列アライメントを使用します。
BLASTとFASTAの違い
定義
BLAST: BLASTは、塩基配列やアミノ酸配列のような生物学的な一次配列情報を比較するためのアルゴリズムです。
FASTA: FASTAは、DNAとタンパク質の配列アライメントソフトウェアパッケージです。
の略です。
BLAST: BLASTはBasic Local Alignment Search Toolの略です。
FASTA:FASTAは「fast-all」または「FastA」の略です。
グローバル/ローカルアライメント
BLAST: BLASTはローカル配列アライメントを使用します。
FASTA: FASTAはまずローカル配列アライメントを行い、その後グローバルアライメントに類似性検索を拡張します。
ローカルシークエンスアライメント
BLAST: BLASTは2つの配列の個々の残基を比較して、ローカルアラインメントの類似性を検索します。
FASTA: FASTAは、配列パターンや単語を比較することにより、ローカルアラインメントの類似性を検索します。
検索の種類
BLAST:BLAST は密接にマッチした配列や局所的に最適な配列の類似性検索に適しています。
FASTA: FASTAは、あまり似ていない配列の類似性検索に適しています。
仕事の種類
BLAST: BLASTはタンパク質の検索に最適です。
FASTA: FASTAはヌクレオチドの検索に最適です。
クエリシーケンス内のギャップ
BLAST:BLASTでは、クエリ配列とターゲット配列の間にギャップは許されません。
FASTA: FASTAでは、ギャップは許容されます。
感度
BLAST: BLASTは感度の高いバイオインフォマティクスツールです。
FASTA: FASTA は BLAST よりも感度が高い。
速度
BLAST:BLASTはFASTAより高速です。
FASTA:FASTAはBLASTに比べ、速度が劣る。
開発者
BLAST: BLASTは1990年にNational Institute of HealthのStephen Altschul, Webb Miller, Warren Gish, Eugene Myers, David J. Lipmanによって設計されました。
FASTA: FASTAは1985年にDavid J. LipmanとWilliam R. Pearsonによって開発された。
意義
BLAST: 現在、バイオインフォマティクスのツールで最も広く使われている類似性検索がBLASTです。
FASTA: FASTAの遺産は、現在バイオインフォマティクスでユビキタスになっているFASTAフォーマットです。
結論
BLASTとFASTAは、バイオインフォマティクスにおいてDNAやタンパク質の配列間の類似性を検索するために使用される2つのペアワイズ配列アライメントツールです。
BLASTは塩基配列やアミノ酸配列のローカルアライメントに最も広く使われているツールです。
FASTAは、配列パターンや単語を利用した精度の高い類似性検索ツールです。
類似度の低い配列間の類似性検索に最適です。
BLASTとFASTAの主な違いは、それぞれのツールで使用されている類似性検索手法にあります。