ATAC-seqデータではどのような品質管理指標が重要ですか?

ATAC-seqデータではどのような品質管理指標が重要ですか?

ATAC-seq には、他の次の NGS タイプと同様に、ライブラリの準備、ベースコール、リードマッピングなどの多くの手順が含まれます。 結果の品質を保証するには、各ステップを評価する必要があります。

ライブラリの複雑さ

ライブラリの複雑さは、シーケンスされるライブラリ内の固有のリードの数を示し、使用される細胞の数と正の相関があります。 ATAC-seq では、細胞が少なすぎると過剰な転位 (または過剰な消化) が発生し、小さなフラグメントが大量に発生する可能性があり、セルが多すぎると過小な転位が発生し、非常に大きなフラグメントが大量に発生する可能性があります。

基本品質

塩基コールの品質は、ヌクレオチドのコールにエラーがある確率を使用して計算されるスコア (PHRED スコア) によって定義されます。 PHRED スコアが高いほど品質が高く、エラーの可能性が低くなります。

アライメント

塩基コールがリードにコンパイルされたら、それらをゲノム上で正確に位置合わせすることが最も重要です。 2 つの指標は、シーケンス反応の品質をよく反映しています。 アライメント率はゲノム上にマッピングされたリードの割合を示し、最適値は 90% 以上です。 アライメントの品質、つまりリードがゲノムの特定の領域にどの程度一致するかは、MAPQ スコアとして報告されます。 最高の MAPQ 値 (255) は単一領域に固有の読み取りに割り当てられ、最低 (0) は一致する領域が多数ある読み取りに割り当てられます。