ユニークなアライメント率が 20% である場合、サンプルが汚染されていることを意味しますか?

ユニークなアライメント率が 20% である場合、サンプルが汚染されていることを意味しますか?

コンタミが原因の一つである可能性もありますが、他の問題である可能性もあります。

80% がアライメントされていない読み取りを含む低品質サンプルのサンキープロットの例。

1. 種が間違っている。 データを不正確な種に合わせて調整することは、調整率が低下する非常に一般的な理由です。 サンプルをアップロードするときは、正しい種を選択したことを再確認する必要があります。 これを行うには、サンプルをクリックしてメタデータを確認します。 マウスサンプルを追加したいが、種としてヒトを選択した場合、95% 以上のリードがアライメントされていないことがわかります。

2. サンプルの品質が低い。 アライメントが低い場合は、サンプルの品質が低いことが原因である可能性もあります。 おそらく、読み取り値が短すぎるか、非常に積極的にトリミングされた可能性があります。

3. 多数の多重アラインメント読み取り。 サンプルに多重アライメントされたリードが多数含まれている可能性もあります。 サンプルに繰り返し領域が多数含まれているか、読み取り長が非常に短い可能性があります。

Basepair はアライメントのパーセンテージを提供しますが、それらのパーセンテージを解釈するのは研究者次第です。