RNA-Seqのノーマライゼーションとヒートマップの作成
RNA-Seq のデータ正規化
生の読み取り数は DESeq2 パッケージを使用して正規化されます。 DESeq2 は、すべてのサンプルにわたる各遺伝子の幾何平均を計算する内部正規化を実行します。 次に、各サンプル内の遺伝子の数をこの平均で割ります。 サンプル内のこれらの比率の中央値が、そのサンプルのサイズ係数です。
heatmapの場合は、各遺伝子のサンプル全体の正規化された読み取りカウントに対して Z スコア正規化が実行されます。 Z スコアは、 遺伝子ごと (行ごと) 平均値を引いて標準偏差で割ることにより、 に計算されます。 計算された Z スコアは、ヒートマップのプロットに使用されます。
濃い赤色の遺伝子はアップレギュレートされ、青色の遺伝子はダウンレギュレートされます。 行 (遺伝子) は Z スコアでスケールされているため、色はサンプル全体での単一遺伝子のさまざまな発現を表します。