ChIP-Seqの結果
アライメントのワークフロー
アライメントワークフローは、fastq データから始まり、QC を実行し、リードをゲノムにアライメントし、重複リードを削除して、ゲノムカバレッジファイルを作成します。
- Sample.trimmed.per-base-quality.png:fastq データの基本品質
- Sample.trimmed_fastqc.zip:すべての QC 結果
- Sample.genome.bam [.bai]:アライメントされたbamファイル
- Sample.genome.dedup.bam [.bai]:アライメントされ重複排除された bam ファイル、重複した読み取りを削除
- Sample.genome.alignment-summary.png:アライメントされたリードの割合を示す図
- Sample.genome.dedup.norm-1M.bigwig:bigwigフォーマットのカバレッジ情報。 このファイルは、UCSCゲノムブラウザ、IGVブラウザなどで使用できます。
ピークコーリング(Peak calling)ワークフロー
ピークコーリングワークフローは、アライメント ワークフローのbamファイルを使用して、サンプル単独のピーク、またはコントロールと比較した差分ピークを見つけます。 プロモーター、最も近い遺伝子などとの重複を示すためにピークにアノテーションを付け、サテライトリピート領域と重複するピーク (ノイズの可能性があります) を除外して、プロモーター、ジーンボディ、または遺伝子間ターゲットのリストを作成します。 最後に、ピーク内で既知のモチーフと新規モチーフを見つけます。
- Sample_1_vs_Sample_2.genome.hg19.macs_peaks.bed:Macs はbed形式でピークに達し、IGV または他のブラウザでロードされる可能性があります
- Sample_1_vs_Sample_2.genome.macs_peaks.annotated.xls:アノテーション情報が追加されたピーク。プロモーターとの重複、遺伝子本体または最も近い遺伝子との重複を示します。
- Sample_1_vs_Sample_2.genome.macs_peaks.filtered.xls:サテライト領域と重なるピークはノイズである可能性が高いため、除去します。
- Sample_1_vs_Sample_2.genome.macs_peaks.filtered.targets.xls:標的遺伝子のリスト
- Sample_1_vs_Sample_2.genome.macs_peaks.motifs.zip:山頂にモチーフが見られます。 結果には 2 種類があります: a) 過剰に表現された n-mer をデノボ検索し、それらを既知のモチーフと照合する (homerMotifs.html)、および b) 既知のモチーフを取得し、ピーク内でそれらを検索します (knownMotifs.html) 。