Basepairを使用したNGS結果の視覚化

作家は文章を書き、画家は絵を描き、ゲノミクス研究者は…バイオインフォマティクスパイプラインがNGSデータの処理を完了するまで辛抱強く待っているのに、結果の視覚化に同じくらいの時間を費やすだけでしょうか?

長年、研究者および生物情報学者として、私たちはNGSデータ分析においてあらゆるボトルネックがイノベーションを妨げていることをよく知っています。 ゲノミクスデータをアルゴリズムに入力し、ファイル形式を変換し、すべての処理が完了して次のステップに進むのを待つのに費やす1時間ごとに、下流の分析を掘り下げて重要な洞察を導き出すために使用できる貴重な時間が奪われていることになります。

研究者がNGSデータの分析に取り組んでいる時間のかかる複数ステップのプロセスを自動化し、飛躍的に高速化するために、私たちはBasepairを開発しました。 現在、Basepair の Web プラットフォームは、大学生や職員から大企業のチームまで、あらゆる人に人気があり、当社のプラットフォームを使用して最大数千のサンプルを並行して分析できます。セットアップにはわずか数分、処理時間は1時間未満です。最も計算量の多いタスクであっても。

私たちの目標は、手動によるNGSデータ分析によって失われた数千時間を個人やチームに取り戻すことでした。 しかし、結果として得られたファイルを単に出力して終わりにするのは適切ではないと考えました。 私たちは、下流の分析にとってレポートとビジュアルがいかに重要であるか、そしてその設定がどれほど面倒であるかを理解しています。そのため、NGS データ分析レポートの一部として、豊富なビジュアルおよびインタラクティブなコンポーネントを多数含めています。

出力ファイルに加えて、Basepairには、下流の NGS データ分析を高速化する3つの主要なレポート コンポーネントが含まれています。QCおよびアライメントメトリクス、ゲノムブラウザ、またたとえば数値の調整が可能なボルケーノプロットやバリアントブラウザなどを含むそのワークフローに関連するインタラクティブな図です。

Basepair レポートに表示される内容

RNA-Seq、ChIP-Seq、CUT&RUN、CUT&TAG、DNA-Seq、または ATAC-Seq データに対して選択したワークフローに応じて、レポートには独自のビジュアルとインタラクティブな要素が含まれます。 たとえば、 発現カウント(Expression count)ワークフローからの RNA-seq データセットの全体的なレポートを見てみましょう。

このワークフローの場合、レポートには、生およびフィルターされたリードからの品質スコアの概要、アライメント統計、および遺伝子レベルと転写レベルの両方での生および正規化された発現値が含まれます。 遺伝子発現レベルの分布も、データを表示する内蔵のゲノム ブラウザーとともに表示されます (この機能については以下で詳しく説明します)。

次に、 DESeq2レポートを覗いてみましょう 。

インタラクティブなレポートページは、さまざまなp値または倍数変化のしきい値を使用するように調整でき、目的の特定の遺伝子をボルケーノ プロットとヒートマップの両方でラベル付けできます。 すべての遺伝子の遺伝子発現解析結果を含む表が利用可能であり、すべてのサンプルのPCAプロットも表示されます。 これらのインタラクティブな要素の次の動画でも確認できます。

NGSデータ分析の世界では1つのサイズがすべてに適合するわけではありません。そのため、ゲノミクスデータを最適に表現するために、30のワークフローのそれぞれにグラフと表のカスタマイズされたセットが含まれるようにしました。 Basepairのレポートに表示されるプロットの種類をさらに詳しく見てみましょう。

DNA-seq データの場合、 アライメント (BWA) ワークフローは、ゲノムに沿ったシーケンスの深さを要約するカバレッジ プロットとともに、QCおよびアライメント統計を含むレポートを提供します。

ChIP-Seq、CUT&RUN、CUT&TAG データのピークとモチーフにはMACS2 または SEACRを使用し、モチーフの同定にはの位置を特定するために、Homerを 使用します。 このレポートは、遺伝子アノテーションのヒートマップと平均プロファイル プロットも自動的に生成します。

Basepair のゲノムブラウザで生データを探索する

各レポートには統合されたゲノムブラウザーが含まれており、生データをインタラクティブに視覚化できます。

上記の各トラックはカスタマイズ可能です。名前、高さ、色、データ範囲を好みに合わせて設定したり、トラックを追加または削除したりできます。 ゲノム ブラウザは、データの品質を評価し、特定の遺伝子に焦点を当て、データセットを全般的に観察するための迅速な方法です。

バリアントブラウザでのバリアントデータの探索

DNA-Seq データの下流分析は、多くの場合、数千、さらには数百万の生のバリアント コールから始まります。 このデータを使って何ができるでしょうか? これらの亜種のうちどれが興味深いでしょうか? このトピックに関する提案について多くのお問い合わせをいただきました。 これに応えて、私たちは Variant Browser を開発しました。

現在、現在Variant Annotation または Variant Callingワークフローを介して分析されたDNA-Seq データには、Basepair ユーザーがさまざまなパラメーターやフィルターを試すことのできる、インタラクティブなバリアントブラウザーが含まれており、より直観的かつ迅速に有用なデータの発見ができます。

パラメーターには、品質、深度、gnomAD頻度、代替リード頻度スライダーなどが含まれます。 特定の遺伝子、アノテーション、特徴タイプ、または染色体でフィルターすることもできます。 テーブルの強力な柔軟性に加えて、[Analytics] タブでは、基本変更数からバリアント タイプの数、その他の有用なプロットまで、一連の有用なメトリクスにアクセスできます。

Basepair の使命は、NGS データ分析を可能な限りシームレス、高速、そして有益なものにし、お客様が最も得意なことに集中できるようにすることです。 当社のインタラクティブレポートには、ワークフロー固有のさまざまなグラフ、表、対話型要素が含まれており、サンプルの数がどれほど多くても、レポート作成と下流分析を効率化します。

6サンプル フリートライアル 実施中

最大6つのサンプルを無料でアップロードして分析できます。アップロードされたサンプルに対する解析は無制限です。世界トップクラスの機関、研究室、製薬チームがBasepairを使用して、数千ドルを節約している理由をご覧ください。