Basepairの誕生秘話

Basepairは2008年に設立されました。BasepairのCEOであるAmit Sinhaが、ハーバード大学医学部やその他の研究機関に勤務していた際に、次世代シーケンス(NGS)解析の際に彼が個人的に直面していた課題に直接応える形で設立されました。NGSは、高密度集積回路のトランジスタ数は約2年ごとに倍増するという「ムーアの法則」の3倍もの速度でデータ量が増えています。ファイルの圧縮、コピー、解析のような単純な操作でさえ、数分かかることがあります。その結果、コンピューティング・リソースは常に負荷が高い状態にあります。実際、Amit氏はシステム管理者から、ジョブを減らすか、ファイルの削除を何度も警告を受けました。これは、何GBもの分析を実行しなければならないときに聞きたいことではありませんでした。リソースの制約に加えて、クラスタ上で物事を実行することの複雑さを考えると、科学者は標準的なパイプラインを実行するためにさえバイオインフォマティシャンに依存することになります。

Amit氏はBasepairで、研究者として自分が持っていたいと思うようなソフトウェアアプリケーションを作りたいと考えました。Basepairのゴールは使用するためのトレーニングは1分以内で、操作にかかる時間を最小限に抑え、主要なNGSアプリケーション用のすぐに使えるパイプラインを持ち、解釈しやすい結果を出すアプリケーションを常に開発することです。

Basepairの成長はまさに有機的なもので、完全にユーザーによって支えられています。Basepairは3つのNGSパイプラインからスタートし、今では50を数えるまでになりました! 現在では、バリアントコーリング(DNA-Seq)、発現変動解析(RNA-Seq)、ピークコーリング(ChIP-Seq)、オープンクロマチン(ATAC-Seq)などの解析にBasepairを使用することができます。出版要件を満たすためにGEOにデータを自動的に提出するためのパイプラインも開発しました。

既存のワークフローも常に更新しています。例えば、発現変動解析パイプラインはヒートマップとボルケーノプロットを生成するようになりました。 また、ピークコールパイプラインはピークのゲノム分布を示す図を作成します。

Basepairを立ち上げた重要な目的のひとつは、ユーザーのニーズとともに進化するソフトウェアを作ることでした。私たちが直接受け取るフィードバックに加え、私たちのソフトウェアがどのように使用されているかを理解するために、フードの下には多くの分析があります。お気に入りは、サンプルの追加と分析に平均1分もかからないことです。

また、アップロード完了後の自動解析開始、マルチファイルアップロード(シーケンシングコアがデータを複数のファイルに分割する場合)など、いくつかの技術的な改善も行いました。アーリーアダプターになってくださった方々に感謝します。NGS解析を大幅に加速し、皆様の生活がより簡単になることを願っています。

この投稿を読んでいる他の皆さん…無料で試してみて、ご自分の目で確かめてみませんか? 

6サンプル フリートライアル 実施中

最大6つのサンプルを無料でアップロードして分析できます。アップロードされたサンプルに対する解析は無制限です。世界トップクラスの機関、研究室、製薬チームがBasepairを使用して、数千ドルを節約している理由をご覧ください。