Nextflow で複数の解析プログラムを次々に実行する
·1 分
NGSのデータ解析は複数のプログラムやデータベースを組み合わて実行する必要がある。これをパイプライン処理やワークフロー処理と呼ぶ。通常、Make, Rake, シェルスクリプトなどを利用して、ワークフローを実装する。
ワークフロー作成・管理ツールもあり、Galaxy はウェブUIやデータ管理機能もあり、よく使われている。ここではコマンドラインベースの軽量ワークフローシステムである、Nextflow について述べる。
インストール#
まず Java 8 をインストールする。Nextflow の動作は Java 7以上が求められる。Java のバージョン確認は以下の通り。
java -version次にコマンドラインから以下を実行する。
cd ~/opt/local/bin
curl -fsSL get.nextflow.io | bash
export PATH=$HOME/opt/local/bin/:$PATH # 必要ならパスを通すNextflowを実行してみる。
nextflow run hello
Picked up _JAVA_OPTIONS: -Duser.language=en -Dfile.encoding=UTF-8
N E X T F L O W ~ version 0.18.0
Launching 'nextflow-io/hello' - revision: 35f898dfe5 [master]
[warm up] executor > local
[59/99fce6] Submitted process > sayHello (5)
[d8/890e37] Submitted process > sayHello (4)
[44/e3768b] Submitted process > sayHello (1)
[84/9af872] Submitted process > sayHello (2)
[5c/3dc2d9] Submitted process > sayHello (3)
Γεια σου world!
Bojour world!
Hola world!
Ciao world!
Hello world!ワークフローを作る#
簡単なワークフローを作ってみる。
2016/04/26