2008,12,17, Wednesday
FindPeaksを使ってみる
コレ
http://www.bcgsc.ca/platform/bioinfo/software/findpeaks
ダウンロードして解凍するだけ。
Inputには、MaqフォーマットかELANDフォーマットのファイルが使用できます。
ELANDフォーマットファイルは、まず染色体毎に分割します。
% time java -jar SeparateElandReads.jar input_file.eland ./
カレントディレクトリに、各染色体毎の.gzファイルが作られます。
次が本番。
% time java -jar FindPeaks.jar -name test -dist_type 1 200 -minimum 1 -eff_size 1.8655e9 -output ./ -input ./*.part.eland.gz
マニュアルでは「-eff_size」でなく「-eff_frac」というオプションを使っていますが
バージョン3.1.9.2 のusageでは「-eff_sizeを使え」と言ってきます。
(当然の気もしますが・・・)
32bpまでのマッピングではゲノムサイズの70%をカバー ということらしいので、
mouseゲノムサイズ×0.7 の数値を入れます。
続きます
http://www.bcgsc.ca/platform/bioinfo/software/findpeaks
ダウンロードして解凍するだけ。
Inputには、MaqフォーマットかELANDフォーマットのファイルが使用できます。
ELANDフォーマットファイルは、まず染色体毎に分割します。
% time java -jar SeparateElandReads.jar input_file.eland ./
カレントディレクトリに、各染色体毎の.gzファイルが作られます。
次が本番。
% time java -jar FindPeaks.jar -name test -dist_type 1 200 -minimum 1 -eff_size 1.8655e9 -output ./ -input ./*.part.eland.gz
マニュアルでは「-eff_size」でなく「-eff_frac」というオプションを使っていますが
バージョン3.1.9.2 のusageでは「-eff_sizeを使え」と言ってきます。
(当然の気もしますが・・・)
32bpまでのマッピングではゲノムサイズの70%をカバー ということらしいので、
mouseゲノムサイズ×0.7 の数値を入れます。
続きます
| BioInformatics::Software | 03:28 PM | comments (0) | trackback (x) |