山内のサイト

手順をメモっておく 2019-05-15

科研の分、ゲノムresequenceデータ

受け取ったデータをコピー

fastqcによる品質チェック

/KishimotoRNA/下

XXX_fastqc.html        

breseqの処理

昔のメモでは

breseq -j16 -o Output -r ../AP012030.gb 1_2-1_R1.fastq 1_2-1_R2.fastq >& breseq.out

正確に言うと、最初のメモではreferenceにFASTAと書いているが、その後のメモでGBとしている。GBを受け付けるし、結果出力にアノテーションが入るので、この方がいい。

#!/usr/bin/bash
for lot in 01_43B_S1 02_45a_plus_S2  \
 03_45a_minus_S3 04_45b_plus_S4 05_45b_minus_S5 \
 06_45c_plus_S6 07_45c_minus_S7  \
 08_45A_plus_S8  09_45A_minus_S9 10_45L_S10 
#for lot in 01_43B_S1
do
file1="../Kishimoto_${lot}_R1_001.fastq.gz"
file2="../Kishimoto_${lot}_R2_001.fastq.gz"
log="${lot}.out.log"
#echo "breseq -j16 -o $lot -r AP012030.gb $file1 $file2 >& $log"
breseq -j16 -o $lot -r AP012030.fasta $file1 $file2 >& $log &
done

breseqのCコードではpthreadで並列設定をしているが、実際に並列化されているコードは ほとんど見当たらなかった。Samtoolsを使う部分でnum_procを渡しているので、Samtoolsの 中は並列実行すると思われる。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-05-21 (火) 09:28:10 (420d)