[[山内のサイト]]
*手順をメモっておく 2019-05-15 [#ub47a18c]
科研の分、ゲノムresequenceデータ
**受け取ったデータをコピー [#e38639d4]
**fastqcによる品質チェック [#j3cf6515]
~/KishimotoRNA/下
XXX_fastqc.html
**breseqの処理 [#a80edf14]
breseq -j16 -o Output -r ../CP001637.fastq 1_2-1_R1.fastq 1_2-1_R2.fastq >& breseq.out
昔のメモでは
breseq -j16 -o Output -r ../AP012030.gb 1_2-1_R1.fastq 1_2-1_R2.fastq >& breseq.out
正確に言うと、最初のメモではreferenceにFASTAと書いているが、その後のメモでGBとしている。GBを受け付けるし、結果出力にアノテーションが入るので、この方がいい。
#!/usr/bin/bash
for lot in 01_43B_S1 02_45a_plus_S2 \
03_45a_minus_S3 04_45b_plus_S4 05_45b_minus_S5 \
06_45c_plus_S6 07_45c_minus_S7 \
08_45A_plus_S8 09_45A_minus_S9 10_45L_S10
#for lot in 01_43B_S1
do
file1="../Kishimoto_${lot}_R1_001.fastq.gz"
file2="../Kishimoto_${lot}_R2_001.fastq.gz"
log="${lot}.out.log"
#echo "breseq -j16 -o $lot -r AP012030.fastq $file1 $file2 >& $log"
#echo "breseq -j16 -o $lot -r AP012030.gb $file1 $file2 >& $log"
breseq -j16 -o $lot -r AP012030.fasta $file1 $file2 >& $log &
done
breseqのCコードではpthreadで並列設定をしているが、実際に並列化されているコードは
ほとんど見当たらなかった。Samtoolsを使う部分でnum_procを渡しているので、Samtoolsの
中は並列実行すると思われる。