[[山内のサイト]]

*手順をメモっておく 2019-05-15 [#ub47a18c]
科研の分、ゲノムresequenceデータ


**受け取ったデータをコピー [#e38639d4]
**fastqcによる品質チェック [#j3cf6515]

~/KishimotoRNA/下
 XXX_fastqc.html        



**breseqの処理 [#a80edf14]
 breseq -j16 -o Output -r ../CP001637.fastq 1_2-1_R1.fastq 1_2-1_R2.fastq >& breseq.out
昔のメモでは
 breseq -j16 -o Output -r ../AP012030.gb 1_2-1_R1.fastq 1_2-1_R2.fastq >& breseq.out
正確に言うと、最初のメモではreferenceにFASTAと書いているが、その後のメモでGBとしている。GBを受け付けるし、結果出力にアノテーションが入るので、この方がいい。


 #!/usr/bin/bash
 for lot in 01_43B_S1 02_45a_plus_S2  \
  03_45a_minus_S3 04_45b_plus_S4 05_45b_minus_S5 \
  06_45c_plus_S6 07_45c_minus_S7  \
  08_45A_plus_S8  09_45A_minus_S9 10_45L_S10 
 #for lot in 01_43B_S1
 do
 file1="../Kishimoto_${lot}_R1_001.fastq.gz"
 file2="../Kishimoto_${lot}_R2_001.fastq.gz"
 log="${lot}.out.log"
 #echo "breseq -j16 -o $lot -r AP012030.fastq $file1 $file2 >& $log"
 #echo "breseq -j16 -o $lot -r AP012030.gb $file1 $file2 >& $log"
 breseq -j16 -o $lot -r AP012030.fasta $file1 $file2 >& $log &
 done

breseqのCコードではpthreadで並列設定をしているが、実際に並列化されているコードは
ほとんど見当たらなかった。Samtoolsを使う部分でnum_procを渡しているので、Samtoolsの
中は並列実行すると思われる。

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS