Pythonバイオ? Pythonバイオ/ツール?
47   2019-05-15 (水) 14:09:10

VCFフォーマットとBCFフォーマット

参照

Samtoolsのcallingについての、元ラボの説明 ⇒ Samtools の Calling and analysis を見よ
具体的には当該箇所に曰く

SAMフォーマット

ヘッダーセクション 〜 一時忘れる
アライメントセクション 〜 リードが1行ずつ

ColFieldTypeRegexp/RangeBrief description
1QNAMEString[!-?A-~]{1,254}Query template NAME
2FLAGInt[0, 2^16 − 1]bitwise FLAG
3RNAMEString\*[:rname:∧*=][:rname:]*Reference sequence NAME
4POSInt[0, 2^31 − 1]1-based leftmost mapping POSition
5MAPQInt[0, 2^8 − 1]MAPping Quality
6CIGARString\*([0-9]+[MIDNSHPX=])+CIGAR string
7RNEXTString\*=[:rname:∧*=][:rname:]*Reference name of the mate/next read
8PNEXTInt[0, 2^31 − 1]Position of the mate/next read
9TLENInt[−2^31 + 1, 2^31 − 1]observed Template LENgth
10SEQString\*[A-Za-z=.]+segment SEQuence
11QUALString[!-~]+ASCII of Phred-scaled base QUALity+33

BAMファイルはSAMファイルと同等内容で、形式がバイナリ(非文字)なだけ。量が減る。

pythonでSAM/BAMファイルを扱うライブラリ pysam

ソートとインデックス(bai)

VCFファイル


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-05-15 (水) 14:09:10 (10d)