[[Pythonバイオ]] [[Pythonバイオ/ツール]]~
&counter();   &lastmod();~

*GeneBankファイルからfasta+gffファイルへ変換 [#k613fb64]

遺伝研のフレームワークでは、参照シーケンスをfastaファイル+gffファイルで取り込んでいる。

GeneBankファイル形式から(配列部分を)Fastaに、(アノテーション部分を)GFF形式に
変換することを考える。

参考資料
-[[GFF(General Feature Format):https://staffblog.amelieff.jp/entry/2015/07/31/143358]]
-[[SeqIO | データベースからダウンロードしたファイルを処理する BioPython モジュール:https://bi.biopapyrus.jp/python/biopython/seqio.html]]
-[[BiopythonでGenbankファイル操作:CDSをすべてFASTAに書き出す - Qiita:https://qiita.com/sato32ha6/items/b9d85fad2d9de53374bf]]
-[[Biopython:Genbank file parsing cheat sheet - Qiita:https://qiita.com/sato32ha6/items/9687f5f0b56d7f318783]]
-[[Parsing GFF Files · Biopython:https://biopython.org/wiki/GFF_Parsing]]の中に、Writing GFF3というセクションがあって、その中に
 #Converting other formats to GFF3
 from BCBio import GFF
 from Bio import SeqIO
 
 in_file = "your_file.gb"
 out_file = "your_file.gff"
 in_handle = open(in_file)
 out_handle = open(out_file, "w")
 
 GFF.write(SeqIO.parse(in_handle, "genbank"), out_handle)
 
 in_handle.close()
 out_handle.close()


トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS