ノート/ノート

訪問者数 338      最終更新 2019-02-27 (水) 10:57:25

Gene Ontologyタームを数える

GOのシステムで使いたい概念・名称の整理

このグラフを生成してくれるソフトが、gotoolsの中にある。ここに記述がある

このスクリプトを簡単に試してみるには、スタート点となるGOタームをファイルにリストしておき、それを処理する。GITの内容をgoatools-master下に展開してあるとして、ファイル:goatools-master/tests/data/go_plot/go_file_mine.txtに以下のデータ(GeneName yjgKに関連するGOターム、#以降は色の指定だが、無くてもよい、他にフィールドがあってもよいようだが、最低限これだけは必要らしい)を用意した。

GO:0005829
GO:0044010  #d6fffa

現在ディレクトリをgotools-masterに置いて、コマンド

scripts/go_plot.py --go_file=tests/data/go_plot/go_file_mine.txt -o go_file_mine.png

を実行すると、下記の端末出力

go-basic.obo: fmt(1.2) rel(2019-02-03) 47,381 GO Terms
        GO:0008150  # BP 29693 L00 D00       biological_process
#f1fbfd GO:0009987  # BP 11248 L01 D01 A     cellular process
#f1fbfd GO:0051704  # BP  1475 L01 D01 B     multi-organism process
        GO:0044764  # BP    78 L02 D02 AB    multi-organism cellular process
        GO:0042710  # BP    12 L03 D03 AB    biofilm formation
#d6fffa GO:0044010  # BP     4 L04 D04 AB    single-species biofilm formation
        GO:0005575  # CC  4205 L00 D00       cellular_component
#f1fbfd GO:0044464  # CC  3306 L01 D01 A     cell part
        GO:0044424  # CC  2366 L02 D02 A     intracellular part
        GO:0044444  # CC  1262 L03 D03 A     cytoplasmic part
#ffffe4 GO:0005829  # CC     3 L04 D04 A     cytosol
    2 usr  11 GOs  WROTE: go_file_mine.png

が得られ、下記のグラフがPNGファイルに出力される。

go_file_mine.png

より複雑な例として、 goatools-master/tests/data/go_plot/go_file_mine2.txtに以下のデータ(GeneName yfgCに関連するGOターム、#以降は色の指定だが、無くてもよい、他にフィールドがあってもよいようだが、最低限これだけは必要らしい)を用意した。

GO:0003756  #ff0000
GO:0004222  #55AA00
GO:0046872  #AA5500
GO:0005515  #00FF00
GO:0051603  #00AA55
GO:0061077  #0055AA
GO:0008237  #0000FF
GO:0016020  #5500AA
GO:0043165  #AA0055
GO:0030288  #55AA00

現在ディレクトリをgotools-masterに置いて、コマンド

scripts/go_plot.py --go_file=tests/data/go_plot/go_file_mine.txt -o go_file_mine.png

を実行すると、下記の端末出力

go-basic.obo: fmt(1.2) rel(2019-02-03) 47,381 GO Terms
        GO:0008150  # BP 29693 L00 D00       biological_process
#f1fbfd GO:0071840  # BP  1728 L01 D01 C     cellular component organization or biogenesis
#f1fbfd GO:0009987  # BP 11248 L01 D01 A     cellular process
#f1fbfd GO:0008152  # BP  6395 L01 D01 B     metabolic process
        GO:0006807  # BP  3951 L02 D02 B     nitrogen compound metabolic process
        GO:0016043  # BP  1699 L02 D02 AC    cellular component organization
        GO:0006457  # BP    12 L02 D02 A     protein folding
        GO:0044238  # BP  4205 L02 D02 B     primary metabolic process
        GO:0071704  # BP  6049 L02 D02 B     organic substance metabolic process
        GO:1901564  # BP  2880 L03 D03 B     organonitrogen compound metabolic process
        GO:0061024  # BP   233 L03 D03 AC    membrane organization
#0055AA GO:0061077  # BP     4 L03 D03 A     chaperone-mediated protein folding
        GO:0043170  # BP  2379 L03 D03 B     macromolecule metabolic process
        GO:0022607  # BP   502 L03 D03 AC    cellular component assembly
        GO:0071709  # BP     8 L04 D04 AC    membrane assembly
        GO:0019538  # BP  1169 L03 D04 B     protein metabolic process
        GO:0006508  # BP   101 L04 D05 B     proteolysis
#AA0055 GO:0043165  # BP     0 L05 D05 AC    Gram-negative-bacterium-type cell outer membrane assembly
#00AA55 GO:0051603  # BP    36 L05 D06 B     proteolysis involved in cellular protein catabolic process
        GO:0005575  # CC  4205 L00 D00       cellular_component
#5500AA GO:0016020  # CC   208 L01 D01 B     membrane
#f1fbfd GO:0044464  # CC  3306 L01 D01 A     cell part
        GO:0042597  # CC     3 L02 D02 A     periplasmic space
#55AA00 GO:0030288  # CC     0 L03 D03 A     outer membrane-bounded periplasmic space
        GO:0003674  # MF 11112 L00 D00       molecular_function
#f1fbfd GO:0003824  # MF  7674 L01 D01 A     catalytic activity
#f1fbfd GO:0005488  # MF  1906 L01 D01 B     binding
        GO:0016787  # MF  1647 L02 D02 A     hydrolase activity
#00FF00 GO:0005515  # MF   971 L02 D02 B     protein binding
        GO:0043167  # MF   209 L02 D02 B     ion binding
        GO:0140096  # MF   444 L02 D02 A     catalytic activity, acting on a protein
        GO:0016853  # MF   262 L02 D02 A     isomerase activity
        GO:0016860  # MF    72 L03 D03 A     intramolecular oxidoreductase activity
        GO:0043169  # MF    59 L03 D03 B     cation binding
        GO:0008233  # MF    75 L03 D03 A     peptidase activity
        GO:0016864  # MF     1 L04 D04 A     intramolecular oxidoreductase activity, transposing S-S bonds
        GO:0070011  # MF    70 L04 D04 A     peptidase activity, acting on L-amino acid peptides
#AA5500 GO:0046872  # MF    32 L04 D04 B     metal ion binding
#ff0000 GO:0003756  # MF     0 L03 D05 A     protein disulfide isomerase activity
        GO:0004175  # MF    19 L05 D05 A     endopeptidase activity
#0000FF GO:0008237  # MF     9 L05 D05 A     metallopeptidase activity
#55AA00 GO:0004222  # MF     1 L06 D06 A     metalloendopeptidase activity
   10 usr  42 GOs  WROTE: go_file_mine2.png

が得られ、下記のグラフがPNGファイルに出力される。

go_file_mine2.png

Gene Nameごとに、それに関係するGene Ontologyタームを数える

これから考える。

考え方


添付ファイル: filego_file_mine.png 189件 [詳細] filego_file_mine2.png 152件 [詳細] fileGOサンプル.png 198件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-02-27 (水) 10:57:25 (573d)