ノート/ノート
訪問者数 3811      最終更新 2008-07-30 (水) 13:36:57

分子進化学の実際ネタ

やりたいこと: 同じタンパクの、種の間の違いを比較する。 その距離に応じたクラスタリングを、たとえばClustral-Wを使って行う。
結果が常識的な結論(系統樹)になって欲しい。
以前に試みたときは、うまくならなかった。

理由として考えられること:同じ(名前の)タンパクを作る遺伝子が、 DNA上に複数存在して、それぞれが別々に進化する。
種Aの遺伝子座Xと種Bの遺伝子座Yを比較すると、結構遠い可能性がある。
もし種AとBが近くて、AとCが遠いとき、AのX、CのX、BのYを比較してクラスタリングすると、AXとCXはより近くて、AXとBYはより遠い、という結果が出ても不思議がない。

どの座が対応するかをちゃんと理解すればいいのだが、便宜的な方法としては、 先に相同性をチェックしてしまうのがよい。具体的には
 * まず種Aの遺伝子Xを選ぶ
 * A/Xに相同的に近い遺伝子を検索する BLAST
 * その結果の中から異なる種B、C、Dのものを選ぶ

なお、あまり変化のないタンパクを選んだ方がよかろう。たとえばhemoglobinとかmioglobinとか。

結果を見ると、E値の小さいもの100はみんなHumanで、役立たなかった。

もっと他の動物から始めた方がよさそうだ。やり直し。

結果のリスト file結果のリスト  file結果のHP これでXXXXの部分は何なのだろうか?

これらから選んで、FASTA配列ファイルを並べた入力を作り、clustalWに与える

★その2★

違うタンパクでもう1度試そう。myoglobinはどうか?

結果のリスト file結果のリスト  file結果のHP

ちなみに、cytochrome bやcで試みたが、あまりデータが揃わなかった。
cytochromeの結果のリスト file結果のリスト  file結果のHP

myoglobinのリストから選ぶが、hemoglobinの時となるべく同じ動物にしたい。どうしても揃わないときはあきらめよう。

FASTA配列ファイルを並べた入力を作り、clustalWに与える

★別のタンパク質 リゾチーム(lysozyme) ではどうか★

ヒトから始める。

>human-P61626
    MKALIVLGLV LLSVTVQGKV FERCELARTL KRLGMDGYRG ISLANWMCLA KWESGYNTRA
    TNYNAGDRST DYGIFQINSR YWCNDGKTPG AVNACHLSCS ALLQDNIADA VACAKRVVRD
    PQGIRAWVAW RNRCQNRDVR QYVQGCGV

BLAST-PSIで相同検索してみる。

Homo sapiens (Human) P61626|LYSC_HUMAN (スタート)
Macaca mulatta(アカゲザル) P61633|LYSC_CERAE
Papio anubis (Olive baboon)  P61629|LYSC_PAPAN
Pan troglodytes (Chimpanzee)  P61628|LYSC_PANTR
Pongo pygmaeus (Bornean orangutan) P79239|LYSC_PONPY
Gorilla gorilla gorilla (Lowland gorilla) P79179|LYSC_GORGO
Coturnix coturnix japonica (Japanese quail)(ニホンウズラ) P00701|LYSC_COTJA
Gallus gallus (Chicken) P00698|LYSC_CHICK
Anas platyrhynchos (Domestic duck) P00705|LYSC1_ANAPL
Mus musculus (Mouse) Q3TXG2|Q3TXG2_MOUSE
Ovis aries (Sheep) A4Z8Q3|A4Z8Q3_SHEEP
Meleagris gallopavo (Common turkey) P00703|LYSC_MELGA
Rattus norvegicus (Rat) P00697|LYSC1_RAT
Bos taurus (Bovine) P80189|LYSCN_BOVIN
Sus scrofa (Pig)  P12069|LYSC3_PIG
Paralichthys olivaceus (Japanese flounder)(ヒラメ) Q9DD65|LYSC_PAROL
Ovis aries (Sheep) P17607|LYSC1_SHEEP
Japanese pufferfish (Fugu) P61944|LYSC_FUGRU
Oryctolagus cuniculus (Rabbit) P16973|LYSC_RABIT
Halichoerus grypus (Gray seal) Q659U5|LYSC_HALGR
Oncorhynchus mykiss (Rainbow trout) P11941|LYSC2_ONCMY
Canis familiaris (Dog1) P81708|LYSC1_CANFA
Canis familiaris (Dog2) P81709|LYSC2_CANFA
Camelus dromedarius (Dromedary) (Arabian camel) P37712|LYSC_CAMDR
Chelonia mydas (Green sea-turtle) P84492|LYSC_CHEMY
Columba livia (Domestic pigeon)  P00708|LYSC_COLLI
Bombyx mori (Silk moth) P48816|LYS_BOMMO
Anopheles gambiae (African malaria mosquito) Q17005|LYSC1_ANOGA
Danio rerio (Zebrafish) Q90YS5|Q90YS5_DANRE
Cyprinus carpio (Common carp) Q9IBG5|Q9IBG5_CYPCA

lysozime-CはAlpha-lactalbuminと相同性が高い?? 〜 Blast検索で混ざって出てくる

α-lactalbumin is an important whey protein in cow's milk (~1 g/l), and
is also present in the milk of many other mammalian species.

FASTA配列ファイルを並べた入力を作り、clustalWに与える

PHYLIPについて

Phylipパッケージは


添付ファイル: filelysozime.dst 652件 [詳細] filelysozime.png 548件 [詳細] filelysozime.wmf 644件 [詳細] filelysozime.aln 304件 [詳細] filelysozime.htm 709件 [詳細] filelysozime.ph 680件 [詳細] filelysozime_fasta.txt 678件 [詳細] filemyoglobin.png 617件 [詳細] filemyoglobin.wmf 682件 [詳細] filemyoglobin.ph 681件 [詳細] filemyoglobin.dst 662件 [詳細] filemyoglobin.htm 740件 [詳細] filemyoglobin_fasta.txt 703件 [詳細] filemyoglobin_blast_p.txt 665件 [詳細] filemyoglobin_blast_p.htm 1455件 [詳細] filecytochrome_blast_p.txt 763件 [詳細] filecytochrome_blast_p.htm 1176件 [詳細] filehemoglobin.dst 665件 [詳細] filehemoglobin.htm 727件 [詳細] filehemoglobin.png 597件 [詳細] filehemoglobin.wmf 657件 [詳細] filehemoglobin.ph 719件 [詳細] filehemoglobin_fasta.txt 677件 [詳細] fileblast_p.htm 1387件 [詳細] fileblast_p.txt 741件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2008-07-30 (水) 13:36:57 (3226d)