[[山内の授業のページ]]~ アクセス数 &counter(); このページの最終更新 &lastmod(); &color(red){学期内のレポート課題は3回を想定していましたが、適当な課題にならないので、2回のみにします。}; &color(red){学期末のレポート課題を準備しました。}; ⇒ &ref(期末課題.pdf); **2011年春学期 バイオインフォマティクス基礎論 [#kf212584] 火曜日 4限 ***授業の目的 [#x1922f4d] 「バイオ」(生物学・生命科学)を適用の中心分野としたときの、「インフォマティクス」(情報学 〜 大量のデータから意味ある情報を知的処理によって抽出)のさまざまな手法・原理を学ぶ。 -インフォマティクス(情報学、非常に幅広い)のうち、生命科学に適用されている手法・原理に限定して学ぶ。インフォマティクスの応用分野は、当然、生命科学だけではなく、ここで概観する手法・原理は他の分野にも適用されるものである。 -インフォマティクスは、特にアルゴリズムや処理方法を中心にして概観する。 -生命科学・生物学については、適用の対象として理解する程度にとどめる。生命科学の系統的な理解は、別途その分野の教科書等を参照して欲しい。~ やさしい入門書の例: 「ファーストブック 生命科学がわかる」~ 工藤佳久・都筑幹夫、技術評論社、978-4-7741-3613-4、平成20年10月 1780円 -生命科学の研究者が使うためのハウツーではない。生命科学者にとってバイオインフォマティクスはツールであって、使いこなすことが目的で、原理は興味の対象外である事が多い。「バイオインフォマティクス」を称する教科書も、そのような本があるが、それはこの授業の目指すところではない。具体的にはネット経由で遺伝子データベースをアクセスするやりかたの解説や、Perlなどの言語と生命科学用パッケージ(たとえばBioPerlなど)を使ってデータ処理プログラムを作る解説などである。 -逆に、情報処理のための生物学、たとえば、生命現象を利用した計算処理(ニューロコンピューティング、遺伝的アルゴリズム、生命化学反応による情報処理など)は授業の対象とはしない。(注)これらはそれぞれに面白いテーマであるし、特に最後の生命化学反応を素子とするコンピュータはほとんど未知であって興味深いのだが、この授業では対象としない。 ***前提知識 [#n6a9ffb5] -生命科学についての予備知識は、最低限として高校の生物や啓蒙書レベルの程度を求める。授業の進展につれて、興味を持っていろいろな本を読んで欲しい。 -情報科学・情報処理についての予備知識は、情報科学科3年生としてのレベルを求める。アルゴリズムとは一般にどのようなものかを理解していること、アルゴリズムをプログラム化できること、コンピュータおよびネットを操作できることなど。授業で扱う特定のアルゴリズムについては、特に前提知識は不要である。 ***授業スケジュール(as of 2011/02/22) [#u321055e] |回|日|テーマ|内容|教科書| | 1|04/05| バイオインフォマティクス総論 | &ref(バイオインフォ総論.pdf,,(分子)生物学の概観、情報処理); |第1章| | 2|04/12| 配列アラインメント(1)|&ref(アラインメント(1).pdf,,ペアワイズアラインメント・ローカルアラインメント); | 2.1〜2.4 | | 3|04/19| 配列アラインメント(2)|&ref(アラインメント(2).pdf,,ホモロジー検索・マルチプルアラインメント); | 2.5〜2.6 | | 4|04/26| 配列解析(1)| &ref(配列解析(1).pdf,,モチーフ・HMM・カーネル法); | 3.1〜3.3 | | 5|05/10| 配列解析(2)| &ref(配列解析(1).pdf,,ゲノム配列推定・ゲノム再構成); | 3.4〜3.5 | | 6|05/17| 進化系統樹推定(1)| &ref(進化系統樹(1).pdf,,系統樹・距離行列法); | 4.1〜4.3 | | 7|05/24| 進化系統樹推定(2)| &ref(進化系統樹(2).pdf,,最節約法・進化の確率モデル・評価と比較); | 4.4〜4.6 | | 8|05/31| 高次構造解析・比較 | &ref(高次構造解析(1).pdf,,RNA2次構造予測・構造比較); | 5.1〜5.2| | 9|06/07| 高次構造推定 | &ref(高次構造解析(2).pdf,,タンパク質立体構造予測); | 5.3 | |10|06/14| ネットワーク解析(1) | &ref(ネットワーク解析(1).pdf,,遺伝子発現解析・遺伝子ネットワーク); | 6.1〜6.4 | |11|06/21| 情報のマイニング(1) | &ref(テキストマイニング.pdf,,文献情報とテキストマイニング); | | |12|06/28| 情報のマイニング(2) | &ref(データマイニング.pdf,,データマイニングとテキストマイニング追加); | | |13|07/05| | | | |14|07/12| | | | ***授業の進め方・評価・教科書などについて [#p308603a] 授業の進め方: -基本は講義形式とする。 教科書: -「バイオインフォマティクスの数理とアルゴリズム」 阿久津達也著 共立出版 4-320-12178-2 3,000円~ アルゴリズムの説明は、この本をベースにして行い、随時必要に応じて他の本の説明を紹介する。 参考書: いずれも、図書館にある。その他、授業中に必要に応じて紹介する。 -「バイオインフォマティクス基礎講義」A.M.Lesk、岡崎康司他訳、MEDSi 4-89592-343-6 -「バイオインフォマティクス入門」J.C.Setubal他、五条堀孝他訳、共立出版 4-320-05580-2 -「バイオインフォマティクスのためのアルゴリズム入門」 N. C. Jones他、渋谷哲朗・坂内英夫訳、共立出版、4-32005650-3 (アラインメントの説明が非常に丁寧) 評価 -授業内課題(60点)、期末試験(40点)の合計点を評価とする。 オフィス・アワー -当面は金2限と火3限 (春学期開始後、変更の可能性あり)~ -その他、空き時間には随時。 空き時間は [[週間予定>山内のサイト]] と [[その日の予定:http://www.google.com/calendar/embed?src=del681f17urk1auo7hp2bort0s%40group.calendar.google.com&pvttk=fa261f92a65990b8a8f20bc4a274558e]] を参照のこと~ 場所は4号館5階 4541室 メモ: [[清水謙多郎先生の資料:http://www.bi.a.u-tokyo.ac.jp/~shimizu/bio/index-bio.html]] メモ: JSTバイオインフォマティクス推進センター[[ゲノム解析ツール リンク集:http://www-btls.jst.go.jp/Links/link.cgi?category=0]] ***2011年度課題 [#w72afe5c] | | 内容 | | 締切 | | 第1回 | &ref(アラインメント課題.pdf,,配列アラインメントプログラミング);|&ref(alignmentdata.txt,,サンプル入力);| 5/17 | | 第2回 | ClustralWを使って系統樹を書く(下記2010年度分資料参照) |下記fastaデータ参照 | 6/7 | | 第3回 | タンパク質の構造⇒中止 | | 無しにします| | 第3回 | タンパク質の構造 ⇒ 中止 | | 無しにします| |期末| 期末課題レポート |&ref(期末課題.pdf,,期末レポート課題); | 7/19(火)午後5時 | ***2010年度分の第7回進化系統樹(2)演習課題のための資料とデータ例 [#n23f2375] -&ref(山内の授業のページ/10春/バイオインフォマティクス基礎論/bif10_7_enshuu.pdf); -&ref(山内の授業のページ/08秋/講究2/hemoglobin_fasta.txt); -&ref(山内の授業のページ/08秋/講究2/myoglobin_fasta.txt); -&ref(山内の授業のページ/08秋/講究2/lysozyme_fasta.txt);