山内の演習のページ
訪問者数 1125 最終更新 2012-10-23 (火) 08:31:52
2013年度(2014年3月卒業予定)卒論生の募集 †
卒論募集時に配布するメモ
2013年度の卒論生を、次の要領で募集します。
- 山内研では、自分から積極的に挑戦する、やる気のある学生を求めます。
- 最近(08〜11年)の卒論では、つぎのようなテーマに挑戦しています。
- テキストマイニング
- 学生レポートの盗作(剽窃)を検出しようとしている。09年には2つのレポートや論文の類似性を比較する技術を検討したが、未だ実用するには検討が不十分である。10年には、いくつか考えられる類似性比較の方法を比較検討。11年はネットからのコピペ検出を研究。12年は位置合せとそれに対する別スコアリングによるコピペ検出判定関数を検討中。
- 12年度にツイッタ−(パブリックライン)の解析に着手。世の中でもかなりいろいろされているが、とにかく着手のレベル。これを拡大することが望まれる。
- 並列処理による高速化
- 直列型アルゴリズムの並列化チャレンジ 11年に、配列アラインメントのDPアルゴリズムの並列化、遺伝的アルゴリズムの並列化など、原理的に難しい問題に挑戦している。12年には多配列アラインメントの並列化とGPU化に挑戦中。
- クラスタ化の1つであるマルチクラスタ分析の並列化に挑戦中。
- 生物系データの可視化・マルチクラスタ分析・時系列分析
- 09年度は比較的単純なフローサイトメトリ測定結果のバイナリデータの処理を行ったが、そのデータを可視化及びマルチクラスタ解析している。また、11年度から生物動態シミュレーションの並列化にも挑戦して一定の並列度を得ており、12年度は改善とGPU化に挑戦している。
- 必要なスキルなど
- プログラミングが必須になります。研究室では主にC言語(C++を含む)とPythonとPHPと統計パッケージRのプログラミング言語(名称不明)が飛び交います。
- 論理的な(理屈っぽい)ものの考え方が要求されます。なぜその問題は挑戦に値するのか、なぜそのやり方・解決法を選ぶのか、なぜその結果は妥当だと思うのか、など、「なぜ」を問い続ける態度が必要です。他人に指摘されなくても、自分で自分の思考を整理し突き詰めてゆく習慣を付けてください。
- 常に挑戦し、常に明るく陽気で、常に外向きであることを要求します。社会で生きていくためには、これらは必須です。研究室も然りです。自分を「この程度」と思ったら、それ以上大きくなれません。まだ上に上れる・もっと飛びついてやる・チャンスをものにしてもっと大きくなる、と思うこと、大きな声で挨拶しいつもにこにこ・はっきりものを言うこと、外部の研究会などに積極的に出て行っていろいろな人と交流すること、これらを要求します。
- 英語の資料を読む力がある程度必要です。山内研では英語の資料がどうしても出てきます。翻訳されていないような新しい技術を使う時、英語で資料を読めることが必要です。本格的に問題に取り組むときまでにはある程度読めることが望まれます。これも、やる気さえあれば、半年もあれば一通りできるようになるはずです。
- できれば、いろいろなことに興味を持ってください。技術・文化・宗教・法制・人間・プロジェクトマネージメント・コンピュータサイエンス・生物、なんでも。