ノート
訪問者数 1059 最終更新 2011-09-02 (金) 08:25:21
2011/9/2 課題:abstractの流れ †
流れを検出するためのアイデア 〜 まずは「結論」(その論文の主張するところ)の検出
- 語、おそらくは動詞、たとえば「conclude」とか「claim」とか
- その語の主語(係り受け解析が必要と言っている)「We claim」なのか「XXX claims」なのか。
- パターンでもいいのだが、複雑な文を考えると係り受けがほしい
- 変な構造をしているとき、うまく見つけられるか興味 (It is apparent that ...)
- abstract中の位置。第1文(トピックセンテンス)、最終文(トピックセンテンスもしくは結論)〜〜判断材料として使える(これだけを見るという方式もアリだが、若干疑問)
発展課題
- 類似の手法で、「前提」や「既存の研究」を分離できるか?
流れを検出することの「意味」
- 結論 vs 前提や他の研究 を分離する
- 流れそのものに意味がある
実験の提案
- 特定の話題に関する論文のabstractを10〜20編ぐらい集め、上記のアイデアを試す。
- 去年試したColorectal CancerとAspirinのデータをもう一度集めなおしてみたらどうか?
- 一編ごとに手で上記の評価基準を当てはめてみる。但し、係り受けの検出はパーザーを用いてデータを取り出す。
- それを自動化する仕組みを考える
- 大きなサイズのabstract集合に対して、自動化した仕組みで妥当性を検討する。