ノート/テキストマイニング
2014-03-04 係り受け処理の問題で †
<学会ポインタ>
情報処理学会 HP
情報処理学会自然言語研究会 HP
このページ下方のリンクリストに各研究会の内容(抄録)あり
情報処理学会知能システム研究会 HP
情報処理学会音声言語情報処理研究会(ちょっと違うかも) HP
人工知能学会 HP
論文誌は ここから
JSTAGEに公開されている ここへ
研究会 HP
言語処理学会 HP <<-- これが一番私のイメージに近い
論文誌はJSTAGEに公開されている ここへ
<英文のDependency Parser関連>
<「係り受け」でいくつか検索してみた結果>
<上の 単語単位の係り受けの違和感で話題に上げていた係り受けベースの句vs単語議論について、単語単位を主張する京大グループの議論を拾ってみた>
<追加>
<おまけ>
- [[Stanford Head-Driven Phrase Structure Grammar://hpsg.stanford.edu/]]
- 日本語係り受け解析APIとマッシュアップ 本文に曰く
マッシュアップという観点からの活用を考えると、例えばこういうのはどうでしょう?
・検索結果のスニペットを係り受け解析し、検索された名詞に係る形容詞を抽出して、その形容詞から評判をはかる
・関連検索キーワード以外の語のつながりを視覚化したタグクラウド
などなど。
<応用は?>
- 製品の例(何に使うのかな?) 文 --AYA-- 意味解析が開く、自然言語の世界 ページ先頭に曰く
文-AYA- は、日本語意味解析ツールです。文章を入力すると、形態素解析、係り受け解析、意味解析を高速かつ高精度に行います。
大学での、15年間の研究成果を生かした本格的な意味解析ツールです。
Ayaでは、まず、文章を形態素・文節に区切り、文節を頂点、係り受けを辺とした意味グラフ構造にまとめ上げた後、 形態素の意味をEDR辞書約40万語意の中から、また、文節間の係り受けの役割的関係である深層格をEDRおよび独自定義の30種の中から決定します。
時制、アスペクト、モダリティも解析できるので、「食べる」、「食べた」、「食べたい」の語意以外の意味もきちんと区別し、 文を書いた人の態度やニュアンスなど、より細かい情報も得られます。
意味解析ツールは、以下への応用が考えられます。
・語義解決
・検索、あいまい検索、類似文・文書検索
・質問応答、自動要約
・文書分類
・データマイニング、blogからの情報抽出
- Tomarigi(校正・推敲支援ツール) ページトップに曰く
Tomarigiは、作成した文章表現を改善していく際の気づきを誘発することを目的としています。
作成した文章に対して解析し、誤り候補を抽出し、その詳細情報や修正候補などを表示します。
文章の解析には形態素解析ツール(Mecab)、係り受け解析ツール(Cabocha)を採用しています。これらのツールで複数の文からなる文書を1文ごとに切り分け、形態素情報・文節情報・係り受け情報を構造的に変換します。
この解析結果に対して、文章を執筆する際の定型的な校正ルールを適用し、誤り候補を指摘します。
<IBM Watson>