[[ノート/テキストマイニング]] **2014-03-04 係り受け処理の問題で [#r0ae92dc] <学会ポインタ>~ 情報処理学会 [[HP:http://www.ipsj.or.jp]] 情報処理学会自然言語研究会 [[HP:http://www.nl-ipsj.or.jp/]]~ このページ下方のリンクリストに各研究会の内容(抄録)あり 情報処理学会知能システム研究会 [[HP:http://www.ai.sanken.osaka-u.ac.jp/sig-ics/main.htm]] 情報処理学会音声言語情報処理研究会(ちょっと違うかも) [[HP:http://sig-slp.jp/]] 人工知能学会 [[HP:http://www.ai-gakkai.or.jp/]]~ 論文誌は [[ここから:http://www.ai-gakkai.or.jp/transactions_of_jsai/]]~ JSTAGEに公開されている [[ここへ:https://www.jstage.jst.go.jp/browse/tjsai/-char/ja/]]~ 研究会 [[HP:http://sig.ai-gakkai.or.jp/]] 言語処理学会 [[HP:http://www.anlp.jp/]] <<-- これが一番私のイメージに近い~ 論文誌はJSTAGEに公開されている [[ここへ:https://www.jstage.jst.go.jp/browse/jnlp/-char/ja]] <英文のDependency Parser関連> -サーベイ(CL, 2011) [[Analyzing and Integrating Dependency Parsers:http://aclweb.org/anthology//J/J11/J11-1007.pdf]]~ -2007 (adapted from COLING2006 Tutorialと書いてある) [[Dependency Parsing:http://robot.cmpe.boun.edu.tr/robsem/dependency%20parsing.pdf]] <「係り受け」でいくつか検索してみた結果>~ -[[構文解析が何に役立つのか:http://blog.unnono.net/2010/02/blog-post.html]] -[[ 単語単位の係り受けの違和感:https://plus.google.com/107334123935896432800/posts/KHoDsDssycf]] -[[統計的係り受け解析入門:http://www.slideshare.net/unnonouno/ss-5724050]] -[[言語処理学会 NLP 2010 本会議初日: 係り受け解析の新展開:http://d.hatena.ne.jp/mamoruk/20100309/p1]] -[[日本語機能表現の自動検出と統計的係り受け解析の応用:https://www.jstage.jst.go.jp/article/jnlp1994/14/5/14_5_167/_pdf]] -[[長岡科技大:http://www.jnlp.org/research/topics]] -[[東大計数・言語情報学研究室:http://www.keisu.t.u-tokyo.ac.jp/lab/lab_mist/details/gengo_2.html]] -[[係り受け周辺確率に基づく文節間距離:http://2boy.org/~yuta/publications/nlp2010.pdf]] -[[確率モデルによる言語解析の優先付け:http://nlp.iit.tsukuba.ac.jp/topics/study/learning/kakariuke-learning.html]] -[[単語間の係受け情報を用いた文献検索手法:http://ci.nii.ac.jp/els/110002890577.pdf?id=ART0003214344&type=pdf&lang=jp&host=cinii&order_no=&ppv_type=0&lang_sw=&no=1394428505&cp=]] と [[単語間の係受け関係を用いた情報検索手法の評価:http://ci.nii.ac.jp/els/110002725333.pdf?id=ART0003013544&type=pdf&lang=jp&host=cinii&order_no=&ppv_type=0&lang_sw=&no=1394428309&cp=]] -[[種々の言語知識を組み入れた統計的構文解析:http://tdl.libra.titech.ac.jp/hkshi/recordID/dissertation.bib/TT00006911?caller=xc-search]] -[[種々の言語知識を組み入れた統計的構文解析:http://tdl.libra.titech.ac.jp/hkshi/recordID/dissertation.bib/TT00006911?caller=xc-search]] 格情報とか -[[Yahoo Developer Network の係り受けAPI:http://developer.yahoo.co.jp/webapi/jlp/da/v1/parse.html]] <上の[[ 単語単位の係り受けの違和感:https://plus.google.com/107334123935896432800/posts/KHoDsDssycf]]で話題に上げていた係り受けベースの句vs単語議論について、単語単位を主張する京大グループの議論を拾ってみた> -[[単語単位の日本語係り受け分析:http://www.anlp.jp/proceedings/annual_meeting/2012/pdf_dir/C4-4.pdf]] (言語処理学会 2012/3) -[[単語単位の日本語係り受け分析:http://plata.ar.media.kyoto-u.ac.jp/tool/EDA/slides/flannery2012nlp.pdf]] (上記?スライド) -[[係り受け解析:http://plata.ar.media.kyoto-u.ac.jp/mori/research/topics/WDA/]] -[[係り受け解析に文節の概念は必要か否か?.@zzzelch さんと @taku910 さんの長〜い議論もようやく収束してきたのでまとめます.:http://togetter.com/li/164400]] <追加> -[[Dependency Parser 関連の文献など:http://dyama1813.tumblr.com/post/44608439429/dependency-parser]] -[[係り受け解析器を設計する:http://yu-hatva.hatenablog.com/entry/2012/10/10/145037]] <おまけ> -[[日本語話し言葉コーパス:http://www.ninjal.ac.jp/corpus_center/csj/]] で [[文節の仕様:http://www.ninjal.ac.jp/corpus_center/csj/manu-f/bunsetsu.pdf]] -[[茶筅・南瓜・茶器演習資料:http://chasen.naist.jp/chaki/t/2007-09-04/doc/enshu-slide.pdf]] -[[例文を使って文の解析をしよう:http://www.jaist.ac.jp/~kshirai/papers/shirai00d.pdf]] (情報処理学会誌2000年7月号「ここまできた自然言語処理」) -[[係り受け解析を用いた未知語意味カテゴリー推定手法の有用性に関する諸検討:http://db-event.jpn.org/deim2012/proceedings/final-pdf/e8-2.pdf]] -[[日本語音声対話文の統計的係り受け解析とその評価:http://www.ipsj.or.jp/award/9faeag0000004ej9-att/S_Ohno_Tomohiro.pdf]] -[[節境界に基づく法律文の係り受け解析:http://slp.itc.nagoya-u.ac.jp/web/papers/2004/toukaisibu2004_banno.pdf]] -[[後方文脈を考慮した係り受けモデル:http://www.cs.nyu.edu/~sekine/papers/gengo00-uchimoto.pdf]] -[[自然言語処理の基礎:http://isw3.naist.jp/~isao-ni/publications/Natural-Language-Processing.pdf]] -[[自然言語処理:http://www.sist.ac.jp/~kanakubo/research/natural_language_processing.html]] -[[MST (Minimum Spanning Tree) Parser: http://www.seas.upenn.edu/~strctlrn/MSTParser/MSTParser.html]] -[[MST Parser (sorceforge) :http://sourceforge.net/projects/mstparser/]] -[[MaltParser:http://www.maltparser.org/]] -Eisner Parsing Model COLING96 paper [[Three New Probabilistic Models for Dependency Parsing: An Exploration:http://www.cs.jhu.edu/~jason/papers/eisner.coling96.pdf]] [[Eisner's HP:http://cs.jhu.edu/~jason/papers/]] -HPSG [[主辞駆動句構造文法(英: Head-driven phrase structure grammar, HPSG):http://ja.wikipedia.org/wiki/%E4%B8%BB%E8%BE%9E%E9%A7%86%E5%8B%95%E5%8F%A5%E6%A7%8B%E9%80%A0%E6%96%87%E6%B3%95]] -[[Stanford Head-Driven Phrase Structure Grammar://hpsg.stanford.edu/]] -[[自然言語処理における構文解析と言語理論の関係(国立情報学研究所 宮尾祐介):http://www.ism.ac.jp/~daichi/workshop/2012-parsing/parsing2012-miyao.pdf]] -[[日本語Wikipediaエントリの係り受けデータベース:https://alaginrc.nict.go.jp/wikidep/]] -[[驚異的な解析速度を誇る日本語係り受け解析器J.DepP:http://d.hatena.ne.jp/hjym_u/20120922/1348278329]] -[[日本語係り受け解析APIとマッシュアップ:http://techblog.yahoo.co.jp/web/jlp/api_4/]] 本文に曰く~ マッシュアップという観点からの活用を考えると、例えばこういうのはどうでしょう?~ ・検索結果のスニペットを係り受け解析し、検索された名詞に係る形容詞を抽出して、その形容詞から評判をはかる~ ・関連検索キーワード以外の語のつながりを視覚化したタグクラウド~ などなど。 -[[自然言語処理の再挑戦 〜統計的言語処理を超えて〜:http://www.cl.ecei.tohoku.ac.jp/~inui/papers/0610Fuzzy.pdf]] -[[文間関係認識のための局所構造アライメント:http://www.cl.ecei.tohoku.ac.jp/~inui/papers/0610Fuzzy.pdf]] -[[意味解析?:http://www-haradalb.it.aoyama.ac.jp/sage.html]] -[[格解析の意義:http://hayashibe.jp/publications/pasa_tutorial_kddi.pdf]] -[[決定木を用いた日本語係り受け解析(1997):http://www.kinet-tv.ne.jp/~sat/data/publications/1997/s24.html]] <応用は?>~ -[[日本語係り受け解析器 CaboCha Ruby 拡張の基本的な使い方とちょっとした応用:http://ultraist.hatenablog.com/entry/20111015/1318662808]] (ボットで)対話応用らしい -[[ロボットは東大に入れるか?(社会科) 含意関係認識・質問応答:http://21robot.org/research_activities/social_studies/]] -[[構文片の改善と評判分析・自動要約への適用:http://www.slideshare.net/jnlp/ss-11877976]] -[[係り受け木を用いた日本語文書の重要部分抽出:http://www.hirasa.mgmt.waseda.ac.jp/lab/list/03/2003_13.pdf]] 2003? -[[ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」:http://chalow.net/2008-08-21-1.html]] 2008? -[[テキストデータマイニングのための統合環境:http://tetdm.jp/pukiwiki/index.php]] -[[文節重要度と係り受け整合度に基づく文要約アルゴリズム:http://www.anlp.jp/proceedings/annual_meeting/2000/pdf_dir/P2-9.pdf]] 〜 結果の評価が難しいだろうな。 -[[言語解析論:http://cl.it.okayama-u.ac.jp/kougi/data/gengo/gengod1s.pdf]] の「応用システムへ向けて」 -[[意味解析が開く自然語処理の世界:http://www-haradalb.it.aoyama.ac.jp/doc/nikkei.pdf]] -製品の例(何に使うのかな?) [[文 --AYA-- 意味解析が開く、自然言語の世界:http://www.jsa.co.jp/contents/GG/group/Aya/aya.htm]] ページ先頭に曰く~ 文-AYA- は、日本語意味解析ツールです。文章を入力すると、形態素解析、係り受け解析、意味解析を高速かつ高精度に行います。 ~ 大学での、15年間の研究成果を生かした本格的な意味解析ツールです。~ Ayaでは、まず、文章を形態素・文節に区切り、文節を頂点、係り受けを辺とした意味グラフ構造にまとめ上げた後、 形態素の意味をEDR辞書約40万語意の中から、また、文節間の係り受けの役割的関係である深層格をEDRおよび独自定義の30種の中から決定します。~ 時制、アスペクト、モダリティも解析できるので、「食べる」、「食べた」、「食べたい」の語意以外の意味もきちんと区別し、 文を書いた人の態度やニュアンスなど、より細かい情報も得られます。 ~ 意味解析ツールは、以下への応用が考えられます。~ ・語義解決~ ・検索、あいまい検索、類似文・文書検索~ ・質問応答、自動要約~ ・文書分類~ ・データマイニング、blogからの情報抽出 -[[Tomarigi(校正・推敲支援ツール):http://www.pawel.jp/outline_of_tools/tomarigi/]] ページトップに曰く~ Tomarigiは、作成した文章表現を改善していく際の気づきを誘発することを目的としています。~ 作成した文章に対して解析し、誤り候補を抽出し、その詳細情報や修正候補などを表示します。~ 文章の解析には形態素解析ツール(Mecab)、係り受け解析ツール(Cabocha)を採用しています。これらのツールで複数の文からなる文書を1文ごとに切り分け、形態素情報・文節情報・係り受け情報を構造的に変換します。~ この解析結果に対して、文章を執筆する際の定型的な校正ルールを適用し、誤り候補を指摘します。 -[[基本文型理解のための ICT を活用した日本語学習システムの開発:http://www.japanese-edu.org.hk/sympo/upload/manuscript/20121015054022.pdf]] 日本語学習者の学習ツールとして使う? <IBM Watson> -[[IBM 奇跡の“ワトソン”プロジェクト:http://itpro.nikkeibp.co.jp/article/COLUMN/20111116/374575/]] -[[森山和道の「ヒトと機械の境界面」クイズ王を破ったIBMの質問応答システム「Watson」とは 〜 人間より速くクイズを解く知的処理の仕組みと今後の可能性:http://pc.watch.impress.co.jp/docs/column/kyokai/20110323_434297.html]] -[[質疑応答システムWatsonが示す未来:http://www-06.ibm.com/ibm/jp/provision/no70/pdf/70_SpecialCont2.pdf]]