[[ノート/テキストマイニング]]~
訪問者数 &counter();      最終更新 &lastmod();~

> [[ノート/テキストマイニング]]~
> [[ノート/テキストマイニング/Stanfordパーザーを使ってみる1]]~
> [[ノート/テキストマイニング/Stanfordパーザーを使ってみる2]]

***Penn TreeBank [#rba78100]
-POS Tagging マニュアル: &ref(tagguide.pdf);

-Phase Structure Bracketing Guide: &ref(PRSGUID1.PDF);

-Penn TreeBank マニュアル: &ref(root.pdf);

-Penn TreeBank 論文: &ref(arpa94.pdf);


***Stanford Typed Dependencies [#r3d3363a]
論文: [[Generating Typed Dependency Parses from Phrase Structure Parses:http://nlp.stanford.edu/pubs/LREC06_dependencies.pdf]]

マニュアル: [[Stanford Typed Dependencies Manual:http://nlp.stanford.edu/software/dependencies_manual.pdf]] より抜粋

現在の表現は、55の文法的な「関係」を含んでいる。すべての「関係」は2項関係で、ガバナー(governer、支配者)とデペンデント(dependent、依存者)からなる。

下記の定義記述では、Penn Treebank part-of-speech tagとphrasal labelsを使っている。

Definitions
-abbrev: abbreviation modifier: NPに対する括弧付きのアブリビエーション。たとえば~
  "The Australian Broadcasting Corporation (ABC)"  abbrev(Corporation, ABC)

-acomp: adjectival complement: VPに対する形容的フレーズで、補語(complement)(動詞に対する目的のように)として機能する。節に対するacompはVPのacompであり、その節に対してpredicateとなる。たとえば~
  "She looks very beautiful"   acomp(looks, beautiful)

-advcl: adverbial clause modifier: VPに対して動詞を修飾する(時間を表す節、結果、条件を表す節など)。 たとえば~
  "The accident happened as the night was falling"   advcl(happened, falling)~
  "If you know who did it, you should tell the teacher"   advcl(tell, know)

-advmod: adverbial modifier: ある語に対するadvmodは、(節でない)RBかADVPで、その語の意味を修飾する。 たとえば~
  "Genetically modied food"   advmod(modied, genetically)~
  "less often"   advmod(often, less)

-agent: agent: 受動態の動詞の補語で、前置詞byによって導かれるもので、動作をするもの。 たとえば~
  "The man has been killed by the police"   agent(killed, police)~
  "Effects caused by the protein are important"   agent(caused, protein)

-amod: adjectival modifier: NPに対する形容的な句で、NPの意味を修飾する。たとえば~
  "Sam eats red meat"   amod(meat, red)

-appos: appositional modifier: NPに対するapposは、そのNPにすぐ続いているNPであって、最初のNPを定義したり修飾したりする。括弧付きの例の場合もある。たとえば~
  "Sam, my brother"   appos(Sam, brother)~
  "\Bill (John's cousin)"   appos(Bill, cousin)

-attr: attribute: be動詞やseem、appear、becomeなどのようにイコールの関係で結ぶ動詞(これを継詞、連結詞などと呼ぶ)に対して、それの補語。 たとえば~
  "What is that?"   attr (is, What)

-aux: auxiliary: 節のauxとは、その節の主でない動詞(たとえばmodal auxiliary、composed tenseでの"be", "have"のような)。たとえば~
  "Reagan has died"   aux(died, has)~
  "He should leave"   aux(leave, should)

-auxpass: passive auxiliary: 節に対するauxpassは、その節の主でない動詞で受動的情報を持つもの。たとえば~
  "Kennedy has been killed"   auxpass(killed, been)~
                 aux(killed,has)~
  "Kennedy was/got killed"   auxpass(killed, was/got)

-cc: coordination: ccは接続詞でつながる要素と接続詞を示す。たとえば~
  "Bill is big and honest"   cc(big, and)~
  "They either ski or snowboard"   cc(ski, or)

-ccomp: clausal complement: VPまたはADJPに対するccompとは、その動詞や形容詞の目的語として働く、内側の主語を持つ節である。その節のVPやADJPが節に対するpredicateになっているようなVP/ADJPのccompである。 このようなccompは通常は有限である(但し、場合によって、英語の仮定法の名残である)。~
  "He says that you like to swim"   ccomp(says, like)~
  "I am certain that he did it"   ccomp(certain, did)

-complm: complementizer: ccompのcomplementizerとは、それを導入する言葉で、従属接続詞 "that" か "whether" である。~
  "He says that you like to swim"   complm(like, that)

-conj: conjunct: "and", "or"のような等位接続詞で接続される2つの要素の関係をあらわす。ここでは接続対象は非対称に扱う、つまり、この関係のheadは最初の要素であり、残りの要素はconj関係にイよって従属される。~
  "Bill is big and honest"   conj (big, honest)~
  "They either ski or snowboard"   conj (ski, snowboard)

-cop: copula: copulaは、継動詞(連結動詞、be, appear, becomeなど、イコールの関係で結ぶ動詞)の補語と、その継動詞との関係を示す。たとえば~
  "Bill is big"   cop(big, is)~
  "Bill is an honest man"   cop(man, is)

-csubj: clausal subject: csubjは節の構文的な主語を示す。つまり、主語自体が節である。この関係の支配者は、常に動詞であるとは限らない。もし動詞が継動詞であれば、節のルート(根)はその継動詞の補語である。以下の2つの例では、"what she said"が主語である。~
  "What she said makes sense"   csubj (makes, said)~
  "What she said is not true"   csubj (true, said)

-csubjpass: clausal passive subject: csubjpassは受動節の構文的主語を示す。下記の例では、"that she lied"が主語である。~
  "That she lied was suspected by everyone"   csubjpass(suspected, lied)

-det: determiner: determinerはNPのヘッドとそれのdeterminerとの関係を示す。たとえば~
  "The man is here"   det(man, the)~
  "Which book do you prefer?"   det(book, which)

-dobj: direct object: VPのdirect objectは、その動詞の対格の目的語を示す。節のdobjはその節のpredicateになるVPのdirect objectとする。たとえば~
  "She gave me a raise"   dobj (gave, raise)~
  "They win the lottery"   dobj (win, lottery)

-expl: expletive(余計な): これは存在の"there"を示す。 節の主たる動詞がガバナーになる。~
  "There is a ghost in the room"   expl(is, There)

-infmod:  infinitival modifier: NPに対するinfmodは、そのNPの意味を就職する不定詞(infinitive)を示す。たとえば~
  "Points to establish are . . . "   infmod(points, establish)~
  "I don't have anything to say"   infmod(anything, say)

-iobj: indirect object: VPに対するiobjは、その動詞の与格(dative)の目的語となる名詞節を示す。節に対するiobjは、その節のpredicateであるVPにとってのiobjとする。たとえば~
  "She gave me a raise"   iobj (gave, me)

-mark: marker: 副詞節補語(advcl)のmarkerとは、その補語を導入する語である。それは、thatもしくはwhether以外の従位接続詞(subordinating conjunction)、たとえばbecause, when, althoughなどである。たとえば~
  "Forces engaged in fighting after insurgents attacked"   mark(attacked, after)

-measure: measure-phrase modifier: measure-phrase modifierは、ADJP/ADVPのヘッドと、そのADJP/ADVPを修飾する数詞節のheadと関係を表す。たとえば~
  "The director is 65 years old"   measure(old, years~
  "6 feet long"   measure(long, feet)

-neg: negation modifier: negは、否定語と、それが修飾する語との関係を示す。たとえば~
  "Bill is not a scientist"   neg(scientist, not)
  "Bill doesn't drive"   neg(drive, n't)

-nn: noun compound modifier: NPに対するnnは、そのヘッドである名詞を修飾する名詞である。(現在のシステムでは、すべての名詞はMPの最右端の名詞を修飾する−つまり名詞の複合についての知的な分析は行っていない。これは、Penn TreebankがNPの分岐構造を表現するようになったら、修正されるはずである。)~
  "Oil price futures"   nn(futures, oil)~
                 nn(futures, price)

-nsubj: nominal subject: nsubjは節の構文的な主語である名詞節を示す。この関係のガバナーは常に動詞とは限らない。もし動詞が継動詞(copular verb)である場合、その節のルート(根)はその継動詞の補語になる。~
  "Clinton defeated Dole"   nsubj (defeated, Clinton)~
  "The baby is cute"   nsubj (cute, baby)

-nsubjpass: passive nominal subject: nsubjpassは受動節の構文的な主語である名詞節を示す。~
  "Dole was defeated by Clinton"   nsubjpass(defeated, Dole)

-num: number modifier: NPに対するnumは、そのNPを修飾する数のフレーズである。~
  "Sam eats 3 sheep"   num(sheep, 3)

-number: element of compound number: numberは数のフレーズの部分要素や、通貨の額を示す。たとえば~
  "I lost $ 3.2 billion"   number($, billion)

-parataxis: parataxis: 並列(parataxis)関係(parataxis=ギリシャ語で隣合せに置く意味)とは、節の主たる動詞と他の文要素(たとえば説明的挿入句、コロンやセミコロンの後に置かれる節など)との関係を示す。たとえば~
  "The guy, John said, left early in the morning"    parataxis(left, said)

-partmod: participial modifier(分詞修飾子): NP又はVPに対するpartmodは、動詞の分詞形でNP/VPの意味を修飾するものである。たとえば~
  "Truffls picked during the spring are tasty"   partmod(truffles, picked)~
  "Bill tried to shoot demonstrating his incompetence"   partmod(shoot, demonstrating)~

-pcomp: prepositional complement: 前置詞のpcompは、前置詞に続く節のヘッドを示す。たとえば~
  "We have no information on whether users are at risk"   pcomp(on, are)
  "They heard about you missing classes"   pcomp(about, missing)

-pobj: object of a preposition: pobjは前置詞に続く名詞節のヘッドを示す。(その前置詞は、(代りに?)名詞・動詞などを修飾しているかもしれない。) Penn Treebankと違って、このパーザーではincludingやconcerningなどのようなVBG擬似前置詞の場合を、pobjとする。(この前置詞をpaceやversusに対するFWと呼ぶことが出来る。またCCと呼ぶこともできるが、このパーザーでは現在はそれを扱わないし、結合した(conjoined)前置詞と区別する必要がある。)~
  "I sat on the chair" pobj   (on, chair)

-poss: posession modifier: possは、NPのヘッドと、その所有限定詞又は所有格の補語との関係を示す。たとえば~
  "their offices"     poss(offies, their)~
  "Bill's clothes"     poss(clothes, Bill)

-possesive: possesive modifier: possesiveは、NPのヘッドと、その所有格との関係を表す。たとえば~
  "Bill's clothes"   possessive(John, 's)  ← Billではないか?

-preconj: preconjunct: preconjは、NPのヘッドと、接続詞の部分でそれを強調する単語(たとえばeither, both, neither)との関係を示す。~
  "Both the boys and the girls are here"   preconj (boys, both)

-predet: predeterminer: predetは、NPのヘッドと、NPに先行して置かれてNPの限定詞の利用を明白にする単語との関係を示す。~
  "All the boys are here"   predet(boys, all)

-prep/prepc: prepositional modifier: 動詞・形容詞・または名詞のprep(c)は、その動詞・形容詞・名詞の意味を修飾する前置詞句を示す。もし前置詞句が節であれば、collapsingが起こっていればこの関係をprepcと呼ぶことにする。~
  "I saw a cat in a hat"   prep(cat, in)~
  "I saw a cat with a telescope"   prep(saw, with)~
  "He is responsible for meals"   prep(responsible, for)

-prt: phrasal verb particle: prtは、句となった動詞の場合に、その動詞と接尾部分との間の関係を示す。~
  "They shut down the station"   prt(shut, down)

-punct: punctuation: punctは、節の句読点のうち、もしその句読点がtyped dependencyの中で保持されているなら、それを表す。但しデフォルトでは、句読点では出力に保持されていない。~
  "Go home!"   punct(Go, !)

-purpcl: purpose clause modifier: VPに対するpurpclは、"(in order) to"が先頭にある節で目的を示す。現在はシステムは"in order to"を持つものだけを認識する。そうでないものは、システムはこのようなものと開放節補語(open clausal complements, xcomp) との間で、表層的表現の上で区別がつかない。また、"be VBN"で導入される"to"節を認識できる。~
  "He talked to him in order to secure the account"   purpcl(talked, secure)

-quantmod: quantifier phrase modifier: QP(Quantifier Phrase、数量を示す句)要素のヘッドに対する、修飾要素を示す。たとえば~
  "About 200 people came to the party"   quantmod(200, About)

-rcmod: relative clause modifier: NPに対するrcmodは、NPを修飾する関係節を示す。関係は、NPのヘッドとなっている名詞から、関係節のヘッド(通常は動詞)への、関係である。たとえば~
  "I saw the man you love"    rcmod(man, love)~
  "I saw the book which you bought"   rcmod(book,bought)

-ref: referent: NPのヘッドに対するreferentは、NPを修飾する関係節を導入する、関係詞を示す。たとえば、~
  "I saw the book which you bought"   ref (book, which)

-rel: relative: 関係節に対するrelは、その関係節を導入しているWH節の、ヘッドとなる語を示している。たとえば~
  "I saw the man who you love"    rel (love, who)~
  "I saw the man whose wife you love"   rel (love, wife)

-tmod: temporal modifier: VPもしくはADJPに対するtemporal modifierは、時間を特定することによってそのVPやADJPの意味を修飾する働きをする要素を示す。また節に対するtemporal modifierはその節の述語(predicate)となるVPへの時間的修飾要素を示す。たとえば~
  "Last night, I swam in the pool"   tmod(swam, night)

-xcomp: open clusal complement: VPまたはADJPに対するxcomp(open clausal complement)とは、主語がない節的な補語(clausal complement)であり、その参照先は外部主語(? external subject)によって決められるようなものを指す。これらの補語は常に不定(non-finite)である。xcompという名前はLexical-Functional Grammer (LFG)から借用した。たとえば、~
  "He says that you like to swim"   xcomp(like, swim)~
  "I am ready to leave"   xcomp(ready, leave)

-xsubj: controlling subject: 制御する主語(controlling subject)とは、主語がない節的な補語(open clausal complement, xcomp)と、その節の外部主語(? external subject)の間の関係を示す。たとえば~
  "Tom likes to eat fish"   xsubj (eat, Tom)


Typed Dependencyの階層について

上にリストした文法的依存関係は、階層的である。もっともジェネリックなdependent(dep)は、階層内のより細かい関係が存在しないか、システムによって
取り出すことができなかったとき、使われる。

 dep - dependent
      aux - auxiliary
            auxpass - passive auxiliary
            cop - copula
      arg - argument
            agent - agent
            comp - complement
                 acomp - adjectival complement
                 attr - attributive
                 ccomp - clausal complement with internal subject
                 xcomp - clausal complement with external subject
                 compl - complementizer
                 obj - object
                      dobj - direct object
                      iobj - indirect object
                      pobj - object of preposition
                 mark - marker (word introducing an advcl)
                 rel - relative (word introducing a rcmod)
            subj - subject
                 nsubj - nominal subject
                      nsubjpass - passive nominal subject
                 csubj - clausal subject
                      csubjpass - passive clausal subject
      cc - coordination
      conj - conjunct
      expl - expletive (expletive "there")
      mod - modifier
            abbrev - abbreviation modifier
            amod - adjectival modifier
            appos - appositional modifier
            advcl - adverbial clause modifier
            purpcl - purpose clause modifier
            det - determiner
            predet - predeterminer
            preconj - preconjunct
            infmod - innitival modifier
            partmod - participial modifier
            advmod - adverbial modifier
                 neg - negation modifier
            rcmod - relative clause modifier
            quantmod - quantier modifier
            tmod - temporal modifier
            measure - measure-phrase modifier
            nn - noun compound modifier
            num - numeric modifier
            number - element of compound number
            prep - prepositional modifier
            poss - possession modifier
            possessive - possessive modifier ('s)
            prt - phrasal verb particle
      parataxis - parataxis
      punct - punctuation
      ref - referent
      sdep - semantic dependent
            xsubj - controlling subject

依存性(dependency)の異なる表記方法

typed dependencyには4つの異なる記法がある。これらは同じ形式、つまり 関係名(ガバナー, デペンデント)、但しガバナーとデペンデントは文中での語の番号を付してあるが、に従っている。表記法の違いは、表層的な表記に近いところ(各トークンがトリー上のデペンデントとして見える)から、より意味的に解釈されたところ(ある種の語の関係(たとえば前置詞のような)が依存性として表現されたり、依存性が循環グラフになり得たりする)まで異なる、といったものである。

1)基本(Basic)表現

基本表現は、上記のリストにある依存関係を用いたもので、木を構成する。文のそれぞれの語は(文のヘッドを除いて)他の1つの語に依存する。たとえば、文~
  "Bell, a company which is based in LA, makes and distributes computer
products"~
に対して、基本表現のdependencyは
 nsubj(makes-11, Bell-1)
 det(company-4, a-3)
 appos(Bell-1, company-4)
 rel(based-7, which-5)
 auxpass(based-7, is-6)
 rcmod(company-4, based-7)
 prep(based-7, in-8)
 pobj(in-8, LA-9)
 cc(makes-11, and-12)
 conj(makes-11, distributes-13)
 nn(products-15, computer-14)
 dobj(makes-11, products-15)
である。

2)Collapsed Dependency 折りたたんだ表現

折りたたんだ表現では、依存性が追加される。それらは、木の構造を壊し、単なる有向グラフになってしまうかもしれない(がそれは構わないとする)。上記の例では、次の依存関係が追加される。
 ref(company-4, which-5)
 nsubjpass(based-7, which-5)
これらは、元の基本Basic関係には存在しなかったものである。なぜなら、rcmodとrel関係がサイクルを生じるからである。木の構造を壊す(無視する)依存関係は、この例に見られるような関係節とその先行詞の関係を取り込んだ場合や、コントロール関係(xsubj)を取り込んだ場合である。

更に、前置詞を含む依存関係では、接続詞や、関係節の参照対象の情報は、語の間の直接の依存関係を記述するために、折りたたまれる。この折りたたみは、関係を抽出する利用法に対しては便利なことがある。たとえば、上記の例で前置詞"in"を含む依存性は、以下のような1つの関係に折りたたまれる:
 prep(based-7, in-8)
 pobj(in-8, LA-9)
が
 prep in(based-7, LA-9)
となる。

同じことが、接続詞を含む依存関係についても起こる。
 cc(makes-11, and-12)
 conj(makes-11, distributes-13)
が
 conj and(makes-11, distributes-13)
になる。

関係節の先行詞に関する情報(ref(company-4, which-5))は、以下の依存性を展開するのに役立つ:
 nsubjpass(based-7, which-5)
が
 nsubjpass(based-7, company-4)
となる。

最終的には、この文に対するシステムが導出する折りたたまれた依存性は、次のような形になる:
 nsubj(makes-11, Bell-1)
 det(company-4, a-3)
 appos(Bell-1, company-4)
 nsubjpass(based-7, company-4)
 rel(based-7, which-5)
 auxpass(based-7, is-6)
 rcmod(company-4, based-7)
 prep_in(based-7, LA-9)
 conj_and(makes-11, distributes-13)
 nn(products-15, computer-14)
 dobj(makes-11, products-15)

なお、ある場合には、依存関係の折りたたみ操作によって文の意味が多少異なってくることがある。これはたとえば、"Bill went over the river and through the woods"のようなPP接続の場合で、2つの前置詞"over"と"through"が接続され、動詞"went"によってガバーンされている。関係(前置詞と接続詞)を折りたたむときに2つの別々の部分グラフを作るのを避けるために、このような例では単語"went"のコピーを追加して、同等なVPの形に変形される(システムの出力ではアポストロフィによってマークされる)。これによって次のような表現が得られる
 prep over(went-2, river-5)
 prep through(went-2', woods-10)
 conj and(went-2, went-2')
が、これは"Bill went over the river and went through the woods"という("went"をコピーした)文に対応している。

3)Collapsed dependencies with propagation of conjunct dependencies (折りたたんだ表現で接続依存性を伝播させたもの)

接続詞があると、その接続詞を含む依存性を伝播させることができる。ここの文の例では、この伝播は元の折りたたんだ依存性に2つの依存関係を追加する。それは、動詞"makes"と"distributes"の間の接続関係により、最初の語"makes"にある主語・目的語関係が、2番目の語"distributes"に伝播するからである。
 nsubj(distributes-13, Bell-1)
 dobj(distributes-13, products-15)
これは、元の折りたたまれた依存関係からの拡張に当たり、トリー構造に納まる保証はない。

4)Collapsed dependencies preserving a tree structure (トリー構造を守った、折りたたんだ依存関係)

この表現法では、トリー構造を守らない依存関係は、捨てられる。今まで説明したとおり、これは関係節とその先行詞の間の関係、またはcontrolling subject relation (xsubj)の間の関係にかかわっている場合である。また、これは接続詞関係の伝播は許さない。上記の例で、この表現法を使うと、
 nsubj(makes-11, Bell-1)
 det(company-4, a-3)
 appos(Bell-1, company-4)
 rel(based-7, which-5)
 auxpass(based-7, is-6)
 rcmod(company-4, based-7)
 prep_in(based-7, LA-9)
 conj_and(makes-11, distributes-13)
 nn(products-15, computer-14)
 dobj(makes-11, products-15)
となる。

この4種の表現法の比較を表にすると下記のようになる。
 basic                    collapsed                    propagation                 collapsed tree
 nsubj(makes, Bell)       nsubj(makes, Bell)           nsubj(makes, Bell)          nsubj(makes, Bell)
                                                       nsubj(distributes, Bell)
 det(company, a)          det(company, a)              det(company, a)             det(company, a)
 appos(Bell, company)     appos(Bell, company)         appos(Bell, company)        appos(Bell, company)
 rel(based, which)        rel(based, which)            rel(based, which)           rel(based, which)
 auxpass(based, is)       auxpass(based-7, is)         auxpass(based, is)          auxpass(based, is-)
 rcmod(company, based)    rcmod(company, based)        rcmod(company, based)       rcmod(company, based)
                          nsubjpass(based, company)    nsubjpass(based, company)   
 prep(based, in)
                          prep_in(based, LA)           prep_in(based, LA)          prep_in(based, LA)
 pobj(in, LA)
 cc(makes, and)
                          conj_and(makes, distributes) conj_and(makes, distributes) conj_and(makes, distributes)
 conj(makes, distributes)
 nn(products, computer)    nn(products, computer)      nn(products, computer)      nn(products, computer)
 dobj(makes, products)     dobj(makes, products)        dobj(makes, products)       dobj(makes, products)
 dobj(makes, products)     dobj(makes, products)       dobj(makes, products)       dobj(makes, products)
                                                       dobj(distributes, products)


実際に使う上では

実際に使う上では、2つのクラスを使うことができる。

edu.stanford.nlp.parser.lexparser.LexicalizedParser

テキストを構文解析し、構文木の異なるフォーマットオプションを得たいときは、このクラスを使う。依存関係を得たいときには、-outputFormatオプションにtypedDependenciesを加えればよい。デフォルトでは、これは接続依存の伝播を伴う折りたたまれた依存関係を出力する。もし他の表現が欲しければ、-outputFormatOptionに、次のコマンドを使って指定すればよい。
 basicDependencies        basic dependencies
 collapsedDependencies    collapsed dependencies (not necessarily a tree structure)
 CCPropagatedDependencies collapsed dependencies with propagation of conjunct
dependencies (not necessarily a tree structure)
                          [他のオプションが指定されてないとき、これがデフォルトとなる]
 treeDependencies         collapsed dependencies that preserve a tree structure

また、時間的依存性を識別したいとき、-retainTmpSubcategories オプションを指定すると最大の性能が得られる。以下のコマンド例では、file.txtには1行ごとに1つの文が入っているとする。また、pennオプションは、文の文脈自由文法による表現を出力する。
 java -mx100m edu.stanford.nlp.parser.lexparser.LexicalizedParser
 -retainTmpSubcategories -outputFormat "penn,typedDependencies"
 -outputFormatOptions "collapsedDependencies" englishPCFG.ser.gz file.txt

edu.stanford.nlp.trees.EnglishGrammaticalStructure

もし既にPenn TreeBankスタイルのトリーができている場合(手でアノテーションを作った場合か、他の構文解析プログラムの出力である場合)、このクラスを使ってStanford dependencyを生成することができる。下記の例のように、-treeFileオプションを使えばよい。
 java -mx100m edu.stanford.nlp.trees.EnglishGrammaticalStructure
 -treeFile file.tree -collapsedTree -CCprocessed
他のdependency typeの出力表現を得たい場合には、次のように指定する。
 -basic         basic dependencies
 -collapsed     collapsed dependencies (not necessarily a tree structure)
 -CCprocessed   collapsed dependencies with propagation of conjunct
                dependencies (not necessarily a tree structure)
 -collapsedTree collapsed dependencies that preserve a tree structure

このクラスを使って、テキストを構文解析することができるが、構文木出力選択のオプションを指定することができない。dependency typeの表現の変更しかできない。~
ファイルが1行に1文を書いたものの場合、オプション-treeFileの代わりに-sentFileを使う。オプション-parserFileを使ってパーザーファイルを指定する必要がある。構文木は-parseTreeオプションによって出力することができる。たとえば
 java -mx100m edu.stanford.nlp.trees.EnglishGrammaticalStructure
 -sentFile file.txt -collapsedTree -CCprocessed -parseTree -parserFile
 englishPCFG.ser.gz

grammerbrowser

Bernard Bouは、Stanford Dependencies representationに対するGUIインターフェースを書いた。これは、依存関係を表示するだけでなく、その定義を書き換えることができる。これは、別にダウンロードする。ダウンロード先は、http://grammarbrowser.sourceforge.net/

Stanford Dependenciesに関する他の参考文献
(略)


トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS