[[ノート/テキストマイニング/共起分析]]
[[ノート/テキストマイニング/共起分析]]~
[[ノート/R]]~
訪問者数 &counter();      最終更新 &lastmod();


*共起分析HowTo参考ページ 2014-09-01 [#m593ec60]

-[[KH Coderによる共起ネットワーク作成:http://antibayesian.hateblo.jp/entry/20110220/1298212806]]

-(Rによる) [[統計的テキスト解析(6)〜語のネットワーク分析〜:http://mjin.doshisha.ac.jp/R/61/61.html]]

-[[統計ソフトRのブログ 共起性尺度:http://rbloger.blog51.fc2.com/blog-entry-26.html]]

-[[Collocation Extractor 文書中に頻出する共起表現(collocation)をできるだけ長い形で抽出する:http://www.vector.co.jp/soft/winnt/util/se437559.html]]

-[[データクレンジング重要!〜VGエンジニアブログで共起語ネットワークグラフを作る〜:http://tech.voyagegroup.com/archives/6962622.html]]  KHcoderで共起ネットワーク図を作成 


-[[頻度,共起,ネットワークグラフ@テキストマイニング:http://eu-mour.cocolog-nifty.com/euphoria_mourningblog/2010/08/post-9b36.html]] ~
ソフトウェアは,いろいろと試したのだが,英文ではやはりMLTPを使うこととした。これを用いて,ワードリスト(単語の頻度ランキング),コヒージョン(結束性,共起)を求める。コヒージョンは,事前にBrill Tagger等を用いて品詞タグを埋め込んでおく。これで分析に用いる品詞を特定できる。まずは名詞,形容詞系列を用いてコヒージョンを求める。~
次に,このコヒージョン上位に入っている語を,ネットワークグラフ化する。グラフ化にはRを使う。パッケージはiGraph。

-[[テキストマイニング再び。:http://eu-mour.cocolog-nifty.com/euphoria_mourningblog/cat22190583/]] ~
Pythonを使うこととした。~
少し調べたところ,PythonはNLTKというライブラリを追加することでかなり高度なテキスト処理が可能になるようだ

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS