[[ノート/マイニング]]

*(再)「学習によるデータ分析」の整理  2014-02-24 [#q6be7cd0]
*(再)「学習によるデータ分析」の整理([[朱鷺の杜:http://ibisforest.org/index.php?%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92]]から拝借)  2014-02-24 [#q6be7cd0]
前提: 
-データ分析をしたいが、分析のやり方・仕組・分析のパラメタなどはわかっていない
-分析のための「特徴量」もわかっていないことにする

**データの性質 〜〜 単純なベクトル vs 構造を持ったデータ [#m05083d1]

たとえばグラフ(頻出する部分グラフを見つけるなど)、バスケットデータ(意味あるデータ集合(バスケット)に分割されたデータを対象)、時系列データ、テキスト(マイニング)など

**教師あり学習 vs 教師なし学習 [#x700ffd5]

教師あり(supervised): 教師データセット(データと答のセット)を与えて学習させた機械を用いて、
実用データ(答えのない新しいデータ)の答を推測する

教師なし(non-supervised): 教師データセットは与えられず、データに内在する性質(分布とか)から特徴的なパターンを見つける

このほか、様々な枠組みが提案されている
-転移学習(帰納転移) 〜 [[新規タスクの効果的な仮説を効率的に見つけ出すために,一つ以上の別のタスクで学習された知識を得て,それを適用する問題(朱鷺の杜「転移学習」より):http://ibisforest.org/index.php?%E8%BB%A2%E7%A7%BB%E5%AD%A6%E7%BF%92]]
-[[メタ学習:http://ibisforest.org/index.php?%E3%83%A1%E3%82%BF%E5%AD%A6%E7%BF%92]]

**いろいろな学習の枠組み [#pd8ac835]
-識別(判別・クラス分類)
--線形分離可能
--判別分析
--決定木
--単純ベイズ
--部分空間法
--パーセプトロン
--SVM
--アンサンブル学習
など

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS