[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
[[マイニング>ノート/マイニング]]~
訪問者数 &counter(); 最終更新 &lastmod();
**Rによるバイオインフォマティクスデータ解析 [#r56901d2]
***第8章 データマイニング [#fdf93464]
-データマイニングとは~
データの前処理 ⇒ 特徴抽出 ⇒ 教師なし学習 ⇒ 教師あり学習~
~
多変量解析をする~
前処理: 多変量解析をするに当たって、変量ごとに変動範囲を同等にして、特定の変量のみが結果に影響を及ぼすのを防ぐ~
特徴抽出: データ解析に必要ない変量を除去する。欠損地の除去を行う。またt検定ではずれ値を検出し処理することもある。~
教師なし学習: 多変量データの類似性に基づいてデータを分類する手法。主成分分析、階層クラスタリング、非階層クラスタリングなど。類似性を判定させるために与える変量を説明変数という。~
教師あり学習: 説明変数から目的変数を推定する関数を求める方法。k-最近傍(Nearest Neighbor)法、SVM(Support Vector Machine法)、PLS(Partial Least Square)など。なお、SOM(Self-Organizing Map, 自己組織化マップ)、Random Forest法は両方の学習が可能である。~
~
Cross Validation (交差検証法)~
学習の制度を評価する方法。与えられた元のデータセットをN等分し、そこから1組を抜き出してテストデータセットとし、残りのN-1組のデータセットを訓練用のデータセットとして学習を行い、1回目の学習精度を求め、これをN回繰り返した平均とする。
-モデル式
終了行:
[[マイニング>ノート/マイニング]]~
訪問者数 &counter(); 最終更新 &lastmod();
**Rによるバイオインフォマティクスデータ解析 [#r56901d2]
***第8章 データマイニング [#fdf93464]
-データマイニングとは~
データの前処理 ⇒ 特徴抽出 ⇒ 教師なし学習 ⇒ 教師あり学習~
~
多変量解析をする~
前処理: 多変量解析をするに当たって、変量ごとに変動範囲を同等にして、特定の変量のみが結果に影響を及ぼすのを防ぐ~
特徴抽出: データ解析に必要ない変量を除去する。欠損地の除去を行う。またt検定ではずれ値を検出し処理することもある。~
教師なし学習: 多変量データの類似性に基づいてデータを分類する手法。主成分分析、階層クラスタリング、非階層クラスタリングなど。類似性を判定させるために与える変量を説明変数という。~
教師あり学習: 説明変数から目的変数を推定する関数を求める方法。k-最近傍(Nearest Neighbor)法、SVM(Support Vector Machine法)、PLS(Partial Least Square)など。なお、SOM(Self-Organizing Map, 自己組織化マップ)、Random Forest法は両方の学習が可能である。~
~
Cross Validation (交差検証法)~
学習の制度を評価する方法。与えられた元のデータセットをN等分し、そこから1組を抜き出してテストデータセットとし、残りのN-1組のデータセットを訓練用のデータセットとして学習を行い、1回目の学習精度を求め、これをN回繰り返した平均とする。
-モデル式
ページ名: