山内のサイト

コレスポンデンス分析

Izenman: Modern Multivariate Statistical Techniques --- Regression, Classification, and Manifold Learningの17.2節(642ページ辺)

Hair Color
Eye ColorFairRedMediumDarkBlackTotals
Blue326382411103718
Light68811658418841,580
Medium34384909412261,774
Dark9848403681851,315
Totals1,4552862,1371,3911185,387

手でいじってみる

縦に見て、最大のものをマークする。

Hair Color
Eye ColorFairRedMediumDarkBlack
Blue326382411103
Light6881165841884
Medium3438490941226
Dark984840368185

行を入れ替えて寄せる。

Hair Color
Eye ColorFairRedMediumDarkBlack
Light6881165841884
Medium3438490941226
Dark984840368185
Blue326382411103

解析処理をする

$P$ = (上記の表)/(全合計=5387) 〜〜 全体に対する割合

FairRedMediumDarkBlack
Blue0.06050.00710.04470.02040.0006
Light0.12770.02150.10840.03490.0007
Medium0.06370.01560.16870.07650.0048
Dark0.01820.00890.07480.12640.0158

これを

$B_1$$B_2$$B_j$$B_s$r (tot)
$A_1$$p_{11}$$p_{12}$$p_{1j}$$p_{1s}$$p_{1+}$
$A_2$$p_{21}$$p_{22}$$p_{2j}$$p_{2s}$$p_{2+}$
$A_i$$p_{i1}$$p_{i2}$$p_{ij}$$p_{is}$$p_{i+}$
$A_r$$p_{r1}$$p_{r2}$$p_{rj}$$p_{rs}$$p_{r+}$
c (tot)$p_{+1}$$p_{+2}$$p_{+j}$$p_{+s}$$1$

$P_r$ = 行ごとに取った割合。 $a_i^T = (\frac{n_{i1}}{n_{i+}}, \cdots , \frac{n_{is}}{n_{i+}})$ を並べた $(a_1^T, \cdots , a_r^T)^T$ =

$$\frac{n_{11}}{n_{1+}}$$$$\frac{n_{12}}{n_{1+}}$$$\cdots$$$\frac{n_{1s}}{n_{1+}}$$
$$\frac{n_{21}}{n_{2+}}$$$$\frac{n_{22}}{n_{2+}}$$$\cdots$$$\frac{n_{2s}}{n_{2+}}$$
$\cdots$$\cdots$$\cdots$$\cdots$
$$\frac{n_{r1}}{n_{r+}}$$$$\frac{n_{r2}}{n_{r+}}$$$\cdots$$$\frac{n_{rs}}{n_{r+}}$$

数値は、$P_r=$

0.45400.05290.33570.15320.0042
0.43540.07340.36960.11900.0025
0.19330.04740.51240.23220.0147
0.07450.03650.30650.51790.0646

同様に、$b_j^T = (\frac{n_{1j}}{n_{+j}}, \cdots , \frac{n_{rj}}{n_{+j}})$ を並べた $(b_1^T, \cdots , b_s^T)^T$ = $(P_c)^T=$

$$\frac{n_{11}}{n_{+1}}$$$$\frac{n_{12}}{n_{+2}}$$$\cdots$$$\frac{n_{1s}}{n_{+r}}$$
$$\frac{n_{21}}{n_{+1}}$$$$\frac{n_{22}}{n_{+2}}$$$\cdots$$$\frac{n_{2s}}{n_{+r}}$$
$\cdots$$\cdots$$\cdots$$\cdots$
$$\frac{n_{r1}}{n_{+1}}$$$$\frac{n_{r2}}{n_{+2}}$$$\cdots$$$\frac{n_{rs}}{n_{+r}}$$

数値は、$P_c=$

0.22410.47290.23570.0674
0.13290.40560.29370.1678
0.11280.27330.42540.1886
0.07910.13520.29620.4896
0.02540.03390.22030.7203

カイ2乗距離

$P_r$の各行間の距離、$P_c$の各列間の距離を、カイ2乗距離で計算する。

$a_i = (\frac{n_{i1}}{n_{i+}}, \cdots , \frac{n_{is}}{n_{i+}})^T$ と $a_i^{\prime}$ の $\chi^2$距離は、

\begin{eqnarray*} d^2(a_i , a_{i^\prime}) &=& (a_i - a_{i^\prime})^T D_c^{-1} (a_i - a_{i^\prime}) \\ &=& \sum_{j=1}^s \frac{n}{n_{+j}} (\frac{n_{ij}}{n_{i+}} - \frac{n_{i^\prime j}}{n_{i^\prime +}})^2 \end{eqnarray*}


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2018-08-26 (日) 18:07:22 (106d)