CRETから、最新の教育・テストに関する書籍情報をお届けします。
非計量多変量解析法 ―主成分分析から多重対応分析へ―
![]() |
非計量多変量解析法 ―主成分分析から多重対応分析へ― 足立 浩平・村上 隆(著)朝倉書店(2011年8月) 本体価格:3,360円
|
書は日本行動計量学会設立35周年を記念して出版されている「シリーズ<行動計量の科学>」の第9巻にあたり、多変量解析法の中でも「主成分分析」(Principal Component Analysis; PCA)、「非計量主成分分析」(Nonmetric Component Analysis; NCA)、そして「多重対応分析」(Multiple Correspondence Analysis; MCA)という3つのデータ解析法について、その定式化や手法間の相互関係、実用上の問題点などを論じている。タイトルに「多変量解析」を冠する本は数あれど、「非計量」と付いているのは本書が初めてではないだろうか。
本書は9つの章で構成されているが、前半部(1章~6章)と後半部(7章~9章)の2つのパートに分けられる。前半部ではPCA・NCA・MCAの相互比較・理論の整理が主な話題である。PCA・NCA・MCAはそれぞれ、「等質性基準」「成分負荷基準」「分割表基準」という3つの最小二乗基準の最小化問題として定式化可能で、3手法×3基準のマトリックスとして整理できるという。さらに3手法の間には各基準のもとで一定の階層関係が存在し、MCA・NCAはPCAを非計量へと拡張したモデルであることが確認される(「非計量」の意味については本文中の解説を参照のこと)。この3手法間の階層関係が本書のタイトル・サブタイトルの由来である。
後半部ではMCAにおける回転問題、2値データのPCA・MCA、馬蹄現象、難しさの因子(difficulty factor)などの実用上の問題が取り上げられている。回転問題は因子分析固有の問題であるという認識が一般的で、MCAの文脈で回転が語られることはほとんどない。しかし本書ではMCAの解の回転が数学的に可能であることを指摘するだけでなく、回転が余剰次元の分離に有効である可能性を示唆している。また、2値データのPCAとMCAの解が本質的に同等であるのに、2値データへのPCAの適用を誤用とみなす風潮が論理的でないとも述べている。こういった批判や前半部で論じられた理論の整理からは、データ解析の理論的側面・数学的側面を尊重しようとする著者らの姿勢が見て取れる。
これらのテーマに対して本書は微積分や射影行列を一切使わずに特異値分解だけで議論を進めている。このアプローチについて著者らは「まえがき」で「線形代数の諸概念の中でも、著者らは、キーワード [5] の特異値分解が最も大切なものと信じています。特異値分解さえ知っていれば、本書の議論のほとんどを理解でき、さらには、本書の範囲を超えた多変量データ解析法の理解においても、特異値分解は格別に重要なものであると考えています。」と述べている(p.ii)。第2章「特異値分解から始める線形代数」は、そのような著者らの信念が色濃く反映された特徴的な章であると言えよう。
ここまで述べてきたように本書は理論的側面・数学的側面を前面に出しているのに加えて、分析例・具体例が決して多くはなく、「入門書」とは言いがたい。入門的な内容を求める読者は足立(2006)を参考にするとよいだろう。また、本書では実際に分析するためのソフトウェアについてほとんど触れられていない。したがって各自の分析環境においてPCAやMCAを実行する関数のヘルプや解説書を参照したり、特異値分解のライブラリ・関数を利用してプログラムを自作しなければならないことに注意が必要だ。初学者やエンドユーザー向けというよりも、多変量解析の理論面を本格的に学びたい読者や多変量解析を専門とする大学院生向けの1冊であるといえるだろう。
【参考文献】
足立浩平 (2006)。 多変量データ解析法 ―心理・教育・社会系のための入門―。 朝倉書店。