因子分析
- 因子分析とは測定された多数の変数の相関関係に基づいて、直接測定できない潜在因子(因子:(factor)を見いだす手法である。
- たとえば相関関係が高い3つの変数がある、ということは、「単一の潜在因子」によってこれら3つの変数の値が決定されていると考える事ができる。
- ただし「因子」そのものは直接に観察することはできない。そこで測定データ(の相関行列)に基づいて、その背後に隠れている「因子」を抽出していこうとするのが因子分析である。
- 因子分析についてはこの文書を参考にする事。
■変数・観測値・測定尺度
- 理論的には変数の数と同数の観測値の数がそろえば因子分析は可能であるが、実際には目安として変数の数の5〜10倍の観測値が必要である。観測値が多ければ多いほど結果が安定し、信頼性の高いものとなる。
- 変数の測定尺度は基本的には比例尺度が望ましいが、観測値の数が多ければ、順序尺度あるいは間隔尺度であってもかまわない。
■(潜在)因子の概念
- レジュメにも書いてあるとおり、変数間の相関関係は「データの偏差ベクトル」の間の角度で表す事ができる。「偏差ベクトル」がその変数の「特徴」や「個性」を表していると考えてもよい。
- 複数の変数の「特徴」や「個性」が近いほど−すなわち幾何学的に考えると「偏差ベクトル」の間の角度が狭いほど−それらの変数の相関関係が高い事になる。
- 因子分析では、「偏差ベクトル」の位置関係はそのままにしておいて、「適切な軸」をひく事を考える。これは、以前にやった多次元尺度構成法と基本的な考え方は同じ。
- 座標軸のひき方は無数に考えられるが、これにはいくつかの基準がある。また、一般に直交する座標軸をひく場合が多い。
- ひいた座標軸も、「偏差ベクトル」と同じように「何らかの点数」を表していると考える事ができる。
- この座標軸のことを「(潜在)因子」と呼ぶ。
- また、各変数の「偏差ベクトル」から座標軸へおろした垂線の足(偏差ベクトルの先から、各座標軸に垂線を描きこれらが交わった点)をその変数の、その因子に対する「負荷量」と呼ぶ。
- 負荷量というのは、その変数が、その因子の影響をどれくらい多く受けているかの指標となる。
■因子の数と命名
- 因子の数は理論的には変数の数だけ求めることができるが、実際にはscree
plotというグラフを書いて、相関行列の固有値という値が1以上の因子だけが意味を持っているという考え方が一般的である。
- また、因子の数によって、因子の累積寄与率(当該の因子全部によってデータの分散がどの程度説明できるかの値−理想的には100%だけれども大体50〜80%くらい−)が求まるが、これによっても、因子の数をいくつにするか判断することができる。
- 因子の抽出は数学的な繰り返し計算で行われるもので、その因子が何を意味しているかは、どんな変数がその因子に高い負荷を持っているかを分析者が見て、因子に適切な名前をつける必要がある。
■因子分析の実行手順
- 因子分析の手順:[分析]→[データの分解]→[因子分析]。この後分析対象となる変数を指定する。
- 因子抽出ボタン:初期解の抽出方法を指定する。またスクリープロットもここで指定する。
- 回転ボタン:抽出した因子の解釈を容易にするための回転方法の選択を行う。
■データ例
多変量解析のページに戻る
目次のページに戻る