본문 바로가기

공부/통계

[통계] Path Modeling 경로 모형

왜 경로 모형을 사용하는가?

  • 경로 모형은 측정 변수들을 위한 구조적 모델이다. 관찰된 여러 변수들의 상관관계 구조에 대한 기저(메커니즘)를 가정과 관련해 설명한다.

 

 

경로 모형과 관련된 용어

  • Exogenous variable, 외생 변수 : 모델로 설명되지 않는 변수들. 하지만 모델 내의 다른 변수들을 설명한다. 다항 회귀식에서의 독립 변수(predictor, independent variable)와 상통하는 의미를 가진다.
  • Endogenous variable, 내생 변수 : 모델로 설명되는 변수들. 다항 회귀식에서의 종속 변수(outcome, dependent variable)와 상통하는 의미를 가진다.
  • Mediator variable, 매개 변수 : 같은 모델에서 exogenous와 endogenous의 특징을 갖는 변수. 회귀 모델로 설명할 수 없다.

 

 

Recursive 모델과 non-Recursive 모델의 차이점

 

Recursive 모델

  • 대개 수직적, 직관적이다. Recursive 모델
  • disturbance(오차)와는 상관이 없다.
  • 모든 인과 관계는 일방향이다.

non-Recursive 모델

  • feedback 고리를 포함하고 있다. feedback loop은 세 개 내지 네 개의 변수를 가질 수 있다. 이를 간접 피드백 고리(indirect feedback loop)라고 표현한다.
  • disturbance(오차)와 상관관계가 있다.
  • reciprocal (causal) effect; 상호 인과관계에 대한 가정이 요구된다. 

간접 효과 모형은 매개변수를 포함하고 있다.

 

(c)에서 Y1이 매개 변수이다. D는 disturbance term이다.

두 모형은 피드백 고리가 없으며 일방향이므로 recursive model이다. 또한 disturbance 간의 상관관계가 없다.

 

 

 

Path coefficient 계산하기

 

  • 경로 계수는 모델에 포함되어 있는 변수들의 상관 관계 구조를 설명하는 기준이다. 관찰된 상관 관계들은 경로 계수로 인해 정해진다.
  • 계산된 경로 계수들은 상관 관계 매트릭스에 기반한다. 이것을 Tracing rule 또는 Wright's rule이라 부른다. 이것은 모든 상관 관계들을 위해 경로 계수를 구할 수 있는 수식으로 만들 수 있게 한다.

 

 

Tracing rule

 

  • Loop이 있어서는 안된다. 접근 가능한 경로들은 오직 한 변수 당 한번이어야 한다.
  • 오직 하나의 동일한 경로 (상관관계), 하나만의 상관관계를 포함할 수 있다.
  • 일방향으로만 향할 수 있고 뒤(backward)로 돌아가면 안된다.

X1에서 X3으로 접근 가능한 경로는?

  • 직접적 경로인 X1 - X3과 비직접적 경로인 X1 - X2 - X3이다. 이것을 상관관계의 수식으로 나타내면 r13 = p31 + p21 * p32 이고, 만약 r23을 수식으로 나타내고 싶다면  r23 = p32 + p21 * p31 이 될 것이다.

 

4개의 변수가 있는 모델은 몇개의 상관관계를 갖게 되는가?

  • p = 변수의 갯수
  • p * (p-1) / 2 → 4 * 3 / 2 ; 6개

 

 

r14를 tracing rule에 따라 복구해본다면? 또, X4에 대한 X1의 효과를 분해해본다면?

Reproduce r14 based on the tracing rules

r14 = P41 + P43 * P31 + P42 * r21 + P43 * P32 * r21

 

 

Decompose the effect of X1 on X4

(총) 간접 효과(indirect effect): P43 * P31

직접 효과(direct effect): P41

총 효과(total effect): P41 + P43*P31