backdoor criterion을 사용할 때 Z 집합은 여러 후보 중 하나이기만 하면 되지만 반드시 필요한 변수가 측정하기 어려운 상황일 때 frontdoor criterion(앞문 판별법?)을 사용한다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/4ca10e29-353e-4d9f-b997-6d113721e74a/Screenshot_20201028-013826_Samsung_Notes.jpg

위 상황에서 Z1이 측정 불가능하다면 backdoor criterion은 적용할 수 없음


Frontdoor criterion

P(x,z) > 0 인 상황에서 Z 집합이 아래 조건을 만족해야 한다

  1. Z가 X에서 Y로 가는 직접적인 경로를 모두 가로막는다
  2. X에서 Z로 차단되지 않은 경로(unblocked path)는 없어야 한다 → X에서 Z는 모두 blocked path여야 함
  3. Z에서 Y로 가는 뒷문 경로는 X에 의해 막혀야 한다(blocked)

$P(Y=y|do(X=x))$

$= \sum_z\sum_{x\prime}P(Y=y|Z=z,X=x\prime)P(X=x\prime)P(Z=z|X=x)$

직관적으로 생각하자면 frontdoor criterion은 backdoor criterion을 2단계로 이어 붙인 것이다

  1. X→Z, 2) Z→Y

조건2를 통해 X→Z를 진행하고, 조건3을 통해 Z→Y를 진행한다

Z→Y를 기존 backdoor criterion 방식으로 표현하면 Z가 기존 X의 역할하고 X가 기존 Z 역할 함

$P(Y=y|do(Z=z)) = \sum_{x\prime} P(Y=y|Z=z, X=x\prime)P(X=x\prime)$

ㄴ여기서는 x'로 표기하는 이유는 특정 x값이 중요한 게 아니라 summing out 목표로 하는 표기이기 때문에 차이를 명시하기 위함이고, $P(Z=z|X=x)$에서는 특정 x값이 중요하기 때문에 x 그대로 써줌

X→Z는 조건2를 통해 그 외 경로가 모두 blocked path이기 때문에 조건부 확률로 표현