처치변수 X와 결과변수 Y 사이의 모든 경로를 막는 방법을 Backdoor Criterion(뒷문 판별법?)이라 한다
Backdoor Criterion을 만족시키는 변수집합 Z가 되기 위해서는
위 조건을 만족하면 아래 수식을 통해 do-operator를 제거하고 인과효과를 측정할 수 있다 $P(Y=y|do(X=x)) = \sum_z P(Y=y|X=x, Z=z) P(Z=z)$
$P(Y=y|do(x)) \not= P(Y=y|X=x)$인데 위 수식이 성립하는 이유는 두 조건 때문
인과효과는 X의 Y에 대한 영향력을 측정하기 위해 x를 바꾸는 것이고 X로 들어오는 변을 쳐낸다
1을 통해 x가 변했을 때 제3의 변수가 영향을 받고 이것이 y에 영향가는 것을 막는다
2를 통해 X로 향하는 변수만 남기게 되고, Z의 영향력을 평균내버리는(없애는) 과정으로 인과효과만 남긴다
collider 상황에서 Z 변수를 넣는다는 건 주변 경로를 열어주는 것이다.
위 상황에서 충분한 수정 집합은 2개씩 있는 $Z_1, Z_n$인데, 굳이 늘려서 3개, 4개짜리 집합으로 만드는 것도 조건을 만족할 수 있지만 집중할 수 있도록 최소한으로 제한하는 것이 좋다
가능한 수정집합을 찾으면 인과효과를 matching, inverse probability weighting, 선형회귀 등을 통해 측정할 수 있다
backdoor criterion은 치료효과 맥락에서 unconfoundedness 가설을 합리화하는 편한 방법이다
$$ (Y^1, Y^0)\perp \!\!\! \perp X | Z $$