backdoor와 frontdoor criterion을 쓸 수 없는 상황에서 일반화시켜서 사용하는 기법이 do-calculus이고 이를 잘 조합하면 do(x)가 있는 형태를 do-free하게 바꾼다

Do-Calculus 규칙

Rule 1 - 관측치의 추가와 제거

$$ P(y|do(x),z,w) = P(y|do(x),w)\space\space if\space (Y \perp \!\!\! \perp Z |X,W){G{\overline X}}

X로 들어오는 화살표가 다 지워진 그래프 모형에서 Y와 Z가 조건부 독립이면 z를 조건에 추가하거나 제거하는 것이 가능하다는 뜻

$$ P(y|do(x),do(z),w) = P(y|do(x),z,w) \space\space if \space (Y\perp \!\!\! \perp Z | X,W){G{\overline X \underline Z}} $$

Z에서 나가는 화살표가 다 지워진 그래프 모형에서 Y와 Z가 조건부 독립이면 do(z) 대신 z를 쓰거나 z대신 do(z)로 써도 된다는 뜻

$$ P(y|do(x),do(z),w) = P(y|do(x),w) \space\space if \space (Y\perp \!\!\! \perp Z | X,W){G{\overline X \overline{ Z(W)}}} $$

Z(W)는 W에 영향 받은 Z노드들을 의미하는데 Z(W)로 들어오는 화살표가 다 지워진 그래프 모형에서 Y와 Z가 조건부 독립이면 do(z)를 추가하거나 제거하는 게 가능하다는 뜻

<aside> 💡 * G 옆에 아래첨자로 된 노드 기호에 overline은 해당 노드로 들어오는 화살표가 모두 지워졌다는 의미고, underline은 해당 노드에서 나가는 화살표가 모두 지워졌다는 의미

</aside>

$P(y|do(z),w)$가 필요하지만 관측데이터만 있는 경우에 $G_{\underline Z}$는 W가 Z와 Y 사이의 유일한 backdoor 경로를 막는다 $Y:Z \leftarrow W \dashleftarrow\dashrightarrow Y$

$(Y \perp \!\!\! \perp Z |W){G{\underline Z}}$ d-separation을 적용하고 2번 규칙을 적용하면 쉽게 $P(y|do(z),w) = p(y|z,w)$ 되는 것을 확인 가능