Causal+Data+Science+with+DAGs+-+Section+1.pdf
구글에서 여성이나 소수 집단에 대한 저임금 상황에 대한 결정을 내리기 위해 연구를 진행
https://apption.co/embeds/mas263
집단을 나누기 전에는 한쪽 집단이 더 많이 버는 것으로 보이고, 집단을 나눈 후에는 다른 집단이 더 많이 버는 것으로 보인다
이런 것을 Simpson's Paradox
라고 함
이렇게 수정된 gender pay gap 방식이 과연 옳을까? (강의자는 옳지 않다는 의견)
여자/남자를 건강한 라이프스타일/건강하지 않은 라이프스타일로 바꿔보자
이 경우 라이프스타일, 매니저 여부로 나눠 건강한 라이프스타일이 돈을 더 번다고 해석하는 게 옳아 보인다
그럼 무엇이 차이일까?
주어진 숫자 상황에는 차이가 없지만 각 변수들의 관계
에 차이가 있음
우리가 알고자 하는 관계는 성별, 라이프스타일이 급여에 어떤 영향을 주는가인데 잡타이틀(Management)이 개입함
이때 성별은 직간접적으로 잡타이틀에 영향을 주는 관계이고, 라이프스타일은 잡타이틀에 영향을 받는 관계
위 관계에서 라이프스타일/잡타이틀을 나눠 급여를 비교하는 방식은 옳지만, 성별/잡타이틀을 나눠 급여를 비교하는 방식은 이미 잡타이틀에 성별이 영향을 주었기 때문에 옳지 못함
<aside> 💡 통계 자체로는 이런 문제의 해결에 도움을 주지 못한다
</aside>
통계적으로 보면 두 문제상황은 완벽하게 같다