미완성 글입니다. 최종본에서는 이 경고가 제거됩니다.
상관 관계는 인과 관계가 아니다.
그러면 인과 관계는 어떻게 다루나요?
인과 추론 입문자가 입문자들에게 책을 4권 소개한다. 한 권은 읽고 있는 중이고, 세권은 읽었다.1
The Book of Why: The New Science of Cause and Effect
매혹적인 제목에 이끌려 몇년 전에 킨들 샘플을 받아뒀다. 이 때만 해도 인과 추론(Causal Inference)라는 단어도 몰랐고, 읽을 거리도 많이 밀려있어서 번역서 나오면 보자고 미뤄두었다. 인과 추론 공부를 시작하니 저자 Judea Pearl 의 이름이 거의 모든 곳에서 등장한다. 2011 년 튜링상 수상자다.
번역서는 아직도 나오지 않았다. 더는 기다리지 못하고 지금 읽고 있는 책이다. 인과 추론의 역사서로 보아도 좋다. 통계학이 어떤 과정으로 인과성을 분실했는지를 살피는 것으로 시작한다. 오늘 소개하는 4권 중 이 책을 가장 마지막에 읽고 있기는 하지만, 원래 순서로는 가장 앞으로 와야할 책이다. 배경 지식 같은 것은 필요 없어 보인다.
Causal Inference in Statistics - A Primer
역시 Judea Pearl 의 책이다. 저자에게 The Book of Why 다음에 읽을 책으로 적당한 것이 뭐냐고 물으니 이 책을 추천한적이 있다.
번역서가 있기는 하지만, 차마 권하지는 못하겠다. 굉장히 얇은 책이니 무리해서라도 원서로 보기를 권한다.
나는 이 책으로 시작했는데, 특히 아무것도 모르는 상태에서 얻을 것이 무척 많다. 뒷문 조건(Backdoor Criterion), 앞문 조건(Frontdoor Criterion), 개입(Intervention), 반사실(Counterfactual) 등등 기본 개념들에 대해서는 뒤에 소개할 두권보다 훨씬 철처하게 다룬다. 필요한 배경지식은 베이즈 정리 정도다.
인과관계 추론과 발견 with Python
실무로 통하는 인과추론 with 파이썬
각주
사실은 한 권 더 읽었지만, 소개할 가치가 없어 뺐다.↩︎