[Causal Inference] 호텔 예약 취소에 숨은 인과관계
·
Causal Inference/DoWhy
0. Intro 호텔 예약이 취소되는 이유는 다양합니다. 원하는 시설(주차장, 풀)이 없거나 여행이 취소됐을 수도 있습니다. 일부는 호텔에서 조치를 취할 수 있는 반면 여행 취소와 같은 일은 호텔의 통제 범위를 벗어납니다. 어쨌든 이러한 요인 중 어떤 것이 예약 취소를 유발하는지 더 잘 이해하고 싶습니다. 따라서 Antonio, Almeida, Nunes(2019) 의 호텔 예약 데이터셋과 Microsoft의 DoWhy라이브러리를 사용하여 다른 방을 배정해주는 것과 예약 취소 사이의 인과관계를 분석해보고자 합니다. 앞서 인과관계를 알기 위한 최적의 방법(gold standard)은 무작위 시행 또는 무작위 대조 실험 (Randomized Controlled Trial, RCT)을 이용해 편향을 제거하는 ..
[Causal Inference] 잠재적 결과 프레임워크와 무작위 통제실험
·
Causal Inference
0. 인과추론의 양대산맥 인과추론 방식의 양대산맥으로 Potential Outcomes Framework과 Structural Causal Model가 있습니다. 전자는 잠재적 결과를 이용하여 인과관계를 분석하려는 것으로 사회과학 분야를 바탕으로 발전되어 왔으며 후자는 인과관계로 표현할 수 있는 변수들을 인과그래프로 모델링한 후, 인과관계를 분석하려는 방식으로 컴퓨터과학 분야를 바탕으로 발전되었다고 합니다. 1. 잠재적 결과 프레임워크 (Potential Outcome Framework) 이번에는 인과추론 방식 중 하나인 잠재적 결과 프레임워크에 대해 알아보겠습니다. 말 그대로 인과효과를 실제 결과와 잠재적 결과의 차이로 정의하는 접근입니다. 1-1. 인과추론의 근본적인 문제 인과관계를 추론하는 가장 확..
[Causal Inference] 인과 추론의 개요와 어려움
·
Causal Inference
0. 인과 추론? 요즘 여러 산업에서 AI/ML을 활용하여 문제를 해결해나가고 있는데요, 대부분의 목적은 예측(prediction)에 있습니다. 코로나 감염 추세가 어떻게 될지, 상품 추천의 결과가 어떻게 될지, 주가가 어떻게 될지 등에 대해 말이죠. 하지만 인과관계를 알고자 만약에라는 질문을 하면 이에 대해서는 답을 하기가 어렵습니다. 만약에 백신을 안 맞으면 어떻게 될지, 만약 마케팅 프로모션을 진행하지 않으면 어떻게 될지, 만약 그때 주식을 샀으면 어떻게 될지 말이죠. 예시와 같이 특정 조치(treatment) X가 Y라는 결과에 미치는 영향을 추론하는 것이 인과 추론입니다. 검증된 인과관계는 데이터 분석가로부터 납득할 수 있는 스토리텔링을 할 수 있게 해 주며 기업의 의사결정에 도움이 됩니다. 따..