[ADPADsP] 머신러닝과 오컴의 면도기 법칙 :: 단순함이 복잡함을 이기다

 

오컴의 면도기 법칙은 14세기 영국 신학자 윌리엄 오컴이 제시한 이론으로 ‘면도로 잘라내듯 모든 가정을 도려낸 뒤에 남는 단순한 것, 그것이 바로 본질’이라는 내용을 골자로 하고 있습니다.

이게 머신러닝이랑 무슨 상관이 있지?라고 생각하시는 분들이 많을 것 같아요.오캄의 면도기 법칙은 경제 분야에서도 많이 활용되고 있으며, 또한 통계를 적용하는 분야에서도 많이 활용되고 있습니다.

데이터분석또한통계를바탕으로가설을수립하고확률적인판단과분석을수행하기위해서가설수립과결과에대한판단을위한어느정도직관력을도움이되는도구라고생각해도될것같습니다.

오캄 면도날의 핵심 내용을 살펴보면 어떤 사실이나 현상 속에서 진실은 가장 단순한 것일 가능성이 크다라는 원칙을 근간으로 하고 있습니다.

이해하기 쉽게 예를 들면”강남 아파트 시세가 많이 오른 “이라는 사실이 있다고 가정하고 보겠습니다.

이런 사실을 뒷받침하기 위한 가정에서

공급보다 수요가 많아서 아파트 시세가 올라갔을 것이다.

부동산 투기꾼들이 아파트 시세를 올리기 위해서 연합을 하고 이에 의해서 아파트 값이 올라갔을 것이다.

정부에서 발표한 부동산 정책의 영향으로 풍선 효과가 나타나고 이에 의해서 사는 사람이 많아졌기 때문 아파트 가격이 오른 것이다.

오컴의 면도 칼날의 법칙에 의하면 우리는 첫번째를 선택해야 합니다.

3개의 가정을 보면 사실을 뒷받침하기 위한 다양한 가정이 성립됩니다.

이런 경우에 가정이 너무 많으면 한 사실에 대한 진실을 파악하기가 어렵다는 논리입니다.

결국 제한된 정보가 있으면 불필요한 가정을 줄이고 판단 실수를 줄여야 한다는 의미입니다.

그러나 어떤 것이 정답인지 모를 것이며 가장이 진실일지도 모르고, 2번, 3번이 맞는지도 모릅니다.

오컴의 면도날의 법칙의 취지는 사실과 현상, 또는 주장의 진실을 파악할 때 신뢰도를 Rough에 파악할 수 있는 기준입니다.데이터 분석에서의 오캄의 면도날 법칙을 적용하면 제한된 데이터 내에 복수의 가정이 존재합니다.

주요 인자를 이끌어 내는 과정이나 학습 모델 결과를 평가하는 과정에서, 오컴의 면도기 법칙을 적용할 수 있습니다.