기자명 이건호 기자 (rheegh95@skkuw.com)

 임의의 자연수를 하나 선택했을 때 첫 자리 수가 1일 확률은 분명히 1/9이다. 그렇다면 실제로 주변의 모든 수치 자료를 모았을 때 그 수들의 첫 자리 숫자가 1일 확률이 1/9일까? 상식적으로 1/9이라고 유추할 것이다. 그러나 △경제 지표들에 나타나는 숫자 △미국의 도로 번호 △회사의 회계 장부 등과 같은 다양한 숫자들을 수집해 맨 앞자리 숫자들을 조사해보면, 첫 자리 수가 1일 확률은 무려 30.1%나 된다고 한다. 이러한 숫자들의 분포를 공식화한 것이 바로 ‘벤 포드 법칙’이다. ‘벤 포드 법칙’의 아이디어는 미국의 천문학자 사이먼 뉴컴으로부터 시작됐다. 1881년 그는 로그표가 담긴 책을 보면서 앞쪽 페이지가 뒤쪽 페이지들보다 많이 닳아 있는 것을 발견했다. 이는 사람들이 1로 시작하는 로그 값을 더 많이 찾아봤다는 것을 뜻한다. 그 후 1938년 물리학자 프랭크 벤 포드는 △농구 통계 △물리학 상수 △순열 △잡지 기사 수 등 2,229개의 첫 자리 수 분포를 분석해 ‘벤 포드 법칙’을 내놓았다.
우리 주변에서 발견할 수 있는 숫자들의 첫 자리의 수가 n(n=1,2…9)일 확률을 P(n)라고 하면, P(n)은 다음의 식으로 유도 된다. 유도된 아래의 식이 바로 ‘벤 포드 법칙’이다.

 

 

 첫 자리 수가 1일 확률은 P(1)=log2≒0.301, 약 30.1%이고, n이 커질수록1/n 확률은 작아져 다음과 같은 확률이 나온다.

 

 '벤 포드 법칙'이 성립하는 이유는 통계의 많은 항목이 곱셈과 관련이 깊기 때문이다. 값을 곱셈에 대한 식으로 표현하면 y=ktx로 나타낼 수 있다. 이때, y가 m+1자리의 숫자이고, 맨 처음 자리 숫자가 자연수 a인 숫자들을 ①식처럼 부등식으로 나타낼 수 있다.

 

①식을 양변에 상용로그를 씌우면, ②식이 유도된다.

 

 따라서 이 조건을 만족하는 x값의 범위는 log(a+1)과 loga의 차이에 비례하게 된다. a가 1일 때 log2-log1=0.3010으로 벤 포드 법칙에서 첫 자리 수가 1일 확률과 같아진다. 또한, n이 커질수록 확률은 낮아진다.
벤 포드의 법칙은 실생활에 많이 사용되고 있다. 특히 국세청이나 공정거래위원회에서는 이 법칙을 응용해 회계부정 여부를 판단한다. 우선 그들은 기업 회계장부의 첫 자리 수로 그래프를 그렸을 때 벤 포드 법칙을 따르는지 확인한다. 그래프가 벤 포드 법칙에 위배되면 그 기업은 정밀하게 조사 받기 시작한다. 논문 『Benford 법칙에 대하여』의 저자 유익승은 “일반적으로 기업의 회계장부를 조작할 때 첫 자리 수를 1부터 9까지 거의 같은 빈도로 조작한다”고 말했다. 회사가 이 법칙에 대해 알고 조작한다고 해도 자기 자신과 똑같은 모양을 되풀이하는 프랙탈의 속성을 이용하면 회계장부 조작 여부를 판단할 수 있다. 즉, 회계장부 수치에 곱하기 2,3…n번을 수행했을 때 그래프가 벤 포드 법칙에 위배되면 그 역시 회계장부가 조작된 것을 의미한다. 실제로 그리스의 분식 회계 장부조작은 벤 포드 법칙에 의해 밝혀졌다.
 이렇게 우리 주변에는 상식과 반대되는 현상들이 존재한다. 물리학에서 초전도체 현상이 우리가 알고 있던 중력의 법칙에 반하는 것처럼 통계학에서도 벤 포드 법칙은 우리가 알고 있는 상식에 위배된다. 우리가 알고 있는 상식들이 어떠한 상황에서도 성립하는 것은 아니다. 이제는 상식에서 벗어나는 상식에 주목해볼 필요가 있지 않을까?