복잡계 네트워크 이론, 네트워크를 통해 세상을 바라보다

'복잡계 네트워크 이론'이라 불리는 분야는 21세기 초에서야 태동한 신생 학문이다. 그럼에도 불구하고 복잡계 네트워크 이론은 물리학, 생물학, 컴퓨터과학, 사회과학, 경제학 등 여러 분야에서 광범위하게 응용되고 있다. 복잡계 네트워크 이론과 그 발전 과정, 응용 방안에 대해 살펴보자.

밀그램의 좁은 세상 실험과 네트워크

세상을 살아가다 보면, 처음 만난 사람이 알고 보니 친구의 친구였다거나 지인의 사촌의 친구였다는 등의 우연한 인연을 만나게 된다. 이럴 때 우리는 ‘세상 참 좁다’고 말하는데, 멀고도 가깝게만 느껴지는 사람 사이의 관계를 공간적인 개념에 빗대어 드러낸 점이 참신하게 느껴진다.

1960년대 말 하버드 대학교의 사회심리학자 스탠리 밀그램(Stanly Milgram)은 세상이 정말로 ‘좁은가’에 대해 알아보기 위한 실험을 진행하였다. 좁은 세상 실험(Small World Experiment)이라 불리는 이 실험에서는, 무작위로 선택된 사람들로부터 출발한 편지가 특정 인물에게 도착할 때까지 거친 사람들의 수를 세었다. 미국 사회 전체의 연결성을 알아보고자 한 실험인 만큼 충분히 멀리 떨어진 사람들을 택했는데, 출발점은 미국의 위치타, 캔자스, 오마하, 네브래스카 등 미국 중부 지역에 거주하는 사람들로 설정하였고, 도착점은 매사추세츠 주의 샤론과 보스턴에 거주하는 두 명이었다. 만약 편지를 받는 사람이 도착점의 인물들을 직접 알고 있다면 직접 우편으로 보내도 되지만, 그렇지 않으면 본인의 지인 중에서 그 사람들을 알 만한 사람에게 편지를 전달하는 것이 규칙이었다. 또한 편지를 수신하는 사람은 자신의 이름을 적도록 하여 편지가 몇 명의 사람을 거쳤는지 알 수 있도록 했다.

미 대륙을 가로지른 편지의 이동 거리를 생각한다면 그 결과는 가히 놀랄 만했다. 우선 출발점에서 보낸 160개의 편지 중 42개가 도착점까지 성공적으로 도착했고, 그 편지들이 거친 사람 수의 중앙값은 5.5명이었다. 이는 대략 6명의 단계를 거치면 대부분의 사람이 서로 연결되어 있다는 뜻이다. 이를 여섯 단계의 분리(Six Degrees of Separation)라고 한다.

여기서 사람과 사람 사이의 관계를 조금 더 단순하게 나타내어 보자. 각 사람을 점으로 표시하고, 서로 친분이 있는 사람들을 선으로 연결한다. 이런 방식으로 인간관계에 대한 그래프, 혹은 네트워크를 완성할 수 있는데 이때 각 점을 노드(Node), 선을 링크(Link)라고 부르며 두 노드 간의 거리는 한 노드에서 다른 노드로 가기 위해 지나야 하는 최소의 노드 수로 정의한다. 이러한 관점에서 보면 밀그램의 실험에서 관찰한 사람들 간 거리는 대략 6이라고 추측할 수 있다. 우리가 좁다고 비유했던 세상을 네트워크로 표현하면 정말로 ‘좁은’ 세상이 되는 것이다.

복잡계 이론 연구의 새로운 패러다임

복잡계란 자연계의 많은 구성 요소 간의 유기적인 협동에서 비롯되는 복잡한 현상들의 집합체를 뜻한다. 복잡계는 완전한 질서도, 완전한 무질서도 보이지 않은 채 그사이에 존재하며 구성 요소 단위에서는 관찰되지 않는 성질들을 나타내기도 한다. 관찰할 수 없는 전체를 파악하는 대신 현상을 구성하는 요소들에 집중하는 기존의 환원주의적 연구 패러다임으로는 복잡계를 연구하는 데 한계가 있을 수밖에 없다. 이를 극복하는 좋은 방법의 하나가 바로 복잡계를 네트워크로 기술하는 것이고, 여기서 탄생한 학문이 바로 복잡계 네트워크 이론이다. 그렇다면 과연 네트워크는 복잡계와 어떤 관련이 있을까? 그 해답을 얻기 위해 복잡계 네트워크 이론이 정립되기까지의 과정을 따라가 보자.

복잡계와 네트워크가 우연히 만나다

1950년대 후반 수학자 폴 에르되시(Paul Erdos)와 알프레드 레니(Alfred Renyi)는 네트워크 이론의 가장 기초가 될 만한 연구 결과를 발표했다. 그들이 고안한 무작위 네트워크는 처음부터 정해진 개수의 노드가 존재하고, 이들 중 임의의 2개의 노드를 뽑아 둘을 잇는 링크를 연결하는 방식으로 형성된다. 에르되시와 레니가 수학적으로 증명해 낸 네트워크의 중요한 특성 중 하나는 각각의 노드가 하나씩의 링크만을 가져도 모든 노드가 서로 연결될 수 있다는 점이다. 여기서 우리가 사는 세상이 좁은 세상이라는 사실에 수긍할 수 있다. 모든 사람이 한 명씩의 친구만을 가져도 서로 전부 연결될 수 있다는 뜻인데, 실제로는 그것보다 훨씬 많은 수의 링크를 가지기 때문이다. 더 정량적으로 생각해보면, 예를 들어 각 노드가 10개씩의 링크를 가지고 있다고 하자. 이를 ‘노드의 연결선 수가 10이다’라고 표현한다. 이 경우, 한 개의 노드를 거치면 10 곱하기 10, 즉 100여 개에 달하는 노드에 다다를 수 있고, 두 개만 거쳐도 그 범위는 1,000개의 노드를 아우른다. 거리가 1씩 늘어날 때마다 도달 가능한 노드는 기하급수적으로 커진다.

이처럼 무작위 네트워크는 좁은 세상이라는 실제 현상은 잘 나타내지만, 온전하게 현실을 반영하지는 않는다. 예를 들면, 우리는 무작위적으로 친구를 사귀는 것이 아니라 가까운 친구들이 여럿 있어서 이들끼리 클러스터(Cluster)를 이룬다. 이러한 점을 보완하기 위해 왓츠-스트로가츠(Watts-Strogatz) 모형이 제시되는 등 대안이 등장했다. 또 다른 한계점은, 무작위 네트워크는 모든 노드 중 하나를 같은 확률로 선택하여 링크를 부여하기 때문에 노드들이 대략 같은 연결선 수를 가진다는 점이다. 따라서 무작위 네트워크의 연결선 수는 푸아송 분포를 따르게 된다. 푸아송 분포는 특정 값에 대다수가 몰려 있고, 나머지는 극히 드문 종형 곡선과 유사한 분포이다. 그러나 조금만 생각해보아도 이것은 현실과는 괴리가 있는 특징임을 알 수 있다. 사람들의 친구 수도 넓은 분포를 가지는 것처럼 말이다. 세상에는 특별히 사교성이 좋아 아주 많은 수의 친구를 가진 자들부터, 정반대의 사람까지 골고루 존재한다. 왓츠-스트로가츠(Watts-Strogatz) 모형도 이런 점을 반영하지는 못했다. 이 모형도 푸아송 분포를 따르는 것은 마찬가지였기 때문이었다.

1999년 노트르담 대학의 앨버트 라즐로 바라바시(Albert-Laslo Barabasi) 교수와 당시 노트르담 대학 박사후연구원으로 재직했던 본교 정하웅 교수는 노트르담 대학 도메인의 웹페이지 연결 상태를 조사하였다. 그 결과 극소수의 페이지들은 매우 많은 수의 링크를 가지고 있지만, 대부분은 그에 훨씬 미치지 못한다는 것을 관찰하였다. 이러한 연결선 수의 양상은 멱함수 분포를 따르게 된다. 멱함수 분포는 반비례 곡선 형태의 분포와 유사한데, 대다수의 노드가 적은 수의 링크를 가지지만 얼마든지 많은 링크를 가지는 노드들 또한 존재한다는 특징이 있다. 이 때 특별히 많은 링크를 가지는 노드들을 허브(Hub)라고 부른다. 허브의 존재, 그리고 멱함수 분포라는 현상은 이전까지 등장했던 네트워크 모형들에 정면으로 충돌하게 되었다.

무작위 네트워크와 왓츠-스트로가츠(Watts-Strogatz) 모형의 공통적인 특징은 바로 무작위성이다. 노드 간 연결의 전부, 혹은 일부가 무작위적으로 이루어지기 때문이다. 이것이 바로 이들 네트워크의 연결선 수가 푸아송 분포를 따르는 이유였다. 따라서 웹페이지 네트워크의 연결선 수가 멱함수 분포를 따르는 것은 이들이 완전히 무작위적으로 연결되지 않았다는 점을 시사한다. 멱함수 분포는 복잡계가 보이는 특성이기도 하다. 요소들이 모여서 새로운 성질을 보이는 복잡계는 더 이상 완전히 무작위적이지 않다. 네트워크를 통해 복잡계를 표현할 수 있는 실마리가 마련된 것이다. 이런 새로운 종류의 네트워크는, 척도 없는(Scale Free) 네트워크라는 이름으로 불리게 되었다.

그렇다면, 척도 없는 네트워크의 연결선 수는 어떻게 멱함수 분포를 따르는 것일까? 척도 없는 네트워크의 한 종류인 바라바시-앨버트(Barabasi–Albert) 모형은 노드의 추가, 즉 네트워크의 성장 그리고 연결선 수에 비례하여 노드가 선택되는 선호적 연결이 그 원인임을 보여준다. 복잡계에서처럼 네트워크의 형성 과정에서도 요소들의 작용에 의해 멱함수 분포가 나타나게 된다. 바라바시-앨버트 모형 이외에도 실제 네트워크의 형성에 영향을 미칠 수 있는 요인들을 고려한 모형들이 여럿 제시되었다. 선호적 연결을 보완하여 각 노드의 연결선 수 이외에도 연결에 영향을 미치는 인자가 있다는 적합성 모형, 노드 간의 링크가 끊어지기도 하는 적응 모형 등이 그 예시이다.

허브 공격에 취약한 현실의 네트워크

그렇다면 복잡계 네트워크 이론을 현실에 응용할 수 있는 사례에 대해 알아보자. 현실 네트워크의 특징 중 하나는, 공격을 당하기도 한다는 점이다. 웹사이트가 디도스(DDoS) 공격으로 마비되기도 하고, 돌연변이로 생체 내 단백질 중 하나의 발현이 중지될 수도 있다. 따라서 일련의 공격에 대한 네트워크의 변화 특징에 대해서도 알아야 할 필요가 있다. 네트워크가 파괴되는지를 가장 잘 드러내는 지표는 바로 임의의 두 노드 간의 평균 거리, 즉 네트워크의 지름이다. 네트워크의 연결성이 감소할수록 평균 거리는 멀어지는데, 현실에서라면 이 경우 많은 문제점이 발생한다. 연구팀은 두 가지 상황에서 척도 없는 네트워크와 무작위 네트워크의 지름이 어떻게 변하는가를 살펴보았다. 첫 번째는 노드 중 하나를 임의로 제거하는 경우이다. 이 경우 무작위 네트워크보다 척도 없는 네트워크의 견고함이 두드러지게 드러났다. 반면 연결선 수가 큰 노드부터 차례로 제거했을 때에는 척도 없는 네트워크가 상당히 취약한 것으로 관찰되었다. 허브의 공격 앞에서는 척도 없는 네트워크도 당해내지 못한다.

백신 보급 등 여러 사례에 적용 가능

이러한 특성은 의외로 긍정적인 응용으로 이어질 수 있다. 에이즈 백신을 접종하는 경우를 생각해보자. 가장 효율적으로 백신을 접종하려면 척도 없는 성관계 네트워크의 허브 역할을 하는 사람들을 집중적으로 주사해야 한다. 하지만 이런 민감한 부분을 어떻게 조사해야 할까? 신기하게도 사생활을 해치지 않으면서 허브들에 백신을 접종하는 방법이 제시되었다. 임의의 사람들에게 백신을 나누어 준 뒤 자신의 파트너에게 주사하도록 한다. 그러면 자연스레 파트너 숫자가 많은 허브가 주사를 맞을 확률도 높아지게 된다. 척도 없는 네트워크의 취약점을 활용한 기발한 아이디어라 할 수 있다.

바라바시 교수는 '네트워크의 링크를 따라 전개되는 동역학적 성질에 관심을 가져야 한다' 고 제시하고 있다. 이제는 생물체의 네트워크를 연구할 때에도 신진대사 네트워크의 구조를 파악하기보다, 네트워크의 링크에 해당하는 화학 반응과 그에 따른 전체 세포의 변화에 대한 연구가 필요한 시점인 것이다. 이는 특정 네트워크의 본질을 파고드는 문제이기 때문에, 앞으로는 복잡계 네트워크 이론에서도 다양한 분야의 연구자들이 전문성을 발휘해야 한다.

참고문헌 | <링크, 21세기를 지배하는 네트워크 과학>, A.L.바라바시, EASTASIA, <복잡계 네트워크 과학, 21세기의 정보과학>, 강병남, 집문당

박종건 기자 panyaang99@kaist.ac.kr

상단영역

본문영역

복잡계 네트워크 이론, 네트워크를 통해 세상을 바라보다

기사 댓글 0

비회원 로그인