대규모의 복잡한 데이터 집합을 분석하는 방법들 중에서 ‘주성분 분석’이라는 기법이 있습니다. 영어로 principal component analysis (이하 PCA라고 쓰겠습니다)라 불리는 이 방법론은, 고차원의 좌표 공간에 흩어져 있는 개별 데이터들을 잘 구분해내기 위한 핵심 축선들을 찾아 나가는 기법입니다. 이러한 핵심 축선은 한 개 만으로도 충분할 수 있지만 일반적으로는 여러 개가 필요하며, 이들이 주어진 데이터를 얼마나 잘 구분해내는지에 따라 개별 축선의 우선 순위를 매길 수도 있습니다. 즉 어떤 축선이 주어진 데이터들 간의 차이를 보다 잘 구분해낼 수록, 상대적으로 더 중요한 축선으로써 기능하게 되는 것입니다. 이렇게 찾아낸 핵심 축선들을 잘 활용하면, 우리는 복잡한 데이터 집합에 내재되어 있는 숨겨진 특성을 확인할 수 있고, 이로부터 새로운 통찰을 얻어내는 것이 가능합니다.

이해를 돕기 위해 우리 카이스트의 개별 구성원들이, 개인의 특성을 표현하는 수많은 인자들로 대변될 수 있는 하나의 데이터와 같다고 가정하겠습니다. 그렇다면 우리는 개별 인자들이 구성하는 고차원의 좌표 공간을 생각해볼 수 있고, 카이스트의 개별 구성원에 대한 데이터를 이 공간 상에 놓인 한 점으로 표현할 수 있습니다. 여기에 PCA 기법을 적용하게 되면, 우리는 카이스트의 구성원들을 가장 잘 구분해낼 수 있는 핵심 축선들을 찾아 나갈 수 있게 되는데, 그러한 축선들의 예로는 매월 언제 월급을 받는지, 하루에 몇 잔의 커피를 마시는지, 일주일에 운동을 몇 번 가는지와 같은 것들이 가능할 수 있습니다. 아마도 우리 카이스트 구성원들 개개의 특별함을 보이는데 있어서, 1-2개의 핵심 축선만으로는 많이 부족할 것으로 생각됩니다.

저 역시 수 년 간의 박사과정을 진행해오며 이 기법을 많이 활용해 왔습니다. 특히 저는 단일 세포 수준에서 측정된 유전자들의 발현량, 흔히 ‘단일 세포 데이터’라고 불리는 대상에 PCA 기법을 적용해 왔습니다. 이러한 유형의 데이터 분석에 있어서 PCA는 필수적이라고 할 수 있는데, 수만 여개의 세포들에서 측정된 수만 여개 유전자들의 발현량으로 이루어진 방대한 데이터 집합으로부터, 생체조직을 구성하는 주요 세포들의 군집을 성공적으로 분류해내는데 큰 도움을 주기 때문입니다. 제가 수행하는 대부분의 분석들이 특정한 세포 군집과 그들의 변화에 집중되어 있기에, PCA는 제 연구에서 핵심적인 부분을 담당하고 있을 뿐 아니라, 약간의 과장을 보태자면 제 일상이라고 봐도 될 정도였습니다. 그런데 평상시와 다름없이 분석을 진행하던 중, 문득 그런 생각이 들었습니다. “어쩌면 우리가 일상의 경험을 받아들이는 것 역시, PCA와 같은 방식으로 진행되는 것이 아닐까” 라는 생각이 말입니다.

일견 뚱딴지같은 소리라고 생각되시겠지만, 저는 우리가 일상에서 경험하는 개별적인 사건들 또한 수많은 변수들 사이의 복잡한 인과관계에서 도출된 하나의 ‘데이터’로 볼 수 있다고 생각합니다. 그리고 소소한 일상들이 누적되어 한 사람의 인생을 만들어 나가는 것처럼, 저는 그러한 데이터들이 한데 모여 구성하는 고차원 좌표 공간 상의 ‘데이터 집합’이, 곧 한 사람의 인생으로 볼 수 있다고 생각합니다. 이러한 관점에서 복잡한 데이터들을 잘 구분해내기 위한 핵심 축선들을 찾아 나가는 PCA 기법의 행위가, 마치 우리가 일상의 경험들을 본인의 가치관이라는 핵심 축선들을 통하여 잘 해석해보고자 하는 행위와 비슷하다는 생각이 들었습니다. 더 나아가 어쩌면 우리는 한 사람의 인생이라는 동일한 데이터 집합을 놓고도, 제각기 다른 핵심 축선들을 가져와 자기 자신, 또는 다른 사람의 인생에 대한 판단을 제멋대로 내리며 살아가는 건 아닐까 하는 생각이 들었습니다.

다만 이러한 비유를 현실에 대입하기 위해서는 추가로 고려해야 할 점들이 몇 가지 있습니다. 첫 번째로, 인생이라는 데이터 집합의 규모는 고정된 것이 아니라 매일 변화하고 있기 때문에, 데이터 집합의 핵심 축선들이 달라질 수 있는 가능성이 항상 존재하고 있습니다. 우리는 학습과 경험을 통해 많은 것을 느끼고 발전해 나갈 수 있으며, 그 과정에서 가치관의 변화를 통해 이전과 다른 삶의 자세를 갖게 되기도 합니다. 두 번째로, 하나의 데이터 집합에서 훌륭한 설명력을 가진 핵심 축선들을 찾았다고 해도, 그들이 다른 데이터 집합에서도 최선의 답이 될 것인지는 보장할 수 없습니다. 어떤 사람들에게는 최선의 가치관이라고 생각되는 것이, 다른 집단의 사람들에게는 전혀 맞지 않을 수도 있습니다. 마지막으로, 인생이라는 데이터 집합에서 본인이 찾아낸 핵심 축선들이 있다고 해도, 그들이 실제 핵심 축선들과는 얼마든지 다를 수 있다는 점입니다. 본인이 현재 옳다고 믿는 어떤 가치관이 있을지라도, 그것이 진정으로 본인의 삶과 부합하는 가치관인지에 대해서는 확실하게 이야기할 수 없습니다.

요약하자면 제가 생각했을 때 성공적인 인생을 살아가고 있다는 것은, 매일 변화하는 인생이라는 복잡한 데이터 집합에 PCA 기법을 반복적으로 적용하며, 자신 만의 핵심 축선들을 통해 일상이라는 데이터를 온전히 잘 해석하여 받아들이고 있는 것이라고 생각합니다. 데이터 집합을 분석하는데 있어 1-2개의 축선에만 매몰되어 있거나, 다른 사람의 핵심 축선을 가져다 분석하려고 하거나, 데이터 집합의 변화를 무시하고 기존의 축선 만을 고집하는 것은 데이터에 대한 해석력을 크게 낮추게 될 것입니다. 데이터 집합의 주인인 본인 만이 핵심 축선을 제대로 정립하고 평가할 수 있으며, 새로운 데이터가 들어왔을 때 효과적인 변화를 이끌어낼 수 있다고 생각합니다. 그런데 도대체 그 핵심 축선이라는 것은 어떻게 찾아야 하는 것일까요? 사실 이런 말씀을 드리는 저도 정답을 알고 있지는 않습니다만, 저의 지난 몇 년간 여정에서 이에 대해 느끼게 된 점들이 몇 가지 있었기에, 이를 세 가지 단계로 짧게 공유드릴 수 있을 것 같습니다.

우선 첫 번째 단계는, 자신의 강점과 가장 거리가 먼 약점으로부터 새로운 축선을 만들어보는 것입니다. 실제 PCA 분석에서도 첫 번째 핵심 축선과 직각을 이루는 비의존적인 방향에서 두 번째 핵심 축선을 찾는데, 약점을 정면으로 마주하여 극복하는 과정이 강점을 더 강하게 만드는 것보다 쉽고 빠른 것은 물론, 정신적으로도 매우 큰 만족감을 줄 수 있었습니다. 그리고 그 과정에서 나의 몰랐던 장점과, 경험해보지 못했던 새로운 세상을 만나게 되는 즐거움도 있었던 것 같습니다. 이 단계에서는 오프라인 상에서 도움을 줄 수 있는 현실의 전문가나 주변의 지인들, 특히 SNS의 인플루언서들보다는 현실을 충실히 살아가고 있는 분들에게 조언을 구하는 것을 권해드립니다. 사실 처음에 저는 도움을 요청하는 것이 혹여 그분들을 귀찮게 하는 것은 아닐까 걱정하곤 했었는데, 놀랍게도 거의 모든 분들께서 변화를 시도하려는 제 노력을 지지해주시고 적극적으로 도움을 주시려는 것을 경험하게 되어 신선한 충격을 받았던 경험이 있습니다.

두 번째 단계는, 일정 기간이 지난 후 새로운 축선에 대한 평가를 진행하는 것입니다. 이 단계에서는 도움주시는 분들의 울타리를 벗어나 비판적 관점으로 정보를 받아들이면서, 내가 새로 만들어 낸 축선에 대한 자체 평가를 진행해야 합니다. 현재 진행 중인 상황에 대해 꾸준하게 기록하고, 스스로 정보를 찾아보고, 다른 전문가나 지인들을 만나 새로운 관점에서의 의견을 구하는 방법들이 좋았던 것 같습니다. 아무리 큰 의욕을 가지고 출발했다고 하더라도 필연적으로 권태기는 찾아올 수밖에 없는데, 앞선 방법들을 잘 활용하면 새로운 축선에 대한 신중한 평가를 통해 금세 안정기로 진입할 수 있었던 것 같습니다. 혹시나 그 과정에서 현재의 축선이 잘 맞지 않다는 생각이 들었어도, 그간 쌓아온 경험들을 통해 보다 좋은 축선들을 금방 찾아 나갈 수 있었던 것 같습니다.

마지막 단계는, 주어진 일상에 충실하며 핵심 축선들을 재정리하는 것입니다. 실제 PCA 분석에서도 너무 많은 축선을 잡게 되면 분석 과정만 복잡해질 뿐, 데이터를 해석하는데 유의미한 도움을 주지는 못합니다. 일단 하나의 핵심 축선이 잘 잡혀 있어야 다음 축선을 찾는 것이 가능해지는 것처럼, 주어진 일상을 충실히 보내며 다른 핵심 축선들을 재정리해 나갈 때 비로소 삶에 꾸준한 안정감을 가져올 수 있었습니다. 자신 만의 핵심 축선들을 잘 정립하게 되면 일상의 경험들을 고차원 좌표 공간 상에서 다각도로 관조할 수 있게 되는데, 그 과정에서 예상치 못한 변화를 만나게 되더라도 이전의 경험들을 되돌아보며 효과적이고 능동적인 대응 방안을 금방 찾을 수 있었던 것 같습니다. 어느 정도 일상의 데이터가 누적된 상황에서 기존의 핵심 축선들이 잘 동작하지 않는다고 생각된다면, 다시 첫 번째 단계로 돌아가 이 과정을 반복하여 보다 좋은 자신 만의 핵심 축선들을 찾아볼 수 있을 것이라 생각합니다.
약 2년 전의 제 모습을 돌이켜보면, 저는 학업 성취도라는 핵심 축선 하나 만을 가지고 저의 인생이라는 복잡한 데이터 집합을 분석해보려 애썼던 것 같습니다. 학부 과정까지는 어느 정도 만족스러운 설명력을 보여주었던 핵심 축선이었지만, 대학원이라는 새로운 환경에 들어와서는 더 이상 유효하지 않았기에, 한동안 ‘데이터’를 해석하는 데 어려움을 많이 겪었던 것 같습니다. 그러나 의도치 않게 시작한 헬스가 이제는 저의 핵심 축선으로 자리잡게 되었고, 지금은 평생 해보지 않았던 노래를 배우러 다니고 있으며, 연구 외 분야의 사람들을 만나게 되며 그 동안 생각해보지 않았었던 새로운 진로를 목표로 하게 되었습니다. 업무적으로는 가장 강도 높은 한 해를 보내고 있음에도 불구하고, 제 개인적인 삶의 질은 그 어느 때보다도 높다고 생각하며 심지어 안정적이라는 느낌까지 들고 있습니다. 아마 제 인생이라는 데이터 집합이 변화해 감에 따라 핵심 축선들 또한 바뀔 수 있겠지만, 그 때마다 저는 PCA 기법을 다시 적용해 나가며 또 다른 핵심 축선을 찾을 수 있을 것이라는 희망을 가지고 있습니다. 아마 이번 문학상에 응모하게 되면서 새로운 축선이 하나 생겨났는지도 모르겠습니다. 여러분께서도 자신 만의 핵심 축선들을 찾아보는 즐거운 경험을 해보시길 바라며, 긴 글 이만 줄이도록 하겠습니다. 감사합니다.
 

저작권자 © 카이스트신문 무단전재 및 재배포 금지