(논문명) Ohm-GPU: Integrating New Optical Network and Heterogeneous Memory into GPU Multi-Processors

연구팀이 제안하는 Ohm-GPU의 구조 개요                                                              정명수 교수 제공
연구팀이 제안하는 Ohm-GPU의 구조 개요                                              정명수 교수 제공

    소수의 다국적 기업 주도하에 개발/생산되던 GPU(Graphic Processing Unit)의 메모리 시스템을, 이종 메모리와 광 네트워크를 활용해 용량과 대역폭 모두를 대폭 향상한 기술이 전기및전자공학부 정명수 교수 연구팀에 의해 개발됐다. 

옴-지피유(Ohm-GPU)기술이란?

    최근 심층학습, 그래프 처리 등 빅데이터 애플리케이션의 수요가 급증하고 있으며, 이들의 데이터 요구량은 GPU 내 메모리 시스템 용량을 크게 넘어선다. 따라서 GPU를 활용하는 시스템에서는 호스트 메모리 또는 스토리지 장치에 데이터를 저장해두고, 필요할 때마다 가속 플랫폼으로 데이터를 전송하는 방식을 활용하였는데, 이 과정에서 발생하는 빈번한 데이터 이동은 시스템 성능을 크게 저하시킨다. 옴-지피유는 이러한 데이터 이동 문제를 해결하기 위해 제안된, 광학 네트워크 기반의 대용량 하이브리드 메모리 시스템 기술이다. 기존 DRAM 기반 메모리 시스템의 부족한 용량 문제를 해결하기 위해 고확장성 비휘발성 메모리인 3D XPoint*를 활용하여 메모리 시스템을 구성하였으며, 이로 인한 성능 저하를 방지하기 위해 DRAM을 3D XPoint의 캐시로 활용하였다. 또한, 기존 전기 신호 기반 메모리 채널을 광학 네트워크** 기반 메모리 채널로 대체하여 채널 대역폭을 향상시키고, 전력 소모를 낮추었다. 정명수 교수 연구진은 옴-지피유 메모리 시스템을 적용할 경우, 기존 GPU의 데이터-중심 응용 처리 성능이 2.81배 향상됨을 확인하였다. 

옴-지피유 기술의 장점과 추가적인 연구 계획 및 기술 적용

    연구팀이 개발한 옴-지피유는 서로 다른 장치로 구성된 하이브리드 메모리 시스템의 문제점을 해결하기 위해 광학 네트워크의 특성을 활용한 최초의 연구라는 점에서 차별점이 있다. 또한, 연구팀은 새로운 심층학습 연산 장치 구조의 개발까지 연구 범위를 확장하고자 한다. 해당 연산 장치 개발 시, 옴-지피유 메모리 시스템을 적용하고, 옴-지피유의 특성을 고려하면서 장치 내 다른 요소들의 구조 및 동작을 설계할 계획이다. 이러한 옴-지피유를 대용량 데이터-중심 애플리케이션에 활용함으로써, 빈번한 데이터 이동을 줄이고, 성능을 개선시킬 수 있다. 예를 들어, 넷플릭스, 구글 등에서 사용자를 위한 추천 시스템이나 최근 떠오르는 심층 학습 모델인 그래프 신경망을 통해 페이스북 등 소셜 네트워크 서비스에서 친구 관계 예측 등에 활용될 수 있다.   

연구팀이 제안하는 Ohm-GPU의 구조 개요
    연구팀은 광학 네트워크 기반 하이브리드 메모리 시스템을 구성하여 성능 개선을 어느 정도 달성하였지만 하이브리드 메모리 시스템을 구성하는 3D XPoint와 DRAM간에 이루어지는 데이터 이동이 메모리 채널 및 메모리 컨트롤러를 점유함으로 인해, 외부에서 들어오는 데이터 요청을 지연시키는 문제가 존재한다는 것을 발견하였다. 따라서, 연구팀은 이 문제는 광학 네트워크 기반 메모리 체널에서의 데이터 전송이 메모리 컨트롤러에 의해서만 관리되기 때문이라고 판단하였다. 이에 본 연구진은 메모리 채널을 ‘3D XPoint와 DRAM 사이를 연결하는 메모리 경로’, ‘3D XPoint와 DRAM을 메모리 컨트롤러에 연결하는 데이터 경로’로 구분하고, 메모리 경로를 통한 데이터 전송은 3D XPoint 컨트롤러가, 데이터 경로를 통한 데이터 전송은 메모리 컨트롤러가 관리하도록 디자인을 수정하였다.

    마지막으로 정 교수는 “이번 연구성과를 기반으로 일부 해외 유수 기업 주도에서 메모리 시스템 관련 시장에서 우위를 선점할 가능성을 열었다는 점에서 의의가 있다”고 강조하였다.
 

3D XPoint*
최근 인텔사에서 개발한 비휘발성 메모리로, 3차원 행렬 형태로 메모리 구성이 가능하기에 기존 DRAM에 비하여 약 8배 높은 용량 밀도를 가짐. 성능은 DRAM보다 약 4-6배 느림.

광학 네트워크**
광학 신호를 기반으로 하는 네트워크. 특정 주파수의 빛을 흡수하는 Micro Ring Resonator (MRR)를 활용하여, 광원을 원하는 방식으로 변형시킨 후 송신. 변형된 광원은 수신기 측 MRR을 통해 흡수됨. 기존 전기 신호 기반 메모리 채널에 비하여 약 2배 높은 대역폭을 제공함과 동시에 전력 소모를 약 10배 감소시킬 수 있음.

 

저작권자 © 카이스트신문 무단전재 및 재배포 금지