디지스트 김민수 교수팀
‘지스트림 2.0’ 기술 개발
성능·속도 세계 최고 수준
인공지능 적용 등 기대
‘지스트림 2.0’ 기술 개발
성능·속도 세계 최고 수준
인공지능 적용 등 기대
슈퍼컴퓨터로 하던 빅데이터 분석을 컴퓨터 한 대로 처리하는 기술이 지역에서 개발됐다. 이 기술은 현존하는 관련 최신기술인 미국 그래프랩(GraphLab)을 능가하는 수준으로 평가받고 있다.
7일 디지스트(이하 DGIST)는 정보통신융합공학전공 김민수 교수 연구팀이 슈퍼컴퓨터로도 처리하기 어려운 인간 두뇌 신경망 데이터와 같은 대용량 그래프 데이터를 단 한 대의 컴퓨터로 처리할 수 있는 ‘지스트림(이하 GStream) 2.0’ 기술을 개발했다고 밝혔다. 기술 개발로 초대규모 심층 인공 신경망을 구현하는 데 도움이 될 것으로 DGIST는 기대했다.
GStream 2.0은 뇌 과학과 인공 지능, IoT, 웹, 소셜네트워크 등 다양한 분야에서 사용하는 그래프 형태의 빅데이터를 세계 최고 수준의 성능과 속도로 처리할 수 있다.
이 기술은 약 100조개의 간선으로 구성된 인간의 뇌 신경망 중 최대 2천560억개 규모의 간선 데이터를 처리한다. 즉 인간의 뇌 400분의 1 크기 신경망 데이터를 처리하는 셈이다.
복잡한 구조의 특성을 가진 인간 두뇌의 신경망은 그동안 여러대의 컴퓨터에 나눠 저장해왔다. 데이터가 늘어날수록 통신 비용과 메모리 사용량 등이 기하급수적으로 증가해 슈퍼컴퓨터를 사용하더라도 인간 두뇌의 1천분의 1 크기 데이터를 처리하는 데 어려움을 겪었다.
연구팀은 여러 대의 컴퓨터 메모리에 나눠 저장하는 방식에서 벗어나 컴퓨터 한 대의 PCI-e SSD(고속의 보조기억장치)에 저장하고, SSD로부터 GPU 메모리에 비동기적 방식으로 스트리밍하면서 동시에 GPU의 수천개 계산 코어들을 이용해 데이터를 처리하는 새로운 접근 방법을 시도했다.
이 기술은 두 개의 GPU와 두 개의 PCI-e SSD를 장착한 컴퓨터 한 대만으로 320억개 간선의 데이터를 500초 만에 처리했다. 이는 뛰어난 빅데이터 분석 성능을 가진 미국 카네기멜론대학교 그래프랩(GraphLab)이 슈퍼컴퓨터에 320억개의 간선 데이터를 처리하는 데 걸리는 1천400초보다 두 배나 앞서는 기술이다. 이번 연구 성과는 지난달 28일 미국 샌프란시스코에서 열린 데이터베이스 분야 세계적 학술대회인 2016 ACM SIGMOD(시그모드)에서 발표됐다.
DGIST 정보통신융합공학전공 김민수 교수는 “신경망 형태의 빅데이터를 GPU와 SSD 기반으로 고속 처리할 수 있는 소프트웨어 기술을 확보했다”며 “뇌과학 및 인공지능 분야에서 사용되는 신경망 형태의 데이터 처리나 IoT 데이터 기반의 사이버 보안 등에 활용할 것”이라고 말했다.
김지홍기자 kjh@idaegu.co.kr
7일 디지스트(이하 DGIST)는 정보통신융합공학전공 김민수 교수 연구팀이 슈퍼컴퓨터로도 처리하기 어려운 인간 두뇌 신경망 데이터와 같은 대용량 그래프 데이터를 단 한 대의 컴퓨터로 처리할 수 있는 ‘지스트림(이하 GStream) 2.0’ 기술을 개발했다고 밝혔다. 기술 개발로 초대규모 심층 인공 신경망을 구현하는 데 도움이 될 것으로 DGIST는 기대했다.
GStream 2.0은 뇌 과학과 인공 지능, IoT, 웹, 소셜네트워크 등 다양한 분야에서 사용하는 그래프 형태의 빅데이터를 세계 최고 수준의 성능과 속도로 처리할 수 있다.
이 기술은 약 100조개의 간선으로 구성된 인간의 뇌 신경망 중 최대 2천560억개 규모의 간선 데이터를 처리한다. 즉 인간의 뇌 400분의 1 크기 신경망 데이터를 처리하는 셈이다.
복잡한 구조의 특성을 가진 인간 두뇌의 신경망은 그동안 여러대의 컴퓨터에 나눠 저장해왔다. 데이터가 늘어날수록 통신 비용과 메모리 사용량 등이 기하급수적으로 증가해 슈퍼컴퓨터를 사용하더라도 인간 두뇌의 1천분의 1 크기 데이터를 처리하는 데 어려움을 겪었다.
연구팀은 여러 대의 컴퓨터 메모리에 나눠 저장하는 방식에서 벗어나 컴퓨터 한 대의 PCI-e SSD(고속의 보조기억장치)에 저장하고, SSD로부터 GPU 메모리에 비동기적 방식으로 스트리밍하면서 동시에 GPU의 수천개 계산 코어들을 이용해 데이터를 처리하는 새로운 접근 방법을 시도했다.
이 기술은 두 개의 GPU와 두 개의 PCI-e SSD를 장착한 컴퓨터 한 대만으로 320억개 간선의 데이터를 500초 만에 처리했다. 이는 뛰어난 빅데이터 분석 성능을 가진 미국 카네기멜론대학교 그래프랩(GraphLab)이 슈퍼컴퓨터에 320억개의 간선 데이터를 처리하는 데 걸리는 1천400초보다 두 배나 앞서는 기술이다. 이번 연구 성과는 지난달 28일 미국 샌프란시스코에서 열린 데이터베이스 분야 세계적 학술대회인 2016 ACM SIGMOD(시그모드)에서 발표됐다.
DGIST 정보통신융합공학전공 김민수 교수는 “신경망 형태의 빅데이터를 GPU와 SSD 기반으로 고속 처리할 수 있는 소프트웨어 기술을 확보했다”며 “뇌과학 및 인공지능 분야에서 사용되는 신경망 형태의 데이터 처리나 IoT 데이터 기반의 사이버 보안 등에 활용할 것”이라고 말했다.
김지홍기자 kjh@idaegu.co.kr
저작권자 © 대구신문 무단전재 및 재배포 금지