자일링스, HPC 및 빅데이터 작업부하 위해 가장 강력한 성능의 U55C 가속기 카드 출시 기자간담회 개최하고 표준 기반 API 지원 클러스터링 솔루션과 알베오 U55C 데이터센터 가속기 소개
최교식 2021-11-16 17:21:42

자일링스(Xilinx)는 오늘, 온라인 기자간담회를 열고, 대규모로 FPGA를 구축할 수 있는 새로운 표준 기반 API 지원 클러스터링 솔루션과 알베오 U55C(Alveo U55C) 데이터센터 가속기 카드를 선보였다.

알베오 U55C 가속기는 고성능 컴퓨팅(HPC: High Performance Computing) 및 데이터베이스 작업부하를 위해 탁월한 와트당 성능을 제공하며, 자일링스 HPC 클러스터링 솔루션을 통해 손쉽게 확장이 가능하다.

발표를 담당한 자일링스 데이터센터 그룹 HPC 제품 매니저인 네이선 창(Nathan Chang) 씨는 HPC 및 빅데이터 작업부하를 위해 특별히 구현된 새로운 알베오 U55C 카드는 자일링스 알베오 가속기 포트폴리오 중 가장 높은 컴퓨팅 밀도와 HBM 용량을 제공하는 가장 강력한 알베오 가속기 카드라고 설명했다.

또한 대규모 컴퓨팅 작업부하를 처리하는 광범위한 고객들은 새로운 자일링스 RoCE v2 기반 클러스터링 솔루션을 이용해 기존의 데이터센터 인프라 및 네트워크에서 강력한 FPGA 기반 HPC 클러스터링을 구현할 수 있다고 말했다.

알베오 카드와 같이 아키텍처 측면에서 FPGA를 사용하는 가속기는 많은 컴퓨팅 집약적 작업부하에서 최저비용으로 최고 성능을 제공한다. 또한 고객의 기존 인프라와 네트워크를 사용하여 알베오 HPC 클러스터를 생성할 수 있는 표준 기반 방법론을 도입함으로써, 이러한 주요 이점들을 모든 데이터센터의 대규모 확장에 활용할 수 있다. 네이선 창 매지저는 이러한 획기적인 혁신은 데이터센터 전반에 걸쳐 알베오 및 적응형 컴퓨팅이 보다 폭넓게 채택될 수 있는 중요한 기점이 될 것이라고 설명했다.

 

 

자일링스 HPC 제품 매니저인 네이선 창(Nathan Chang) 씨는, 소프트웨어 개발자 및 데이터 과학자들은 애플리케이션 및 클러스터의 하이레벨 프로그래밍 기능을 통해, 자일링스 적응형 컴퓨팅의 이점을 활용할 수 있다고 말했다.

 

 

 

HPC 및 빅데이터 애플리케이션용으로 구현

 

알베오 U55C 카드는 오늘날 HPC 작업부하에 필요한 많은 주요 기능을 갖추고 있다. 더 많은 데이터 파이프라인의 병렬화, 탁월한 메모리 관리, 파이프라인 전반에 걸쳐 최적화된 데이터 이동은 물론, 알베오 포트폴리오 중 가장 뛰어난 와트당 성능을 제공한다.

또 낮은 150W의 최대 전력으로 단일 슬롯 FHHL(Full Height, Half Length) 폼팩터로 구현이 된 것도 특징이다. 이전 제품인 듀얼 슬롯 알베오 U280 카드 대비 두 배에 이르는 16GB HBM2와 탁월한 컴퓨팅 밀도를 제공한다. U55C는 고밀도 알베오 가속기 기반 클러스터를 생성할 수 있도록 더 작은 폼팩터로 더욱 뛰어난 컴퓨팅 성능을 지원한다. 이는 빅데이터 분석 및 AI 애플리케이션과 같이 확장이 필요한 빅 컴퓨팅과 고밀도 스트리밍 데이터 및 높은 IO가 수반되는 수학 문제를 해결할 수 있다.

한편, RoCE v2 및 데이터센터 브릿징과 200Gbps 대역폭을 활용하는 API 기반 클러스터링 솔루션은 공급업체에 종속되지 않고 성능 및 처리지연 측면에서 인피니밴드(InfiniBand)에 준하는 알베오 네트워크를 구현할 수 있다. 또한 HPC 개발자들은 통합 MPI를 통해 자일링스 바이티스(Vitis) 통합 소프트웨어 플랫폼에서 알베오 데이터 파이프라인을 스케일 아웃(Scale-Out)할 수 있다. 따라서 기존의 개방형 표준 및 프레임워크를 활용하여 서버 플랫폼 및 네트워크 인프라와 공유 작업부하 및 메모리와 상관없이 수백 개의 알베오 카드를 확장할 수 있다.

창 매니저는 소프트웨어 개발자 및 데이터 과학자는 바이티스 플랫폼을 활용하여 애플리케이션 및 클러스터의 하이 레벨 프로그래밍 기능으로 알베오와 적응형 컴퓨팅의 이점을 누릴 수 있다고 말했다.

자일링스는 하드웨어 전문지식이 없는 소프트웨어 개발자와 데이터 과학자들이 적응형 컴퓨팅에 보다 쉽게 접근할 수 있도록 바이티스 개발 플랫폼과 툴 플로우에 상당한 투자를 진행했다. 파이토치(Pytorch) 및 텐서플로우(Tensorflow)와 같은 주요 AI 프레임워크는 물론, C, C++ 및 파이썬(Python)과 같은 하이-레벨 프로그래밍 언어를 지원함으로써 개발자들이 특정 API 및 라이브러리를 사용하여 도메인 솔루션을 구현하거나 자일링스 소프트웨어 개발 키트를 활용하여 기존 데이터센터 내의 주요 HPC 작업부하를 쉽게 가속화할 수 있도록 지원한다.

 

 

Alveo-U55C

 

 

HPC 고객 적용사례

 

알베오 U55C 카드를 적용사례가 소개됐다.

세계 최대 규모의 전파 천문학 안테나 어레이를 보유하고 있는 호주 국립과학산업연구기구인 CSIROSKA(Square Kilometer Array) 전파 망원경의 신호 처리를 위해 알베오 U55C 카드를 활용하고 있다. HBM과 함께 알베오 카드를 네트워크 연결 가속기로 구축하면, HPC 신호처리 클러스터를 확장하여 대규모 처리량을 달성할 수 있다. CSIRO는 알베오 가속기 기반 클러스터를 통해 131,000개의 안테나에서 데이터를 실시간으로 집계하고, 필터링, 준비 및 프로세싱을 위한 방대한 컴퓨팅 작업을 처리하고 있다. P4 지원 100Gbps 스위치와 완벽하게 네트워크로 연결된 420개의 알베오 U55C 카드는 신호처리 클러스터 전반에 걸쳐 460GBHBM2 대역폭을 제공한다. 알베오 U55C 클러스터는 낮은 전력 및 비용 효율적인 풋프린트를 통해 전반적으로 15Tb/s 처리량에 달하는 프로세싱 성능을 제공한다. CSIRO는 현재 다른 전파 천문학 또는 관련 산업에서 동일한 성과를 달성할 수 있도록 알베오 레퍼런스 디자인 예제를 완성하는 중이다.

앤시스의 LS-DYNA 충돌 시뮬레이션 소프트웨어는 전 세계 거의 모든 자동차 회사에서 사용되고 있다. 안전 및 구조 시스템의 설계는 물리적 충돌 테스트 비용을 완화하는 컴퓨터 지원 설계 유한 요소법(Finite Element Method, 혹은 FEM) 시뮬레이션 모델의 성능에 달려 있다. 유한 요소법 해석은 자유도가 수억 개에 달하는 시뮬레이션을 구동하는 주요 알고리즘이며, 이러한 거대한 알고리즘은 PCG, 희소행렬(Sparse Matrix), ICCG와 같은 보다 기초적인 해석으로 나눌 수 있다. LS-DYNA는 다수의 알베오 카드 전반에 걸쳐 하이퍼 병렬 데이터 파이프라이닝으로 확장됨에 따라 x86 CPU에 비해 성능을 5배 이상 가속화할 수 있다. 이를 통해 LS-DYNA 고객들은 알베오 파이프라인에서 클럭 주기당 더 많은 작업을 수행하고, 획기적인 시뮬레이션 시간 단축의 혜택을 누릴 수 있다.

또 선도적인 그래프 분석 플랫폼을 공급하는 타이거그래프(TigerGraph)는 그래프 기반 추천 엔진 및 클러스터링 엔진을 구동하는 가장 많은 2개의 알고리즘을 클러스터링하고, 가속화하기 위해 다수의 알베오 U55C 카드를 사용하고 있다. 그래프 데이터베이스는 데이터 과학자를 위한 혁신적인 플랫폼이다. 그래프는 사일로에서 데이터를 가져와 데이터 간의 관계에 초점을 맞춘다. 그래프의 다음 단계는 이러한 해답을 실시간으로 찾는 것이다. 알베오 U55C는 추천 엔진에 대한 쿼리(Query) 시간과 예측을 분 단위에서 밀리초 단위로 가속화한다. 다수의 U55C를 활용하여 분석 성능을 스케일 업(Scale Up)함으로써 뛰어난 컴퓨팅 성능과 메모리 대역폭으로 CPU 기반 클러스터에 비해 그래프 쿼리 속도를 최대 45배까지 가속화할 수 있다. 품질 스코어 또한 최대 35%까지 증가하여 신뢰도를 높이고, 오탐 빈도(False Positives Rate)를 한 자릿수까지 크게 낮출 수 있다.

 

디지털여기에 news@yeogie.com <저작권자 @ 여기에. 무단전재 - 재배포금지>