
KT클라우드가 올 3분기 인공지능(AI) 학습용 인프라 서비스 'AI 트레인'에 엔비디아의 최신 그래픽처리장치(GPU) H200을 도입한다고 밝혔다.
20일 열린 'KT클라우드 AI 사업 및 GPUaaS' 온라인 설명회에서 정미진 KT클라우드 AI사업팀장은 최근 확보한 엔비디아 H200의 구독형 GPU 서비스(GPUaaS) 도입 계획에 관해 "AI 트레인에 H200 GPU를 적용해 3분기 중 보다 강화된 인프라를 제공할 예정"이라고 말했다.
H200은 지난해 엔비디아가 내놓은 최신 GPU 제품으로, AI·고성능 컴퓨팅(HPC) 워크로드를 가속화하는 데 중점을 둔 제품이다.
메타의 오픈소스인 라마2를 기준으로 했을 때, H200은 직전 모델인 H100보다 약 2배 빠른 추론 속도를 보여준다는 장점이 있다.
AI 트레인은 초대형 AI 시스템을 만들 때 짧은 기간 동안 고성능 GPU가 집중적으로 필요한 학습 과정에 특화된 서비스다.
컨테이너 기술을 활용해 여러 대의 GPU를 하나로 묶어 사용할 수 있어 기업의 대규모 AI 개발에 효율적이다.
현재 A100과 H100 GPU를 제공하고 있으며, 이번에 더 강력한 H200까지 추가하게 된다.
구체적으로 H200을 몇 장 확보했는지는 밝히지 않았다.
KT클라우드 관계자는 "구체적인 도입 수량은 공개하기 어렵다"면서도 "향후에도 대규모 투자를 통해 고성능 인프라 서비스를 제공할 예정"이라고 밝혔다.
이 밖에도 KT클라우드는 개인정보 보호를 위해 과학기술정보통신부와 개인정보보호위원회가 공동주관하는 '정보보호·개인정보보호 관리체계 인증인 'ISMS-P' 인증 기준에 맞춘 보안 체계를 갖췄으며, 여러 사용자가 함께 사용하는 환경에서도 데이터 보안이 보장된다고 설명했다.
또한 공공기관을 위한 'CSAP' 보안 인증도 추진할 계획이다.
국내 기업 '리벨리온'이 개발한 NPU(신경망처리장치) 기반 클라우드 서비스도 함께 제공 중이다.
NPU는 GPU보다 전력 효율이 높고 비용도 절감할 수 있는 장점이 있다.
GPU 자원은 기본적으로 여러 사용자가 공유하는 방식으로 운영하고 있지만, 전용 사용 서비스도 검토 중이라고 밝혔다.
KT클라우드는 1분기 중 고도화된 AIOPS(AI 기반 IT 운영) 솔루션을 출시하고, 이후 기업 환경에 맞춘 RAG(검색증강생성) 서비스도 차례로 선보일 계획이다.
검색증강생성은 기계 학습 모델에서 검색과 생성을 결합한 기술을 말한다.
RAG 서비스는 3분기 출시를 목표로 하며, 문서 처리와 정보 검색, AI 언어 모델 연동 등 필요한 기능들을 준비 중이다.
박유진 기자 genie@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제 무단전재 배포금지>