[AI 반도체 대전] ③ GPU 능가하는 ‘NPU’에 꿈의 메모리 ‘CXL’까지…AI 반도체 기술경쟁 촉발

시간 입력 2024-04-24 07:00:00 시간 수정 2024-04-23 17:28:47
  • 페이스북
  • 트위치
  • 카카오
  • 링크복사

‘AI 시대’ 기기 스스로 연산 가능케하는 NPU 부상
삼성, ‘엑시노스 2400’ 등 NPU 내장 SoC 선봬
지난해 12월엔 네이버와 협업·개발한 NPU 공개
SK하이닉스, 자회사 사피온 통해 NPU 개발 박차

‘챗GPT’가 쏘아올린 AI(인공지능) 열풍으로 글로벌 반도체 시장이 요동치고 있다. 생성형 AI 구동에 필수인 AI 반도체 수요가 폭발적으로 늘면서 AI 칩 시장에서 선도적 지위를 확보하려는 빅테크 간 경쟁이 날로 격화되고 있다. 세계 AI 반도체 시장을 선도하고 있는 엔비디아에 맞서 인텔, 구글, AMD, 삼성, SK 등 주요 빅테크들이 차세대 AI 반도체를 잇따라 공개하며 추격의 고삐를 더욱 죄는 모습이다. CEO스코어데일리는 최근 날로 격화하는 AI 반도체 시장의 현 주소와 함께, 삼성·SK 등 K-반도체 진영의 경쟁력도 조명해 보고자 한다. <편집자주>

전 세계 AI(인공지능) 반도체 시장을 독점하다시피 한 엔비디아의 독주에 맞서 인텔, 구글 등 글로벌 빅테크들이 앞다퉈 AI 칩 시장에 뛰어 들고 있다. 주요 빅테크들의 공세가 거센 가운데 K-반도체 진영도 시장 주도권을 단숨에 쟁취할 수 있는 방안을 심도 있게 고민하고 있다.

삼성전자와 SK하이닉스는 차별화 전략을 통해 AI 반도체 시장에서의 경쟁 우위를 확보하겠다는 전략이다. 삼성·SK는 현재 AI 칩 시장을 지배하고 있는 GPU(그래픽처리장치) 대신 인간의 뇌처럼 연산하는 NPU(신경망처리장치)를 집중 개발해 글로벌 시장을 선점해 나간다는 구상이다. 또 CXL(컴퓨트익스프레스링크) 기반 차세대 메모리를 앞세워 K-반도체의 위상을 더욱 제고하기로 했다. 

◇2030년 세계 NPU 시장 규모 1170억달러…삼성·SK, 엔비디아 GPU 뛰어 넘는 NPU 개발 박차

시장조사업체 가트너에 따르면 글로벌 NPU 시장 규모는 2022년 326억달러(약 44조9065억원)에서 2030년 1170억달러(약 161조1675억원)로, 8년 새 무려 258.9% 확대될 것으로 추정된다.

NPU 시장이 급성장할 것으로 전망되는 것은 날로 고도화하는 생성형 AI 구현을 위한 첨단 AI 칩 수요가 급증하고 있기 때문이다.

실제로 올해 초 ‘갤럭시S24’ 출시로 ‘AI 스마트폰 시대’가 처음 개화한 이후 AI TV, AI 가전 등 우리 일상 속에 AI 서비스가 빠른 속도로 확산되면서 온디바이스(On device) AI 반도체의 중요성이 급속도로 커지는 추세다.

다만 다양한 기기에서 AI 서비스를 구현하기 위해선 데이터센터에 탑재된 GPU를 기반으로 AI 연산을 제공하는 클라우드 연결 없이도 스스로 AI 연산이 가능해야 한다. 이같은 문제를 해결할 수 있는 AI 반도체가 바로 NPU다.

NPU는 AI 반도체의 양대 축인 학습용과 추론용 중 추론에 최적화된 칩이다. 주로 IT 기기용 SoC(시스템온칩)에 장착돼 외국어 자동 번역, 콘텐츠 화질 업그레이드 등을 담당한다. GPU에 비해 범용성이 다소 떨어지긴 하나, 칩의 크기가 크고 값도 비싼 GPU와 달리 스마트폰과 같은 모바일 기기에 적용하기가 훨씬 용이하다. 인터넷 연결 없이도 AI 기능을 수행할 수 있는, 작고 빠른 NPU를 능가하는 칩이 없는 셈이다.

이재용 삼성전자 회장(오른쪽에서 두번째)이 삼성전자 천안캠퍼스에서 반도체 제품을 살펴보고 있다. <사진=삼성전자>

이에 맞춰, 주요 빅테크들이 최근 NPU에 주목하고 있다. 지난해 인텔은 AI PC용 CPU(중앙처리장치) ‘메테오 레이크(Meteor Lake)’를 공개했다. 메테오 레이크에는 소비자용 CPU 중 최초로 NPU가 내장됐다.

퀄컴도 AI PC용 ‘스냅드래곤 X 엘리트’에 NPU 45TOPS를 장착했다. TOPS는 데이터를 1초에 1조번 연산할 수 있는 속도로, 스냅드래곤 X 엘리트에 들어간 NPU는 초당 45조번의 AI 연산이 가능하다. 또한 모바일 AP(애플리케이션 프로세서)용 ‘스냅드래곤 8 3세대’에도 NPU를 탑재했다. 스냅드래곤 8 3세대의 NPU 성능은 기존 제품 대비 98%나 개선된 것으로 전해졌다.

인텔, 퀄컴 등 주요 반도체 업체들이 NPU를 미래 먹거리로 삼고, 글로벌 시장 확대에 사활을 건 가운데 삼성전자, SK하이닉스 등 K-반도체도 NPU 경쟁력 제고에 박차를 가하고 있다.

NPU 기술 경쟁에서 앞서 나가고 있는 곳은 삼성이다. 삼성전자는 지난해 10월 기존 제품보다 NPU 성능을 14.7배 끌어올린 모바일 AP ‘엑시노스 2400’을 공개했다.

지난해 12월엔 네이버와 손잡고 약 1년 간 개발한 NPU를 최초로 선보였다. 삼성전자는 지난해 12월 19일 서울 서초구 더케이호텔에서 열린 ‘제4차 AI 반도체 최고위 전략대화’에서 ‘프로그래머블 반도체(FPGA)’ 시제품을 공개했다. FPGA는 프로그래밍이 가능하도록 구현된 칩이다.

이 칩은 특정 응용처를 위한 주문형 반도체(ASIC·에이직)로 제작됐다. AI 가속기로 각광받고 있는 NPU가 대표적인 에이직이다.

삼성전자와 네이버는 새 NPU를 활용하면 엔비디아의 GPU보다 같은 성능을 내면서도 전력 효율은 8배 이상 높다고 자신했다.

이동수 네이버클라우드 이사는 “지구상에서 가장 전력 효율적인 반도체다”며 “굉장히 저전력이기 때문에 언어 모델뿐 아니라 자동차, 로봇에도 탑재할 수 있다”고 강조했다.

삼성전자 ‘엑시노스 2400’. <사진=삼성전자>

SK도 NPU 분야에 손을 뻗고 있다. SK하이닉스는 SK텔레콤, SK스퀘어와 함께 지분을 보유한 AI 반도체 계열사 ‘사피온’을 통해 NPU 개발에 속도를 내고 있다.

사피온은 2020년 11월 국내 첫 데이터센터용 AI 칩 ‘X220’을 내놨다. 지난해 11월에는 이전 제품보다 4배 빨라진 ‘X330’을 출시하겠다는 청사진을 제시했다.

마이클 쉐바노우 사피온 CTO(최고기술책임자)는 “내부 분석 결과, X330은 동급 GPU보다 전력 효율이 1.3배에서 최대 1.9배 뛰어나다”며 “경쟁사 GPU를 X330으로 교체하면 소나무 1130만그루를 심는 탄소 저감 효과를 얻을 수 있다”고 자평했다.

◇CXL 생태계 확장에 진심…삼성·SK, 차세대 메모리 기술 확보 속도전

K-반도체는 차세대 메모리 기술인 CXL 분야에서도 입지 다지기에 나섰다.

AI 서비스를 구현하기 위해선 AI 연산이 원활히 이뤄져야 한다. AI 연산의 경우 수많은 데이터를 학습하고 추론하는 과정을 반복하는 탓에 PCIe와 같은 기존 컴퓨팅 규격 기반에서는 온전히 AI 반도체를 구동하기 어렵다. PCIe 규격에선 AI 연산을 돕는 메모리를 원하는 용량만큼 확장하기가 쉽지 않다.

이같은 단점을 해소한 것이 CXL이다. CXL은 확장성이라는 큰 장점을 갖고 있다. 서버에 필요한 D램을 거의 무한대로 확장하는 것이 가능하다. 뿐만 아니라 CPU, GPU 등의 프로토콜(통신 규약)을 하나로 묶어 데이터 병목 현상을 줄이고, 전력 효율에도 큰 도움을 준다.

이에 따라, 최근 CXL 규격을 지원하는 차세대 메모리의 필요성이 빠르게 확대되고 있다. 시장정보업체 욜그룹은 2028년 글로벌 CXL 시장 규모가 158억달러(약 21조7724억원)를 기록할 것으로 전망했다. 이 중 80%에 달하는 125억달러(약 17조2250억원)가량은 CXL D램 시장에 집중될 것으로 관측됐다.

CXL D램에 대한 향후 전망은 매우 밝은 상황이다. 2027년 이후 모든 CPU가 CXL과 연동되도록 설계될 예정이기 때문이다.

이미 CXL 규격을 적용한 CPU의 출시가 본격화하고 있다. 지난해 12월 인텔은 AI 성능이 대폭 향상된 서버용 CPU 제온 스케일러블 프로세서 5세대 제품을 공개했다. 해당 제품은 데이터센터의 서버 내에서 각종 정보를 연산하고 처리하는 핵심 칩이다.

눈여겨볼 점은 이번 칩부터 CXL 규격 적용이 가능해졌다는 것이다. 이와 관련해 인텔 관계자는 “일부 5세대 칩은 CXL 타입3 워크플로우를 선도적인 클라우드 서비스 공급 업체에 지원한다”고 밝히기도 했다.

인텔이 CXL 규격을 채택한 CPU를 내놓으면서 향후 메모리 시장에 지각변동이 일어날 수 있다는 목소리가 높아지고 있다. 인텔이 전 세계 서버용 CPU 시장에서 80% 이상의 점유율을 차지하고 있는 만큼 이번 신제품을 시작으로 CXL D램 생태계가 빠르게 확장될 것으로 예측되고 있다.

이에 삼성전자와 SK하이닉스는 CXL 기술력 확보에 박차를 가하고 있다.

CXL D램 시장에서 두각을 드러내고 있는 곳은 삼성전자다. 삼성은 2021년 5월 세계 최초로 CXL 기반 D램 기술을 개발했다. 이어 1년 만인 2022년 5월엔 DDR5 기반 512GB CXL D램 제품을 선뵀다.

2021년 10월에는 CXL D램에 대한 시스템 개발자들의 기술 접근성을 높이기 위해 ‘스케일러블 메모리 개발 키트(Scalable Memory Development Kit)’를 개발하기도 했다. 또한 지난해 5월엔 CXL 2.0을 지원하는 128GB CXL D램을 공개하며, 차세대 메모리 시장을 선도하고 나섰다. 삼성은 연내 해당 제품을 본격 양산하겠다는 포부를 내비친 상태다.

최장석 삼성전자 메모리사업부 신사업기획팀장 상무는 “삼성전자는 CXL 컨소시엄의 이사회 멤버로서 CXL 기술을 선도하고 있다”며 “글로벌 기업들과의 협력을 통해 데이터센터·서버·칩셋 등 CXL 생태계를 더욱 확장해 나갈 것이다”고 밝히기도 했다.

최근에는 △CMM-D △CMM-DC △CMM-H △CMM-HC 등 CXL 관련 상표 4개를 잇달아 출원하며 상용화를 예고했다.

삼성전자 128GB CXL 2.0 D램. <사진=삼성전자>

CXL 고객사 확보에도 힘쓰고 있다. 삼성전자는 지난달 26~27일 미국 캘리포니아주 실리콘밸리에서 열린 미국반도체학회 ‘멤콘 2024’에서 ‘AI 시대의 HBM 및 CXL 메모리 혁신 주도’를 주제로 기조연설을 했다.

이 자리에서 삼성 CXL의 성능과 솔루션, 전략 등을 전격 공개했다. 삼성전자의 이번 연설에는 실리콘밸리의 IT 및 반도체 관련 기업 관계자들이 대거 참석한 것으로 알려졌다.

또 지난달 18일엔 미국 캘리포니아주 새너제이 SAP 센터에서 열린 엔비디아 연례 개발자 콘퍼런스 ‘GTC 2024’에서 ‘데이터 중심의 컴퓨팅을 위한 CXL’을 주제로 발표를 했다. 이렇듯 삼성은 굵직한 국제 행사에 잇따라 참석하며 삼성 CXL 홍보에 박차를 가하고 있다.

삼성은 글로벌 CXL 시장을 서둘러 선점해 AI 반도체 주도권을 확보한다는 구상이다. 경계현 삼성전자 대표이사 사장은 지난달 20일 열린 삼성전자 정기 주주 총회(주총)에서 “CXL의 경우 다양한 고객과 협의해 실제 적용 등을 진행하고 있다”며 “곧 가시적인 성과를 보일 것이다”고 자신했다.

SK하이닉스도 2022년 8월 DDR5 D램 기반 첫 96GB CXL 메모리 샘플을 개발했다. 또한 같은해 10월에는 업계 최초로 CXL 기반 연산 기능을 통합한 메모리 솔루션 CMS(Computational Memory Solution) 개발에 성공하고, 이를 ‘OCP 글로벌 서밋 2022’에서 공개한 바 있다. CMS는 HPC(고성능컴퓨팅) 물리 서버에 활용되는 응용 프로그램의 성능을 개선하고, 에너지 사용량을 줄여준다. 또 간접 메모리 접근을 가속화하고, 데이터 이동을 크게 줄일 수 있는 기능도 갖췄다.

지난해 11월 미국 콜로라도주 덴버에서 열린 ‘슈퍼컴퓨팅 2023(SC 2023)’ 콘퍼런스에선 ‘나이아가라: CXL 분리형 메모리 솔루션’ 플랫폼 시제품도 선뵀다. 해당 플랫폼은 AI와 빅데이터 분산 처리 시스템에서 높은 수준의 성능 향상을 제공할 수 있는 ‘풀드(pooled) 메모리 솔루션’으로 주목 받았다.

SK하이닉스 CXL 2.0 D램. <사진=SK하이닉스>

최근엔 DDR5 기반 96GB·128GB CXL 2.0 메모리 솔루션 제품을 중심으로 올해 상반기 내에 고객 인증을 완료하고, 하반기 상용화한다는 계획이다. 현재 SK하이닉스는 고객과 협업을 통해 샘플을 제공하고, 상용화 초읽기에 들어간 것으로 알려졌다.

SK하이닉스의 CXL 2.0은 DDR5만 탑재한 기존 시스템과 비교해 대역폭 50% 향상, 용량 최대 50~100% 확장 등이 가능하다.

SK하이닉스 관계자는 “CXL은 메모리 확장과 새로운 시장을 창출할 수 있는 새로운 계기다”며 “최첨단 D램 및 진보 패키지 기술을 개발해 CXL 기반의 다양한 대역폭·대용량 확장 메모리 솔루션 제품을 순차적으로 출시하겠다”고 말했다.

시장에서는 삼성전자와 SK하이닉스가 CXL 시장 주도권을 무난히 차지할 것으로 점치고 있다. 일부 메모리 시장에서 중국을 비롯한 경쟁자들의 추격이 거세긴 하나 차세대 메모리 반도체 분야에서 기술적인 우위를 확고히 할 경우, K-반도체의 경쟁력이 더욱 극대화할 수 있다는 것이다.

메모리 업계 관계자는 “CXL은 일부에 한해 개발됐을 뿐 생태계 전체를 아우르는 기술은 부족한 상황이다”며 “전 세계 CXL 시장의 성장 가능성을 인지한 삼성·SK가 서둘러 CXL 기술을 확보한다면 글로벌 반도체 시장에서 K-반도체의 위상은 한 단계 더 높아질 것이다”고 설명했다.

[CEO스코어데일리 / 오창영 기자 / dongl@ceoscore.co.kr]

댓글

[ 300자 이내 / 현재: 0자 ]

현재 총 0개의 댓글이 있습니다.