국내주식

AI 반도체 '학습'에서 '추론'으로... K-팹리스, NPU로 엔비디아에 도전장

Htsmas 2026. 1. 19. 09:41
728x90
반응형

2026년 1월, 인공지능(AI) 산업의 무게중심이 거대 모델을 만드는 '학습' 단계를 넘어, 실생활에서 AI를 구동하는 **'추론(Inference)'**으로 급격히 이동하고 있습니다. 이에 따라 고비용·고전력 GPU를 대체할 **신경망처리장치(NPU)**가 차세대 AI 인프라의 핵심으로 부상하며, 국내 팹리스(반도체 설계) 기업들이 글로벌 시장 전면에 나서고 있습니다.


1. 왜 '추론용 NPU'인가?

그동안 시장을 지배한 GPU는 범용성이 높지만, 전력 소모가 막대하고 가격이 비싸 실시간 서비스를 대량으로 제공해야 하는 '추론' 단계에서는 효율성이 떨어집니다.

  • 효율성: NPU는 오직 AI 연산만을 위해 설계되어 GPU 대비 **전성비(전력 대비 성능)**가 수배에서 수십 배 높습니다.
  • 비용 절감: 데이터센터 운영사는 NPU 도입을 통해 전기료와 서버 구축 비용을 획기적으로 줄일 수 있습니다.
  • 시장 규모: 데이터인테로(DataIntero) 등 시장조사업체에 따르면 글로벌 NPU 시장은 2033년 약 304억 달러(약 41조 원) 규모로 연평균 약 20%씩 성장할 전망입니다.

2. 'K-NPU' 4대 천왕: 2026년 양산 및 실전 배치 가속

국내 대표 팹리스 기업들은 이번 CES 2026에서 차세대 칩을 대거 공개하며 기술력을 과시했습니다.

기업명 핵심 제품 타겟 시장 현재 상황 (2026. 01)
리벨리온 리벨(REBEL) 데이터센터 / 거대언어모델(LLM) 삼성 4나노 공정 기반 양산, '리벨 쿼드' 최초 공개
퓨리오사AI 레니게이드(RNGD) 데이터센터 추론용 TSMC 5나노 기반 본격 양산 돌입, 글로벌 판매 개시
딥엑스 DX-M2 (2세대) 엣지 AI / 피지컬 AI 5W 미만 초저전력으로 1,000억 파라미터 LLM 구동 로드맵 발표
모빌린트 에리스·레귤러스 스마트 팩토리 / 온디바이스 AI 로봇 및 공정 자동화 시장 실증 완료 및 제품군 확대

3. 주요 관전 포인트: "피지컬 AI와 데이터센터의 결합"

  • 딥엑스의 'DX-M2': CES 2026에서 공개된 이 칩은 "AI를 전기·서버 비용에서 해방하겠다"는 비전을 제시했습니다. 5와트 수준의 낮은 전력으로 로봇이나 산업 현장에서 직접 AI 판단을 수행하는 '피지컬 AI' 시대를 주도하고 있습니다.
  • 퓨리오사AI의 '레니게이드': 기술 검증 단계를 넘어 실제 글로벌 데이터센터 공급망에 납품을 시작하며, 엔비디아가 독점하던 시장에 '효율성'이라는 새로운 기준을 제시하고 있습니다.
  • 리벨리온의 '리벨 쿼드': 칩렛(Chiplet) 구조와 HBM3E를 결합해 초거대 AI 모델도 저전력으로 구동할 수 있는 성능을 확보, 엔터프라이즈 시장 공략에 속도를 내고 있습니다.

 전문가 인사이트: "2026년은 국산 NPU 수익성 증명의 해"

12년 차 반도체 산업 분석가로서 볼 때, 올해는 기술 과시를 넘어 **'숫자(매출)'**로 증명하는 시기입니다.

"지난 2~3년간 한국 NPU 기업들이 글로벌 학회와 전시회에서 성능을 인정받았다면, 2026년은 양산 물량이 실제 데이터센터와 로봇에 탑재되는 원년입니다. 특히 퓨리오사AI와 리벨리온이 글로벌 빅테크의 공급망에 안착하느냐가 K-반도체의 미래를 결정할 것입니다. '메모리는 삼성·SK, 설계는 리벨리온·퓨리오사'라는 공식이 완성될 가능성이 매우 높습니다."

반응형