반응형
엔비디아가 복잡한 사고 기반 AI 모델 확대에 대응하기 위해 MLPerf 추론 벤치마크 차기 기준을 선점할 전략을 공개했습니다. 4월 1일 프리브리핑에서 공개된 내용을 중심으로 기술 동향과 투자 아이디어를 분석합니다.
1. 엔비디아의 추론 전략 핵심
▷ 차기 MLPerf 대비 '사고형 AI' 지원 강화
- MLPerf는 AI 모델의 훈련/추론 성능을 측정하는 글로벌 표준 벤치마크로, 리즈닝 모델(추론 기반 AI) 평가항목 도입 논의가 진행 중입니다.
- 엔비디아는 중국 AI 스타트업 **딥시크(DeepSeek)**의 생성형 AI 모델을 활용, 복잡한 추론 작업에서의 성능을 시연하며 기술 리더십을 과시했습니다.
▷ 대규모 병렬 연산 시스템 'GB200 MBL' 공개
- 72개의 GPU를 동시 연동해 복잡한 추론을 처리하는 시스템으로, 향후 다중 GPU 병렬 연산이 표준이 될 것으로 예상.
- 기존 단일 GPU 환경 대비 연산 효율성을 극대화해 LLM(대규모 언어모델) 훈련 시 H100 대비 12배 성능 향상을 달성.
2. MLPerf 벤치마크에서의 성과
▷ B200 GPU: 훈련·추론 성능 혁신
- MLPerf 4.1 기준 B200은 전 세대 A100 대비 12배, H100 대비 6배 빠른 성능을 기록.
- 스테이블 디퓨전 XL 및 메타 Llama2-70B와 같은 복합 모델 테스트에서도 우수한 결과를 보였습니다.
▷ 엔터프라이즈용 A30·A10 GPU 확장
- 저전력 고성능을 강점으로 삼아 의료 영상 분석부터 상업용 추천 시스템까지 다양한 분야 적용 가능.
- 시스코·델·HPE 등 주요 OEM사와 협력해 2024년 하반기 양산 예정.
3. 시사점 & 투자 아이디어
▷ AI 인프라 수혜주 주목
- GPU 공급망: 엔비디아와 협업하는 델, HPE, 레노버 등 하드웨어 파트너사 성장세 예상.
- 클라우드 서비스: AWS·구글 클라우드 등에서 다중 GPU 병렬 시스템 도입 확대에 따른 수요 증가 전망.
▷ 추론 특화 반도체 기업
- 퀄컴·시마AI 등 엣지 AI 추론 시장 공략 기업이 MLPerf 엣지 부문에서 경쟁력 강화 중.
- 국내에선 AI 반도체 개발에 집중하는 팹리스 기업(예: 퓨전라이트) 관심 요구.
▷ AI 소프트웨어 생태계
- NVIDIA Triton 추론 서버를 활용하는 MS·위챗 등 플랫폼 기업의 AI 서비스 고도화 가능성.
- 생성형 AI 모델 최적화를 위한 MLOps(머신러닝 운영) 솔루션 기업 성장 예상.
결론: AI 추론 시장의 판도 변화
엔비디아는 MLPerf 기준을 선점하며 "단일 GPU → 다중 GPU 클러스터" 패러다임 전환을 주도하고 있습니다. 2025년 기준 글로벌 AI 추론 시장은 1조 달러 규모로 성장할 전망이며, 관련 산업 전반에 걸친 기술 투자가 활발해질 것으로 보입니다.
728x90
'해외주식' 카테고리의 다른 글
엔비디아 H20 칩, 중국 기업 대규모 주문…미국 규제 속 기회와 리스크 (0) | 2025.04.03 |
---|---|
메타, 고급 스마트 안경 '하이퍼노바' 출시 임박…핸즈프리 시장의 미래는? (0) | 2025.04.03 |
BYD, 1분기 차량 인도량 100만 대 돌파 (0) | 2025.04.03 |
엔비디아 H20 칩 품귀 현상 (0) | 2025.04.02 |
US스틸 운명은…"일본제철, 10조원 추가 투자 제안" (0) | 2025.04.02 |