최신 글
2026년 6월 19일
NVIDIA BioNeMo Recipes로 LoRA를 활용한 생물학적 파운데이션 모델 파인튜닝하기
파운데이션 모델은 계산 생물학의 패러다임을 바꾸고 있습니다. 단백질이나 게놈 서열의 방대한 데이터로 사전 학습된 ESM2(단백질 언어 모델)와…
7 MIN READ
2026년 6월 19일
NVIDIA 플랫폼에서 DiffusionGemma 실행하기: 개발자 친화적인 고처리량 텍스트 생성
채팅 어시스턴트, 코파일럿, 에이전트 워크플로우 등 실시간 AI를 개발하는 개발자는 종종 토큰을 하나씩 생성하는 속도 제약에 부딪힙니다.
3 MIN READ
2026년 6월 17일
NVIDIA ACE Game Agent SDK와 Unreal Engine 5 플러그인으로 온디바이스 AI 동반자 구축하기
NVIDIA RTX 기술은 NVIDIA RTX Branch of Unreal Engine과 NVIDIA DLSS Unreal Engine 플러그인을…
5 MIN READ
2026년 6월 12일
NVIDIA, 첫 에이전트 AI 벤치마크에서 선도적인 에이전트 코딩 성능 달성
AI 에이전트는 추론 워크로드의 복잡성을 근본적으로 바꿔 놓았습니다. 지금까지 업계는 이러한 조건에서 추론 시스템이 어떻게 동작하는지를 측정할…
4 MIN READ
2026년 6월 12일
AI 팩토리를 위한 프로덕션급 배터리 에너지 저장 시스템(BESS) 설계
AI 팩토리는 데이터센터 인프라가 수행해야 할 역할 자체를 바꾸고 있습니다. 전통적인 데이터센터와 달리 AI 팩토리는 지능을 대규모로 생산하기 위해…
8 MIN READ
2026년 6월 10일
고급 융합 커널로 MoE 학습 처리량 높이기
전문가 혼합(MoE, Mixture-of-Experts) 모델은 현대의 대규모 AI 시스템에서 빠르게 핵심 구성 요소로 자리 잡았습니다.
5 MIN READ
2026년 5월 29일
NVIDIA CUDA Tile로 C++에서 고성능 GPU 커널 개발하기
이제 개발자는 기존의 대규모 C++ GPU 코드베이스 안에서 NVIDIA CUDA Tile 프로그래밍을 활용해, 타일 기반 추상화로 고도로 최적화된…
8 MIN READ
2026년 5월 29일
NVIDIA Cosmos 3로 피지컬 AI 추론·월드·액션 모델 개발하기
피지컬 AI 시스템은 현실 세계 안에서 행동하기에 앞서 그 세계를 먼저 이해해야 합니다. 로봇과 자율주행차, 스마트 공간은 자신이 놓인 환경에서…
6 MIN READ
2026년 5월 27일
DynoSim: 파레토 프런티어를 시뮬레이션하다
오늘날의 LLM 서빙은 튜닝하기가 까다롭습니다. 배포마다 모델 백엔드, 텐서 병렬(TP) 형태, 프리필/디코드 분할, 워커 수, 스케줄러 설정…
8 MIN READ
2026년 5월 22일
AI 모델 서빙 파이프라인의 마찰을 제거하는 방법
학습된 AI 모델을 프로덕션 환경으로 배포하는 과정은 매끄러워야 하지만, 실제로 그렇게 되는 경우는 드뭅니다. 많은 팀이 몇 주 동안 모델을…
6 MIN READ
2026년 5월 21일
NVIDIA Vera Rubin 플랫폼이 에이전틱 AI의 스케일업 과제를 해결하는 방식
에이전틱 추론은 비결정적 궤적—AI 에이전트가 과제를 수행하며 생성하는 행동, 관찰, 의사 결정—을 추론 워크로드에 도입하여 런타임 동작 방식을…
5 MIN READ
2026년 5월 20일
모델 양자화: NVIDIA Model Optimizer로 구현하는 학습 후 양자화(PTQ)
모델 양자화는 NVIDIA GeForce RTX GPU와 같은 컨슈머 디바이스에서 VRAM 사용량을 줄이고 추론 성능을 끌어올리는 효과적인…
5 MIN READ
2026년 5월 19일
실시간 GPU 플릿 가시성과 최적화를 위한 NVIDIA Fleet Intelligence 소개
대규모 GPU 플릿(fleet)의 컴퓨트 역량은 전례 없는 혁신 기회를 제공하며, 짧은 시간 안에 고객에게 가치를 전달할 수 있게 합니다.
5 MIN READ
2026년 5월 14일
NVIDIA NemoClaw·OpenClaw로 DGX Spark에 더 안전한 상시 로컬 AI 에이전트 구축하기
NVIDIA NemoClaw가 OpenShell·OpenClaw를 오케스트레이션해 Nemotron 3 Super 120B 모델을 DGX Spark에서 로컬 추론하고 Telegram으로 원격 접속하는 상시 가동 AI 에이전트를 약 20~30분에 구축하는 단계별 가이드입니다.
6 MIN READ
2026년 5월 14일
NVIDIA Nemotron 3 Super 공개 — 에이전틱 추론을 위한 오픈 하이브리드 Mamba-Transformer MoE
NVIDIA Nemotron 3 Super가 120B 총 파라미터·12B 활성 파라미터의 하이브리드 Mamba-Transformer MoE 아키텍처와 1M 토큰 컨텍스트, 네이티브 NVFP4 사전 학습으로 에이전틱 추론 성능과 효율을 동시에 끌어올리며 정식 공개됐습니다.
8 MIN READ
2026년 5월 13일
NVIDIA로 차량 내 AI 에이전트 구축하기 — 클라우드부터 자동차까지 풀 스택 가이드
NVIDIA DRIVE AGX, MediaTek Dimensity AX C-X1, NeMo, TensorRT Edge-LLM을 활용해 룰 기반 명령에서 에이전틱 멀티모달 캐빈 어시스턴트로 진화하는 차량 내 AI 아키텍처와 클라우드-에지 하이브리드 파이프라인 구축 방법을 다룹니다.
9 MIN READ