NVIDIA Llama 3.3 Nemotron Super 49B V1.5 비용 계산기

모델: NVIDIA: Llama 3.3 Nemotron Super 49B V1.5, 컨텍스트: 131072, 비용: 1M 입력 토큰당 $0.1, 1M 출력 토큰당 $0.4

참고: 이 계산은 공개 데이터를 기반으로 한 대략적인 값입니다. 가격은 변동될 수 있으므로 공식 웹사이트를 확인하세요.

저희 NVIDIA Llama 3.3 Nemotron Super 49B V1.5 비용 계산기를 사용하여 이 강력한 AI 모델 사용을 위한 대략적인 비용을 확인할 수 있습니다.

모델: NVIDIA Llama 3.3 Nemotron Super 49B V1.5

  • 입력 토큰 비용: 100만 토큰당 $0.1
  • 출력 토큰 비용: 100만 토큰당 $0.4
  • 컨텍스트 크기: 131,072 토큰

이 모델은 Meta의 Llama 3.3 70B Instruct에서 파생된 490억 개의 매개변수를 가진 영어 중심의 추론/채팅 모델입니다. 수학, 코드, 과학 및 다중 턴 채팅 전반에 걸쳐 SFT를 통해 에이전트 워크플로(RAG, 도구 호출)를 위해 후처리되었으며, 이후 여러 RL 단계(RPO, RLVR, DPO)를 거쳤습니다. 이 모델은 실용적인 추론 효율성(높은 토큰/초, 감소된 VRAM)을 목표로 하며, 단일 GPU(H100/H200) 배포를 가능하게 합니다.

계산 공식:

총 비용 = (입력 토큰 수 / 1,000,000) * 입력 비용 + (출력 토큰 수 / 1,000,000) * 출력 비용

예시:

사용자가 1,000,000개의 입력 토큰과 2,000,000개의 출력 토큰을 사용한다고 가정해 봅시다.

  • 입력 비용: (1,000,000 / 1,000,000) * $0.1 = $0.1
  • 출력 비용: (2,000,000 / 1,000,000) * $0.4 = $0.8
  • 총 비용: $0.1 + $0.8 = $0.9

이 계산기는 NVIDIA Llama 3.3 Nemotron Super 49B V1.5 기반 애플리케이션의 비용을 예측하는 데 도움이 됩니다. 필요한 입력 및 출력 토큰 수를 입력하고 "계산" 버튼을 클릭하여 예상 비용을 확인하세요.

참고: 이 계산은 공개 데이터를 기반으로 한 대략적인 값입니다. 가격은 변동될 수 있으므로 공식 웹사이트를 확인하세요.