참고: 이 계산은 공개 데이터를 기반으로 한 대략적인 값입니다. 가격은 변동될 수 있으므로 공식 웹사이트를 확인하세요.
저희 NVIDIA Llama 3.3 Nemotron Super 49B V1.5 비용 계산기를 사용하여 이 강력한 AI 모델 사용을 위한 대략적인 비용을 확인할 수 있습니다.
모델: NVIDIA Llama 3.3 Nemotron Super 49B V1.5
- 입력 토큰 비용: 100만 토큰당 $0.1
- 출력 토큰 비용: 100만 토큰당 $0.4
- 컨텍스트 크기: 131,072 토큰
이 모델은 Meta의 Llama 3.3 70B Instruct에서 파생된 490억 개의 매개변수를 가진 영어 중심의 추론/채팅 모델입니다. 수학, 코드, 과학 및 다중 턴 채팅 전반에 걸쳐 SFT를 통해 에이전트 워크플로(RAG, 도구 호출)를 위해 후처리되었으며, 이후 여러 RL 단계(RPO, RLVR, DPO)를 거쳤습니다. 이 모델은 실용적인 추론 효율성(높은 토큰/초, 감소된 VRAM)을 목표로 하며, 단일 GPU(H100/H200) 배포를 가능하게 합니다.
계산 공식:
총 비용 = (입력 토큰 수 / 1,000,000) * 입력 비용 + (출력 토큰 수 / 1,000,000) * 출력 비용
예시:
사용자가 1,000,000개의 입력 토큰과 2,000,000개의 출력 토큰을 사용한다고 가정해 봅시다.
- 입력 비용: (1,000,000 / 1,000,000) * $0.1 = $0.1
- 출력 비용: (2,000,000 / 1,000,000) * $0.4 = $0.8
- 총 비용: $0.1 + $0.8 = $0.9
이 계산기는 NVIDIA Llama 3.3 Nemotron Super 49B V1.5 기반 애플리케이션의 비용을 예측하는 데 도움이 됩니다. 필요한 입력 및 출력 토큰 수를 입력하고 "계산" 버튼을 클릭하여 예상 비용을 확인하세요.
참고: 이 계산은 공개 데이터를 기반으로 한 대략적인 값입니다. 가격은 변동될 수 있으므로 공식 웹사이트를 확인하세요.