모델: NVIDIA: Llama 3.1 Nemotron Ultra 253B v1, 컨텍스트: 131072, 비용: 1M 입력 토큰당 $0.6, 1M 출력 토큰당 $1.8
참고: 이 계산은 공개 데이터를 기반으로 한 대략적인 값입니다. 가격은 변동될 수 있으므로 공식 웹사이트를 확인하세요.
NVIDIA Llama 3.1 Nemotron Ultra 253B v1 토큰 비용 계산기
본 계산기는 NVIDIA의 Llama 3.1 Nemotron Ultra 253B v1 모델을 사용하여 API 호출에 대한 예상 비용을 계산합니다. 입력 토큰과 출력 토큰 수를 기준으로 비용을 산출하며, 요청 수를 통해 총 비용을 추정할 수 있습니다.
계산 공식:
- 입력 비용 = (입력 토큰 수 / 1,000,000) * 1,000,000 ($0.6) * 요청 수
- 출력 비용 = (출력 토큰 수 / 1,000,000) * 1,000,000 ($1.8) * 요청 수
- 총 비용 = 입력 비용 + 출력 비용
예시:
10,000개의 입력 토큰과 2,000개의 출력 토큰을 5번 요청하는 경우:
- 입력 비용: (10,000 / 1,000,000) * 1,000,000 * $0.6 * 5 = $30
- 출력 비용: (2,000 / 1,000,000) * 1,000,000 * $1.8 * 5 = $18
- 총 비용: $30 + $18 = $48
모델 정보:
- 모델: NVIDIA Llama 3.1 Nemotron Ultra 253B v1
- 최대 컨텍스트 길이: 131,072 토큰
- 비용: 1백만 입력 토큰당 $0.6, 1백만 출력 토큰당 $1.8
참고: 이 계산은 제공된 정보를 기반으로 한 추정치이며 실제 비용은 다를 수 있습니다. 정확한 가격 정보는 NVIDIA 공식 문서를 참조하시기 바랍니다.