모델: MoonshotAI: Kimi Linear 48B A3B Instruct, 컨텍스트: 1048576, 비용: 1M 입력 토큰당 $0.3, 1M 출력 토큰당 $0.6
참고: 이 계산은 공개 데이터를 기반으로 한 대략적인 값입니다. 가격은 변동될 수 있으므로 공식 웹사이트를 확인하세요.
이 계산기는 MoonshotAI: Kimi Linear 48B A3B Instruct 모델 사용 비용을 추정하는 데 도움을 줍니다.
MoonshotAI의 Kimi Linear 48B A3B Instruct는 효율적인 게이팅 메커니즘을 사용하는 Kimi Delta Attention(KDA)을 특징으로 하는 하이브리드 선형 어텐션 아키텍처입니다. 이는 특히 긴 컨텍스트 작업에서 우수한 성능과 하드웨어 효율성을 제공하며, 최대 1M 토큰의 컨텍스트에 대해 KV 캐시를 최대 75%까지 줄이고 디코딩 처리량을 최대 6배까지 향상시킵니다.
모델의 컨텍스트 길이는 1,048,576 토큰입니다. 비용은 다음과 같습니다:
- 입력 토큰 비용: 1백만 토큰당 $0.3
- 출력 토큰 비용: 1백만 토큰당 $0.6
계산 공식:
총 비용 = (입력 토큰 수 × (1M 토큰당 입력 비용 / 1,000,000)) + (출력 토큰 수 × (1M 토큰당 출력 비용 / 1,000,000)) × 요청 수
예시:
입력 토큰 10,000개, 출력 토큰 5,000개, 요청 1회인 경우:
- 입력 비용: 10,000 × ($0.3 / 1,000,000) = $0.003
- 출력 비용: 5,000 × ($0.6 / 1,000,000) = $0.003
- 총 비용: $0.003 + $0.003 = $0.006