LLM Gateway Hub
Claude Code

Claude Code 用户选中转站,先看缓存和限速。

代码任务通常输入长、输出中等、上下文复用高。只看输出单价很容易误判,应该把 prompt cache、长上下文和请求限制一起纳入预算。

按我的用量计算
claude-code-cost.md
scenario:
  monthly_requests: 50,000
  avg_input_tokens: 3,500
  avg_output_tokens: 900
  prompt_cache_hit: 25%

watch:
  - cache price
  - model authenticity
  - rate limit
  - pricing update date

Shortlist

Claude Sonnet 中转站候选