文档
定价计费
计费介绍

计费介绍

计费概念

计费单元

Token:代表常见的字符序列,是模型表示自然语言文本的基本单位,单个Token可以是1个中文词语、1个中文短语或者是1个英文单词。 一般来说,对于一段通用的中文文本,Token和字数的换算比例大约为1:1.6,实际处理Token数量以模型调用返回为准,可从返回结果的usage中的prompt_tokenscompletion_tokenstotal_tokens分别获取相应的Token统计。

计费策略

计费逻辑

我们会根据模型的输入和输出的总Token数实行按量计费,如果使用了多模态大模型,我们会按照图片的数量进行按每个图片400Token消耗进行核算,最终按Token的总用量进行计费。 费用扣减的方式是通过 Token使用量 x 模型单价 计算扣减费用,按顺序从赠送账户和充值账户进行扣减。赠送金额会存在过期时间,建议用户按需尽快使用。

限速逻辑

速率限制是API的常见做法,实施速率限制有以下几个不同考量:

  • 有助于防止API被滥用或误用。例如,恶意行为者可能会向API发送大量请求,以尝试使API服务过载或导致服务中断。通过设置速率限制,可以一定程度防范这种行为。
  • 速率限制有助于确保每个人都能公平地访问API。如果一个人或组织发出过多请求,可能会使API对其他人的使用变得缓慢。通过限制单个用户可以发出的请求数量,我们可以确保大多数人有机会使用API,而不会遇到响应过慢问题。
  • 速率限制可以帮助我们管理基础设施的总体负载。如果对API的请求数量急剧增加,可能会使服务器负担过载并导致性能问题。通过设置速率限制,我们可以帮助为所有用户保持平稳和一致的体验。