> ## Documentation Index
> Fetch the complete documentation index at: https://platform.stepfun.com/docs/llms.txt
> Use this file to discover all available pages before exploring further.

# 定价与限速

## 定价明细

### 多模态推理大模型的定价表

| 模型               | 计费单位      | 输入价格(缓存未命中) | 输入价格(缓存命中) | 输出价格 |
| :--------------- | --------- | ----------- | ---------- | ---- |
| `step-3.7-flash` | 1M tokens | 1.35元       | 0.27元      | 8.1元 |

此处 1M= 1,000,000

### 推理大模型的定价表

| 模型               | 计费单位      | 输入价格(缓存未命中) | 输入价格(缓存命中) | 输出价格 |
| ---------------- | --------- | ----------- | ---------- | ---- |
| `step-3.5-flash` | 1M tokens | 0.7元        | 0.14元      | 2.1元 |

此处 1M= 1,000,000

### 视觉大模型的定价表

| 模型                     | 计费单位      | 输入价格(缓存未命中) | 输入价格(缓存命中) | 输出价格 |
| :--------------------- | --------- | ----------- | ---------- | ---- |
| `step-1o-turbo-vision` | 1M tokens | 2.5元        | 0.5元       | 8元   |

此处 1M= 1,000,000

与文本输入一样，图像输入是以 token 计量和收费的。目前默认情况下每张图片输入的 token 数为169 tokens，开启 detail 模式后，根据图片大小计算 token。

### 端到端语音模型定价表

| 模型                       | 计费单位      | 输入价格(缓存未命中) | 输入价格(缓存命中) | 输出价格 |
| :----------------------- | --------- | ----------- | ---------- | ---- |
| `stepaudio-2.5-realtime` | 1M tokens | 10元         | 2元         | 70元  |
| `stepaudio-2.5-chat`     | 1M tokens | 10元         | 2元         | 25元  |
| `step-1o-audio`          | 1M tokens | 25元         | 5元         | 60元  |
| `step-audio-2`           | 1M tokens | 10元         | 2元         | 70元  |
| `step-audio-r1.1`        | 1M tokens | 限免中         | 限免中        | 限免中  |

此处 1M= 1,000,000

与文本输入一样，语音输入是以 token 计量和收费的。目前聊天 1 小时成本约为 3.8 元，实际会跟随设定的 system prompt、对话内容有所增长。

### 语音模型的定价表

| 模型                                                   | 模型类型           | 单价                             |
| :--------------------------------------------------- | -------------- | ------------------------------ |
| `stepaudio-2.5-tts`                                  | 基于语境理解的文本转语音模型 | 5.8 元/万字符                      |
| `step-tts-2`                                         | 新一代文本转语音模型     | 2.8 元/万字符                      |
| `step-tts-mini`                                      | 文本转语音模型        | 0.9 元/万字符                      |
| `stepaudio-2.5-tts` / `step-tts-2` / `step-tts-mini` | 语音复刻模型         | 9.9 元/音色，试听接口仅收合成费用；正式复刻成功立即收费 |
| `stepaudio-2.5-asr`                                  | 语音识别模型         | 0.15元/小时                       |
| `stepaudio-2-asr-pro`                                | 语音识别模型         | 2元/小时                          |
| `step-asr`                                           | 语音识别模型         | 0.9元/小时                        |
| `step-asr-1.1`                                       | 语音识别模型         | 2.2元/小时                        |
| `step-asr-1.1-stream`                                | 流式语音识别模型       | 2.6元/小时                        |

此处1个汉字算1个字符，两个英文字母算1个字符，两个标点符号算1个字符。

### 文生图 Step 1X 的定价表

| 模型                  | 计费单位（1张） |
| :------------------ | -------- |
| `step-2x-large`     | 0.1元     |
| `step-image-edit-2` | 0.02元    |

此处以生成图片的张数计量和收费，单次默认生成1张。

`step-2x-large` 已于 2026 年 06 月 12 日结束限时免费，按 `0.1 元/张` 计费。

### 增值能力的定价表

|   模型  | 计费单位（1次）   |
| :---: | ---------- |
| 互联网搜索 | 0.04 元     |
|  文件存储 | 0.5 元/GB/天 |

此处以实际调用增值能力的次数计费。

## 阶梯限速

### 充值与限速表

为了整体资源分配的公平性，同时防止恶意攻击，我们会根据您拥有的账户累计充值金额实施相应的速率限制策略。具体如下表：

| 用户等级 | 累计充值金额  | 并发     | RPM     | TPM         |
| :--: | :------ | :----- | :------ | :---------- |
|  V0  | ¥0      | 5      | 10      | 5,000,000   |
|  V1  | ¥100    | 100    | 1,000   | 20,000,000  |
|  V2  | ¥500    | 200    | 5,000   | 30,000,000  |
|  V3  | ¥2,000  | 400    | 10,000  | 40,000,000  |
|  V4  | ¥5,000  | 1,000  | 20,000  | 50,000,000  |
|  V5  | ¥10,000 | 10,000 | 200,000 | 100,000,000 |

### 概念说明

* 并发: 同一时间内请求的数量
* RPM: request per minute 指一分钟内您最多向我们发起的请求数
* TPM: token per minute 指一分钟内您最多和我们交互的 token 数

### 特殊说明

* 我们默认的限速是为了更公平合理地分配资源。如果您认为有必要提升更高的更稳定的限速，请提前联系我们的工作人员，我们会在2个工作日内答复您。联系邮箱：[platform@stepfun.com](mailto:platform@stepfun.com)
* 我们将全力保障您的正常使用，但当资源达到容量上限时，我们可能会采取临时的限流措施，对各类限速进行调整。
