step-3.7-flash;如需纯文本推理,也可以使用 step-3.5-flash。
step-3.7-flash 是阶跃星辰的旗舰多模态推理模型。在 step-3.5-flash 的高速推理与工具调用能力基础上,新增原生图片和视频理解能力,支持三档推理强度,适合 Agent、代码、多模态分析和复杂规划任务。
step-3.5-flash 是阶跃星辰最强大的开源基座模型。它专为极致效率而生,具备前沿的推理能力和卓越的智能体(Agent)性能。该模型基于稀疏混合专家(MoE)架构,尽管拥有 1960 亿参数,但处理每个 Token 时仅需选择性激活 110 亿参数。这种极高的“智能密度”使其推理深度足以媲美顶级闭源模型,同时兼顾了实时交互所需的敏捷响应速度。
推理强度控制
支持三档推理强度的模型可通过参数控制思考深度。Chat Completion API 使用reasoning_effort;Messages API 使用 output_config.effort。
| 推理强度 | 适用场景 |
|---|---|
low | 简单问答、摘要、改写、信息抽取 |
medium | 默认推荐,适合一般推理和多步骤任务 |
high | 复杂推理、数学、规划、代码分析 |
完整调用示例见 Step 3.7 Flash 快速上手。参数字段说明见 Chat Completion API 和 Messages API。
文本推理调用示例
推理模型的文本对话调用方式基本一致。以下以纯文本场景常用的step-3.5-flash 为例,构建一个流式对话。
多模态图片理解示例
以下使用最简单的代码实现step-3.7-flash 对图片进行分析。推理强度(reasoning_effort)等参数详见 Step 3.7 Flash 快速上手。
copy
获取 Reasoning 内容
阶跃星辰的推理大模型在处理复杂问题时,会在输出中包含 reasoning 字段,展示模型的思考过程。开发者可以通过判断该字段是否存在来获取模型的思考信息。通过 reasoning_content 字段,获取模型的思考过程。
如果你目前使用的推理模型中已经使用 reasoning_content 字段,可以继续使用该字段。阶跃星辰的推理模型也支持这一字段,开发者可以根据自己的需求选择使用。
只需要在请求时传入 reasoning_format="deepseek-style" 即可。(如使用 OpenAI SDK,则需要通过 extra_body 字段传入)
多模态模型使用注意事项
- 深度思考优势:模型在接收到图片及文字提示后,会首先经过内部思考(reasoning)再输出最终结果。这一过程有助于完成复杂的关联和因果推理,但可能会使响应时间略有延迟,应据此考虑超时设置。
- 图片数据格式:确保传入的图片数据使用正确的 Base64 编码格式,并按照 API 要求指定图片类型(如 JPG/JPEG、PNG、静态 GIF、WebP 等)和细节参数,保证推理的准确性。详见文档
- 错误处理与日志记录:在输出时已加入 Trace ID,若遇到模型推理问题,可将此 ID 反馈给我们。
智能路由(Step Plan 专属)
step-router-v1 是阶跃星辰为 Step Plan 通道提供的智能路由模型,按请求特征自动在 deepseek-v4-pro 与 step-3.5-flash 之间切换,让复杂决策走 Pro、高频执行走 Flash。详细使用方式与最佳实践见 Step Router V1 智能路由开发指南。