阶跃星辰的旗舰多模态推理模型。基于 196B 总参数 / 11B 激活参数的稀疏 MoE 架构,原生支持图片和视频理解。Documentation Index
Fetch the complete documentation index at: https://platform.stepfun.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
关键信息
模型类型
稀疏 MoE 架构
196B 总参数 / 11B 激活参数
196B 总参数 / 11B 激活参数
上下文长度
256K tokens
场景定位
高速推理 + 原生多模态
智能体与代码任务优化
智能体与代码任务优化
核心能力
👁️ 原生多模态
原生支持图片和视频理解,在 Agent 框架中无需额外视觉模型,直接拖入对话框即可使用。
🚀 高速推理
稀疏 MoE 架构带来高吞吐与低延迟,适合实时智能体工作流与高频调用场景。
🛠️ 工具调用
可靠的工具调用能力,支持多步任务分解与计划执行。
🎯 高完成度复杂任务
面向代码生成、方案规划、视觉转工作流等复杂任务,单次调用即可产出更完整的计划、代码与文档,减少中途反复调试。
推理强度
step-3.7-flash 支持三档推理强度,可根据任务复杂度灵活选择:
| 推理强度 | 适用场景 |
|---|---|
low | 简单问答、摘要、改写、信息抽取 |
medium | 默认推荐,适合一般推理和多步骤任务 |
high | 复杂推理、数学、规划、代码分析 |
Chat Completions API 使用
reasoning_effort 控制推理强度;Messages API 使用 output_config.effort。完整调用示例见 快速上手指南。开始使用
多模态快速上手
从图片、视频、本地文件和推理强度控制开始接入。
场景示例
查看白板转计划、图表转数据、票据转表格等任务模板。
手机操作 Agent
通过 GELab-Zero 连接 Android 真机,让模型基于屏幕截图规划操作。
Chat Completion
POST /v1/chat/completionsOpenAI 协议兼容,支持流式与工具调用。
Messages
POST /v1/messagesAnthropic 协议兼容,可直接复用 Anthropic SDK。
定价
| 计费项 | 单价(每百万 tokens) |
|---|---|
| 输入(缓存命中) | 0.27 元 |
| 输入(缓存未命中) | 1.35 元 |
| 输出 | 8.1 元 |
框架适配
step-3.7-flash 可稳定接入主流 Coding 与 Agent 工具,适合在终端、IDE 和 Agent 工作流中完成代码生成、文件编辑与复杂任务协作。
查看 Step Plan 接入指南 →
相关阅读
推理模型开发指南
了解推理模型在复杂任务、工具调用和长上下文中的推荐用法。
图片理解最佳实践
深入了解图片理解的 API 参数、detail 设置和最佳实践。
视频理解最佳实践
深入了解视频理解的 API 参数、文件限制和常见问题。
Step 3.5 Flash
了解不含多模态能力的纯文本推理模型。