概览 - StepFun 开放平台文档中心

阶跃星辰的旗舰多模态推理模型。基于 198B 总参数 / 11B 激活参数的稀疏 MoE 架构，原生支持图片和视频理解。

关键信息

模型类型

稀疏 MoE 架构
198B 总参数 / 11B 激活参数

上下文长度

256K tokens

场景定位

高速推理 + 原生多模态
智能体与代码任务优化

核心能力

👁️ 原生多模态

原生支持图片和视频理解，在 Agent 框架中无需额外视觉模型，直接拖入对话框即可使用。

🚀 高速推理

稀疏 MoE 架构带来高吞吐与低延迟，适合实时智能体工作流与高频调用场景。

🛠️ 工具调用

可靠的工具调用能力，支持多步任务分解与计划执行。

🎯 高完成度复杂任务

面向代码生成、方案规划、视觉转工作流等复杂任务，单次调用即可产出更完整的计划、代码与文档，减少中途反复调试。

推理强度

step-3.7-flash 支持三档推理强度，可根据任务复杂度灵活选择：

推理强度	适用场景
`low`	简单问答、摘要、改写、信息抽取
`medium`	默认推荐，适合一般推理和多步骤任务
`high`	复杂推理、数学、规划、代码分析

Chat Completions API 使用 reasoning_effort 控制推理强度；Messages API 使用 output_config.effort。完整调用示例见快速上手指南。

开始使用

多模态快速上手

从图片、视频、本地文件和推理强度控制开始接入。

场景示例

查看白板转计划、图表转数据、票据转表格等任务模板。

手机操作 Agent

通过 GELab-Zero 连接 Android 真机，让模型基于屏幕截图规划操作。

Chat Completion

POST /v1/chat/completions
OpenAI 协议兼容，支持流式与工具调用。

Messages

POST /v1/messages
Anthropic 协议兼容，可直接复用 Anthropic SDK。

定价

计费项	单价（每百万 tokens）
输入（缓存命中）	0.27 元
输入（缓存未命中）	1.35 元
输出	8.1 元

框架适配

step-3.7-flash 可稳定接入主流 Coding 与 Agent 工具，适合在终端、IDE 和 Agent 工作流中完成代码生成、文件编辑与复杂任务协作。查看 Step Plan 接入指南 →

推理模型开发指南

了解推理模型在复杂任务、工具调用和长上下文中的推荐用法。

图片理解最佳实践

深入了解图片理解的 API 参数、detail 设置和最佳实践。

视频理解最佳实践

深入了解视频理解的 API 参数、文件限制和常见问题。

Step 3.5 Flash

了解不含多模态能力的纯文本推理模型。

开始使用

模型列表

定价计费

条款与协议

概览

关键信息

模型类型

上下文长度

场景定位

核心能力

👁️ 原生多模态

🚀 高速推理

🛠️ 工具调用

🎯 高完成度复杂任务

推理强度

开始使用

多模态快速上手

场景示例

手机操作 Agent

Chat Completion

Messages

定价

框架适配

相关阅读

推理模型开发指南

图片理解最佳实践

视频理解最佳实践

Step 3.5 Flash

​关键信息

模型类型

上下文长度

场景定位

​核心能力

👁️ 原生多模态

🚀 高速推理

🛠️ 工具调用

🎯 高完成度复杂任务

​推理强度

​开始使用

多模态快速上手

场景示例

手机操作 Agent

Chat Completion

Messages

​定价

​框架适配

​相关阅读

推理模型开发指南

图片理解最佳实践

视频理解最佳实践

Step 3.5 Flash

关键信息

核心能力

推理强度

开始使用

定价

框架适配

相关阅读