跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://platform.stepfun.com/docs/llms.txt

Use this file to discover all available pages before exploring further.

阶跃星辰的旗舰多模态推理模型。基于 196B 总参数 / 11B 激活参数的稀疏 MoE 架构,原生支持图片和视频理解。

关键信息

模型类型

稀疏 MoE 架构
196B 总参数 / 11B 激活参数

上下文长度

256K tokens

场景定位

高速推理 + 原生多模态
智能体与代码任务优化

核心能力

👁️ 原生多模态

原生支持图片和视频理解,在 Agent 框架中无需额外视觉模型,直接拖入对话框即可使用。

🚀 高速推理

稀疏 MoE 架构带来高吞吐与低延迟,适合实时智能体工作流与高频调用场景。

🛠️ 工具调用

可靠的工具调用能力,支持多步任务分解与计划执行。

🎯 高完成度复杂任务

面向代码生成、方案规划、视觉转工作流等复杂任务,单次调用即可产出更完整的计划、代码与文档,减少中途反复调试。

推理强度

step-3.7-flash 支持三档推理强度,可根据任务复杂度灵活选择:
推理强度适用场景
low简单问答、摘要、改写、信息抽取
medium默认推荐,适合一般推理和多步骤任务
high复杂推理、数学、规划、代码分析
Chat Completions API 使用 reasoning_effort 控制推理强度;Messages API 使用 output_config.effort。完整调用示例见 快速上手指南

开始使用

多模态快速上手

从图片、视频、本地文件和推理强度控制开始接入。

场景示例

查看白板转计划、图表转数据、票据转表格等任务模板。

手机操作 Agent

通过 GELab-Zero 连接 Android 真机,让模型基于屏幕截图规划操作。

Chat Completion

POST /v1/chat/completions
OpenAI 协议兼容,支持流式与工具调用。

Messages

POST /v1/messages
Anthropic 协议兼容,可直接复用 Anthropic SDK。

定价

计费项单价(每百万 tokens)
输入(缓存命中)0.27 元
输入(缓存未命中)1.35 元
输出8.1 元

框架适配

step-3.7-flash 可稳定接入主流 Coding 与 Agent 工具,适合在终端、IDE 和 Agent 工作流中完成代码生成、文件编辑与复杂任务协作。 查看 Step Plan 接入指南 →

相关阅读

推理模型开发指南

了解推理模型在复杂任务、工具调用和长上下文中的推荐用法。

图片理解最佳实践

深入了解图片理解的 API 参数、detail 设置和最佳实践。

视频理解最佳实践

深入了解视频理解的 API 参数、文件限制和常见问题。

Step 3.5 Flash

了解不含多模态能力的纯文本推理模型。