推理模型总览

模型列表

Step 3.7 Flash

推荐使用。阶跃星辰的旗舰多模态推理模型。在 step-3.5-flash 的高速推理与工具调用能力基础上，新增原生多模态输入能力，可直接理解图片和视频内容，无需借助视觉 MCP 或额外模型。基于 198B 总参数 / 11B 激活参数的稀疏 MoE 架构，支持三档推理强度（low/medium/high），是智能体、代码与多模态场景的快且可依赖的模型。上下文长度为 256K。

Step 3.5 Flash

纯文本推理。阶跃星辰的旗舰语言推理模型。该模型具备顶尖推理能力与快速可靠的执行能力。能够完成对复杂任务的分解、计划，可快速可靠地调用工具执行任务，胜任逻辑推理、数学、软件工程、深度研究等各种复杂任务。上下文长度为 256K。

模型上下文长度

模型的上下文长度是指在进行一次特定的推理时，模型在生成响应之前可以”回顾”和”理解”的输入内容的长度。这个参数决定了模型能够记住和参考多少先前的信息。较长的上下文长度允许模型在生成响应时利用更多的历史信息，从而提高生成文本的连贯性和准确性。需要注意的是，长度同时限制了模型输入和输出，即输入和输出的总长度不能超过模型上下文限制。

模型	上下文长度
Step 3.7 Flash	256K
Step 3.5 Flash	256K

模型快速入门

推理模型开发指南

了解推理模型在复杂任务、工具调用和长上下文中的推荐用法。

从 OpenAI 迁移至阶跃星辰

使用兼容 OpenAI 的调用方式，快速切换到阶跃星辰模型。

实现多轮对话

管理消息历史与上下文，构建稳定的多轮对话体验。

实现文档问答

解析文档内容并结合文本模型完成问答、抽取和理解任务。

输出 JSON

让模型输出可解析的结构化 JSON，便于和应用逻辑集成。

流式输出

通过流式返回逐步渲染结果，缩短用户感知等待时间。

实现 Tool Call

让模型调用搜索、数据库或业务函数，扩展应用能力。

实现联网搜索

接入互联网搜索，为模型补充最新信息与外部知识。

Prompt 缓存

复用重复上下文，降低成本并提升长对话场景响应速度。

开始使用

模型列表

定价计费

条款与协议

模型概览

模型列表

Step 3.7 Flash

Step 3.5 Flash

模型上下文长度

模型快速入门

推理模型开发指南

从 OpenAI 迁移至阶跃星辰

实现多轮对话

实现文档问答

输出 JSON

流式输出

实现 Tool Call

实现联网搜索

Prompt 缓存

​模型概览

​模型列表

​Step 3.7 Flash

​Step 3.5 Flash

​模型上下文长度

​模型快速入门

推理模型开发指南

从 OpenAI 迁移至阶跃星辰

实现多轮对话

实现文档问答

输出 JSON

流式输出

实现 Tool Call

实现联网搜索

Prompt 缓存

模型概览

模型列表

Step 3.7 Flash

Step 3.5 Flash

模型上下文长度

模型快速入门