Documentation Index
Fetch the complete documentation index at: https://platform.stepfun.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
模型概览
推理大模型拥有深度思考的推理能力,擅长处理逻辑推理、数学、代码等任务。模型列表
Step 3.7 Flash
推荐使用。阶跃星辰的旗舰多模态推理模型。在step-3.5-flash 的高速推理与工具调用能力基础上,新增原生多模态输入能力,可直接理解图片和视频内容,无需借助视觉 MCP 或额外模型。基于 198B 总参数 / 11B 激活参数的稀疏 MoE 架构,支持三档推理强度(low/medium/high),是智能体、代码与多模态场景的快且可依赖的模型。上下文长度为 256K。
查看详细文档 →
Step 3.5 Flash
纯文本推理。阶跃星辰的旗舰语言推理模型。该模型具备顶尖推理能力与快速可靠的执行能力。能够完成对复杂任务的分解、计划,可快速可靠地调用工具执行任务,胜任逻辑推理、数学、软件工程、深度研究等各种复杂任务。上下文长度为 256K。模型上下文长度
模型的上下文长度是指在进行一次特定的推理时,模型在生成响应之前可以”回顾”和”理解”的输入内容的长度。这个参数决定了模型能够记住和参考多少先前的信息。较长的上下文长度允许模型在生成响应时利用更多的历史信息,从而提高生成文本的连贯性和准确性。需要注意的是,长度同时限制了模型输入和输出,即输入和输出的总长度不能超过模型上下文限制。| 模型 | 上下文长度 |
|---|---|
| Step 3.7 Flash | 256K |
| Step 3.5 Flash | 256K |
模型快速入门
推理模型开发指南
了解推理模型在复杂任务、工具调用和长上下文中的推荐用法。
从 OpenAI 迁移至阶跃星辰
使用兼容 OpenAI 的调用方式,快速切换到阶跃星辰模型。
实现多轮对话
管理消息历史与上下文,构建稳定的多轮对话体验。
实现文档问答
解析文档内容并结合文本模型完成问答、抽取和理解任务。
输出 JSON
让模型输出可解析的结构化 JSON,便于和应用逻辑集成。
流式输出
通过流式返回逐步渲染结果,缩短用户感知等待时间。
实现 Tool Call
让模型调用搜索、数据库或业务函数,扩展应用能力。
实现联网搜索
接入互联网搜索,为模型补充最新信息与外部知识。
Prompt 缓存
复用重复上下文,降低成本并提升长对话场景响应速度。