

实现流式输出
开放平台的 Chat Completion 接口支持通过传入 stream=True,来开启流式输出内容, API 将会返回 SSE 请求内容,你可以通过解析 SSE 请求的返回结果,并将其渲染到 UI 上,来实现效果。代码示例
注意事项
- 在使用流式输出时,虽然模型返回的速度较快,但依然有等待延迟,在此期间,你可以配合 Loading 引导用户等待,以帮助用户即时获得反馈。
Documentation Index
Fetch the complete documentation index at: /docs/llms.txt
Use this file to discover all available pages before exploring further.
🎉 新模型 Step 3.7 Flash 上线——面向真实 Agent / Coding / 多模态工作流的高效率 Flash 模型。查看详情 →


from openai import OpenAI
# 初始化 阶跃星辰 Client
STEPFUN_KEY = ""
client = OpenAI(base_url="https://api.stepfun.com/v1", api_key=STEPFUN_KEY)
# 调用补全接口进行补全
stream = client.chat.completions.create(
model="step-3.7-flash",
messages=[{"role": "user", "content": "全季酒店怎么样?"}],
stream=True,
)
# 对流式返回的内容进行打印 / 渲染输出
for chunk in stream:
if chunk.choices[0].delta.content is not None:
print(chunk.choices[0].delta.content, end="")
此页面对您有帮助吗?