请求地址
POST https://api.stepfun.com/v1/images/generations
请求参数
-
modelstringrequired
需要使用的模型名称,当前支持:step-image-edit-2(推荐)step-2x-largestep-1x-medium
-
promptstringrequired
图像的文本描述。step-image-edit-2:最大长度为 512 个字符。step-2x-large:最大长度为 512 个字符。step-1x-medium:最大长度为 512 个字符。
-
sizestringoptional
生成的图片的大小,默认为1024x1024。不同模型支持的取值如下:step-image-edit-2(格式为height x width,不是width x height):- 正方形:1024x1024
- 长方形:768x1360, 896x1184, 1360x768, 1184x896
step-2x-large:- 正方形:256x256, 512x512, 768x768, 1024x1024
- 长方形(16:9):1280x800, 800x1280
step-1x-medium:- 正方形:256x256, 512x512, 768x768, 1024x1024
- 长方形(16:9):1280x800, 800x1280
-
nintoptional
生成的图片数量,当前仅支持每次生成一张图片。 -
response_formatstringoptional
生成的图片返回的格式。支持参数为b64_json或url。默认为url。 -
seedintoptional
随机种子。step-image-edit-2:取值范围[0, 2147483647];若不传,服务端会随机生成一个种子。step-2x-large:当不传或传入为 0 时,使用系统随机生成的种子。step-1x-medium:当不传或传入为 0 时,使用系统随机生成的种子。
-
stepsintoptional
生成步数。step-image-edit-2:取值范围[1, 50]。默认为 8。step-2x-large:取值范围[1, 50]。默认为 50。step-1x-medium:取值范围[1, 50]。默认为 50。
-
cfg_scalefloatoptional
classifier-free guidance scale。step-image-edit-2:必须 >= 1.0,取值范围[1.0, 10.0]。默认为 1.0。step-2x-large:取值范围[1, 10]。默认为 6。step-1x-medium:支持 1 ~ 10 之间的数字。默认为 7.5。
-
negative_promptstringoptional
负面提示词,仅step-image-edit-2支持。字符数不超过 512,默认""。若cfg_scale = 1.0,当前实现不会把负面提示词传给底层模型。 -
text_modebooloptional
针对文字场景的优化策略,仅step-image-edit-2支持。默认False,按需开启。 -
style_referenceobjectoptional
风格参考参数,仅step-1x-medium支持。
请求响应
createdint
创建图片时的时间戳,精确到秒级别dataobject array
计算 token 返回数据 -seedint
生成时传入的 Seed 或系统随机生成的 Seed。相同的 Seed 有助于生成类似的图片。finish_reasonstring
生成停止的原因,如果为 success ,则为成功生成;为 content_filtered 表示生成成功,但命中检测所以停止。b64_jsonstring
生成的图片的 Base64 编码。当 response_format 设置为 b64_json 时,返回此字段。urlstring
生成的图片的下载链接。当 response_format 设置为 url 时,返回此字段。链接存在有效期限(当前为 30 天),建议下载保存到自己的存储以避免依赖。
示例
- python
- js
- curl
- curl (step-image-edit-2)
- curl (step-2x-large)