调用 API 生成图片,并处理生成结果
在使用阶跃星辰文生图 API 时,你可以使用 OpenAI SDK 来完成调用,以 Python 为例,你可以使用如下代码来完成文生图 API 的调用。copy
url: 以https://res.stepfun.com/image_gen/为前缀的图片链接。base64: 图片的 base64 编码。
copy
垫图生成
使用场景
垫图使用场景一般为 图像随机重新生成(image variation),细节增强,同时可能支持一些小范围修改的情况,而不适合做大规模的图像修改(属于 Image Edit 的范畴),人脸保持(属于 Cref 的范畴),等等。超参参考数值
主要超参为 source_weight。当 source_weight 为 1 时,为图像完全重新生成,垫图将不起任何作用。点击查看垫图生成 API 文档
| 预期功能 | Prompt 要求 | source_weight 建议 | 备注 |
|---|---|---|---|
| 图像随机重新生成(image variation) | 尽量还原原图的描述 | 0.8 ~ 1.0 | |
| 细节增强 | 还原原图的描述的同时,增加一些质量词,例如 amazing quality,finely details | 0 ~ 0.5 | |
| 小范围修改 | 根据需要的内容写 prompt | 0.3 ~ 0.8 | 容易出现 badcase,因为图像修改主要是通过 image edit 相关的方法实现 |
示例
| 垫图输入 | prompt | source_weight | 效果图 |
|---|---|---|---|
![]() | 金毛边上有一个圣诞树,圣诞氛围,温暖的灯光 | 0.5 | ![]() |
![]() | 一幅猫的画,超高质量,细节丰富 | 0.3 | ![]() |
风格参考生成 (Sref)
使用场景
通过文本控制内容,图像提供风格进行生成。超参参考数值
主要超参为 style_reference.weight,默认设置为1,建议数值在 1 上下浮动不超过 0.5。(因为图像信息会输入给网络,过大的数值会导致参考图像的内容泄漏到生成图片中)点击查看文生图 API 文档
例子
以下测试 style_reference.weight 均为 1| prompt | 文生图直出 | 风格参数图 | 效果图 |
|---|---|---|---|
| an owl with its wings spread out swooping over a tree | ![]() | ![]() | ![]() |
| a boat in the canals of venice | ![]() | ![]() | ![]() |
其他常见用法
调整生成图片的分辨率
阶跃星辰文生图模型支持生成不同分辨率的图片,从而帮助开发者结合合适的使用场景,优化生成的图片的速度 你可以通过修改size 参数,来设置使用不同的分辨率。目前支持的分辨率有:
正方形(1:1)
- 256x256
- 512x512
- 768x768
- 1024x1024
- 1280x800
- 800x1280
优化图片的生成速度
阶跃星辰文生图模型支持多个不同的参数,其中 steps、size 会影响生成的速度和质量。steps越大,则生成的效果越好,同时消耗的算力和生成的速度也会越慢;size越大,则消耗的算力也越大,同时生成的速度会越慢;
持续生成相同风格的图片
在生成图片时,默认的seed 为 0 ,表示阶跃星辰模型将会随机生成一个 seed 用于图片生成。
在实际业务场景中,如果你有诉求让多个 Prompt 保持同一风格:比如用户生成过程中,通过不断增删 prompt 来调整生成效果,则可以在第一次使用自动生成的 seed 或自行生成一个 seed 值,并在后续的持续生成过程中保持 seed 为第一次生成返回的 seed 值,从而确保生成的图片风格和效果稳定。









