跳转到主要内容
阶跃星辰提供图像编辑模型,可基于用户输入的图片和 Prompt 对图片进行修改。图像编辑能力通过 /v1/images/edits 接口调用。

支持的模型

模型说明
step-image-edit-2新一代轻量级图像生成编辑模型,单次编辑任务仅需 1-2 秒,适合实时交互修图场景。输入图最大支持 4096x4096 分辨率。
完整参数、取值范围和响应结构请参考 图片编辑 API 文档

输入图要求

step-image-edit-2 对输入图的限制:
  • 分辨率:最大支持 4096x4096
  • 传入方式:支持图片的 Base64
  • 输出结果:返回和输入图一样大小的结果图

基础调用

import base64
from openai import OpenAI

client = OpenAI(api_key=STEP_API_KEY, base_url="https://api.stepfun.com/v1")

prompt = """
变成一只英短猫
"""

result = client.images.edit(
    model="step-image-edit-2",
    image=open("cat.jpg", "rb"),
    prompt=prompt,
    response_format="b64_json",
    extra_body={
        "cfg_scale": 1.0,
        "steps": 8,
        "seed": 1
    },
)

print(result)
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

with open("cat-on-rooftop.png", "wb") as f:
    f.write(image_bytes)

参数要点

  • Prompt 最大长度:512 个字符。
  • cfg_scale:默认 1.0、范围 [1.0, 10.0]
  • steps:默认 8、范围 [1, 50]
  • text_mode:针对文字场景的优化策略,按需开启,默认关闭。
  • negative_prompt:字符数不超过 512,默认 ""。若 cfg_scale = 1.0,当前实现不会把负面提示词传给底层模型。
  • response_format:支持 b64_jsonurl,默认 url

编辑 Prompt 示例

以下示例 Prompt 与效果图摘自 step-image-edit-2 的官方样例,可作为不同编辑任务的写法参考。

姿态 / 对话气泡

Prompt:让图中猫躺在地上露出肚皮,旁边有个对话气泡框写着”我错了”
输入图效果图

服装替换

Prompt:图中男性换成西装和衬衫,女性换成一个美丽的西式婚纱,头戴纱巾,两个人同时正面面向镜头
输入图效果图

常见问题

  • 返回 “消息获取失败”:在使用 step-image-edit-2 时,这种情况大概率是输入图太大(目前最大支持 4096x4096 分辨率的输入图)。
  • 错误处理:更系统的异常处理思路可参考 处理异常,让你的应用更加健壮

相关链接

图片编辑 API 文档

图片生成最佳实践