文档
模型列表
文生图模型

文生图模型

模型简介

文生图模型是一种基于深度学习的模型,能够根据给定的文本描述或其他形式的输入,生成高质量、多样化的图像。生图模型在艺术创作、设计、游戏开发等领域具有广泛的应用前景。

当前阶跃星辰已推出step-1x系列生图模型:

step-1x
该模型拥有强大的图像生成能力,支持文本描述作为输入方式。具备原生的中文支持,能够更好的理解和处理中文文本描述,并且能够更准确地捕捉文本描述中的语义信息,并将其转化为图像特征,从而实现更精准的图像生成。模型能够根据输入生成高分辨率、高质量的图像,并具备一定的风格迁移能力。

关键术语

  1. 图像分辨率:指生成图像的长宽像素数量,分辨率越高,图像细节越丰富,但生成时间和计算资源消耗也会增加。
  2. 图像风格:指生成图像所呈现的视觉特征和艺术效果,如写实风格、抽象风格、卡通风格等。
  3. 输入描述:指用户向模型提供的关于所需生成图像的文字描述或示例图像,描述越详细、准确,生成的图像越符合预期。
  4. 模型参数量:一般来说,参数量越大,模型的表达能力越强,能够捕捉到更丰富的图像细节和特征,从而生成更高质量的图像。目前step-1x提供2B参数量模型。

使用限制

  1. 支持的输入格式:使用自然语言描述所需生成图像的内容、风格等信息。
  2. 单次请求生成图像数量上限:step-1x系列模型限制了单次请求生成的图像数量,单次最多可请求生成1张图像。
  3. 生成图像分辨率限制:正方形:256x256, 512x512, 768x768, 1024x1024;长方形(16:9):1280x800, 800x1280
  4. 生成时间:根据输入的复杂性和模型的计算能力,生成图像可能需要一些时间。
  5. 生成质量:模型生成的图像质量可能受到多种因素的影响,如输入描述的准确性、模型的训练数据等。在某些情况下,可能需要多次尝试才能获得满意的结果。
  6. 版权和使用权:生成的图像版权和使用权归用户所有,但不得用于非法或侵犯他人权益的目的。 请注意,生图模型仍处于发展阶段,可能存在一些局限性和不确定性。在使用过程中,建议根据实际需求和场景进行评估和调整。

模型快速入门