复刻音色
复刻音色,本 API 可以基于之前上传的 WAV、MP3文件,复制一个新的音色,用于 TTS 生成音频。
请求地址
POST https://api.stepfun.com/v1/audio/voices
请求参数
-
model
string
required
需要使用的模型名称 -
text
string
required
音频源文件对应的文本内容 -
file_id
string
required
用于复刻音色的音频源文件的 File ID。File ID 可以通过 上传文件 获取,上传时,purpose 必须为 storage,支持文件格式为 mp3,wav。 -
sample_text
string
optional
用于生成试听音频的文本(最多支持 50 个字)。
请求响应
-
id
string
音色 ID,可用于后续的音频生成。 -
object
string
文件类型,固定为 audio.voice -
duplicated
boolean
是否重复请求。如果用户二次消费,则新增此字段,告诉用户已经创建过了。 -
sample_text
string
试听音频对应的文本 -
sample_audio
string
试听音频的 base64 格式内容,格式为 wav 格式,可转换成文件后播放。
示例
curl -L 'https://api.stepfun.com/v1/audio/voices' \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer $STEP_API_KEY" \
-d '{
"file_id":"file-Ckyl3cV09A",
"model":"step-tts-mini",
"text":"智能阶跃,十倍每一个人的可能",
"sample_text":"今天天气不错"
}'