语音大模型
模型简介
阶跃星辰语音模型基于业界先进的语音生成等技术,开放 TTS 接口,帮助用户实现音频相关能力。可应用于智能客服、有声阅读、音视频创作、游戏NPC等应用场景。
目前主要提供以下模型,详细介绍可查看各模型目录下的说明文档:
step-tts-mini
该模型具有强大的文字转语音能力,在中英文混合输入场景表现突出,可广泛应用于有声阅读、音视频创作等场景。
使用限制
- 单次请求支持的最大字符数:tts模型单次最多支持输入 1000 个字符。
- 输出格式:支持wav、mp3、flac、oups,默认为mp3格式。
模型快速入门
音频合成开发指南