文档
模型列表
语音大模型

语音大模型

模型简介

阶跃星辰语音模型基于业界先进的语音生成等技术,开放 TTS 接口,帮助用户实现音频相关能力。可应用于智能客服、有声阅读、音视频创作、游戏NPC等应用场景。

目前主要提供以下模型,详细介绍可查看各模型目录下的说明文档:

step-tts-mini
该模型具有强大的文字转语音能力,在中英文混合输入场景表现突出,可广泛应用于有声阅读、音视频创作等场景。

使用限制

  1. 单次请求支持的最大字符数:tts模型单次最多支持输入 1000 个字符。
  2. 输出格式:支持wav、mp3、flac、oups,默认为mp3格式。

模型快速入门


音频合成开发指南