长文本语音合成优化 #3365

zhanghx0905 · 2024-12-11T03:23:09Z

例行检查

我已确认目前没有类似 features
我已确认我已升级到最新版本
我已完整查看过项目 README，已确定现有版本无法满足需求
我理解并愿意跟进此 features，协助测试和提供反馈
我理解并认可上述内容，并理解项目维护者精力有限，不遵循规则的 features 可能会被无视或直接关闭

功能描述

OpenAI 默认的 TTS（Text-to-Speech）接口对输入文本有不超过 4096 个字符的限制。当输入文本超过这个限制时，API 会返回错误。为了提升用户体验，希望项目能够自动处理超过 4096 个字符的文本，将其拆分成多个部分，分别调用 TTS API 生成音频，最后将生成的多个音频片段合并成一个完整的音频文件。

应用场景

长文本语音播放：在自动化生成语音内容的场景中，确保不会因为文本长度限制而失败，提升自动化流程的鲁棒性。

相关示例

William-715 · 2024-12-12T07:41:07Z

赞同

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

长文本语音合成优化 #3365

长文本语音合成优化 #3365

zhanghx0905 commented Dec 11, 2024

William-715 commented Dec 12, 2024

长文本语音合成优化 #3365

长文本语音合成优化 #3365

Comments

zhanghx0905 commented Dec 11, 2024

William-715 commented Dec 12, 2024