这是一个用于上传参考音频创建自定义音色的工具,适用于硅基流动API。通过简单的界面操作,您可以轻松上传音频文件,创建专属于您的AI语音音色。 硅基流动文档
- 简洁直观的用户界面
- 支持多种音频格式上传
- 支持选择不同的模型
- 自动验证API密钥
- 提供详细的上传结果信息
- 查询已上传的音频ID
- Python 3.7+
-
克隆或下载本仓库
git clone https://github.com/flyhunterl/SiliconflowVoiceUpLoad.git cd SiliconflowVoiceUpLoad -
安装Python依赖
pip install -r requirements.txt -
运行程序
python upload.py
- 启动应用后,您将看到一个简洁的界面
- 输入您的API Key(从硅基流动控制台获取)
- 上传参考音频文件(支持mp3、wav等格式)
- 选择模型名称
- 为您的音色取一个名字
- 输入音频中说的文字内容(尽量准确匹配音频内容)
- 点击"提交上传"按钮
- 上传成功后,您将获得一个音色ID,可用于后续请求
- 重要:使用自定义音色功能需要完成实名认证
- 音频文件应清晰无噪音,时长建议在5-30秒之间
- 文字内容应与音频内容精确匹配,这将影响克隆音色的质量
- 上传过程可能需要一些时间,请耐心等待
- 非本地使用请把代码中的server_name="127.0.0.1",改成server_name="0.0.0.0",
A: 请检查以下几点:
- API Key是否正确
- 网络连接是否正常
- 音频文件是否符合要求
- 是否已完成实名认证
A: 登录硅基流动控制台,在API密钥管理页面获取。
A: 支持常见的音频格式,如mp3、wav、ogg等。
欢迎贡献代码或提出建议!请遵循以下步骤:
- Fork本仓库
- 创建您的特性分支 (
git checkout -b feature/amazing-feature) - 提交您的更改 (
git commit -m 'Add some amazing feature') - 推送到分支 (
git push origin feature/amazing-feature) - 开启一个Pull Request
您的打赏能让我在下一顿的泡面里加上一根火腿肠。
本项目采用MIT许可证 - 详见LICENSE文件
- 作者博客:https://llingfei.com
- 问题反馈:请在GitHub Issues提交
