forked from stakira/OpenUtau
-
Notifications
You must be signed in to change notification settings - Fork 28
多说话人功能说明
oxygen-dioxide edited this page Mar 2, 2023
·
2 revisions
安装并选择音源后,可使用voice color (CLR)参数快速分配每个字的说话人:
如需精细调节每个说话人的比例,点击左下角齿轮图标→“获取渲染器建议的表情”,将说话人控制曲线参数(CL01、CL02等)添加到工程中。参数的范围为0~100。
具体机制:将各个说话人的控制曲线参数求和。如果总和小于100%,则用CLR中指定的说话人补足。如果总和大于100%,则按比例缩小使总和等于100%。
以下打包方法以FemaleTriplet音源为例:
将导出的所有emb文件放置在音源文件夹中(和dsconfig.yaml放在一起。emb可以修改名称,但必须是英文)
然后在dsconfig.yaml中添加以下内容。注意:所有文本编码均为UTF-8。yaml文件的缩进很关键。建议使用具有语法检查功能的VSCode编辑yaml文件:
# 训练时使用的hidden_size,默认256
hidden_size: 256
# 说话人英文名称,与emb的文件名对应
speakers:
- opencpop
- qixuan
- xiayezi
在character.yaml中添加以下内容:
# 每个说话人为一个subbank
# color为说话人的中文名,必须以两位数字编号开头,编号必须与本文件中的顺序一致:01,02,03,04,...
# suffix为说话人的英文名,与.emb的文件名对应
# prefix和tone_ranges不可修改
subbanks:
- color: "01: Opencpop"
prefix: ''
suffix: opencpop
tone_ranges:
- C1-B7
- color: "02: 绮萱"
prefix: ''
suffix: qixuan
tone_ranges:
- C1-B7
- color: "03: 夏叶子"
prefix: ''
suffix: xiayezi
tone_ranges:
- C1-B7