多说话人功能说明

使用

安装并选择音源后，可使用voice color (CLR)参数快速分配每个字的说话人：

如需精细调节每个说话人的比例，点击左下角齿轮图标→“获取渲染器建议的表情”，将说话人控制曲线参数（CL01、CL02等）添加到工程中。参数的范围为0~100。

具体机制：将各个说话人的控制曲线参数求和。如果总和小于100%，则用CLR中指定的说话人补足。如果总和大于100%，则按比例缩小使总和等于100%。

音源打包方法

以下打包方法以FemaleTriplet音源为例：

将导出的所有emb文件放置在音源文件夹中（和dsconfig.yaml放在一起。emb可以修改名称，但必须是英文）

然后在dsconfig.yaml中添加以下内容。注意：所有文本编码均为UTF-8。yaml文件的缩进很关键。建议使用具有语法检查功能的VSCode编辑yaml文件：

# 训练时使用的hidden_size，默认256
hidden_size: 256
# 说话人英文名称，与emb的文件名对应
speakers:
  - opencpop
  - qixuan
  - xiayezi

在character.yaml中添加以下内容：

# 每个说话人为一个subbank
# color为说话人的中文名，必须以两位数字编号开头，编号必须与本文件中的顺序一致：01,02,03,04,...
# suffix为说话人的英文名，与.emb的文件名对应
# prefix和tone_ranges不可修改
subbanks:
- color: "01: Opencpop"
  prefix: ''
  suffix: opencpop
  tone_ranges:
  - C1-B7
- color: "02: 绮萱"
  prefix: ''
  suffix: qixuan
  tone_ranges:
  - C1-B7
- color: "03: 夏叶子"
  prefix: ''
  suffix: xiayezi
  tone_ranges:
  - C1-B7

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

多说话人功能说明

使用

音源打包方法

Clone this wiki locally