扩充词表后，如何做增量预训练 #108

mc112611 · 2024-09-24T06:47:19Z

模型训练与精调

Llama-3-Chinese-8B（基座模型）

Linux

# 请在此处粘贴运行代码（请粘贴在本代码块里）

因为需要做某个垂直领域的llama3，由于包含很多专有词汇，直接做指令微调效果甚微。所以想请教一下如何做增量预训练。或者其他可以让llama3更适合某一专业领域的训练方法。

# 请在此处粘贴依赖情况（请粘贴在本代码块里）

# 请在此处粘贴运行日志（请粘贴在本代码块里）

The text was updated successfully, but these errors were encountered:

Provide feedback