v0.6.1
‒ 新增支持Mistral-7B模型
‒ 完善CodeLLama-34B的微调/预训练适配
‒ 添加对Group Query Attention在模型转换过程中的模型并行能力的支持
‒ 优化Data模块代码结构
‒ 修复已知的Bugs
‒ 新增支持Mistral-7B模型
‒ 完善CodeLLama-34B的微调/预训练适配
‒ 添加对Group Query Attention在模型转换过程中的模型并行能力的支持
‒ 优化Data模块代码结构
‒ 修复已知的Bugs