1022冲刺CCF-A

总事件进展

2024/11/15 第一次组会，梳理 LLM Reasoning 领域研究现状，划分研究方向
2025/4/20 回归科研，研究模型参数融合和隐空间推理

Idea💡

Can Language Models Learn to Skip Steps?

可以尝试利用 $D_0$ 和 $D_i'$构建偏好数据对，对应 $D_i'$里的答案，若存在正确且短的，就让模型偏好这个，若存在短的但是错误的就偏好原始长的且正确的

实验计划

xxx

Lzq阶段表

2025/4 隐空间推理调研

2025/4/23 阅读综述

2025/4/24 阅读论文《Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning》

外部资源链接

[llm推理相关大集合] Awesome-LLM-Strawberry
[LlamaFactory] LLaMA-Factory QuickStart
[国内下Huggingface模型的方法] 如何快速下载huggingface模型

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
lzq		lzq
wulei		wulei
公用技术文档		公用技术文档
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

1022冲刺CCF-A

总事件进展

Idea💡

实验计划

Lzq阶段表

外部资源链接

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

LeiWu7999/LLM1022

Folders and files

Latest commit

History

Repository files navigation

1022冲刺CCF-A

总事件进展

Idea💡

实验计划

Lzq阶段表

外部资源链接

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Packages