LLM Research

Enjoy LLM.

项目简介

我们致力于建立一个LLM论文解读笔记仓库，我们将集结LLM领域的经典论文，然后为这些论文提供解读笔记。

通过LLM Research，研究人员可以迅速查阅到LLM领域的重要论文，无需费时费力地查找和筛选。此外，针对(只想粗略浏览LLM领域学术前沿的核心思想的)其他方向的研究人员，本仓库也提供了这些重点论文的相应解读笔记(每篇笔记分为TLDR简版和精读版)，让这部分研究人员必须不花时间去细读每篇原文。

我们已经初步组建好写作小组，并计划于近期三四个月撰写好相应文章的精读笔记。

项目受众

想细致学习LLM学习前沿的同学们。
对大模型科研感兴趣的研究人员。
仅需要对深度学习和NLP有基本了解。

项目亮点

大型语言模型在当今技术领域占据重要地位，其在自然语言处理、文本生成、信息检索等方面的广泛应用不断拓展。随着这一领域的迅速发展，我们意识到研究人员需要一个可供他们快速系统了解LLM基础论文的解读笔记仓库。

如今有许多LLM领域的研究论文，但为了获取全面的了解，研究人员往往需要花费大量时间筛选和阅读这些基础文献。LLM Research 的创立旨在为研究人员提供一个便捷的途径，集结LLM领域的经典论文，并提供论文的解读笔记供简单了解or深入学习这些论文。这种深度解析旨在帮助研究人员更好地理解论文的核心概念，并提供有深度的领域知识。

我们相信，通过LLM Research，研究人员可以更轻松地跟踪LLM领域的最新进展，拓展他们的知识边界。

项目规划

a. 内容规划

我们的项目旨在创建一个系统全面的LLM基础论文解读笔记仓库，以支持对大型语言模型（LLM）领域的学术前沿感兴趣的研究人员。为了实现这一目标，我们已经组建了一个由5名成员组成的小组，专注于整理、深入解析和精读LLM领域的经典论文。想加入的同学们可以加负责人微信: linjh1118_nlp

每一篇精读笔记都将涵盖论文的核心思想、方法和关键贡献，旨在为研究人员提供深刻的理解。每篇笔记将分两个章节，第一个章节是TLDR版，其中将阐述文章的motivation、innovation、insight等核心思想以及核心代码，第二个章节则是全文精读版，这章节的行文逻辑按照原文的行文逻辑来，相当于对每段文章做一个summary，重点要放在methods和discussion，为读者提供一些深度解读。

具体内容见下: 经典论文列表

b. 人力规划

我们的项目将在接下来的三到四个月内进行。在这个时间框架内，我们小组将致力于每周产出5-7篇质量过关的论文笔记。这个周产出计划的目的是确保我们能够迅速而系统地覆盖LLM领域的广泛话题，并为研究人员提供及时的资源。同时，这也有助于确保我们的笔记在质量上经过仔细审查和审核。此外，为了进一步确保笔记的质量，我们邀请了几位资深老师担任内容审核的角色。这些老师将负责审查、提供反馈，并确保每篇笔记符合标准。通过这一团队构成，我们有信心在规定时间内产出水平过关的经典论文笔记，为研究人员提供有价值的学术资源。

经典论文列表

Ch1. Parameter-Efficient Fine-Tuning
Ch2. Full Parameter Fine-Tuning
- 1. LOMO-series
Ch3. In-Context-Learning
Ch4. Prompt Engineering
Ch5. LLM-based Agent
Ch6. LLM for Other Tasks

Ch1. Parameter-Efficient Fine-Tuning

目前还没有一个仓库有系统地整理“parameter-efficient-finetuning”领域论文。所以本仓库优先整理了这方面的论文。力求覆盖peft库中的基础微调方式。

1. Low Rank Decomposition Method

Title	Date	Publication	citation	Summary	Notes	Deadline
LoRA: Low-Rank Adaptation of Large Language Models	2021-10	arXiv	1555		@林景豪	12.23
Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning (AdaLoRA)	2023-02	ICLR	55		@林景豪	12.23
LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models	2023-09	arxiv	16	Lora_series_notes	@林景豪	12.23
QLoRA: Efficient Finetuning of Quantized LLMs	2023-05	arxiv	224		@胡锦琛	1.17
Orthogonal Subspace Learning for Language Model Continual Learning(o-lora)	2023-10	arxiv			@胡锦琛	1.27
S-LoRA: Serving Thousands of Concurrent LoRA Adapters	2023-11	arxiv			@胡锦琛	2.4

2. Continuous-Prompt Learning Method

Title	Date	Publication	citation	Notes	Deadline
Prefix-Tuning: Optimizing Continuous Prompts for Generation	2021-08	ACL	1859	@余绍缘	12.30
GPT Understands, Too (P-Tuning)	2021-03	AI Open	307	@余绍缘	1.6
The Power of Scale for Parameter-Efficient Prompt Tuning (Prompt-Tuning)	2021-04	EMNLP	1683	@余绍缘	1.13
P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks	2021-10	ACL	220	@余绍缘	1.20
Late Prompt Tuning: A Late Prompt Could Be Better Than Many Prompts	2022-10	EMNLP	6	@余绍缘	1.27
Black-Box Tuning for Language-Model-as-a-Service	2022-06	ICLR	100	@余绍缘	2.4

3. Adapter Method

Title	Date	Publication	citation	Notes	Deadline
Parameter-Efficient Transfer Learning for NLP (Adapter)	2019-06	ICML	1767	@王淏	12.30
AdapterHub: A Framework for Adapting Transformers	2020-07	EMNLP		@王淏	1.6

4. Mixed Method

Title	Date	Publication	citation	Notes	Deadline
UniPELT: A Unified Framework for Parameter-Efficient Language Model Tuning	2022-05	ACL	79	@林景豪	12.30
Towards a Unified View of Parameter-Efficient Transfer Learning	2022 -02	ICLR (spotlight)	385	@林景豪	12.30

Ch2. Full Parameter Fine-Tuning

1. LOMO-series

Title	Date	Publication	citation	Notes	Deadline
Full Parameter Fine-tuning for Large Language Models with Limited Resources	2023-06	arXiv	7	@王淏	12.23
AdaLomo: Low-memory Optimization with Adaptive Learning Rate	2023-10	arXiv		@王淏	12.30

Ch3. In-Context-Learning

Title	Date	Publication	citation	Notes	Deadline
Chain of Thought Prompting Elicits Reasoning in Large Language Models	2023-01	Nips2022	2141	@袁鑫喆	12.30
Challenging BIG-Bench Tasks and Whether Chain-of-Thought Can Solve Them	2022-10	ACL2022	62	@袁鑫喆	1.6
Automatic Chain of Thought Prompting in Large Language Models	2022-10	ICLR2022	200	@袁鑫喆	1.13
Multimodal Chain-of-Thought Reasoning in Language Models	2023-02	arxiv	100	@袁鑫喆	1.20

Ch4. Prompt Engineering

Title	Date	Publication	citation	Notes	Deadline
Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing	2021-07	ACM Computing Surveys	1640	＠胡锦琛	12.30
Exploring Lottery Prompts for Pre-trained Language Models	2023-05	ACL	1	＠胡锦琛	1.6
Making Pre-trained Language Models Better Few-shot Learners	2021-06	ACL	1159	＠胡锦琛	1.13

Ch5. LLM-based Agent

Title	Date	Publication	citation	Notes	Deadline
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs	2023-10	arxiv	53	@王淏	1.6
AgentBench: Evaluating LLMs as Agents	2023-10	arxiv	12	@王淏	1.6
The Rise and Potential of Large Language Model Based Agents: A Survey	2023-09	arxiv	43	@林景豪	1.6
Reflexion: Language Agents with Verbal Reinforcement Learning	2023-06	arxiv	1640	@林景豪	1.6
CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society	2023-11	Nips	61	@林景豪	1.13
Generative Agents: Interactive Simulacra of Human Behavior	2023-08	arxiv	263	@林景豪	1.13
Language Models can Solve Computer Tasks	2023-11	Nips	62	@王淏	1.13
ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate	2023-08	arxiv	29	@王淏	1.13
Improving Factuality and Reasoning in Language Models through Multiagent Debate	2023-05	arxiv	75	@王淏	1.20
Self-collaboration Code Generation via ChatGPT	2023-05	arxiv	34	@王淏	1.20
Exploring Large Language Models for Communication Games: An Empirical Study on Werewolf	2023-09	arxiv	10	@林景豪	1.20
Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents	2023-10	Nips	79	@林景豪	1.20

Ch6. LLM for Other Tasks

6.1 Relation Extraction

Title	Date	Publication	citation	Notes	Deadline
Revisiting Relation Extraction in the era of Large Language Models	2023-05	ACL	14	@王淏	1.20

6.2 Graph Learning

Title	Date	Publication	Notes	Deadline
G-Adapter: Towards Structure-Aware Parameter-Efficient Transfer Learning for Graph Transformer Networks	2023-05	arXiv	@袁鑫喆	1.20

6.3 Knowledge Graph Reasoning

Title	Date	Publication	Notes	Deadline
Making Large Language Models Perform Better in Knowledge Graph Completion (KoPA from ZJU)	2023-10	arXiv	@林景豪	1.20

At last

项目负责人

林景豪-项目负责人&核心内容创作者（东北大学研究生）微信: linjh1118_nlp
王淏-项目负责人&核心内容创作者（协和医学院医工所研究生）微信: Wandering_42

核心贡献者

余绍缘核心内容创作者 (吉林大学)
袁鑫喆核心内容创作者 (吉林大学)
胡锦琛核心内容创作者 (吉林大学)
吉林大学车浩源，李昊天，段云娜老师们核心内容创作者&审核者
东北大学张富，程经纬老师们核心内容创作者&审核者

核心审查者

非常感谢导师们仔细审查了本仓库的所有笔记内容，感谢他们的大力支持，同时也感谢吉林大学机器人梦工厂和东北大学IDKE实验室的伙伴们的大力支持
非常感谢datawhale组织的好大哥 谢文睿，范晶晶等对本项目的全程支持。

How to contact me?

If you have any questions or want to join us, please do not hesitate to contact me [email protected].

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
Lora		Lora
docs		docs
images		images
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Research

项目简介

项目受众

项目亮点

项目规划

a. 内容规划

b. 人力规划

经典论文列表

Ch1. Parameter-Efficient Fine-Tuning

1. Low Rank Decomposition Method

2. Continuous-Prompt Learning Method

3. Adapter Method

4. Mixed Method

Ch2. Full Parameter Fine-Tuning

1. LOMO-series

Ch3. In-Context-Learning

Ch4. Prompt Engineering

Ch5. LLM-based Agent

Ch6. LLM for Other Tasks

6.1 Relation Extraction

6.2 Graph Learning

6.3 Knowledge Graph Reasoning

At last

相关LLM学习仓库传送门

About

Releases

Packages

TinderZ/llm-research

Folders and files

Latest commit

History

Repository files navigation

LLM Research

项目简介

项目受众

项目亮点

项目规划

a. 内容规划

b. 人力规划

经典论文列表

Ch1. Parameter-Efficient Fine-Tuning

1. Low Rank Decomposition Method

2. Continuous-Prompt Learning Method

3. Adapter Method

4. Mixed Method

Ch2. Full Parameter Fine-Tuning

1. LOMO-series

Ch3. In-Context-Learning

Ch4. Prompt Engineering

Ch5. LLM-based Agent

Ch6. LLM for Other Tasks

6.1 Relation Extraction

6.2 Graph Learning

6.3 Knowledge Graph Reasoning

At last

相关LLM学习仓库传送门

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages