GitHub - jasoncao11/nlp-notebook: NLP 领域常见任务的实现，包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。

项目描述

NLP 领域常见任务的实现，包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、文本生成、句子相似度判断、三元组抽取、预训练模型等。

依赖

python 3.7
pytorch 1.8.0
torchtext 0.9.1
optuna 2.6.0
transformers 3.0.2

Name		Name	Last commit message	Last commit date
Latest commit History 393 Commits
0-1.WordsDiscovery		0-1.WordsDiscovery
1-1.Word2Vec		1-1.Word2Vec
1-2.Glove		1-2.Glove
2-1.TextCNN		2-1.TextCNN
2-2.FastText		2-2.FastText
2-3.TextRCNN		2-3.TextRCNN
2-4.TextRNN_Att		2-4.TextRNN_Att
2-5.DPCNN		2-5.DPCNN
2-6.XGboost		2-6.XGboost
2-7.Distill_finetune_Bert		2-7.Distill_finetune_Bert
2-8.Pattern-Exploiting-Training		2-8.Pattern-Exploiting-Training
2-9.R-drop		2-9.R-drop
3-1.Bert-MRC		3-1.Bert-MRC
3-2.Bert-CRF		3-2.Bert-CRF
3-3.Bert-Label-Semantics		3-3.Bert-Label-Semantics
3-4.Bert-MLM		3-4.Bert-MLM
4-1.Seq2seq		4-1.Seq2seq
4-2.Seq2seq_Att		4-2.Seq2seq_Att
4-3.Transformer		4-3.Transformer
4-4.GPT		4-4.GPT
4-5.Bert-seq2seq		4-5.Bert-seq2seq
4-6.Bert-extractive-summarizer		4-6.Bert-extractive-summarizer
5.Sentence-Similarity		5.Sentence-Similarity
6.MultiLabel-Classification		6.MultiLabel-Classification
7.Relation-Extraction		7.Relation-Extraction
8.Pretrained-Language-Model		8.Pretrained-Language-Model
9.P-tuning		9.P-tuning
PaperwithCode		PaperwithCode
QA		QA
Tricks		Tricks
algo		algo
data		data
images		images
LICENSE		LICENSE
README.md		README.md

数据集	数据量
训练集	56700
验证集	7000
测试集	6300

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

项目描述

依赖

目录

0. 新词发现算法

1. 词向量

2. 文本分类 (每个模型内部使用optuna进行调参)

3. 实体识别NER

4. 文本摘要生成

1). 生成式

2). 抽取式

5. 句子相似度判别

6. 多标签分类

7. 三元组抽取

8. 预训练模型(ELECTRA + SimCSE)

9. 提示学习

10. PaperwithCode

11. QA

About

Releases

Packages

Languages

License

jasoncao11/nlp-notebook

Folders and files

Latest commit

History

Repository files navigation

项目描述

依赖

目录

0. 新词发现算法

1. 词向量

2. 文本分类 (每个模型内部使用optuna进行调参)

3. 实体识别NER

4. 文本摘要生成

1). 生成式

2). 抽取式

5. 句子相似度判别

6. 多标签分类

7. 三元组抽取

8. 预训练模型(ELECTRA + SimCSE)

9. 提示学习

10. PaperwithCode

11. QA

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages