We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent e9b9866 commit e4c4986Copy full SHA for e4c4986
README.md
@@ -15,13 +15,15 @@
15
16
新增性别标注。
17
18
+---
19
20
<strong>中文古代人名(Ancient_Names_Corpus)</strong>
21
22
25万。
23
24
多个人名词典汇总。删除了罕见姓氏、和带生僻字的人名。
25
26
27
28
<strong>日文人名(Japanese_Names_Corpus)</strong>
29
@@ -31,6 +33,7 @@
31
33
32
34
数据清洗过程相见,“[日本人名数据清洗分享](https://github.com/wainshine/Chinese-Names-Corpus/issues/4)”。
35
36
37
38
<strong>翻译人名(English_Cn_Name_Corpus)</strong>
39
@@ -40,13 +43,15 @@
40
43
41
44
清洗后仍存有少量badcase,尤其是英文地名。
42
45
46
47
48
<strong>中文姓氏(Chinese_Family_Name)</strong>
49
50
1千。
51
52
从亿级人名语料中提取。删除了罕见姓氏。
53
54
55
56
<strong>中文称呼(Chinese_Relationship)</strong>
57
@@ -59,6 +64,7 @@
59
64
60
65
多个人名词典汇总。清洗后仍存有大量badcase。
61
66
67
62
68
63
69
<strong>成语词典(ChengYu_Corpus)</strong>
70
0 commit comments