Skip to content

Commit

Permalink
更新词库
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed May 5, 2023
1 parent 7a0c1b2 commit 0087e13
Show file tree
Hide file tree
Showing 33 changed files with 547,821 additions and 75,754 deletions.
6 changes: 6 additions & 0 deletions docs/corrections.md
Original file line number Diff line number Diff line change
Expand Up @@ -7,6 +7,12 @@ nav_order: 99
<!-- omit in toc -->
# 宇浩输入法拆分校正历史

## 2023年5月4日

将「𮓡」头认定为「虍」的异体。一共影响全字集20个字:𭄏𭅍𭇢𭞐𭞥𭟾𭸣𭸮𭾐𮉗𮎗𮓘𮓙𮓜𮓠𮓡𮓥𮙟𮬗𱮫

修正部分简码错误。

## 2023年5月2日

修正拆分:
Expand Down
15 changes: 9 additions & 6 deletions docs/install.md
Original file line number Diff line number Diff line change
Expand Up @@ -74,12 +74,15 @@ nav_order: 2

- yuhao.schema.yaml 给熟手的方案,默认关闭拆分提示、常用字优先。
- yuhao_tradition.schema.yaml 传统汉字方案,默认关闭拆分提示、常用字优先。
- yuhao.dict.yaml 主码表,包含宇浩一级简体词库。
- yuhao_tradition.dict.yaml 传统汉字字典文件。
- yuhao.words_l1.dict.yaml 宇浩一级简体词库:约50000个词语,频率较高。
- yuhao.words_l2.dict.yaml 宇浩二级简体词库:约25000个词语,频率较低。
- yuhao.words_l3.dict.yaml 宇浩三级简体词库:约20000个词语,多为成语和古诗词,除非有特殊需求,否则不建议开启。
- yuhao.words_tc.dict.yaml 宇浩繁体词库:约30000个核心词语,包括台湾、香港、大陆古籍繁体三种字形。
- yuhao.dict.yaml 简化字优先主码表。
- yuhao_tradition.dict.yaml 传统汉字优先主码表。
- yuhao.quick.dict.yaml 简化字简码码表。
- yuhao_tradition.quick.dict.yaml 传统汉字简码码表。
- yuhao.full.dict.yaml 单字全码码表。
- yuhao.words 宇浩核心简体词库。约50000个词语,频率较高。
- yuhao.words_extended 宇浩增广简体词库。约45000个词语,频率较低,多为成语和古诗词,除非有特殊需求,否则不建议开启。
- yuhao_tradition.words 宇浩核心繁体词库,包括台湾、香港、大陆古籍繁体三种字形。约50000个词语,频率较高。
- yuhao_tradition.words_extended 宇浩增广繁体词库。约45000个词语,频率较低,多为成语和古诗词,除非有特殊需求,否则不建议开启。
- yuhao.symbols.dict.yaml 特殊符号码表。
- yuhao_pinyin.schema.yaml 拼音配置文件,用于反查。
- yuhao_pinyin.dict.yaml 拼音字典文件。
Expand Down
17 changes: 11 additions & 6 deletions docs/updates.md
Original file line number Diff line number Diff line change
@@ -1,8 +1,8 @@
---
<!-- ---
title: 更新日志
layout: default
nav_order: 98
---
--- -->

<!-- omit in toc -->
# 宇浩输入法更新日志
Expand All @@ -11,13 +11,18 @@ nav_order: 98

[拆分校正历史请点击此处。](./corrections)

## 2023年5月4日
## 2023年5月5日

词库码表结构优化,现将词库分为核心和增广词库,各自分为繁简。核心词库对应了宇浩一级词库,增广词库对应了宇浩二级词库。名称如下:

增加 CJK 扩展 I 区的 603 个汉字。字形来源:https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf
- yuhao.words
- yuhao.words_extended
- yuhao_tradition.words
- yuhao_tradition.words_extended

将「𮓡」头认定为「虍」的异体。一共影响全字集20个字:𭄏𭅍𭇢𭞐𭞥𭟾𭸣𭸮𭾐𮉗𮎗𮓘𮓙𮓜𮓠𮓡𮓥𮙟𮬗𱮫
## 2023年5月4日

修正部分简码错误。
增加 CJK 扩展 I 区的 603 个汉字。字形来源:[https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf](https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf)

同步更新拆分表和在线查询系统。

Expand Down
2 changes: 1 addition & 1 deletion index.md
Original file line number Diff line number Diff line change
Expand Up @@ -143,7 +143,7 @@ nav_order: 1

宇浩三码顶是一个宇浩输入法的衍生方案,基于宇浩的字根布局和拆分数据,引入三码顶字的输入方式。由于其不改变原宇浩的布局和拆分,可以实现和宇浩标准版间的无缝切换。

作者:lost-melody
作者:王牌饼干

项目地址:https://github.com/lost-melody/rime-smyh

Expand Down
Loading

0 comments on commit 0087e13

Please sign in to comment.