diff --git a/v1/chaifen/app.js b/cloud/chaifen/app.js similarity index 100% rename from v1/chaifen/app.js rename to cloud/chaifen/app.js diff --git a/v1/chaifen/d3.v3.min.js b/cloud/chaifen/d3.v3.min.js similarity index 100% rename from v1/chaifen/d3.v3.min.js rename to cloud/chaifen/d3.v3.min.js diff --git a/v1/chaifen/index.html b/cloud/chaifen/index.html similarity index 100% rename from v1/chaifen/index.html rename to cloud/chaifen/index.html diff --git a/v1/chaifen/styles.css b/cloud/chaifen/styles.css similarity index 100% rename from v1/chaifen/styles.css rename to cloud/chaifen/styles.css diff --git "a/v1/chaifen/\345\256\207\346\265\251\345\255\227\346\240\271\347\240\201\344\275\215\346\230\240\345\260\204\350\241\250.csv" "b/cloud/chaifen/\345\256\207\346\265\251\345\255\227\346\240\271\347\240\201\344\275\215\346\230\240\345\260\204\350\241\250.csv" similarity index 100% rename from "v1/chaifen/\345\256\207\346\265\251\345\255\227\346\240\271\347\240\201\344\275\215\346\230\240\345\260\204\350\241\250.csv" rename to "cloud/chaifen/\345\256\207\346\265\251\345\255\227\346\240\271\347\240\201\344\275\215\346\230\240\345\260\204\350\241\250.csv" diff --git "a/v1/chaifen/\345\256\207\346\265\251\350\274\270\345\205\245\346\263\225\345\205\250\346\274\242\345\255\227\346\213\206\345\210\206\350\241\250.csv" "b/cloud/chaifen/\345\256\207\346\265\251\350\274\270\345\205\245\346\263\225\345\205\250\346\274\242\345\255\227\346\213\206\345\210\206\350\241\250.csv" similarity index 100% rename from "v1/chaifen/\345\256\207\346\265\251\350\274\270\345\205\245\346\263\225\345\205\250\346\274\242\345\255\227\346\213\206\345\210\206\350\241\250.csv" rename to "cloud/chaifen/\345\256\207\346\265\251\350\274\270\345\205\245\346\263\225\345\205\250\346\274\242\345\255\227\346\213\206\345\210\206\350\241\250.csv" diff --git a/v1/practice/practice.html b/cloud/practice/practice.html similarity index 100% rename from v1/practice/practice.html rename to cloud/practice/practice.html diff --git a/v1/practice/practice_100.html b/cloud/practice/practice_100.html similarity index 100% rename from v1/practice/practice_100.html rename to cloud/practice/practice_100.html diff --git a/v1/practice/practice_characters.html b/cloud/practice/practice_characters.html similarity index 100% rename from v1/practice/practice_characters.html rename to cloud/practice/practice_characters.html diff --git a/docs/updates.md b/docs/updates.md index 0d95d220..3401de0c 100644 --- a/docs/updates.md +++ b/docs/updates.md @@ -1,9 +1,11 @@ - +本頁面主要展示「宇浩拆分」和「宇浩方案」較重大的更新。一般的更新説明可在 [release](https://github.com/forFudan/yuhao/releases) 頁面查看。 + +## 宇浩·光華和宇浩·星陳 + +### 2023年10月20日 + +v3.1.0 發佈。 + +Rime 拆分提示(快捷鍵 Ctrl + C 或反斜槓)現在顯示單字全部件拆分。如:霽 = 雨亠丷丨刀<齊右><介下>二 + +星陳方案不必依賴光華方案安裝包。 + +### 2023年10月18日 + +v3.0.0 發佈。 + +星陳方案進入穩定版。yuhao 和 yustar 發佈包大版本號升入 v3。 + +將 RIME 方案中的分詞庫置於 /yuhao 文件夾下,避免主目錄下文件過多。 + +修正若干拆分。 + +## 宇浩·光華 + +### 2023年10月1日 + +v2.5.1 發佈。 + +「𣎆𦝠𦟀」 等全部歸併入 <赢头> Uw。 + +RIME 方案關閉默認四碼唯一自動上屏,防止誤擊回删。 + +### 2023年9月24日 + +v2.5.0 發佈。 + +「襄頭」歸併到「高頭」上,無論幾個「口」。 + +「龠頭」歸併到「合」上,無論幾個「口」。 + +修正大字集中部分錯誤拆分。 + +受影響單字:嚷壤攘曩瀹瓤禳穰襄镶骧龠儴勷孃忀懹欀瀼爙爚獽瓖禴籥籲纕蘘蘥蠰讑讓躟釀鑰鑲饟驤鬤鸙龡龢龣龤龥㒢㠤㵸䉴䑋䟑䠯䶳䶵𠎘𠎤𢅹𢐿𣀮𣤸𣰶𤂃𤐯𤬞𤰂𥀶𥌉𥌺𥗝𥤉𥤖𥸤𥽬𦇬𦴁𦿈𧕋𧟄𧟇𧢢𧭆𧹊𨙄𨟚𨳃𨷲𨸎𨽢𩆶𪊊𪓃𪛊𪛋𪛌𪛍𪛏𪛒𪛓𪛔𪛕𪛖𪱒𫗵𬙋𬰰𬱳𬺟𭄜𭤑𭨑𭨣𮪟𮯘𮯠𰁬𰅴𰉰𰋙𰑌𰑝𰛬𰠱𰢙𰶏𰾂𱂪𱊵𱍉𱍊𱰓𱱰⿕ + +### 2023年9月18日 + +v2.4.8 發佈。 + +三大方案單字全碼皆使用同一碼表。在「原始排序」模式下,單字依照繁簡混合字頻排序。 + +增加簡體、陸繁、臺繁三個字集優先開關,分别前置《通規》《古籍通規》《常用國字》三大字集中的漢字。快捷鍵爲 Shift + Contrl + I。 + +修改部分簡碼。 + +### 2023年9月1日 + +v2.4.5 發佈。 + +本輸入法特殊符號現可通過 / 引導輸入。 + +### 2023年8月31日 + +v2.4.4 發佈。 + +更新 CJK-I 區的漢字編碼和拆分。本區共622個漢字。 + +### 2023年8月29日 + +v2.4.3 發佈。 + +RIME 中,只後置排名第一的簡碼字的全碼。 + +增加開關,一鍵開啓或關閉輸入預測 (Shift + Ctrl + Y)。 + +### 2023年8月27日 + +v2.4.1 發佈。 + +本次更新修正了一批錯誤拆分,不涉及常用字集。 + +### 2023年8月19日 + +v2.4.0 發佈。本次更新因涉及字根變動,故而次版本號增加。 + +第一項 + +根據《〔宇委2023地字〕關於認定「干口」爲「舌」字根的提案》《〔宇委2023玄字〕關於增加「壴」字根的提案》,做出以下更新: + +1. 認定「干口」,卽臺灣字型的「舌」,爲「舌」字根。「舍」及相關字,現拆爲「人舌」。 +2. 增加「壴」字根,編碼爲 Dd。 + +GB0中,「喜嘉」不再重碼,「涛澍」成爲重碼。國字常用字中,「喜嘉膨彫」不再重碼。 + +更改後,重碼數據如下: +GB0: 320 +國: 198 (-4) +GBK: 5164 +簡動: 4.3‱ (-0.6‱) +繁動: 14.3‱ (-0.8‱) + +第二項 + +修正臺灣簡碼方案的二級簡碼的設置,使之符合臺灣字型。如:rg「全」、tl「今」。 + +修正臺灣方案字型拆分,「穴」字頭不再拆作「宀儿」,而是「穴」字根。 + +第三項 + +兩根字在輸入第三碼時,按照字頻順序列出所有的候選單字,用户可選擇: + +1. 利用選重鍵或數字鍵上屏。 +2. 補首根小碼上屏。 + +第四項 + +自 Wafel·吉旦餅輸入法 移植自定義 lua 宏功能: + +- 提示: 作爲提示顯示在候選處, 可用於快捷短語或作爲其他宏的功能提示 +- 開關: 可用於顯示輸入法的功能開關狀態, 並予以切換 +- 單選: 同開關類似, 顯示開關狀態並在多個選項之間切換 +- Shell: 適用於 Linux/Mac 系統的命令宏, 可以執行預先配置的命令或脚本 +- 求值: 提供 lua 擴展功能, 允許配置 lua 語句、函數或 table 對象 + +第五項 + +使用「斜槓 /」引導特殊符號,等同於由 kk 引導。 + +第六項 + +在拆分表中特别標示出第三、四碼是補碼的情况。 + +### 2023年8月10日 + +v2.3.1 發佈。 + +本次更新修正了一批錯誤拆分,不涉及常用字集。 + +### 2023年8月2日 + +v2.3.0 發佈。 + +本次更新有以下幾項内容: + +- 合併核心和擴展詞庫(現共有80000詞條),減少文件數量。 +- 爲臺灣方案的反查提供臺灣字形的拆分。 +- 提供 Rime 默認的符號輸入方式。 + +### 2023年7月29日 + +v2.2.1-rc 預覽版發佈。 + +根據群友「不倒翁」的指正: + +- 「曹」依規則應拆爲「艹日日」而非「艹冂日」,因爲同根數、同不合筆順,前者結構完整。 +- 「衰」依規則應拆爲「<京頭>一𧘇」。 +- 「甶」依規則應拆爲「丿田」而非「<𰃦>土」,因爲同根數、同合筆順,前者結構完整。 + +本次更新影響以下單字的拆分: +嘈曹榱槽漕糟艚蓑螬衰遭傮嶆慒滖甶簑縗缞蓸褿蹧醩鏪鰽㜖㡟㯾㲤㷮䄚䏆䐬䙑䜊𠂽𠃁𠖡𡐋𡬭𡮦𡯹𢍉𢡨𢱻𢲵𣁽𣉿𣊛𣍖𣬖𤗰𤠠𤡐𤰲𤱖𤱮𤲄𤸬𥀛𥕢𥲍𦂖𦂢𦄧𦉀𦋿𦖛𦶃𦹽𦼄𦿩𧕐𧱋𨎝𨘨𨠷𨡛𩘳𩞄𩠎𩲆𩲇𩴫𩴰𪙡𪦁𪬀𪭎𪯓𪴊𪶣𪽐𫒀𫚧𫣐𬂯𬏅𬘿𬝕𬧭𬴾𬵀𬵙𬿽𭀯𭀸𭅡𭏗𭔉𭕩𭚽𭟆𭬞𭶲𭿕𮗆𮗙𮞱𮠁𮫜𮫝𮫣𮫥𮫦𮫨𮫩𮫪𮫫𮯐𰅕𰔜𰘻𰡸𰣈𱐽𱜅𱯞𲁳𲂓𲃿 + +### 2023年7月17日 + +v2.2.0 發佈。 + +根據《關於增加「丌(丿改丨)」字根的提案〔宇委 2023 天字〕》,恢復「丌(丿改丨)」字根。 + +GB0中,影響「亚」「严」及相關字共15個。 +亚:一业 —— 丌䒑 +严:一业丿 —— 丌䒑丿 + +GBK中,影響「亜」及相關字3個。 +亜:丅口上 —— 丌口一 + +修正其他拆分錯誤。 + +本次更新影響以下單字的拆分: +严亚俨哑垩垭娅恶戬晋桠氩痖缙酽亜唖壸悪挜搢榗橊溍澑瑨璢畱癅縉鄑鐂铔霊飅驑㙧㩅㫫㬐䅉䴡𠀜𠅛𠋿𠏊𠐚𠒋𠞐𠼁𡋲𡏍𡟽𡠂𡦌𡹕𡺽𢊺𢔲𢥍𢧫𢨙𢮮𢲖𢳩𣊰𣌽𣱌𣶑𣺯𤂢𤄉𤉁𤖥𤞤𤨁𤩖𤮷𥉢𥛽𥢋𥨌𥰸𥷢𦠝𦵻𧎽𧪽𨍬𨖻𨻥𩂳𩅸𩔰𩞷𩤼𩬾𩮢𪅳𪇾𪋳𪨂𪨷𪰥𪶮𪷎𪹓𪿊𫒣𫤌𫥍𫥼𫪂𫫇𫭲𫰫𫱷𫲒𫳃𫳇𫿞𬁺𬂲𬅮𬇬𬓎𬥔𬥤𭂿𭃀𭄘𭉟𭊇𭒭𭔿𭚣𭞔𭡛𭡵𭦢𭭈𭭒𭯋𭴪𭺪𭻍𮆕𮇔𮊚𮍇𮠑𮠕𮥔𮪜𰁲𰅰𰌦𰎠𰒜𰖈𰗝𰗻𰙽𰡉𰤐𰦴𰦾𰧡𰭋𰲸𰵨𰹤𰾪𱉨𱍰𱎫𱎿𱏀𱒭𱙎𱙔𱛝𱫯𱽛𲂉𲍓𲍣𮰴𮳁𮴆縉搢鄑 + +更新部分臺灣兼容拆分。 + +更新部分簡碼。 + +### 2023年7月6日 + +v2.1.3 發佈。 + +修正「一橫二豎」及相關字的拆分,使其爲「丅丨」而非「一〢」,包括: +亜唖悪橊澑璢畱癅籒鐂飅驑㙧㩅𠀜𠋿𡋲𡏍𡟽𢊺𢔲𢥍𢮮𢲖𢳩𣊰𣱌𤄉𤉁𤩖𤮷𥉢𥛽𥢋𥨌𥶅𥷢𦠝𨖻𩅸𩞷𩮢𪅳𪰥𫫖𫰫𬂲𬅂𭄘𭔿𭺪𭺫𮆕𮊚𮠕𰤁𰤐𰧡𰹤𱳤 + +修正「𤩮」的拆分爲「王土日殳」。 + +修正若干簡碼。 + +### 2023年7月3日 + +v2.1.2 發佈。 + +修正「黃」及相關字的臺灣字形拆分。 + +更新預顯示的 lua。 + +### 2023年6月30日 + +v2.1.1 發佈。 + +修正部分錯誤拆分。 + +### 2023年6月20日 + +v2.1.0 發佈。 + +增加 zhelp 引導快捷功能開關([王牌餅乾](https://github.com/lost-melody/))。 + +### 2023年6月18日 + +癸卯年五月初一日,宇浩輸入法 v2.0.0 正式版發佈。 + +### 2023年6月15日 + +在線拆分查詢系統中,現可點擊查詢結果中的漢字,從而進入「字統網」查看該漢字的詳細信息。 + +特殊符號中增加部分 Emoji。 + +### 2023年6月14日 + +預覽版 v2.0.0-rc.1 發佈。 + +修正和删除一批錯誤的繁體用字。 + +### 2023年6月12日 + +預覽版 v2.0.0-rc 發佈。 + +根據大量反饋(主要是宋大佬、麥大佬、笑大佬,還有群裏的小夥伴),作出以下調整。 + +删除字根: + +- 歹 = 一夕 〔使用頻率較低〕 +- 凡 = 几丶 〔使用頻率較低〕 +- 攴 = 卜又 〔使用頻率較低〕 +- 矛 = 予丿 〔使用頻率較低〕 +- 爾 = 一八巾乂乂乂乂 〔使用頻率太低〕 +- 羽 = 习习 〔對立較少,没有必要分離〕 + +增加字根: + +- 里 Kk 〔避免因筆順造成的歧義,呼聲很高。同時,改善了高頻「重」、「動」等字的手感。且「重」字不再需要使用繁體字根「車」。〕 +- 高(亠口、亠口冖)Ol 連續編碼 〔這個是初版的字根,現恢復它,目的是離散「京」「亮」等字。注意,存在歪脖拆的可能:襄 = {亠口}口𠀎𧘇。還要注意穿插:衷:{亠口}丨𧘇〕 +- {⺍一} Is 爲「氵」的附屬根 〔這是爲了和丷䒑一致。所以:兴 = {⺍一}八,应 = 广{⺍一}〕 +- 彑 Bm 同{互中}。〔「彐」和「彑」其實是同字不同形。「彑」爲字根很,「緑」「綠」等字同構同拆。且「互」和「亞」「亚」拆法相同。〕 + +改變小碼: + +- 氵 Ic -> Is 〔取其聲母〕 +- 习 Xu -> Xi 〔取其韻母,正好等於該字全拼〕 + +豎不包夾: + +- 豎向離散的字根,不可包夾其他字根。特别的,「二」「三」出現包夾,就拆爲分散的「一」,如:亘 = 一日一,畺 = 一田一田一。減少判斷的難度。 + +部分臺灣字形拆分補充和修正: + +- 沉 = 氵冖儿 +- 麥 = 來夊〔上方視作「來」的變形,拆爲「十人人人」没有必要。〕 + +簡體前150字,編碼改變五個: + +- 重 = 千里 +- 高 = 高 +- 就 = {京頭}小尤 +- 没 IQhc -> IQhs +- 应= 广{兴頭} + +優化繁體簡碼的設置,縮減碼長。 + +以下爲重碼數據對比: + +| 形碼方案 | GB2312 | 通規一二級 | 國字常用 | 常用繁簡 | GBK | 簡體選重率 | 繁體選重率 | 繁簡混合文本選重率 | 簡體詞語选重率 | +| :-------------- | -----: | ---------: | -------: | -------: | ---: | :--------- | :--------- | :----------------- | :------------- | +| 宇浩v2.0.0 | 314 | 265 | 208 | 583 | 5171 | 5.2‱ | 15.3‱ | 17.1‱ | 116.1‱ | +| 宇浩v2.0.0 | 318 | 273 | 202 | 584 | 5178 | 4.9‱ | 15.1‱ | 16.6‱ | 109.7‱ | + +以下是對於部分意見的反饋: + +某位不願透露姓名的宋姓大佬:能不能二三不包夾?不然總是轉不過彎來。 +反饋:可以的,不過靜態重碼會上升。 +某位不願透露姓名的宋姓大佬:最好豎向的組合字根都不包夾。 +反饋:可以可以,大佬肯背書就好。 + +某位不願透露姓名的宋姓大佬:彑和{互中}合併。 +反饋:好的。 + +小夥伴:「重」居然要用繁體根「車」。而且「里」的筆順總是弄錯。 +反饋:「里」值得一個字根。重 = 千里,手感提升。 + +小夥伴:舞 = 𠂉卌歹ヰ?真丑。 +反饋:「歹」删了! + +小夥伴:「凡」「攴」爲什麼是字根? +反饋:同意,這倆頻率太低,删了。 + +小夥伴:羽 = 习习? +反饋:「习」除了「𠁨」外沒有單獨使用的,所以把它作爲了「羽」的附屬。不過旣然不存在對立,把「羽」删了也好。 + +小夥伴:「亠口」可以分離「京」「高」等字形,否則打詞不舒服。 +反饋:同意,恢復高字根,「亠口」「亠口冖」作爲它的附屬,小碼就用「口」的區碼 L。 + +小夥伴:碼長有些長。 +反饋:同意,簡碼過於陳舊,有的一、二簡還是重複的,需要更新一下。 + +### 2023年6月11日 + +公测版 v2.0.0-beta.2 發佈。 + +恢復簡體簡碼中的两個一簡字: + +- C 好 +- O 为 + +「二」「三」包夾不再分情况討論,一律允許包夾,包括: + +亜唖悪戩晉𠀥𡏍𢳩𣊰𣱌𤇟𤉁𤐦𤩖𨫌𪬕𪰥𫠱𫫖𫰫𬂲𬅂𰤐 + +### 2023年6月10日 + +公测版 v2.0.0-beta.1 發佈。 + +優化簡體簡碼設置,縮減碼長。 + +特别的,一簡有以下變化: + +- C 好 0.38% -> 也 0.50% +- H 地 0.46% -> 到 0.61% +- O 为 0.39% -> 说 0.63% +- T 个 0.78% -> 人 0.97% + +二簡有以下變化: + +- CV 始 -> 好 +- HC 车 -> 地 +- OX 辛 -> 为 +- TN 用 -> 个 + +調整結果如下: + +| 方案 | 毛泽东选集(简) | 天龙八部(简) | 三体(简) | 战争与和平(简) | 史記(繁) | 紅樓夢(繁) | 笑傲江湖(繁) | 論語集解(繁簡混) | +| :---------- | -------------: | -----------: | -------: | -------------: | -------: | ---------: | -----------: | ---------------: | +| 五笔86 | 3.12 | 3.31 | 3.21 | 3.24 | 3.59 | 3.44 | 3.45 | 3.49 | +| 五笔98 | 3.05 | 3.19 | 3.12 | 3.15 | 3.42 | 3.32 | 3.32 | 3.29 | +| 蓝宝石 | 3.04 | 3.1 | 3.03 | 3.05 | 3.48 | 3.29 | 3.29 | 3.36 | +| 徐码23 | 3.15 | 3.21 | 3.18 | 3.17 | 3.49 | 3.32 | 3.33 | 3.33 | +| 宇浩·調整前 | 3.16 | 3.16 | 3.09 | 3.11 | 3.51 | 3.29 | 3.32 | 3.41 | +| 宇浩·調整后 | 3.13 | 3.12 | 3.06 | 3.09 | 3.52 | 3.28 | 3.3 | 3.38 | + +### 2023年6月9日 + +「卿」由「𠂎彐厶卩」改拆「卯彐厶」,因爲少根。 + +此更改還影響大字集中相似字形漢字4個:𣛬𦺄𬁋𮬐 + +### 2023年6月1日 + +公测版 v2.0.0-beta 發佈。 + +小碼改變: + +- 二 Se -> Si 分散雙手 +- 宀 Oo -> Ob 聲母「寶蓋」 +- 立 Ii -> Id 分散雙手 +- 业 Kk -> Kg 分散雙手 +- 早 Jo -> Jd 連續小碼「日十」分散雙手 +- 彐 Xx -> Xl 分散雙手 +- 阝 Cf -> Cj 分散雙手 + +### 2023年5月31日 + +小碼改變: + +- 业 Kk -> Ki + +### 2023年5月30日 + +内测版 v2.0.0-alpha.beta 發佈。 + +字根認定: + +- 認定「业」爲字根,編碼爲 Kk + +受其影響,簡體優先方案的簡碼位有如下變化: + +- uk 赢 -> 普 +- un 普 -> 烟 +- kk 婴 -> 业 +- nu 业 -> 圈 +- jk 映 -> 显 +- jn 显 -> 崮 +- mk 帽 -> 虚 +- mn 虚 -> 皿 + +受其影響,繁體優先方案的二簡位有如下變化: + +- n 對 -> 回 +- ku 剛 -> 對 +- nl 回 -> 圖 +- un 普 -> 廠 +- mn 虚 -> 皿 + +### 2023年5月29日 + +小碼改變: + +- 龰 Nd -> Nf 避讓「鬥」 + +### 2023年5月28日 + +内测版 v2.0.0-alpha.3 發佈。 + +字根認定: + +- 認定「𦣞」「𦣝」字根同「臣」,如 熙 = 臣巳灬,姫 = 姬 = 姬 = 女臣 +- 認定「𦍌」字根同「羊」,如 美 = 羊大,義 = 羊我 = 羊丿扌戈 + +小碼改變: + +- 身 We -> Wm 分散雙手 + +### 2023年5月25日 + +内测版 v2.0.0-alpha.2 發佈。 + +小碼改變: + +- 飛 Bf -> Bk 分散雙手 +- 龰 Nh -> Nn -> Nd 防止 Nh 單指跨行 +- 彡 Ti -> To 讓出碼位給「八」 +- 八 Tb -> Td -> Ti 防止 Tb 單指大跨行,分散雙手 +- 乃 Va -> Vj 分散雙手 +- 九 Yj -> Yf 分散雙手,汉字密度 Yj19 Yf11 + +### 2023年5月23日 + +内测版 v2.0.0-alpha.1 發佈。 + +增加一個文件夾 [generator](../../beta/generator/),包含三個用來生成一級、二級、三級簡碼字詞的文件。如果發現任何 bug,可以直接提出 issue 或者 push commits。 + +### 2023年5月22日 + +四重註解中,詞語編碼用大小寫來區分大小碼。 + +加入「功能開關一鍵配置」文件: + +- yuhao.custom.yaml +- yuhao_tradition.custom.yaml +- yuhao_tradition_tw.custom.yaml + +删除「四豎」字根,因爲只在全字集中被使用了一次。 + +### 2023年5月21日 + +RIME 增加拼音註解。現總共爲四重註解。 + +小碼改變: + +- 凵 Xa -> Xe -> Xg 韻母「丱」,防止大跨行 + +### 2023年5月20日 + +增加測試版方案的[在線字根練習](../../beta/practice/practice.html)。 + +小碼改變: + +- 其 Dq -> Dj 聲母,減少小拇指負擔 +- 凵 Xa -> Xe 韻母 + +### 2023年5月19日 + +增加近四千個臺灣字形兼容拆分,調整臺灣方案簡碼。凡臺灣繁體詞語,都使用臺灣字形編碼。比如「起來=走己來」`DBDl` 和「起=走巳來」`DCDl` 兼收。 + +在線拆分系統現也增加臺灣拆分一欄。 + +小碼改變: + +- 氵 Iv -> Iu -> Ic 分散雙手 +- 艹 So -> Sa -> Sj 韻母,防止 Sa 無名指小拇指連擊 +- 乂 Wa -> Wl 分散雙手 + +### 2023年5月18日 + +小碼改變: + +- 扌 As -> Ao 韻母,防止 As 無名指小拇指連擊 +- 壬 Er -> En 韻母,分散雙手,汉字密度 Er22 En14 +- 士 Hh -> Hf 分散雙手 +- 户 Ih -> Ie 分散雙手 +- 水 Kh -> Kv 韻母 u 轉 v,汉字密度 Kv7 Kh13 +- 冂 Kg -> Kf, 同 「匚」Gf小碼一致 +- 目 Mu -> Mk -> Mf,增加双手互击。 +- 虎 Mh -> Mu 韻母,汉字密度 Mh20 Mu6 +- 巾 Mv -> Mj -> Mv +- 王 Gv -> Gw -> Gn,增加双手互击,汉字密度 Gw25 Gn7 +- 龰 Nh -> Nn, 防止 Mh 單指跨行,汉字密度 Nh 13 Nn 5 +- 之 Pc -> Pe,改善手感 +- 𠂇 Sv -> Ss -> So 「左」韻母。 +- 巛 Vh -> Vc,聲母,同 「川」Qc 小碼一致,汉字密度 Vc3 Vh11 + +增加一個自定義碼表:yuhao.private.dict.yaml,優先級高於官方詞庫。原自定義碼表 yuhao.private.dict.yaml 優先級低於官方詞庫。 + +## 宇浩·卿雲(爲宇浩·光華所取代) + +### 2023年5月12日 + +增加方案「書同文」,方案文件名 yuhao_tradition_tw。以臺灣傳統漢字字形爲標準設置簡碼。例如: + +- I 的一簡字設「沒」而非「没」。 +- OW 上的二簡字設「為」。 +- SH 上的二簡字設「著」。 + +### 2023年5月9日 + +词库码表结构优化,分为核心词库、增广词库、成语诗词词库三部分,各自分繁简。核心词库对应了宇浩一级词库,增广词库对应了宇浩二级词库中的非成语诗词。名称如下: + +- yuhao.words +- yuhao.words_extended +- yuhao.words_literature +- yuhao_tradition.words +- yuhao_tradition.words_extended +- yuhao_tradition.words_literature + +### 2023年5月5日 + +词库码表结构优化,现将词库分为核心和增广词库,各自分为繁简。核心词库对应了宇浩一级词库,增广词库对应了宇浩二级词库。名称如下: + +- yuhao.words +- yuhao.words_extended +- yuhao_tradition.words +- yuhao_tradition.words_extended + +### 2023年5月4日 + +增加 CJK 扩展 I 区的 603 个汉字。字形来源:[https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf](https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf) + +同步更新拆分表和在线查询系统。 + +### 2023年4月20日 + +由于字集过滤插件表现良好,故而不需要一个单独的新手方案和词库,现删除新手方案,只保留繁体简码和简体简码两个方案。 + +### 2023年4月19日 + +优化常用字集过滤插件。使用集合法重写代码,大幅度提升运行效率,不再有卡顿现象。 + +更新反查码表。 + +修正拆分错误。 + +### 2023年4月18日 + +根据反馈,作出以下调整: + +其一,「疒」字根的小码由 `Pv` 改至 `Pb`。目的:不让低频「疽」抢占三简位。影响:凡「疒」头两根字,原本为三码出字,今一律加一补位码 `b`。 + +其二,增加字根「聿上」(彐丨),为「彐」的附属根。影响「肃」「盡」相关字形,包括但不限于: + +- 肃,改拆「{聿上}{介下}八」。 +- 肅,改拆「{聿上}片爿一」。 +- 盡,改拆「{聿上}一灬皿」。 +- 唐,改拆「广{聿上}口」。 + +其三,更改「爿」字根小碼,由 `Xg` 改爲 `Xp`,同「片」的 `Tp` 一致。 + +其四,修正拆分。「那」拆为「𠃌キ阝」,而不是「刀二阝」,因为符合笔顺。受此影响,`B` 键一简改为「对」,「那」设为二简 `Va`。 + +此次更新影响 GB2312 拆分 16个,编码 33 个。影响 GBK 编码 73 个。 + +优化反查系统,使繁简汉字同权数,便于繁简通打。 + +### 2023年4月17日 + +更改「爲下」字根的码位:由 `Yw` 改至 `Ww`。目的是避让「你」字,将高频「爲」字设为二简 `EW`。此次更新只影响繁体。影响GBK拆分20个,影响大字集拆分约50个。重码不变。 + +### 2023年4月14日 + +全面更新官网设计,优化美工,允许站内搜索。 + +### 2023年4月13日 + +更新在线拆分系统: + +- 除单字外,现在还允许用户查询词语和句子。拆分系统会按行显示所有汉字的拆分。 +- 优化美工。 + +### 2023年4月12日 + +对「古」「合」字根进行解释: + +- 「古」下的「口」中如果包含完整的笔画,应该拆如「十囗」。例如:「鄙」左下方的「口」中有「口」,故而应该拆成「口十囗口阝」。 +- 「合」下的「口」中如果包含完整的笔画,应该拆如「人一囗」。例如:「會」中間的「口」中有「小」,故而应该拆成「人一𫩏丷日」。 + +此更改影响 GB2312 字集中 1 个汉字「鄙」,影响 GBK 字集另外 35 个汉字,影响大字集 54 个汉字。 + +优化部分简码。 + +### 2023年4月11日 + +校正部分拆分错误。更新在线字根练习。 + +增加常用字练习。更新1-50汉字。 + +更新码表。 + +### 2023年4月10日 + +校正部分拆分错误,更新字根图、在线字根练习。 + +更新码表。 + +### 2023年4月8日 + +陆续受到了不少用户反馈,对以下几点表达出关切: + +- 折区相似字形的字根被分配在不同的大码上,不适合新人快速学习。比如:之辶、也乜、子了、矛予、己已、巴巳、幺厶纟。 +- 右手无名指的频率高于右手中指。 +- 「高」「㗊」等字根作用不大,可以移除。 +- 对部分拆分规则进行优化,兼顾拆字「逻辑性」和「直观性」。 + +因此,我对字根进行了如下调整: + +删除字根: + +- 高 +- 㗊 + +相似字根合并大码: + +- 之辶同`P`:之 `Ok` - `Pc` +- 也乜同`C`:「乜」转为「也」的附属根 +- 子了同`V`:子 `Bi` - `Vk` +- 矛予同`C`:矛 `Xo` - `Co` +- 己已同`B`:已 `Vy` - `Bi` +- 巴巳同`C`:巳 `Xs` - `Ck` +- 幺厶纟同`V`:幺 `Co` - `Vo` + +其他大码调整: + +- 户:`Oh` - `Ih` +- 𧘇:`Wy` - `Ry` + +代表根转为附属根: + +- 「青头」从「士」:`HHff` +- 「春头」从「夫」:`Guff` + +为了降低字词动态重码、避让简码、优化手感,还作出了以下的小码调整: + +- 且 `Mq` - `Mi` +- 冖 `Ym` - `Yv` +- 穴 `Pu` - `Px` +- 心 `Yv` - `Yn` +- 凵 `Xc` - `Xa` +- 向 `Rg` - `Rn` +- 巴 `Ca` - `Cb` +- 弓 `Vo` - `Vg` +- 甲 `Ka` - `Kj` +- 艹 `Sv` - `So` +- 𠂇 `Su` - `Sv` +- 飛 `Be` - `Bf` +- 車 `Gj` - `Gc` +- 二 `Sr` - `Se` +- 而 `Sj` - `Sr` +- 糸 `Bv` - `Bs` +- 尸 `Bh` - `Bv` +- 攴 `Ku` - `Kp` +- 文 `Pe` - `Pw` +- 目 `Mv` - `Mu` +- 三 `Fn` - `Fa` +- 犬 `Sa` - `Sq` +- 巾 `Mj` - `Mv` + +对于拆分规则进行细化: + +- 「万」拆「一勹」:优化「拆分美观」规则,半包围结构不分拆。 +- 「二」「三」包夹其他字根,必须保证上下两横的独立性,且中间只有一个字根。 + +更新字根图,对小码进行颜色标注。凡小码正好为声母的,标注为蓝色;凡小码正好为韵母的,标注为褐色。 + +更新在线练习软件。 + +更新在线拆分查询。引入一栏「注释」,对某些比较容易混淆的拆分进行规则解释。 + +更新一、二级简码字。 + +更新 Rime 方案,将码表分拆为若干分码表,所有分码表都由主码表导入,便于用户开启或关闭。分码表如下: + +- 简码字词 +- 全码字 +- 一、二、三级词库 +- 特殊符号 + +重码分析: + +- GB2312:304到309 +- 国字常用:206到214 +- GBK:4937到4993 +- 动态重码简体、繁简混合都不变。繁体从0.15%上升到0.16%。 + +### 2023年4月4日 + +正式推出宇浩词库。该词库对词语和排序进行了优化,并分为若干词库文件,借此保障用户的自主选择权。分词库包括: + +- 宇浩一级简体词库:约50000个核心词语。推荐只使用该词库配合单字输入,以获得最佳体验。集成在主码表中。 +- 宇浩繁体词库:约30000个核心词语,包括台湾、香港、大陆古籍繁体三种字形。默认关闭。 +- 宇浩二级简体词库:约25000个词语,频率较低,建议只在手机上开启。默认关闭 +- 宇浩三级简体词库:约20000个词语,多为成语和古诗词,除非有特殊需求,否则不建议开启。默认关闭。 + +对二级简码词进行更新。 + +更新首页内容。 + +### 2023年4月3日 + +更新两个繁体字根码位,使繁体选重率和繁简选重率得以大幅下降,提高通打效率: + +- 馬 由 `Sm` 至 `Dm` +- 金 由 `Rn` 至 `Wj` + +调整简码字若干,简体方案中: + +- `T` 人 - 个 +- `WJ` 胆 - 金 +- `RN` 金 - 徜 +- `LM` 忠 - 吊 +- `DE` 故 - 斯 +- `MK` 贞 - 帽 + +繁体方案: + +- `CS` 媽 - 隨 +- `SM` 馬 - 夢 +- `LS` 嗎 - 器 +- `LD` 喫 - 嗎 +- `RN` 金 - 徜 +- `WJ` 腸 - 金 +- `RS` 錯 - 舉 + +在阿吉委员的帮助下,对二级简码词进行更新。 + +以下为本次更新前后重碼的数据比较: + +| 方案 | GB2312 | 通规一二级 | 国字常用 | 常用繁简 | GBK | 简体选重率 | 繁体选重率 | 繁简混合文本选重率 | +|:--------------|---------:|-------------:|-----------:|-----------:|------:|:-------------|:-------------|:---------------------| +| 更新前 | 303 | 263 | 216 | 573 | 4964 | 0.05% | 0.17% | 0.19% | +| 更新后 | 304 | 262 | 206 | 565 | 4933 | 0.05% | 0.15% | 0.17% | + +重绘字根键位图,使字根不从中间换行。 + +[增加页面statistics](./statistics.md),提供常见输入法的重码数据比较。 + +### 2023年4月2日 + +根据反馈,在不少平台上,没有生僻字屏蔽功能,导致全码状态下生僻字优先于常用词语,造成不便。基于这个问题,做出如下调整: + +- 除了 Rime 方案,其他所有码表,都将生僻字置后。 +- Rime 方案因为存在常用字优先 lua,故而不需要进行调整。 +- 更新大大和小小平台的免安装应用程序。 + +更新字体、拆分表、字根键位图。 + +### 2023年4月1日 + +更新了對以下輸入平臺的支持: + +- 微軟五筆(需要 WubiLex 導入) +- fcitx5-Android + +在QQ群中提供小小輸入法的外掛輸入模式。 + +更新了若干一、二級簡碼,避免簡碼重複。 + +更新了詞庫,增加詞語數量。 + +更新了字根表。 + +更新了主頁和教程。 + +### 2023年3月31日 + +增加繁體方案。該方案爲繁體輸入設置了簡碼和詞庫,名爲`yuhao_tradition`。 + +根據反饋,對「點」的拆分作出規範: + +- 單點和捺在`Od`。 +- 相重疊的兩點,卽「头」「冬」中的部分,同「二」`Sr`。 +- 左對點「冫」和右對點「飞右」,同「二」`Sr`。故而「兆」拆爲「儿二二」。 +- 下對點「八」在`Tb`。 +- 上對點「丷」在`Uh`。 +- 所有三點都在`Iv`。 +- 所有四點都在`Uh`。 + +「为」「卵」等字的兩點不認定爲「兩點」,而認定爲兩個單點「丶」,這和「冬下」不同。 + +根據反饋,將「丽」下的一半,卽「冂丶」,認定爲「冂」的附屬根。「丽」拆作「一冂冂」,卽「一{冂丶同冂}{冂丶同冂}」。 + +根據反饋,離散的字根部件不宜被全包圍或半包圍分割。這一條主要影響的是大字集的拆分。 + +更新字根圖。 + +更新教程,增加若干新的内容,並且更正筆誤。 + +更新在線拆分系統,包括: + +- 使用宇浩字根字體顯示部分字根。 +- 增加一欄以顯示詳細的字根信息和代表根。 +- 增加一欄以顯示簡體方案的簡碼。 +- 增加一欄以顯示繁體方案的簡碼。 + +更新在線字根練習系統,部分字根用宇浩字根字體代替。 + +本次更新後,重碼數據不變。 + +### 2023年3月30日 + +根據反饋,調整若干二級簡碼,使得常用兩根字被一、二、三簡覆蓋。 + +根據反饋,增加常用字符過濾器中的常用漢字數量,全面覆蓋《通規》《國字常用》中的漢字。 + +調整部分小碼,增加左右互擊: + +- 「田」改爲`Jt`,取聲母`t`。 +- 「山」改爲`Js`,取聲母`s`。`Ja`現設爲「时」字二級簡碼。 +- 「𠂤」改爲`Yd`,取聲母`d`。和「豸」分離。 + +調整部分字根: + +- 鑑於「班中」「师左」近似易混,故不作區分,統一爲`Uh`。注意,「师左」爲`𠂤`字簡化,在臺灣標準中同「班中」。 +- 鑑於「丑」字拆分分歧較大,故而增加此字根,編碼爲`Bc`。 +- 「丅」同「下」,故而直接設置「下」字根`Ak`,並且以「丅」爲「下」的附屬根。 + +增加宋體版本字根圖。 + +重碼數據更新。GB2312:303。 + +### 2023年3月28日 + +根據反饋,調整 U 上的若干小碼: + +- 「火」改爲`Uv`。 +- 「言」改爲`Ua`,同`讠`小碼一致。`um`二簡讓給「祖」。 +- 「丷」「䒑」「灬」等對點、四點全部合併到`Uh`上,以「灬」爲代表根。 + +調整「刀」的小碼,使其碼位爲`Bd`,和「刂」一致,設爲二簡,降低`A`鍵使用率。 + +調整拆分方法,凡「冒」字頭都拆作「冂二」。 + +調整三級簡碼生成算法,二根字優先。 + +更新字根練習系統。 + +重碼數據更新。GB2312:305,國字:216,GBK:4971,簡體選重率:0.0529%,繁體選重率:0.1667%,繁簡選重率:0.2128%。 + +### 2023年3月26日 + +更新用户精確造詞功能:造詞時,先按下 \` 符號引導。 + +優化生僻字過濾lua。 + +### 2023年3月25日 + +增加用户精確造詞功能:輸入過程中,按下 ` 符號作爲分隔,使用**數字鍵或空格鍵**依次選擇單字,卽可實現精確造詞。 + +### 2023年3月24日 + +增加全字根在線練習。增加最常用50、100字根在線練習。 + +修正字根圖錯誤。 + +校正部分拆分。 + +### 2023年3月23日 + +增加至撇區的字根在線練習。 + +增加通配符功能,可以使用Z鍵代替所有的非首碼的字母進行輸入。比如`ABCD`,可以輸入爲`Azzz`。 + +全面調整二級簡碼,删除三選中不常用的詞。 + +根據反饋,爲了方便練習字根,現在將没有設爲二簡一選的字根字,全部設成三選。這樣也可以提示該大小碼上有一個字根。新手可以直接通過選重上屏,或者加一個`f`上屏。 + +對字根進行調整:「尝」的上半部分視爲「尚」根,拆作「{尚头}二厶」。因爲「尝」本身就是「嘗」簡化而來。這樣可以使得一個系列的字拆分邏輯一致。 + +### 2023年3月22日 + +對字根做出以下調整: + +- 「亠」字根改爲「宀」的附屬字根,大小碼爲「Ov」。 +- 「丂」小碼改爲`k`。 +- 「斤」小碼改爲`j`。 +- 「酉」改回`Go`。 +- 所有的豎,不管幾個豎,全部改爲`Ns`。 +- 「欠」小碼改爲`i`。 +- {亞下}由`La`改爲`Ja`。 + +增加純淨碼表,只包含單字全碼。 + +### 2023年3月21日 + +提供新的特殊符號輸入方式: + +- `zy`引導註音符號。 +- `jm`引導日語假名。 +- `py`引導拼音字母。 +- `py`引導中文標點。 +- `dy`引導德語字母。 + +提供百度、落格、小小碼表。 + +### 2023年3月20日 + +做出以下調整: + +- 「衤」字根改爲`Py`,和「𧘇」字根小碼一致。 +- 「马」字根改爲`Xm`,和「馬」字根小碼一致。 +- 修正字根圖中的錯誤。 + +字根口訣更新至捺區。 + +### 2023年3月19日 + +根據反饋,做出以下調整: + +- 「欠」字根改爲`En`,「壬」字根改爲`Ee`,「而」字根改爲`Sj`。理由是,目前高頻「次」字需要`SEqr`四碼出字,非常不方便,而且都在左手上。改動後,「次」的手感得到改善,且成爲二級簡碼。 +- 「見」字根改至`Mx`,通簡體字根`见`的小碼保持一致。 +- 「貝」字根改至`Mb`,通簡體字根`贝`的小碼保持一致。 +- 三級簡碼只對常用字集設置。設置後,一級簡碼覆蓋字頻:22.22%,二級簡碼:49.13%,三級簡碼:0.25%,簡碼共覆蓋97.78%字頻。 +- 修正字根圖中的錯誤。 + +### 2023年3月18日 + +根據反饋,做出以下調整: + +- 特殊字符改作由Z結尾。比如分號爲`fhz`。這樣做可以避免和反查衝突,還能充分利用碼位空間。 +- 修正字根圖的錯誤。 +- 將部分表示部首的特殊符號添加到碼表中,作爲字根字進行輸入。 + +### 2023年3月17日 + +字根字現在是二碼,這會造成不少不是特别常用的漢字擠佔了二級簡碼的空間,無法設置其他的高頻漢字。這不符合「越常用的漢字碼長越短」的實用主義宗旨。因此,做出一個調整: + +- 所有的代表根都在二碼後加F。 +- 所有的非代表根都在二碼後加FF。 + +大多數的字根字都是常用字,所以還是會在二級簡碼上的。 + +這樣做還有一個好處。雖然很多輸入法全碼重碼很低,但是在二級、三級簡碼位上加了常用字後,導致了**事實**重碼率的上升。不如直接從根源上對字根字進行分離。 + +用户根據前五百常用字反饋: + +- 很 需要取四碼rvnc,因爲二碼是金,三碼是銀 +- 利 需要取四碼rmdh,因爲二碼是毛,三碼是釗 + +這是因爲「金」字作爲R的代表根,造成了不少字爲三碼,搶佔了常用字的三簡。因此,做出調整: + +將「金」字根改爲Rn(這個碼位上没有什麽特别常用字),將「犭」字根改爲Rv,「僉」改为Rl,將「很」設置爲二簡。 + +川現在的碼位是Wh。但它和荒下十分相近,所以移到Qc上。這還能把二間讓給「特」。 + +聽取意見,將「酉」移到「西」的鍵位上,小碼設置爲`j`,因爲`you`被「雨尤不」佔用了。 + +绘制了简化字字根图。 + +### 2023年3月16日 + +根據反饋,對部分字根進行調整: + +- 減少QA的使用頻率。 +- 增加大小碼的左右互擊。 + +### 2023年3月12日 + +初版。 diff --git a/docs/v1/practice.md b/docs/v1/practice.md index 3d8daf91..0ade2f5f 100644 --- a/docs/v1/practice.md +++ b/docs/v1/practice.md @@ -9,7 +9,7 @@ parent: 宇浩一代·卿雲 ​ 练习并熟悉最常用的100个字根,一共5遍。 -​ [开始练习](../../v1/practice/practice_100) +​ [开始练习](../../cloud/practice/practice_100) ​ 恭喜,你已经学会了占 85% 频率的字根。可以开始练习常用字了。 @@ -17,13 +17,13 @@ parent: 宇浩一代·卿雲 ​ 根据拆分提示,练习最常用的100个汉字,熟悉它们的拆分。这部分汉字占了将近50%的日常使用频率。 -​ [开始练习](../../v1/practice/practice_characters) +​ [开始练习](../../cloud/practice/practice_characters) 3.全部字根: ​ 练习并熟悉全部字根,每日1遍。 -​ [开始练习](../../v1/practice/practice) +​ [开始练习](../../cloud/practice/practice) 4.最常用500字: diff --git a/docs/v1/v1.md b/docs/v1/v1.md index 2119bdc8..421bb28d 100644 --- a/docs/v1/v1.md +++ b/docs/v1/v1.md @@ -28,7 +28,7 @@ has_children: true >[快速入门](./cookbook) · >[详细教程](./learn) · >[在线练习](./practice) · ->[拆分查询](../../v1/chaifen/) +>[拆分查询](../../cloud/chaifen/) ## 简介 diff --git a/docs/v2/updates.md b/docs/v2/updates.md deleted file mode 100644 index 7ea4f29c..00000000 --- a/docs/v2/updates.md +++ /dev/null @@ -1,1127 +0,0 @@ ---- -title: 更新日志 -layout: default -parent: 宇浩二代·光華 -nav_order: 1 ---- - -# 宇浩拆分和方案更新日誌 - -
- - 点此展开目录 - - {: .text-delta } -1. TOC -{:toc} -
- -本頁面主要展示「宇浩拆分」和「宇浩方案」較重大的更新。一般的更新説明可在 [release](https://github.com/forFudan/yuhao/releases) 頁面查看。 - -## 2023年10月18日 - -v3.0.0 發佈。 - -星陳方案進入穩定版。yuhao 和 yustar 發佈包大版本號升入 v3。 - -將 RIME 方案中的分詞庫置於 /yuhao 文件夾下,避免主目錄下文件過多。 - -修正若干拆分。 - -## 2023年10月1日 - -v2.5.1 發佈。 - -「𣎆𦝠𦟀」 等全部歸併入 <赢头> Uw。 - -RIME 方案關閉默認四碼唯一自動上屏,防止誤擊回删。 - -## 2023年9月24日 - -v2.5.0 發佈。 - -「襄頭」歸併到「高頭」上,無論幾個「口」。 - -「龠頭」歸併到「合」上,無論幾個「口」。 - -修正大字集中部分錯誤拆分。 - -受影響單字:嚷壤攘曩瀹瓤禳穰襄镶骧龠儴勷孃忀懹欀瀼爙爚獽瓖禴籥籲纕蘘蘥蠰讑讓躟釀鑰鑲饟驤鬤鸙龡龢龣龤龥㒢㠤㵸䉴䑋䟑䠯䶳䶵𠎘𠎤𢅹𢐿𣀮𣤸𣰶𤂃𤐯𤬞𤰂𥀶𥌉𥌺𥗝𥤉𥤖𥸤𥽬𦇬𦴁𦿈𧕋𧟄𧟇𧢢𧭆𧹊𨙄𨟚𨳃𨷲𨸎𨽢𩆶𪊊𪓃𪛊𪛋𪛌𪛍𪛏𪛒𪛓𪛔𪛕𪛖𪱒𫗵𬙋𬰰𬱳𬺟𭄜𭤑𭨑𭨣𮪟𮯘𮯠𰁬𰅴𰉰𰋙𰑌𰑝𰛬𰠱𰢙𰶏𰾂𱂪𱊵𱍉𱍊𱰓𱱰⿕ - -## 2023年9月18日 - -v2.4.8 發佈。 - -三大方案單字全碼皆使用同一碼表。在「原始排序」模式下,單字依照繁簡混合字頻排序。 - -增加簡體、陸繁、臺繁三個字集優先開關,分别前置《通規》《古籍通規》《常用國字》三大字集中的漢字。快捷鍵爲 Shift + Contrl + I。 - -修改部分簡碼。 - -## 2023年9月1日 - -v2.4.5 發佈。 - -本輸入法特殊符號現可通過 / 引導輸入。 - -## 2023年8月31日 - -v2.4.4 發佈。 - -更新 CJK-I 區的漢字編碼和拆分。本區共622個漢字。 - -## 2023年8月29日 - -v2.4.3 發佈。 - -RIME 中,只後置排名第一的簡碼字的全碼。 - -增加開關,一鍵開啓或關閉輸入預測 (Shift + Ctrl + Y)。 - -## 2023年8月27日 - -v2.4.1 發佈。 - -本次更新修正了一批錯誤拆分,不涉及常用字集。 - -## 2023年8月19日 - -v2.4.0 發佈。本次更新因涉及字根變動,故而次版本號增加。 - -第一項 - -根據《〔宇委2023地字〕關於認定「干口」爲「舌」字根的提案》《〔宇委2023玄字〕關於增加「壴」字根的提案》,做出以下更新: - -1. 認定「干口」,卽臺灣字型的「舌」,爲「舌」字根。「舍」及相關字,現拆爲「人舌」。 -2. 增加「壴」字根,編碼爲 Dd。 - -GB0中,「喜嘉」不再重碼,「涛澍」成爲重碼。國字常用字中,「喜嘉膨彫」不再重碼。 - -更改後,重碼數據如下: -GB0: 320 -國: 198 (-4) -GBK: 5164 -簡動: 4.3‱ (-0.6‱) -繁動: 14.3‱ (-0.8‱) - -第二項 - -修正臺灣簡碼方案的二級簡碼的設置,使之符合臺灣字型。如:rg「全」、tl「今」。 - -修正臺灣方案字型拆分,「穴」字頭不再拆作「宀儿」,而是「穴」字根。 - -第三項 - -兩根字在輸入第三碼時,按照字頻順序列出所有的候選單字,用户可選擇: - -1. 利用選重鍵或數字鍵上屏。 -2. 補首根小碼上屏。 - -第四項 - -自 Wafel·吉旦餅輸入法 移植自定義 lua 宏功能: - -- 提示: 作爲提示顯示在候選處, 可用於快捷短語或作爲其他宏的功能提示 -- 開關: 可用於顯示輸入法的功能開關狀態, 並予以切換 -- 單選: 同開關類似, 顯示開關狀態並在多個選項之間切換 -- Shell: 適用於 Linux/Mac 系統的命令宏, 可以執行預先配置的命令或脚本 -- 求值: 提供 lua 擴展功能, 允許配置 lua 語句、函數或 table 對象 - -第五項 - -使用「斜槓 /」引導特殊符號,等同於由 kk 引導。 - -第六項 - -在拆分表中特别標示出第三、四碼是補碼的情况。 - -## 2023年8月10日 - -v2.3.1 發佈。 - -本次更新修正了一批錯誤拆分,不涉及常用字集。 - -## 2023年8月2日 - -v2.3.0 發佈。 - -本次更新有以下幾項内容: - -- 合併核心和擴展詞庫(現共有80000詞條),減少文件數量。 -- 爲臺灣方案的反查提供臺灣字形的拆分。 -- 提供 Rime 默認的符號輸入方式。 - -## 2023年7月29日 - -v2.2.1-rc 預覽版發佈。 - -根據群友「不倒翁」的指正: - -- 「曹」依規則應拆爲「艹日日」而非「艹冂日」,因爲同根數、同不合筆順,前者結構完整。 -- 「衰」依規則應拆爲「<京頭>一𧘇」。 -- 「甶」依規則應拆爲「丿田」而非「<𰃦>土」,因爲同根數、同合筆順,前者結構完整。 - -本次更新影響以下單字的拆分: -嘈曹榱槽漕糟艚蓑螬衰遭傮嶆慒滖甶簑縗缞蓸褿蹧醩鏪鰽㜖㡟㯾㲤㷮䄚䏆䐬䙑䜊𠂽𠃁𠖡𡐋𡬭𡮦𡯹𢍉𢡨𢱻𢲵𣁽𣉿𣊛𣍖𣬖𤗰𤠠𤡐𤰲𤱖𤱮𤲄𤸬𥀛𥕢𥲍𦂖𦂢𦄧𦉀𦋿𦖛𦶃𦹽𦼄𦿩𧕐𧱋𨎝𨘨𨠷𨡛𩘳𩞄𩠎𩲆𩲇𩴫𩴰𪙡𪦁𪬀𪭎𪯓𪴊𪶣𪽐𫒀𫚧𫣐𬂯𬏅𬘿𬝕𬧭𬴾𬵀𬵙𬿽𭀯𭀸𭅡𭏗𭔉𭕩𭚽𭟆𭬞𭶲𭿕𮗆𮗙𮞱𮠁𮫜𮫝𮫣𮫥𮫦𮫨𮫩𮫪𮫫𮯐𰅕𰔜𰘻𰡸𰣈𱐽𱜅𱯞𲁳𲂓𲃿 - -## 2023年7月17日 - -v2.2.0 發佈。 - -根據《關於增加「丌(丿改丨)」字根的提案〔宇委 2023 天字〕》,恢復「丌(丿改丨)」字根。 - -GB0中,影響「亚」「严」及相關字共15個。 -亚:一业 —— 丌䒑 -严:一业丿 —— 丌䒑丿 - -GBK中,影響「亜」及相關字3個。 -亜:丅口上 —— 丌口一 - -修正其他拆分錯誤。 - -本次更新影響以下單字的拆分: -严亚俨哑垩垭娅恶戬晋桠氩痖缙酽亜唖壸悪挜搢榗橊溍澑瑨璢畱癅縉鄑鐂铔霊飅驑㙧㩅㫫㬐䅉䴡𠀜𠅛𠋿𠏊𠐚𠒋𠞐𠼁𡋲𡏍𡟽𡠂𡦌𡹕𡺽𢊺𢔲𢥍𢧫𢨙𢮮𢲖𢳩𣊰𣌽𣱌𣶑𣺯𤂢𤄉𤉁𤖥𤞤𤨁𤩖𤮷𥉢𥛽𥢋𥨌𥰸𥷢𦠝𦵻𧎽𧪽𨍬𨖻𨻥𩂳𩅸𩔰𩞷𩤼𩬾𩮢𪅳𪇾𪋳𪨂𪨷𪰥𪶮𪷎𪹓𪿊𫒣𫤌𫥍𫥼𫪂𫫇𫭲𫰫𫱷𫲒𫳃𫳇𫿞𬁺𬂲𬅮𬇬𬓎𬥔𬥤𭂿𭃀𭄘𭉟𭊇𭒭𭔿𭚣𭞔𭡛𭡵𭦢𭭈𭭒𭯋𭴪𭺪𭻍𮆕𮇔𮊚𮍇𮠑𮠕𮥔𮪜𰁲𰅰𰌦𰎠𰒜𰖈𰗝𰗻𰙽𰡉𰤐𰦴𰦾𰧡𰭋𰲸𰵨𰹤𰾪𱉨𱍰𱎫𱎿𱏀𱒭𱙎𱙔𱛝𱫯𱽛𲂉𲍓𲍣𮰴𮳁𮴆縉搢鄑 - -更新部分臺灣兼容拆分。 - -更新部分簡碼。 - -## 2023年7月6日 - -v2.1.3 發佈。 - -修正「一橫二豎」及相關字的拆分,使其爲「丅丨」而非「一〢」,包括: -亜唖悪橊澑璢畱癅籒鐂飅驑㙧㩅𠀜𠋿𡋲𡏍𡟽𢊺𢔲𢥍𢮮𢲖𢳩𣊰𣱌𤄉𤉁𤩖𤮷𥉢𥛽𥢋𥨌𥶅𥷢𦠝𨖻𩅸𩞷𩮢𪅳𪰥𫫖𫰫𬂲𬅂𭄘𭔿𭺪𭺫𮆕𮊚𮠕𰤁𰤐𰧡𰹤𱳤 - -修正「𤩮」的拆分爲「王土日殳」。 - -修正若干簡碼。 - -## 2023年7月3日 - -v2.1.2 發佈。 - -修正「黃」及相關字的臺灣字形拆分。 - -更新預顯示的 lua。 - -## 2023年6月30日 - -v2.1.1 發佈。 - -修正部分錯誤拆分。 - -## 2023年6月20日 - -v2.1.0 發佈。 - -增加 zhelp 引導快捷功能開關([王牌餅乾](https://github.com/lost-melody/))。 - -## 2023年6月18日 - -癸卯年五月初一日,宇浩輸入法 v2.0.0 正式版發佈。 - -## 2023年6月15日 - -在線拆分查詢系統中,現可點擊查詢結果中的漢字,從而進入「字統網」查看該漢字的詳細信息。 - -特殊符號中增加部分 Emoji。 - -## 2023年6月14日 - -預覽版 v2.0.0-rc.1 發佈。 - -修正和删除一批錯誤的繁體用字。 - -## 2023年6月12日 - -預覽版 v2.0.0-rc 發佈。 - -根據大量反饋(主要是宋大佬、麥大佬、笑大佬,還有群裏的小夥伴),作出以下調整。 - -删除字根: - -- 歹 = 一夕 〔使用頻率較低〕 -- 凡 = 几丶 〔使用頻率較低〕 -- 攴 = 卜又 〔使用頻率較低〕 -- 矛 = 予丿 〔使用頻率較低〕 -- 爾 = 一八巾乂乂乂乂 〔使用頻率太低〕 -- 羽 = 习习 〔對立較少,没有必要分離〕 - -增加字根: - -- 里 Kk 〔避免因筆順造成的歧義,呼聲很高。同時,改善了高頻「重」、「動」等字的手感。且「重」字不再需要使用繁體字根「車」。〕 -- 高(亠口、亠口冖)Ol 連續編碼 〔這個是初版的字根,現恢復它,目的是離散「京」「亮」等字。注意,存在歪脖拆的可能:襄 = {亠口}口𠀎𧘇。還要注意穿插:衷:{亠口}丨𧘇〕 -- {⺍一} Is 爲「氵」的附屬根 〔這是爲了和丷䒑一致。所以:兴 = {⺍一}八,应 = 广{⺍一}〕 -- 彑 Bm 同{互中}。〔「彐」和「彑」其實是同字不同形。「彑」爲字根很,「緑」「綠」等字同構同拆。且「互」和「亞」「亚」拆法相同。〕 - -改變小碼: - -- 氵 Ic -> Is 〔取其聲母〕 -- 习 Xu -> Xi 〔取其韻母,正好等於該字全拼〕 - -豎不包夾: - -- 豎向離散的字根,不可包夾其他字根。特别的,「二」「三」出現包夾,就拆爲分散的「一」,如:亘 = 一日一,畺 = 一田一田一。減少判斷的難度。 - -部分臺灣字形拆分補充和修正: - -- 沉 = 氵冖儿 -- 麥 = 來夊〔上方視作「來」的變形,拆爲「十人人人」没有必要。〕 - -簡體前150字,編碼改變五個: - -- 重 = 千里 -- 高 = 高 -- 就 = {京頭}小尤 -- 没 IQhc -> IQhs -- 应= 广{兴頭} - -優化繁體簡碼的設置,縮減碼長。 - -以下爲重碼數據對比: - -| 形碼方案 | GB2312 | 通規一二級 | 國字常用 | 常用繁簡 | GBK | 簡體選重率 | 繁體選重率 | 繁簡混合文本選重率 | 簡體詞語选重率 | -| :-------------- | -----: | ---------: | -------: | -------: | ---: | :--------- | :--------- | :----------------- | :------------- | -| 宇浩v2.0.0 | 314 | 265 | 208 | 583 | 5171 | 5.2‱ | 15.3‱ | 17.1‱ | 116.1‱ | -| 宇浩v2.0.0 | 318 | 273 | 202 | 584 | 5178 | 4.9‱ | 15.1‱ | 16.6‱ | 109.7‱ | - -以下是對於部分意見的反饋: - -某位不願透露姓名的宋姓大佬:能不能二三不包夾?不然總是轉不過彎來。 -反饋:可以的,不過靜態重碼會上升。 -某位不願透露姓名的宋姓大佬:最好豎向的組合字根都不包夾。 -反饋:可以可以,大佬肯背書就好。 - -某位不願透露姓名的宋姓大佬:彑和{互中}合併。 -反饋:好的。 - -小夥伴:「重」居然要用繁體根「車」。而且「里」的筆順總是弄錯。 -反饋:「里」值得一個字根。重 = 千里,手感提升。 - -小夥伴:舞 = 𠂉卌歹ヰ?真丑。 -反饋:「歹」删了! - -小夥伴:「凡」「攴」爲什麼是字根? -反饋:同意,這倆頻率太低,删了。 - -小夥伴:羽 = 习习? -反饋:「习」除了「𠁨」外沒有單獨使用的,所以把它作爲了「羽」的附屬。不過旣然不存在對立,把「羽」删了也好。 - -小夥伴:「亠口」可以分離「京」「高」等字形,否則打詞不舒服。 -反饋:同意,恢復高字根,「亠口」「亠口冖」作爲它的附屬,小碼就用「口」的區碼 L。 - -小夥伴:碼長有些長。 -反饋:同意,簡碼過於陳舊,有的一、二簡還是重複的,需要更新一下。 - -## 2023年6月11日 - -公测版 v2.0.0-beta.2 發佈。 - -恢復簡體簡碼中的两個一簡字: - -- C 好 -- O 为 - -「二」「三」包夾不再分情况討論,一律允許包夾,包括: - -亜唖悪戩晉𠀥𡏍𢳩𣊰𣱌𤇟𤉁𤐦𤩖𨫌𪬕𪰥𫠱𫫖𫰫𬂲𬅂𰤐 - -## 2023年6月10日 - -公测版 v2.0.0-beta.1 發佈。 - -優化簡體簡碼設置,縮減碼長。 - -特别的,一簡有以下變化: - -- C 好 0.38% -> 也 0.50% -- H 地 0.46% -> 到 0.61% -- O 为 0.39% -> 说 0.63% -- T 个 0.78% -> 人 0.97% - -二簡有以下變化: - -- CV 始 -> 好 -- HC 车 -> 地 -- OX 辛 -> 为 -- TN 用 -> 个 - -調整結果如下: - -| 方案 | 毛泽东选集(简) | 天龙八部(简) | 三体(简) | 战争与和平(简) | 史記(繁) | 紅樓夢(繁) | 笑傲江湖(繁) | 論語集解(繁簡混) | -| :---------- | -------------: | -----------: | -------: | -------------: | -------: | ---------: | -----------: | ---------------: | -| 五笔86 | 3.12 | 3.31 | 3.21 | 3.24 | 3.59 | 3.44 | 3.45 | 3.49 | -| 五笔98 | 3.05 | 3.19 | 3.12 | 3.15 | 3.42 | 3.32 | 3.32 | 3.29 | -| 蓝宝石 | 3.04 | 3.1 | 3.03 | 3.05 | 3.48 | 3.29 | 3.29 | 3.36 | -| 徐码23 | 3.15 | 3.21 | 3.18 | 3.17 | 3.49 | 3.32 | 3.33 | 3.33 | -| 宇浩·調整前 | 3.16 | 3.16 | 3.09 | 3.11 | 3.51 | 3.29 | 3.32 | 3.41 | -| 宇浩·調整后 | 3.13 | 3.12 | 3.06 | 3.09 | 3.52 | 3.28 | 3.3 | 3.38 | - -## 2023年6月9日 - -「卿」由「𠂎彐厶卩」改拆「卯彐厶」,因爲少根。 - -此更改還影響大字集中相似字形漢字4個:𣛬𦺄𬁋𮬐 - -## 2023年6月1日 - -公测版 v2.0.0-beta 發佈。 - -小碼改變: - -- 二 Se -> Si 分散雙手 -- 宀 Oo -> Ob 聲母「寶蓋」 -- 立 Ii -> Id 分散雙手 -- 业 Kk -> Kg 分散雙手 -- 早 Jo -> Jd 連續小碼「日十」分散雙手 -- 彐 Xx -> Xl 分散雙手 -- 阝 Cf -> Cj 分散雙手 - -## 2023年5月31日 - -小碼改變: - -- 业 Kk -> Ki - -## 2023年5月30日 - -内测版 v2.0.0-alpha.beta 發佈。 - -字根認定: - -- 認定「业」爲字根,編碼爲 Kk - -受其影響,簡體優先方案的簡碼位有如下變化: - -- uk 赢 -> 普 -- un 普 -> 烟 -- kk 婴 -> 业 -- nu 业 -> 圈 -- jk 映 -> 显 -- jn 显 -> 崮 -- mk 帽 -> 虚 -- mn 虚 -> 皿 - -受其影響,繁體優先方案的二簡位有如下變化: - -- n 對 -> 回 -- ku 剛 -> 對 -- nl 回 -> 圖 -- un 普 -> 廠 -- mn 虚 -> 皿 - -## 2023年5月29日 - -小碼改變: - -- 龰 Nd -> Nf 避讓「鬥」 - -## 2023年5月28日 - -内测版 v2.0.0-alpha.3 發佈。 - -字根認定: - -- 認定「𦣞」「𦣝」字根同「臣」,如 熙 = 臣巳灬,姫 = 姬 = 姬 = 女臣 -- 認定「𦍌」字根同「羊」,如 美 = 羊大,義 = 羊我 = 羊丿扌戈 - -小碼改變: - -- 身 We -> Wm 分散雙手 - -## 2023年5月25日 - -内测版 v2.0.0-alpha.2 發佈。 - -小碼改變: - -- 飛 Bf -> Bk 分散雙手 -- 龰 Nh -> Nn -> Nd 防止 Nh 單指跨行 -- 彡 Ti -> To 讓出碼位給「八」 -- 八 Tb -> Td -> Ti 防止 Tb 單指大跨行,分散雙手 -- 乃 Va -> Vj 分散雙手 -- 九 Yj -> Yf 分散雙手,汉字密度 Yj19 Yf11 - -## 2023年5月23日 - -内测版 v2.0.0-alpha.1 發佈。 - -增加一個文件夾 [generator](../../beta/generator/),包含三個用來生成一級、二級、三級簡碼字詞的文件。如果發現任何 bug,可以直接提出 issue 或者 push commits。 - -## 2023年5月22日 - -四重註解中,詞語編碼用大小寫來區分大小碼。 - -加入「功能開關一鍵配置」文件: - -- yuhao.custom.yaml -- yuhao_tradition.custom.yaml -- yuhao_tradition_tw.custom.yaml - -删除「四豎」字根,因爲只在全字集中被使用了一次。 - -## 2023年5月21日 - -RIME 增加拼音註解。現總共爲四重註解。 - -小碼改變: - -- 凵 Xa -> Xe -> Xg 韻母「丱」,防止大跨行 - -## 2023年5月20日 - -增加測試版方案的[在線字根練習](../../beta/practice/practice.html)。 - -小碼改變: - -- 其 Dq -> Dj 聲母,減少小拇指負擔 -- 凵 Xa -> Xe 韻母 - -## 2023年5月19日 - -增加近四千個臺灣字形兼容拆分,調整臺灣方案簡碼。凡臺灣繁體詞語,都使用臺灣字形編碼。比如「起來=走己來」`DBDl` 和「起=走巳來」`DCDl` 兼收。 - -在線拆分系統現也增加臺灣拆分一欄。 - -小碼改變: - -- 氵 Iv -> Iu -> Ic 分散雙手 -- 艹 So -> Sa -> Sj 韻母,防止 Sa 無名指小拇指連擊 -- 乂 Wa -> Wl 分散雙手 - -## 2023年5月18日 - -小碼改變: - -- 扌 As -> Ao 韻母,防止 As 無名指小拇指連擊 -- 壬 Er -> En 韻母,分散雙手,汉字密度 Er22 En14 -- 士 Hh -> Hf 分散雙手 -- 户 Ih -> Ie 分散雙手 -- 水 Kh -> Kv 韻母 u 轉 v,汉字密度 Kv7 Kh13 -- 冂 Kg -> Kf, 同 「匚」Gf小碼一致 -- 目 Mu -> Mk -> Mf,增加双手互击。 -- 虎 Mh -> Mu 韻母,汉字密度 Mh20 Mu6 -- 巾 Mv -> Mj -> Mv -- 王 Gv -> Gw -> Gn,增加双手互击,汉字密度 Gw25 Gn7 -- 龰 Nh -> Nn, 防止 Mh 單指跨行,汉字密度 Nh 13 Nn 5 -- 之 Pc -> Pe,改善手感 -- 𠂇 Sv -> Ss -> So 「左」韻母。 -- 巛 Vh -> Vc,聲母,同 「川」Qc 小碼一致,汉字密度 Vc3 Vh11 - -增加一個自定義碼表:yuhao.private.dict.yaml,優先級高於官方詞庫。原自定義碼表 yuhao.private.dict.yaml 優先級低於官方詞庫。 - -## 宇浩卿雲更新历史 - -### 2023年5月9日 - -修正拆分: - -- 叀:視爲「車」的附屬根,同「專」上。影響大字集的字如右:叀𠵤𡞍𡲡𢮨𣓧𣚢𣶣𤴛𥮔𦁆𦑐𧈌𭤈 -- 槑 - -### 2023年5月7日 - -「发」字由〔<逆折>夂丶〕拆爲〔𠂈又丶〕,卽視「⺃丿」爲字根(卽「𠂈」出頭),由「屮」統攝。 - -原因: - -- 「⺃丿」字根(卽「𠂈」「丩」出頭)已經存在於部分漢字中,如:𠈷𦭺𩑿𦱠𠬞。 -- 「发」下爲「丿又」,不爲「夂」。雖可視爲「夂」的變體,但不够直觀。 -- 「发」「犮」爲部首的字拆分更加統一。 -- 「夂」上穿筆畫的字,現於宇浩輸入法中,基本都拆出「又」。如:「緩」不拆〔糹爪二夂〕而拆〔糹爪干又〕。 -- 由於「发」是簡化漢字,故而此更改主要影響的是 GB2312 字集。 -- 更改後,「发」可設爲 Xb 上的二簡字,避開了高頻「收」字。 - -修正其他含此字根的漢字拆分: - -- 𠈷,亻田丩 -- 𠬞,丩又 -- 𦭺,艹丩丩丩 -- 𩑿,䒑丩貝 -- 𦱠,屮屮丩屮屮 - -本次更改影响: - -- GB2312 字集内 4 字全碼:发废拨泼。 -- GBK 字集内其他 3 字全碼:袯酦䥽。 -- CJK 擴展區 16 字全碼。 - -爲方便過渡,增設「发废拨泼」四字容錯碼。 - -### 2023年5月4日 - -将「𮓡」头认定为「虍」的异体。一共影响全字集20个字:𭄏𭅍𭇢𭞐𭞥𭟾𭸣𭸮𭾐𮉗𮎗𮓘𮓙𮓜𮓠𮓡𮓥𮙟𮬗𱮫 - -修正部分简码错误。 - -### 2023年5月2日 - -修正拆分: - -- 𠈷,亻田𠃋丨 -- 𠬞,𠃋丿又 -- 𦭺,艹𠃋丿𠃋丿𠃋丿 -- 𩑿,䒑𠃋丿貝 -- 𦱠,屮屮𠃋丿屮屮 - -其他修正。 - -本次更改影响大字集 12 字。 - -### 2023年4月29日 - -修正拆分: - -- 「丷厂」改拆「䒑丿」。 -- 「肀」偏旁校正。 - -本次更改影响 GB2312 字集 1 字,影响大字集 22 字。 - -### 2023年4月28日 - -修正拆分: - -- 躖䏋 -- 「𦍎」为偏旁的字。 - -本次更改影响 GBK 字集 10 字,影响大字集 41 字。 - -### 2023年4月26日 - -修正拆分: - -- 𣑍𤓑𮠊𦦴:四字的頭部視爲「冎」的附屬根 -- 𡆵𠀌𠚒 -- 其他修正 - -### 2023年4月19日 - -修正拆分:「庸」拆为「广{聿上}月」,而不是「广彐月丨」,因为字根最少。 - -本次更改影响GB2312字集5字,GBK字集9字。造成常用字GB2312内一组重码:「庸」「朔」。 - -### 2023年4月18日 - -修正拆分:「那」拆为「𠃌キ阝」,而不是「刀二阝」,因为符合笔顺。 - -### 2023年4月14日 - -修正拆分:「耒」拆为「丰八」,而不是「一未」,因为取大。 - -本次更改大约影响GBK字集25字,全字集230字。 - -### 2023年4月11日 - -修正拆分: - -- 「朱」拆为「牛八」,而不是「丿未」,因为取大。 -- 「夬」拆为「ユ人」,而不是「𠃌大」,因为取大。 -- 「曹」拆为「𠀎冂日」,而不是「卄日日」,因为取大。 -- 「釜」拆为「八乂干䒑」,而不是「八乂王丷」,因为完全符合笔顺。 -- 「㑒」拆为「合人」。 - -本次更改在GB2312字集中大约影响30字。 - -### 2023年4月10日 - -修正拆分: - -- 「別」类字:拆为「口勹刂」,而不是「口⺈刂」。大约影响8字。 -- 「覽」的右上方:拆为「{竹右}日」,而不是「{竹右}丶日」。大约影响18字。 -- 「旮」:拆为「九日」,而不是「九曰」。 - -### 2023年4月9日 - -修正一组拆分: - -- 「爰」类字:拆为「爪干又」,因为连而不交。 - -### 2023年4月5日 - -修正一組拆分,影響 GBK 中的兩個漢字: - -- 「沒」 `IYbu` - `IWbu` -- 「歿」 `DYbu` - `DWbu` - -### 2023年3月24日 - -修正CJK-B區,「辶」「廴」「凵」相關部首的拆分錯誤。 - -### 2023年3月23日 - -修正「带」「监」等相关字形的拆分。 - - -## 宇浩一代更新日志 - -### 2023年5月12日 - -增加方案「書同文」,方案文件名 yuhao_tradition_tw。以臺灣傳統漢字字形爲標準設置簡碼。例如: - -- I 的一簡字設「沒」而非「没」。 -- OW 上的二簡字設「為」。 -- SH 上的二簡字設「著」。 - -### 2023年5月9日 - -词库码表结构优化,分为核心词库、增广词库、成语诗词词库三部分,各自分繁简。核心词库对应了宇浩一级词库,增广词库对应了宇浩二级词库中的非成语诗词。名称如下: - -- yuhao.words -- yuhao.words_extended -- yuhao.words_literature -- yuhao_tradition.words -- yuhao_tradition.words_extended -- yuhao_tradition.words_literature - -### 2023年5月5日 - -词库码表结构优化,现将词库分为核心和增广词库,各自分为繁简。核心词库对应了宇浩一级词库,增广词库对应了宇浩二级词库。名称如下: - -- yuhao.words -- yuhao.words_extended -- yuhao_tradition.words -- yuhao_tradition.words_extended - -### 2023年5月4日 - -增加 CJK 扩展 I 区的 603 个汉字。字形来源:[https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf](https://www.unicode.org/L2/L2023/23114-unc-extension-i.pdf) - -同步更新拆分表和在线查询系统。 - -### 2023年4月20日 - -由于字集过滤插件表现良好,故而不需要一个单独的新手方案和词库,现删除新手方案,只保留繁体简码和简体简码两个方案。 - -### 2023年4月19日 - -优化常用字集过滤插件。使用集合法重写代码,大幅度提升运行效率,不再有卡顿现象。 - -更新反查码表。 - -修正拆分错误。 - -### 2023年4月18日 - -根据反馈,作出以下调整: - -其一,「疒」字根的小码由 `Pv` 改至 `Pb`。目的:不让低频「疽」抢占三简位。影响:凡「疒」头两根字,原本为三码出字,今一律加一补位码 `b`。 - -其二,增加字根「聿上」(彐丨),为「彐」的附属根。影响「肃」「盡」相关字形,包括但不限于: - -- 肃,改拆「{聿上}{介下}八」。 -- 肅,改拆「{聿上}片爿一」。 -- 盡,改拆「{聿上}一灬皿」。 -- 唐,改拆「广{聿上}口」。 - -其三,更改「爿」字根小碼,由 `Xg` 改爲 `Xp`,同「片」的 `Tp` 一致。 - -其四,修正拆分。「那」拆为「𠃌キ阝」,而不是「刀二阝」,因为符合笔顺。受此影响,`B` 键一简改为「对」,「那」设为二简 `Va`。 - -此次更新影响 GB2312 拆分 16个,编码 33 个。影响 GBK 编码 73 个。 - -优化反查系统,使繁简汉字同权数,便于繁简通打。 - -### 2023年4月17日 - -更改「爲下」字根的码位:由 `Yw` 改至 `Ww`。目的是避让「你」字,将高频「爲」字设为二简 `EW`。此次更新只影响繁体。影响GBK拆分20个,影响大字集拆分约50个。重码不变。 - -### 2023年4月14日 - -全面更新官网设计,优化美工,允许站内搜索。 - -### 2023年4月13日 - -更新在线拆分系统: - -- 除单字外,现在还允许用户查询词语和句子。拆分系统会按行显示所有汉字的拆分。 -- 优化美工。 - -### 2023年4月12日 - -对「古」「合」字根进行解释: - -- 「古」下的「口」中如果包含完整的笔画,应该拆如「十囗」。例如:「鄙」左下方的「口」中有「口」,故而应该拆成「口十囗口阝」。 -- 「合」下的「口」中如果包含完整的笔画,应该拆如「人一囗」。例如:「會」中間的「口」中有「小」,故而应该拆成「人一𫩏丷日」。 - -此更改影响 GB2312 字集中 1 个汉字「鄙」,影响 GBK 字集另外 35 个汉字,影响大字集 54 个汉字。 - -优化部分简码。 - -### 2023年4月11日 - -校正部分拆分错误。更新在线字根练习。 - -增加常用字练习。更新1-50汉字。 - -更新码表。 - -### 2023年4月10日 - -校正部分拆分错误,更新字根图、在线字根练习。 - -更新码表。 - -### 2023年4月8日 - -陆续受到了不少用户反馈,对以下几点表达出关切: - -- 折区相似字形的字根被分配在不同的大码上,不适合新人快速学习。比如:之辶、也乜、子了、矛予、己已、巴巳、幺厶纟。 -- 右手无名指的频率高于右手中指。 -- 「高」「㗊」等字根作用不大,可以移除。 -- 对部分拆分规则进行优化,兼顾拆字「逻辑性」和「直观性」。 - -因此,我对字根进行了如下调整: - -删除字根: - -- 高 -- 㗊 - -相似字根合并大码: - -- 之辶同`P`:之 `Ok` - `Pc` -- 也乜同`C`:「乜」转为「也」的附属根 -- 子了同`V`:子 `Bi` - `Vk` -- 矛予同`C`:矛 `Xo` - `Co` -- 己已同`B`:已 `Vy` - `Bi` -- 巴巳同`C`:巳 `Xs` - `Ck` -- 幺厶纟同`V`:幺 `Co` - `Vo` - -其他大码调整: - -- 户:`Oh` - `Ih` -- 𧘇:`Wy` - `Ry` - -代表根转为附属根: - -- 「青头」从「士」:`HHff` -- 「春头」从「夫」:`Guff` - -为了降低字词动态重码、避让简码、优化手感,还作出了以下的小码调整: - -- 且 `Mq` - `Mi` -- 冖 `Ym` - `Yv` -- 穴 `Pu` - `Px` -- 心 `Yv` - `Yn` -- 凵 `Xc` - `Xa` -- 向 `Rg` - `Rn` -- 巴 `Ca` - `Cb` -- 弓 `Vo` - `Vg` -- 甲 `Ka` - `Kj` -- 艹 `Sv` - `So` -- 𠂇 `Su` - `Sv` -- 飛 `Be` - `Bf` -- 車 `Gj` - `Gc` -- 二 `Sr` - `Se` -- 而 `Sj` - `Sr` -- 糸 `Bv` - `Bs` -- 尸 `Bh` - `Bv` -- 攴 `Ku` - `Kp` -- 文 `Pe` - `Pw` -- 目 `Mv` - `Mu` -- 三 `Fn` - `Fa` -- 犬 `Sa` - `Sq` -- 巾 `Mj` - `Mv` - -对于拆分规则进行细化: - -- 「万」拆「一勹」:优化「拆分美观」规则,半包围结构不分拆。 -- 「二」「三」包夹其他字根,必须保证上下两横的独立性,且中间只有一个字根。 - -更新字根图,对小码进行颜色标注。凡小码正好为声母的,标注为蓝色;凡小码正好为韵母的,标注为褐色。 - -更新在线练习软件。 - -更新在线拆分查询。引入一栏「注释」,对某些比较容易混淆的拆分进行规则解释。 - -更新一、二级简码字。 - -更新 Rime 方案,将码表分拆为若干分码表,所有分码表都由主码表导入,便于用户开启或关闭。分码表如下: - -- 简码字词 -- 全码字 -- 一、二、三级词库 -- 特殊符号 - -重码分析: - -- GB2312:304到309 -- 国字常用:206到214 -- GBK:4937到4993 -- 动态重码简体、繁简混合都不变。繁体从0.15%上升到0.16%。 - -### 2023年4月4日 - -正式推出宇浩词库。该词库对词语和排序进行了优化,并分为若干词库文件,借此保障用户的自主选择权。分词库包括: - -- 宇浩一级简体词库:约50000个核心词语。推荐只使用该词库配合单字输入,以获得最佳体验。集成在主码表中。 -- 宇浩繁体词库:约30000个核心词语,包括台湾、香港、大陆古籍繁体三种字形。默认关闭。 -- 宇浩二级简体词库:约25000个词语,频率较低,建议只在手机上开启。默认关闭 -- 宇浩三级简体词库:约20000个词语,多为成语和古诗词,除非有特殊需求,否则不建议开启。默认关闭。 - -对二级简码词进行更新。 - -更新首页内容。 - -### 2023年4月3日 - -更新两个繁体字根码位,使繁体选重率和繁简选重率得以大幅下降,提高通打效率: - -- 馬 由 `Sm` 至 `Dm` -- 金 由 `Rn` 至 `Wj` - -调整简码字若干,简体方案中: - -- `T` 人 - 个 -- `WJ` 胆 - 金 -- `RN` 金 - 徜 -- `LM` 忠 - 吊 -- `DE` 故 - 斯 -- `MK` 贞 - 帽 - -繁体方案: - -- `CS` 媽 - 隨 -- `SM` 馬 - 夢 -- `LS` 嗎 - 器 -- `LD` 喫 - 嗎 -- `RN` 金 - 徜 -- `WJ` 腸 - 金 -- `RS` 錯 - 舉 - -在阿吉委员的帮助下,对二级简码词进行更新。 - -以下为本次更新前后重碼的数据比较: - -| 方案 | GB2312 | 通规一二级 | 国字常用 | 常用繁简 | GBK | 简体选重率 | 繁体选重率 | 繁简混合文本选重率 | -|:--------------|---------:|-------------:|-----------:|-----------:|------:|:-------------|:-------------|:---------------------| -| 更新前 | 303 | 263 | 216 | 573 | 4964 | 0.05% | 0.17% | 0.19% | -| 更新后 | 304 | 262 | 206 | 565 | 4933 | 0.05% | 0.15% | 0.17% | - -重绘字根键位图,使字根不从中间换行。 - -[增加页面statistics](./statistics.md),提供常见输入法的重码数据比较。 - -### 2023年4月2日 - -根据反馈,在不少平台上,没有生僻字屏蔽功能,导致全码状态下生僻字优先于常用词语,造成不便。基于这个问题,做出如下调整: - -- 除了 Rime 方案,其他所有码表,都将生僻字置后。 -- Rime 方案因为存在常用字优先 lua,故而不需要进行调整。 -- 更新大大和小小平台的免安装应用程序。 - -更新字体、拆分表、字根键位图。 - -### 2023年4月1日 - -更新了對以下輸入平臺的支持: - -- 微軟五筆(需要 WubiLex 導入) -- fcitx5-Android - -在QQ群中提供小小輸入法的外掛輸入模式。 - -更新了若干一、二級簡碼,避免簡碼重複。 - -更新了詞庫,增加詞語數量。 - -更新了字根表。 - -更新了主頁和教程。 - -### 2023年3月31日 - -增加繁體方案。該方案爲繁體輸入設置了簡碼和詞庫,名爲`yuhao_tradition`。 - -根據反饋,對「點」的拆分作出規範: - -- 單點和捺在`Od`。 -- 相重疊的兩點,卽「头」「冬」中的部分,同「二」`Sr`。 -- 左對點「冫」和右對點「飞右」,同「二」`Sr`。故而「兆」拆爲「儿二二」。 -- 下對點「八」在`Tb`。 -- 上對點「丷」在`Uh`。 -- 所有三點都在`Iv`。 -- 所有四點都在`Uh`。 - -「为」「卵」等字的兩點不認定爲「兩點」,而認定爲兩個單點「丶」,這和「冬下」不同。 - -根據反饋,將「丽」下的一半,卽「冂丶」,認定爲「冂」的附屬根。「丽」拆作「一冂冂」,卽「一{冂丶同冂}{冂丶同冂}」。 - -根據反饋,離散的字根部件不宜被全包圍或半包圍分割。這一條主要影響的是大字集的拆分。 - -更新字根圖。 - -更新教程,增加若干新的内容,並且更正筆誤。 - -更新在線拆分系統,包括: - -- 使用宇浩字根字體顯示部分字根。 -- 增加一欄以顯示詳細的字根信息和代表根。 -- 增加一欄以顯示簡體方案的簡碼。 -- 增加一欄以顯示繁體方案的簡碼。 - -更新在線字根練習系統,部分字根用宇浩字根字體代替。 - -本次更新後,重碼數據不變。 - -### 2023年3月30日 - -根據反饋,調整若干二級簡碼,使得常用兩根字被一、二、三簡覆蓋。 - -根據反饋,增加常用字符過濾器中的常用漢字數量,全面覆蓋《通規》《國字常用》中的漢字。 - -調整部分小碼,增加左右互擊: - -- 「田」改爲`Jt`,取聲母`t`。 -- 「山」改爲`Js`,取聲母`s`。`Ja`現設爲「时」字二級簡碼。 -- 「𠂤」改爲`Yd`,取聲母`d`。和「豸」分離。 - -調整部分字根: - -- 鑑於「班中」「师左」近似易混,故不作區分,統一爲`Uh`。注意,「师左」爲`𠂤`字簡化,在臺灣標準中同「班中」。 -- 鑑於「丑」字拆分分歧較大,故而增加此字根,編碼爲`Bc`。 -- 「丅」同「下」,故而直接設置「下」字根`Ak`,並且以「丅」爲「下」的附屬根。 - -增加宋體版本字根圖。 - -重碼數據更新。GB2312:303。 - -### 2023年3月28日 - -根據反饋,調整 U 上的若干小碼: - -- 「火」改爲`Uv`。 -- 「言」改爲`Ua`,同`讠`小碼一致。`um`二簡讓給「祖」。 -- 「丷」「䒑」「灬」等對點、四點全部合併到`Uh`上,以「灬」爲代表根。 - -調整「刀」的小碼,使其碼位爲`Bd`,和「刂」一致,設爲二簡,降低`A`鍵使用率。 - -調整拆分方法,凡「冒」字頭都拆作「冂二」。 - -調整三級簡碼生成算法,二根字優先。 - -更新字根練習系統。 - -重碼數據更新。GB2312:305,國字:216,GBK:4971,簡體選重率:0.0529%,繁體選重率:0.1667%,繁簡選重率:0.2128%。 - -### 2023年3月26日 - -更新用户精確造詞功能:造詞時,先按下 \` 符號引導。 - -優化生僻字過濾lua。 - -### 2023年3月25日 - -增加用户精確造詞功能:輸入過程中,按下 ` 符號作爲分隔,使用**數字鍵或空格鍵**依次選擇單字,卽可實現精確造詞。 - -### 2023年3月24日 - -增加全字根在線練習。增加最常用50、100字根在線練習。 - -修正字根圖錯誤。 - -校正部分拆分。 - -### 2023年3月23日 - -增加至撇區的字根在線練習。 - -增加通配符功能,可以使用Z鍵代替所有的非首碼的字母進行輸入。比如`ABCD`,可以輸入爲`Azzz`。 - -全面調整二級簡碼,删除三選中不常用的詞。 - -根據反饋,爲了方便練習字根,現在將没有設爲二簡一選的字根字,全部設成三選。這樣也可以提示該大小碼上有一個字根。新手可以直接通過選重上屏,或者加一個`f`上屏。 - -對字根進行調整:「尝」的上半部分視爲「尚」根,拆作「{尚头}二厶」。因爲「尝」本身就是「嘗」簡化而來。這樣可以使得一個系列的字拆分邏輯一致。 - -### 2023年3月22日 - -對字根做出以下調整: - -- 「亠」字根改爲「宀」的附屬字根,大小碼爲「Ov」。 -- 「丂」小碼改爲`k`。 -- 「斤」小碼改爲`j`。 -- 「酉」改回`Go`。 -- 所有的豎,不管幾個豎,全部改爲`Ns`。 -- 「欠」小碼改爲`i`。 -- {亞下}由`La`改爲`Ja`。 - -增加純淨碼表,只包含單字全碼。 - -### 2023年3月21日 - -提供新的特殊符號輸入方式: - -- `zy`引導註音符號。 -- `jm`引導日語假名。 -- `py`引導拼音字母。 -- `py`引導中文標點。 -- `dy`引導德語字母。 - -提供百度、落格、小小碼表。 - -### 2023年3月20日 - -做出以下調整: - -- 「衤」字根改爲`Py`,和「𧘇」字根小碼一致。 -- 「马」字根改爲`Xm`,和「馬」字根小碼一致。 -- 修正字根圖中的錯誤。 - -字根口訣更新至捺區。 - -### 2023年3月19日 - -根據反饋,做出以下調整: - -- 「欠」字根改爲`En`,「壬」字根改爲`Ee`,「而」字根改爲`Sj`。理由是,目前高頻「次」字需要`SEqr`四碼出字,非常不方便,而且都在左手上。改動後,「次」的手感得到改善,且成爲二級簡碼。 -- 「見」字根改至`Mx`,通簡體字根`见`的小碼保持一致。 -- 「貝」字根改至`Mb`,通簡體字根`贝`的小碼保持一致。 -- 三級簡碼只對常用字集設置。設置後,一級簡碼覆蓋字頻:22.22%,二級簡碼:49.13%,三級簡碼:0.25%,簡碼共覆蓋97.78%字頻。 -- 修正字根圖中的錯誤。 - -### 2023年3月18日 - -根據反饋,做出以下調整: - -- 特殊字符改作由Z結尾。比如分號爲`fhz`。這樣做可以避免和反查衝突,還能充分利用碼位空間。 -- 修正字根圖的錯誤。 -- 將部分表示部首的特殊符號添加到碼表中,作爲字根字進行輸入。 - -### 2023年3月17日 - -字根字現在是二碼,這會造成不少不是特别常用的漢字擠佔了二級簡碼的空間,無法設置其他的高頻漢字。這不符合「越常用的漢字碼長越短」的實用主義宗旨。因此,做出一個調整: - -- 所有的代表根都在二碼後加F。 -- 所有的非代表根都在二碼後加FF。 - -大多數的字根字都是常用字,所以還是會在二級簡碼上的。 - -這樣做還有一個好處。雖然很多輸入法全碼重碼很低,但是在二級、三級簡碼位上加了常用字後,導致了**事實**重碼率的上升。不如直接從根源上對字根字進行分離。 - -用户根據前五百常用字反饋: - -- 很 需要取四碼rvnc,因爲二碼是金,三碼是銀 -- 利 需要取四碼rmdh,因爲二碼是毛,三碼是釗 - -這是因爲「金」字作爲R的代表根,造成了不少字爲三碼,搶佔了常用字的三簡。因此,做出調整: - -將「金」字根改爲Rn(這個碼位上没有什麽特别常用字),將「犭」字根改爲Rv,「僉」改为Rl,將「很」設置爲二簡。 - -川現在的碼位是Wh。但它和荒下十分相近,所以移到Qc上。這還能把二間讓給「特」。 - -聽取意見,將「酉」移到「西」的鍵位上,小碼設置爲`j`,因爲`you`被「雨尤不」佔用了。 - -绘制了简化字字根图。 - -### 2023年3月16日 - -根據反饋,對部分字根進行調整: - -- 減少QA的使用頻率。 -- 增加大小碼的左右互擊。 - -### 2023年3月12日 - -初版。 diff --git a/docs/v2/v2.md b/docs/v2/v2.md index 91aaace0..2218dd2f 100644 --- a/docs/v2/v2.md +++ b/docs/v2/v2.md @@ -1,12 +1,12 @@ -# 宇浩二代·光華 +# 宇浩·光華