diff --git a/_config.yml b/_config.yml index f5f2a54..8800f2f 100644 --- a/_config.yml +++ b/_config.yml @@ -1,5 +1,5 @@ -title: 宇浩输入法 -description: ·繁简通打·极致低重·全汉字输入 +title: 宇浩输入法·繁简通 +description: 繁简通打·极致低重·全汉字输入 theme: just-the-docs url: https://zhuyuhao.com/yuhao/ @@ -19,4 +19,26 @@ nav_external_links: url: https://apps.apple.com/us/app/%E4%BB%93%E8%BE%93%E5%85%A5%E6%B3%95/id6446617683 hide_icon: false # set to true to hide the external link icon - defaults to false -markdown: kramdown \ No newline at end of file +# markdown: kramdown + +kramdown: + syntax_highlighter_opts: + block: + line_numbers: false + +callouts_level: quiet # or loud +callouts: + highlight: + color: yellow + important: + title: Important + color: blue + example: + title: Example + color: green + note: + title: Note + color: purple + warning: + title: Warning + color: red \ No newline at end of file diff --git a/docs/articles/articles.md b/docs/articles/articles.md new file mode 100644 index 0000000..2570425 --- /dev/null +++ b/docs/articles/articles.md @@ -0,0 +1,11 @@ +--- +layout: default +title: 相关研究文章 +nav_order: 51 +has_children: true +--- + + +# 相关研究文章 + +这里呈现一些同宇浩输入法相关的研究文章。 diff --git a/docs/discussion.md b/docs/articles/discussion.md similarity index 95% rename from docs/discussion.md rename to docs/articles/discussion.md index 10cfcf9..001d2f0 100644 --- a/docs/discussion.md +++ b/docs/articles/discussion.md @@ -1,13 +1,23 @@ --- -title: 設計哲學 +title: 宇浩輸入法設計哲學 layout: default -nav_order: 31 +parent: 相关研究文章 --- # 宇浩輸入法設計哲學 +{: .no_toc } -## 1. 初衷 +
+ + 目录 + + {: .text-delta } +1. TOC +{:toc} +
+ +## 初衷 2021年底,我开始用中國大陸《古籍通規》標準的繁體字創作一部長篇小説。小説中有大量的文言段落、文白夾雜的對話,以及詩詞。因此,我發現重碼太高的拼音輸入法無法滿足我的需求。我急需一款能够具有高度確定性的輸入法。 @@ -44,11 +54,11 @@ nav_order: 31 - 宇浩输入法部分借鉴了徐码的首根小码后置(回头码)的特点,但徐码的副根字无论在任何情况下都要回头,这等同于在输入单字的时候一直判断取三根还是四根,容易出错。宇浩输入法只有在编码不足四码(双根字)的情况下才需要补上首根小码。 - 宇浩输入法使用了和五笔一样取一二三末根。而不是郑码和徐码那样,有时候取一、二、次末、末,有时候取一二末。这样选择,是因为倒数第二根的判断比较困难,打字的时候容易卡壳。 -## 2. 評價輸入法各個維度的討論 +## 評價輸入法各個維度的討論 這一章我討論評價一款輸入法的各個維度,引出我製作這個輸入法的動機和目標。 -### 2.1. 關於重碼 +### 關於重碼 本着**實用主義**和**現實主義**原則,我將漢字的輸入分爲打字和檢字兩部分: @@ -63,7 +73,7 @@ nav_order: 31 4. 大字集:GBK 字集重碼字 ~ 5000 5. 部分有若幹形態的部首進行歸併。 -### 2.2. 關於編碼規則 +### 關於編碼規則 編碼的規則應該足够簡單和直觀,避免太多的判斷和回改。以下是關於編碼規則的部分偏好: @@ -90,7 +100,7 @@ nav_order: 31 - 不足四碼時,補上末根小碼 - 仍然不足四碼時,補上首根小碼(如果是v不用補) -### 2.3. 關於字根分佈 +### 關於字根分佈 對於字根分佈,有幾個維度。一者,字根是否按橫豎撇捺分區排布;二者,一個鍵上的字根是否具有相似的屬性;三者,是按照鍵盤分區(打字主義,單映射),還是按字母表分區(檢字主義,雙映射);四者,如果有小碼,小碼是如何決定的。 @@ -107,7 +117,7 @@ nav_order: 31 - 大區内比較隨機。 - 字根小碼用拼音提示。(某些字根用v鍵) -### 2.4. 關於拆分規則 +### 關於拆分規則 優先級: @@ -118,12 +128,12 @@ nav_order: 31 - 包圍不拆散,比如昜。 - 豎變斜是變形。 -變形幅度在直觀的範圍内。這一點無法完全量化,畢竟文字是藝術。所以,我也增加了兼容碼。 +變形幅度在直觀的範圍内。這一點無法完全量化,畢竟文字是藝術。所以,我也增加了地區字形兼容碼。 -### 2.5. 字形 +### 字形 某些字形在常用字集内没有區分,或者共用 Unicode 碼位。真正的字形區分往往在 CJK 拓展區,屬於檢字範疇。爲了不增加判斷難度,因此: - 冫和ㄑ都拆成二 -- 日曰除卻「曰汩㫚旮」外都一併爲「日」 +- 日曰除卻「曰汩㫚」外都一併爲「日」 - 木朩𣎳字源不同,但已經混同,术朮亦同。故而不作區分。 diff --git a/docs/articles/guji.md b/docs/articles/guji.md new file mode 100644 index 0000000..05d8c17 --- /dev/null +++ b/docs/articles/guji.md @@ -0,0 +1,56 @@ +--- +title: 關於《古籍印刷通規》 +layout: default +parent: 相关研究文章 +--- + + +# 關於《古籍印刷通用字規範字形表》 + +原文地址:[https://www.zhihu.com/question/494817799/answer/2647217480](https://www.zhihu.com/question/494817799/answer/2647217480) + +本回答使用《古籍印刷通用字規範字形表》所列標準書寫。我已使用本標準所列字形,使用形碼輸入法寫了四十萬字的小説,以下爲箇人心得體會。 + +首先説明態度,總體樂觀: + +- 本標準的出臺有利於解決繁體字出版時的標準混亂。無論它是否完美,有一個大陸標準,好過没有標準或多標準混合使用。 +- 本表遠非完美,甚至存在不少問題,需要不斷修訂。 +- 以下逐條討論,排名不分先後: + +本表並未規定繁簡的對應關係,有時多箇異體字都在表中,可以自由選擇。例如:「箇」、「個」都在表中,並未強制使用「箇」作爲「个」的繁體。我們大可基於最大分離原則,除「箇中」外,都使用「個」,甚至「个」。也可以按照《辭源》實際用字選取「箇」。 + +本表對部分異寫字的字形作出了選擇,但大體上同《辭源》相同。有答案説,本表收「峰」,《辭源》收「峯」,兩者不一致,我並不同意。理由是在《辭源》中「峰」、「峯」都有收錄字頭,且在注文中,也有用「峰」不用「峯」的情况,例如「軍都」、「冷泉」、「六和塔」、「胊山」等詞條。同理,見「群」、「羣」。 + +本表中部分字形或存在不統一,如「卽」左,在「鄉」及相關字中作「即」左。 + +本表存在收字不全的問題。用本表收錄的14250箇漢字,竟無法寫出本表的名字——《古籍印刷通用字規範字形表》。這是因爲不少常用字未被收錄。已發現的就有「蹦擼菇窝崗樑僱划剪古叼呆啪嘀嚐岩」等,未來應當考慮將這些字補入。 + +以下列出本表對部分字形的選擇,排名不分先後: + +- 〔肉缶〕及相關字全作「䍃」形。 +- 「朵」及相關字全作「朶」形。 +- 〔沒右〕〔歿右〕聲旁全作「殳」形。 +- 「彥」及相關字全作「彦」形,上方不作「文」。 +- 「產」及相關字全作「産」形,上方不作「文」。 +- 「吕」及相關字全作「呂」形。 +- 「即」及相關字全作「卽」形。「鄉」及相關字除外。 +- 〔絕右〕及相關字全作「色」形。 +- 「兌」及相關字全作「兑」形。 +- 「內」及相關字全作「内」形。 +- 「虛」及相關字全作「虚」形。 +- 「麼」及相關字全作「麽」形。 +- 「冊」及相關字全作「册」形。「扁」及相關字除外。 +- 「勻」作「匀」形。 +- 「袞」及相關字全作「衮」形。 + +本表只規範字形,不規範用字(如《通用規範漢字表》只規範字形,但用字參照《新華字典》或《現代漢語詞典》)。因此,也需要有一箇取優先字的基準。《辭源》第三版體例中言及:「字頭與行文的字形經過整理,一律採用古籍印刷通用字規範字形。」因此,可以將《辭源》中注釋文字的實際用字作爲取字的參攷。我在日常使用中,遵循以下的取字原則: + +- 如果兩箇字在《辭源》注釋文字實際用字中分領不同含義,則分離。如同取「修」、「脩」。 +- 異寫字(全同異體字),只選取在本表中出現的。如取「説」不取「說」,取「裏」不取「裡」,取「峰」不取「峯」,取「簡」不取「𥳑」。 +- 異寫字,如有兩箇及以上同時出現在本表中,取《辭源》注釋文字實際用字爲準。如取「秘」不取「祕」。 +- 本表中不存在的常用字,加入本表。如「古」。 +- 本表中不存在的字,如在《辭源》注釋文字實際用字中分領不同含義,則依舊進行分離。如同「唸」不在本表中,但在詞條「開口跳」的注釋中,依舊用了「唸白」一詞。故而加入本表。 + +關於繁簡轉換的實現: + +我目前嘗試在 OpenCC 的標準下實現本表中的取字方案。因爲 OpenCC 的繁體標準基於最大分離原則,故而只需要進行一次額外的 1-1 字符映射(約100行),卽可實行本表中規定的標準。 diff --git a/docs/statistics.md b/docs/articles/statistics.md similarity index 96% rename from docs/statistics.md rename to docs/articles/statistics.md index bb50bd4..dd0936a 100644 --- a/docs/statistics.md +++ b/docs/articles/statistics.md @@ -1,13 +1,23 @@ --- title: 常见输入法重码对比 layout: default -nav_order: 41 +parent: 相关研究文章 --- # 常见输入法重码数据对比 +{: .no_toc } -## 1. 重码数据 +
+ + 目录 + + {: .text-delta } +1. TOC +{:toc} +
+ +## 重码数据 这里将世面上可见的各类形码输入法的重码数据(全码)进行对比,统计其在不同汉字字符集下的单字全码的重码数量。其中: @@ -59,7 +69,7 @@ nav_order: 41 | **音形方案 简体方案** | | 小鹤音形 | 730 | 725 | - | - | - | 0.85% | - | - | -## 2. 码表来源 +## 码表来源 码表数据基于: @@ -75,6 +85,6 @@ nav_order: 41 - [092五笔] - [小鹤] -## 3. 125个大陆繁体字形 +## 125个大陆繁体字形 蟶衆螄斕綉覈飆淩轆癡刴戩糉㨃擡佈圇箇絝啓廡儕槪顴躋鉅鋭鎚牀廏衹朶讞噁瑋旣蓽嬡僞蹟癟艶淼㑚紈餚攢樑噠繮曬崗壎濕竈殞揹瓚鵰痠鈺巘裏曁皁奬諏孃贇閆跥歎産顔頽摻爲絶昇繳躱薦閲謔卽纔剮闕暘屌勳覷伲崟蹌饋駡曇躥翀熒鹵説唄龕裋衊㞞〇誒侷玅薈齶燼嬈鉢檯喫摳鶩縐滷襬麪 diff --git a/docs/cookbook.md b/docs/cookbook.md index 6117ffd..01592e6 100644 --- a/docs/cookbook.md +++ b/docs/cookbook.md @@ -17,7 +17,8 @@ nav_order: 11 {:toc} -这里,我会对宇浩输入法的基本规则进行简单介绍。如果你从未接触过字形输入法,可以从头开始一步一步学习。[点击此处阅读详细的《宇浩繁简通打输入法教程》。](./learn) +{: .highlight } +这里,我会对宇浩输入法的基本规则进行简单介绍。如果你从未接触过字形输入法,可以从头开始一步一步学习。[点击此处阅读详细的《宇浩输入法详细教程》。](./learn) ## 汉字拼图 @@ -29,6 +30,7 @@ nav_order: 11 我们给每一个字根以「姓名」(由A到Y的25个字母构成)。当我们把部首对应的「姓」;输入到电脑中(偶尔需要输入「名」),汉字就被组合起来了,并直接显示在屏幕上。 +{: .example } 例如,「浩」这个汉字,就是由三个字根组成的:氵牛口。我们在输入的时候,只要依次输入这三个字根的「姓」,再加上最后一个字根的「名」,就可以输出这个汉字。 ## 字根姓名 @@ -48,9 +50,8 @@ nav_order: 11 在汉字体系中,最常用的100个字根(部首、笔画),占了85%的使用频率!也就是说,当你知道这100个字根的姓名(主要是姓)以后,你就可以组合出85%的汉字来。按照频率降序,这些字根是: -```md +{: .highlight } 白月丶一了日龰不丿扌戈𠂇尚土人文辶亻也米冖小讠丷口儿上至刂宀尤羊目大门自刀二阝厶子丅凵寸手西女氵殳犬灬甲力彳丁心斤乚禾又木匕走己之而八生十身𬺰彐夕豕面矢艹王见艮卜夂纟工龶巴止舌已士尸立囗竹夭户戊乙方且 -``` 所以,在接下来的学习中,请**务必**按照上面的次序记忆字根,而不是一股脑地背诵全部。先练熟*边际收益*高的字根,会显著加快上手打字的进程,增加学习乐趣和成就感。而偏僻的字根,可以等未来慢慢熟悉。[使用字根练习页面来练习最常用的50个字根](../practice/practice_50.html),然后[继续练习最常用的100个字根](../practice/practice_100.html)。 @@ -60,22 +61,21 @@ nav_order: 11 为了方便记忆,我写了一首打油诗(字根口诀),按横竖撇捺排列: -```md -A 丁丌行右瓦,耳下打七寸。 S 草头二犬厂,辰考而有臣。 -D 古來十石尤其戊,西雨不走歹豕丰, F 一木甫三工。 -G 大王革春夫,框面弋酉戈。 H 老上青士示兀牙,末世土干未至车。 - -J 早日山曰田, K 甲申由禺电,下框敲右边,重門兼繁鹵,虫贝水上见。 -L 口是心非, M 巾网貝皿且具上,小目立刀卜虎骨。 -N 方框二三竖,黑册尚止足。 - -Q 荒下没右鱼儿气,撇川竹矢凡几舟。 W 周围炙顶皆同月,千鬼上身生金牛,告头杀上谁侧缶? -E 反文人欠斤,白爪壬乌夭。 R 双人饣匕入舌臼,微禾向夕反犬毛,衣下古風僉繁鳥。 -T 八人手长二三撇,金边自用介下卯。 Y 秃盖心合豸,阜上食九鸟。 - -U 兰头将左四点火,赢框广示言亡羊, I 鹿户三点立水上。 -O 辛亥圆宝盖,言旁点撇方。 P 文门亦米走之底,病头麻穴衣字旁。 -``` +{: .important } +> A 丁丌行右瓦,耳下打七寸。 S 草头二犬厂,辰考而有臣。 +> D 古來十石尤其戊,西雨不走歹豕丰, F 一木甫三工。 +> G 大王革春夫,框面弋酉戈。 H 老上青士示兀牙,末世土干未至车。 +> +> J 早日山曰田, K 甲申由禺电,下框敲右边,重門兼繁鹵,虫贝水上见。 +> L 口是心非, M 巾网貝皿且具上,小目立刀卜虎骨。 +> N 方框二三竖,黑册尚止足。 +> +> Q 荒下没右鱼儿气,撇川竹矢凡几舟。 W 周围炙顶皆同月,千鬼上身生金牛,告头杀上谁侧缶? +> E 反文人欠斤,白爪壬乌夭。 R 双人饣匕入舌臼,微禾向夕反犬毛,衣下古風僉繁鳥。 +> T 八人手长二三撇,金边自用介下卯。 Y 秃盖心合豸,阜上食九鸟。 +> +> U 兰头将左四点火,赢框广示言亡羊, I 鹿户三点立水上。 +> O 辛亥圆宝盖,言旁点撇方。 P 文门亦米走之底,病头麻穴衣字旁。 ## 单字编码 @@ -85,27 +85,35 @@ O 辛亥圆宝盖,言旁点撇方。 P 文门亦米走之底,病头麻穴 2. 不足四码,则补上末根的「名」。 3. 仍然不足四码,则补上首根的「名」。 -例如:「的」字,分为三个字根: - -- 白,姓`E`名`b` -- 勹,姓`W`名`v` -- 丶,姓`O`名`d` +{: .example } +> 例如:「的」字,分为三个字根: +> +>- 白,姓`E`名`b` +>- 勹,姓`W`名`v` +>- 丶,姓`O`名`d` 我们在输入时,依次输入三个字根的姓`EWO`,观察到不足四码,我们补上最后一根的名`d`。因此输入`EWOd`就能够打出「的」字。 -在例如:「整」字,分为五个字根: - -- 木,姓`F`名`v` -- 口,姓`L`名`v` -- 攵(反文),姓`E`名`h` -- 一,姓`F`名`i` -- 止,姓`N`名`i` +{: .example } +>再例如:「整」字,分为五个字根: +> +>- 木,姓`F`名`v` +>- 口,姓`L`名`v` +>- 攵(反文),姓`E`名`h` +>- 一,姓`F`名`i` +>- 止,姓`N`名`i` 我们在输入时,只需要取一、二、三、末根,也就是「木口攵止」即可。依次输入四个字根的姓`FLEN`,就能够打出「整」字。 -为了输入快捷,某些常用字我们只要打它的第一个字母,加一个空格就可以了,我们叫这些常用字为一级简码字。从A到Y排列,一级简码字分别是:`把对好不的一大地没是上中小回为这我得在个着了然出心`。 +为了输入快捷,某些常用字我们只要打它的第一个字母,加一个空格就可以了,我们叫这些常用字为一级简码字。从A到Y排列,一级简码字分别是: + +{: .highlight } +把对好不的一大地没是上中小回为这我得在个着了然出心 + +宇浩的字根设计,使得最高频的汉字分布在最容易按的键上。 -宇浩的字根设计,使得最高频的汉字分布在最容易按的键上,比如:「的」在`E`上,「一」在`F`上,「了」在`V`上,「没」在`I`上,「不」在`D`上,「上」在`K`上。 +{: .example } +比如:「的」在`E`上,「一」在`F`上,「了」在`V`上,「没」在`I`上,「不」在`D`上,「上」在`K`上。 二级简码字共625个,是该字全码的前两个字母。宇浩输入法**全简一致**。 @@ -123,7 +131,7 @@ O 辛亥圆宝盖,言旁点撇方。 P 文门亦米走之底,病头麻穴 - 宇浩核心词库:约50000个词语。推荐只使用该词库配合单字输入,以获得最佳体验。 - 宇浩增广词库:约30000个词语,频率较低,除非有特殊需求,否则不建议开启。 -- 宇浩成语和诗词词库:约15000个成语和诗词,除非有特殊需求,否则不建议开启。 +- 宇浩成语诗词词库:约15000个成语和诗词,除非有特殊需求,否则不建议开启。 所有词库都分为简体和繁体。其中,繁体词库包含以下字形标准: diff --git a/docs/install.md b/docs/install.md index 28146bd..6105a23 100644 --- a/docs/install.md +++ b/docs/install.md @@ -81,10 +81,10 @@ nav_order: 2 - yuhao.full.dict.yaml 单字全码码表。 - yuhao.words 宇浩核心简体词库。约50000个词语,频率较高。 - yuhao.words_extended 宇浩增广简体词库。约30000个词语,频率较低,除非有特殊需求,否则不建议开启。 -- yuhao.words_literature 宇浩成语和诗词简体词库。约15000个成语和诗词,除非有特殊需求,否则不建议开启。 +- yuhao.words_literature 宇浩成语诗词简体词库。约15000个成语和诗词,除非有特殊需求,否则不建议开启。 - yuhao_tradition.words 宇浩核心繁体词库,包括台湾、香港、大陆古籍繁体三种字形。约50000个词语,频率较高。 - yuhao_tradition.words_extended 宇浩增广繁体词库。约30000个词语,频率较低,除非有特殊需求,否则不建议开启。 -- yuhao_tradition.words_literature 宇浩增广繁体词库。约15000个成语和诗词,除非有特殊需求,否则不建议开启。 +- yuhao_tradition.words_literature 宇浩成语诗词繁体词库。约15000个成语和诗词,除非有特殊需求,否则不建议开启。 - yuhao.symbols.dict.yaml 特殊符号码表。 - yuhao_pinyin.schema.yaml 拼音配置文件,用于反查。 - yuhao_pinyin.dict.yaml 拼音字典文件。 diff --git a/docs/learn.md b/docs/learn.md index 34ca445..e982797 100644 --- a/docs/learn.md +++ b/docs/learn.md @@ -26,6 +26,7 @@ nav_order: 12 1. 用户将汉字,用一定规则,编成一串字母、数字、符号的组合,输入电脑中。 2. 输入法会串字符,根据一定的规则,转化为对应的汉字,显示到屏幕上。 +{: .highlight } 本教程中的「输入法」,特别指代上文中提到的第一阶段,亦即:用户将汉字,用一定规则,编成一串字母、数字、符号的组合,输入电脑中,并获得想要的汉字。 #### 输入法种类 @@ -41,9 +42,10 @@ nav_order: 12 **形码输入法**,最常见的例子是五笔字型。我们将汉字拆成若干部件,输入每一个部件对应的代码,软件会显示出汉字。常见的形码,还包括五笔字型,郑码,仓颉等等。这其中有时包括了一个反馈的过程,但因为形码的确定性,大多数时候是不需要确认的,即:输入字母——获得汉字。 -判断一个输入法是音码还是形码的最简单的方法,就是:对于**任意**一个汉字,不用知道它**本身**的读音便能输入。 - -「宇浩」繁简通打输入法,便是一种形码输入法。 +{: .note } +>判断一个输入法是音码还是形码的最简单的方法,就是:对于**任意**一个汉字,不用知道它**本身**的读音便能输入。 +> +>因此,「宇浩」繁简通打输入法,是一种形码输入法。 #### 形码和音码的对比 {: .no_toc } @@ -69,7 +71,7 @@ nav_order: 12 - 低重码。也就是说,每个编码一般只对应唯一的候选项,你不需要进行选字,可以不用打断思路地进行输入。 - 手感好。笔者不喜欢使用 Z 键,所以这个键位被空了出来,用于反查或其他功能。 -[这里对比一下五笔、郑码、宇浩、虎码等十余种常见输入法在不同汉字字符集下重码数据,供大家参考。](./statistics) +这里对比一下五笔、郑码、宇浩、虎码等十余种常见输入法在不同汉字字符集下[重码数据](./articles/statistics),供大家参考。 ### 学习步骤 @@ -77,10 +79,13 @@ nav_order: 12 拆字,就是把汉字按照一定的规则,拆成唯一的部件组合。拆分出来的部件,便叫做「字根」。字根不仅包括你我熟知的「偏旁部首」,也包括了一些基本笔划,甚至是一些汉字。因此,笔画输入法(横竖撇捺折),也是一种特殊的形码。那么我们为什么要创造别的形码呢?因为一个字若用十几个、甚至几十个字母代替,太没有效率。故而,我们会截取一些比较大的部件作为字根。 -对于汉语使用者,拆字并不是一件陌生的事情。我们自小就学会将一个字拆成分离的部首,进行检索。大多数时候,这是非常直观的。比如 +对于汉语使用者,拆字并不是一件陌生的事情。我们自小就学会将一个字拆成分离的部首,进行检索。大多数时候,这是非常直观的。 -- 「部」字,大家会自然地将他拆分为「立口阝」三个部分。 -- 「程」字,大家会自然地将他拆分为「禾口王」三个部分。 +{: .example } +>比如: +> +>- 「部」字,大家会自然地将他拆分为「立口阝」三个部分。 +>- 「程」字,大家会自然地将他拆分为「禾口王」三个部分。 对于「宇浩」而言,大多数的字,也是这么拆分的。并且大多数的偏旁部首,也都是「字根」。 @@ -108,15 +113,13 @@ nav_order: 12 按照使用频率降序,前50的常用字根为: -```md +{: .highlight } 白月丶一了日龰不丿扌戈𠂇尚土人文辶亻也米冖小讠丷口儿上至刂宀尤羊目大门自刀二阝厶子丅凵寸手西女氵殳犬 -``` 前51到100的常用字根为: -```md +{: .highlight } 灬甲力彳丁心斤乚禾又木匕走己之而八生十身𬺰彐夕豕面矢艹王见艮卜夂纟工龶巴止舌已士尸立囗竹夭户戊乙方且 -``` 所以,在接下来的学习中,请**务必**按照上面的次序记忆字根,而不是一股脑地背诵全部。先练熟*边际收益*高的字根,会显著加快上手打字的进程,增加学习乐趣和成就感。而偏僻的字根,可以等未来慢慢熟悉。 @@ -135,10 +138,13 @@ nav_order: 12 ### 字根图 {: .no_toc } -我们将字根的键位画出来,这便是字根图。每一个键位上的大写字母,就是大码,是一群字根的「家」。而字根右下角的小写字母,则是小码,也就是单个字根的「姓名」。将大码和小码组合起来,就是一个字根的编码了。比如: +我们将字根的键位画出来,这便是字根图。每一个键位上的大写字母,就是大码,是一群字根的「家」。而字根右下角的小写字母,则是小码,也就是单个字根的「姓名」。将大码和小码组合起来,就是一个字根的编码了。 -- 「言」这个字根,在字母`U`的方框里,同时,右下角的字母是`v`,因此,它的编码就是`Uv`。 -- 「其」这个字根,在字母`D`的方框里,同时,右下角的字母是`q`,因此,它的编码就是`Dq`。 +{: .example } +>比如: +> +>- 「言」这个字根,在字母`U`的方框里,同时,右下角的字母是`v`,因此,它的编码就是`Uv`。 +>- 「其」这个字根,在字母`D`的方框里,同时,右下角的字母是`q`,因此,它的编码就是`Dq`。 字根图是查询字根的重要工具,初学者应当时常将它放在手边,以利用查询。以下为宇浩输入法字根图。 @@ -164,57 +170,52 @@ nav_order: 12 为了方便记忆,我写了一首打油诗(字根口诀): -横: - -```md -A 丁丌行右瓦,耳下打七寸。(亍丅扌 | 丌jī) -S 草头二犬厂,辰考而有臣。(丂𠂇) -D 古來十石尤其戊,西雨不走歹豕丰, -F 一木甫三工。 -G 大王革春夫,框面弋酉戈。(匚𡗗) -H 老上青士示兀牙,末世土干未至车。(耂龶) -``` - -竖: - -```md -J 早日山曰田, -K 甲申由禺电,下框敲右边,重門兼繁鹵,虫贝水上见。(冂攴) -L 口是心非,(㗊) -M 巾网貝皿且具上,小目立刀卜虎骨。(罒刂 | 罒wǎng) -N 方框二三竖,黑册尚止足。(囗〢〣龰) -``` - -撇: - -```md -Q 荒下没右鱼儿气,撇川竹矢凡几舟。(殳丿) -W 周围炙顶皆同月,千鬼上身生金牛,告头杀上谁侧缶?(⺆勹牜⺧乂隹) -E 反文人欠斤,白爪壬乌夭。(攵亻 | 攵pū) -R 双人饣匕入舌臼,微禾向夕反犬毛,衣下古風僉繁鳥。(彳饣犭𧘇) -T 八人手长二三撇,金边自用介下卯。(钅彡) -Y 秃盖心合豸,阜上食九鸟。(冖𠂤 | 𠂤duī 豸zhì) -``` - -捺点: - -```md -U 兰头将左四点火,赢框广示言亡羊,(丷丬灬礻) -I 鹿户三点立水上。(氵) -O 辛亥圆宝盖,言旁点撇方。(宀讠丶) -P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) -``` +{: .important } +>横: +>A 丁丌行右瓦,耳下打七寸。(亍丅扌 | 丌jī) +>S 草头二犬厂,辰考而有臣。(丂𠂇) +>D 古來十石尤其戊,西雨不走歹豕丰, +>F 一木甫三工。 +>G 大王革春夫,框面弋酉戈。(匚𡗗) +>H 老上青士示兀牙,末世土干未至车。(耂龶) +> +>竖: +>J 早日山曰田, +>K 甲申由禺电,下框敲右边,重門兼繁鹵,虫贝水上见。(冂攴) +>L 口是心非,(㗊) +>M 巾网貝皿且具上,小目立刀卜虎骨。(罒刂 | 罒wǎng) +>N 方框二三竖,黑册尚止足。(囗〢〣龰) +> +>撇: +>Q 荒下没右鱼儿气,撇川竹矢凡几舟。(殳丿) +>W 周围炙顶皆同月,千鬼上身生金牛,告头杀上谁侧缶?(⺆勹牜⺧乂隹) +>E 反文人欠斤,白爪壬乌夭。(攵亻 | 攵pū) +>R 双人饣匕入舌臼,微禾向夕反犬毛,衣下古風僉繁鳥。(彳饣犭𧘇) +>T 八人手长二三撇,金边自用介下卯。(钅彡) +>Y 秃盖心合豸,阜上食九鸟。(冖𠂤 | 𠂤duī 豸zhì) +> +>捺点: +>U 兰头将左四点火,赢框广示言亡羊,(丷丬灬礻) +>I 鹿户三点立水上。(氵) +>O 辛亥圆宝盖,言旁点撇方。(宀讠丶) +>P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) ### 字根小码的规律 {: .no_toc } -字根的小码,都是尽量从它汉语拼音包含的字母中随机选取。如果拼音中有`Z`或`X`,那么可以选`K`来代替。例如: +字根的小码,都是尽量从它汉语拼音包含的字母中随机选取。如果拼音中有`Z`或`X`,那么可以选`K`来代替。 -- `米`,第一笔为「点」,故而它的大码在点区的`P`。小码为了便于记忆,选取了`m`,正好是米字的声母。因此,「米」这个字根的编码就是`Pm`。 +{: .example } +>例如: +> +>- `米`,第一笔为「点」,故而它的大码在点区的`P`。小码为了便于记忆,选取了`m`,正好是米字的声母。因此,「米」这个字根的编码就是`Pm`。 -有些字根的使用频率极高,我们把它们的小码统一设置为`v`(原因是拼音不用v字母,所以这个字母比较闲置)。例如: +有些字根的使用频率极高,我们把它们的小码统一设置为`v`(原因是拼音不用v字母,所以这个字母比较闲置)。 -- `女`,第一笔为「折」,故而它的大码在折区的`C`。「女」的频率很高,所以小码是v。因此,「女」这个字根的编码就是`Cv`。 +{: .example } +>例如: +> +>- `女`,第一笔为「折」,故而它的大码在折区的`C`。「女」的频率很高,所以小码是v。因此,「女」这个字根的编码就是`Cv`。 我在这里使用大写和小写的拉丁字母,是为了区分大码和小码的概念,便于理解学习。在实际打字的过程中,不需要区分大小写。 @@ -226,27 +227,33 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) - 代表字根:大码 + 小码 + F - 被归并到代表字根上的附属根、近似根、部首、兼容字:大码 + 小码 + FF -比如: - -- `月` 的大码是`W`,小码是`v`,它是一个代表字根,所以输入`Wvf`就可以打出这个字。 -- `勹` 的大码是`W`,小码是`v`,它被归并到了`月`上,所以输入`Wvff`就可以打出这个部首。 -- `⺼` 的大码是`W`,小码是`v`,它被归并到了`月`上,所以输入`Wvff`就可以打出这个部首。 +{: .example } +>比如: +> +>- `月` 的大码是`W`,小码是`v`,它是一个代表字根,所以输入`Wvf`就可以打出这个字。 +>- `勹` 的大码是`W`,小码是`v`,它被归并到了`月`上,所以输入`Wvff`就可以打出这个部首。 +>- `⺼` 的大码是`W`,小码是`v`,它被归并到了`月`上,所以输入`Wvff`就可以打出这个部首。 ## 拆字规则 先前说过,拆字,就是把汉字按照一定的规则,拆成唯一的字根组合。 -我刚刚用的「部」字为例,说明了拆字的一般形式。这种将字拆成直观的、分离的部件的方法,足以应付大部分汉字的拆分了。但在实际使用中,遇到这个问题:一个独体字,本身不是字根,怎么办?这时候,我们要把它继续拆成更小的字根甚至笔划。比如: +我刚刚用的「部」字为例,说明了拆字的一般形式。这种将字拆成直观的、分离的部件的方法,足以应付大部分汉字的拆分了。但在实际使用中,遇到这个问题:一个独体字,本身不是字根,怎么办?这时候,我们要把它继续拆成更小的字根甚至笔划。 -- 「戋」这个字,我们可以继续将它拆成「一」和「戈」。查字根图可知,「一」和「戈」正好是两个字根,拆字成功。 -- 「丸」这个字,我们可以继续将它拆成「九」和「丶」。查字根图可知,「九」和「丶」正好是两个字根,拆字成功。 -- 「朱」这个字,我们可以继续将它拆成「牛」和「八」。查字根图可知,「牛」和「八」正好是两个字根,拆字成功。 +{: .example } +>比如: +> +>- 「戋」这个字,我们可以继续将它拆成「一」和「戈」。查字根图可知,「一」和「戈」正好是两个字根,拆字成功。 +>- 「丸」这个字,我们可以继续将它拆成「九」和「丶」。查字根图可知,「九」和「丶」正好是两个字根,拆字成功。 +>- 「朱」这个字,我们可以继续将它拆成「牛」和「八」。查字根图可知,「牛」和「八」正好是两个字根,拆字成功。 有时候,独体字的拆分不是很直观。比如「再」拆成「王冂」两个字根。遇到此类字时的拆分,往往需要一些经验和练习。所以当你遇到不会拆的字时,应该主动查询它的编码,及时学习。 -更麻烦的情况是,**一个字好像有几种拆分方法**,比如: +更麻烦的情况是,**一个字好像有几种拆分方法**。 -- 「井」,可以拆「二{介下}」,也可以拆「一廾」。 +{: .example } +>比如: +>- 「井」,可以拆「二{介下}」,也可以拆「一廾」。 这种一字多拆的情况,任何形码中,都是积极避免的。因为一字多拆,会造成极大的不确定性,并造成编码的混乱。 @@ -254,15 +261,16 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) 宇浩输入法总结了拆字规则,并且不断自我审视每一个拆分是否符合规则。通过大量的努力,明确了一套优先级系统。使每一个汉字,都有唯一的拆分方案,消除了不确定性[^one_division]。 -「宇浩」拆字有五条原则,按优先级排序如下: - -1. 字根最少 -1. 符合笔顺 -1. 散连交断 -1. 结构合理 -1. 字根取大 - -可归纳为:**少>顺>散>连>交>断>理>大**。 +{: .important } +>「宇浩」拆字有五条原则,按优先级排序如下: +> +>1. 字根最少 +>1. 符合笔顺 +>1. 散连交断 +>1. 结构合理 +>1. 字根取大 +> +>可归纳为:**少>顺>散>连>交>断>理>大**。 取根时,如果有多种不同的拆分方式,则按**优先级从高到低**依次检查以上规则,选取符合条件的,排除不满足的,最终得到唯一的拆分方案。以下为规则详细介绍: @@ -292,15 +300,21 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) - 字根相交,指的是两个字根互相交叉。比如「再」拆成「王冂」两个字根,便是相交的。 - 笔划断开,指的是一个笔划断开。比如「我」拆成「丿扌戈」三个字根,其中的「扌」和「戈」两根的横本是一笔写成,但我们将横画断开。 -「散连交断」,优先级以此下降。比如: +「散连交断」,优先级以此下降。 -- 「兰」可以拆成「䒑二」也可以拆成「丷三」。观察到,上面的两点同横相连,故而拆成「䒑二」符合「能散不连」。 -- 「开」可以拆成「一廾」也可以拆成「二{介下}」。观察到,第一种拆法字根相连,第二种拆法字根相交。故而拆成「一廾」符合「能连不交」。 -- 「果」拆作「日木」,不拆成「田木」,这是因为后者将中间的竖断开了。因为「字根相交」的优先级高于「笔画断开」,「果」应当拆成「日木」。 +{: .example } +>比如: +> +>- 「兰」可以拆成「䒑二」也可以拆成「丷三」。观察到,上面的两点同横相连,故而拆成「䒑二」符合「能散不连」。 +>- 「开」可以拆成「一廾」也可以拆成「二{介下}」。观察到,第一种拆法字根相连,第二种拆法字根相交。故而拆成「一廾」符合「能连不交」。 +>- 「果」拆作「日木」,不拆成「田木」,这是因为后者将中间的竖断开了。因为「字根相交」的优先级高于「笔画断开」,「果」应当拆成「日木」。 -为了保证直观性,出现「囗」(包括「日」「目」)结构的字不受此规则影响。比如: +为了保证直观性,出现「囗」(包括「日」「目」)结构的字不受此规则影响。 -- 「单」可以拆成「丷日十」也可以拆成「丷冂丰」。两者都是三根,都完全「符合笔顺」,由于出现了「囗」结构,故而跳过「散连交断」规则,直接判断「拆分美观」。 +{: .example } +>比如: +> +>- 「单」可以拆成「丷日十」也可以拆成「丷冂丰」。两者都是三根,都完全「符合笔顺」,由于出现了「囗」结构,故而跳过「散连交断」规则,直接判断「拆分美观」。 ### 结构合理 {: .no_toc } @@ -316,28 +330,32 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) - 「丨」变成「丿」。如:「牛」字根的「丨」变成「丿」,「干」字根的「丨」变成「丿」。 - 「丿」变成「丨」。如:「尸」字根的「丿」变成「丨」。 -在多种拆分同时存在的情况下,我们不应当选择这种不直观的拆分。比如: - -- 「失」拆「丿夫」而不拆「牛乀」,因为「牛」的一竖是撇,不美观。 -- 「井」拆「二{介下}」而不拆「キ丨」,因为因为「キ」的一竖是撇,不美观。 - -再比如: +在多种拆分同时存在的情况下,我们不应当选择这种不直观的拆分。 -- 「缓」拆「纟爪干又」而不拆「纟爪二夂」。虽然前者「干」的竖是撇,但后者出现了「字根相交」。根据规则优先级,「字根相交」低于「字根相连」,故而拆为「纟爪干又」。 +{: .example } +>比如: +> +>- 「失」拆「丿夫」而不拆「牛乀」,因为「牛」的一竖是撇,不美观。 +>- 「井」拆「二{介下}」而不拆「キ丨」,因为因为「キ」的一竖是撇,不美观。 +>- 「缓」拆「纟爪干又」而不拆「纟爪二夂」。虽然前者「干」的竖是撇,但后者出现了「字根相交」。根据规则优先级,「字根相交」低于「字根相连」,故而拆为「纟爪干又」。 #### 包围结构应完整 {: .no_toc } -「囗」「勹」「冂」等包围结构尽量不拆散。如: +「囗」「勹」「冂」等包围结构尽量不拆散。 -- 「昜」拆「日一勹彡」不拆「日丆𠃌彡」。 -- 「万」拆成「一勹」而非「{一丿}乛」。 -- 上一个规则中提到的「单」字,可以拆成「丷日十」也可以拆成「丷冂丰」。两者都是三根,都完全「符合笔顺」,由于出现了「囗」结构,故而跳过「散连交断」规则,直接判断「拆分美观」。因为包围结构尽量不拆散,故而「单」拆成「丷日十」更优。 +{: .example } +>如: +> +>- 「昜」拆「日一勹彡」不拆「日丆𠃌彡」。 +>- 「万」拆成「一勹」而非「{一丿}乛」。 +>- 上一个规则中提到的「单」字,可以拆成「丷日十」也可以拆成「丷冂丰」。两者都是三根,都完全「符合笔顺」,由于出现了「囗」结构,故而跳过「散连交断」规则,直接判断「拆分美观」。因为包围结构尽量不拆散,故而「单」拆成「丷日十」更优。 -注意,拆分的优先级需要得到贯彻: - -- 「匹」拆「兀乚」而不拆「匚儿」。因为前者完全符合笔顺,而「符合笔顺」的优先级远远高于「拆分美观」。 +{: .note } +>注意,拆分的优先级需要得到贯彻: +> +>- 「匹」拆「兀乚」而不拆「匚儿」。因为前者完全符合笔顺,而「符合笔顺」的优先级远远高于「拆分美观」。 ### 字根取大 {: .no_toc } @@ -347,20 +365,24 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) 1. 让完全符合笔顺的部件尽可能地大。也就是说,只要其中某个字根多写一笔仍然符合笔顺,就多写一笔。 2. 让首笔靠前的字根尽可能地大。 -「取大原则」,按定义,是一个兜底原则。它保证了最终只有一个候选方案能够胜出。 - -一般而言,上述两条中的第二条比较常见。比如: +「取大原则」,按定义,是一个兜底原则。它保证了最终只有一个候选方案能够胜出。一般而言,上述两条中的第二条比较常见。 -- 「井」拆成「二{齐下}」,而不拆成「一廾」,因为「字根取大」原则。让靠前的字根的笔划数尽量地多,这里,「二」的笔画数大于「一」。 -- 「美」拆为「䒑土大」,而不拆成「丷王大」,因为「字根取大」原则。让靠前的字根的笔划数尽量地多,这里,「䒑」的笔画数大于「丷」。 +{: .example } +>比如: +> +>- 「井」拆成「二{齐下}」,而不拆成「一廾」,因为「字根取大」原则。让靠前的字根的笔划数尽量地多,这里,「二」的笔画数大于「一」。 +>- 「美」拆为「䒑土大」,而不拆成「丷王大」,因为「字根取大」原则。让靠前的字根的笔划数尽量地多,这里,「䒑」的笔画数大于「丷」。 -但有的时候,第一条也会被用到。这里以「妻」字举例。「妻」可以拆分为「十彐女」「キコ女」甚至「龶乛女」。我们按顺序检查规则,发现: +但有的时候,第一条也会被用到。这里以「妻」字举例。 -- 三者都是三根。 -- 「キコ女」的拆法中,前两根都不符合笔顺;但「十彐女」「龶乛女」的拆法中,有两根符合笔顺,淘汰「キコ女」。 -- 「十彐女」「龶乛女」都存在相交。 -- 结构合理都不适用。 -- 我们最后检查「字根取大」规则。我们发现,两个字根是穿插书写的。根据规则,只要其中某个字根多写一笔仍然符合笔顺,就多写一笔。「十彐女」可以保证合笔顺的字根写了三笔。而「龶乛女」中,符合笔顺的字根只有一笔。因此「十彐女」胜出。 +{: .example } +>「妻」可以拆分为「十彐女」「キコ女」甚至「龶乛女」。我们按顺序检查规则,发现: +> +>- 三者都是三根。 +>- 「キコ女」的拆法中,前两根都不符合笔顺;但「十彐女」「龶乛女」的拆法中,有两根符合笔顺,淘汰「キコ女」。 +>- 「十彐女」「龶乛女」都存在相交。 +>- 结构合理都不适用。 +>- 我们最后检查「字根取大」规则。我们发现,两个字根是穿插书写的。根据规则,只要其中某个字根多写一笔仍然符合笔顺,就多写一笔。「十彐女」可以保证合笔顺的字根写了三笔。而「龶乛女」中,符合笔顺的字根只有一笔。因此「十彐女」胜出。 上面的例子逻辑虽比较复杂,但是最终的结果还是非常直观的。在宇浩输入法中,大多数的时候,直观的拆分方法往往也是符合规则的。 @@ -377,22 +399,23 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) 以下通过部分例字来说明拆分规则: -一例:亷。候选拆分「亠丷厂彐〢八」和「立丿彐〢八」。 - -- 「亠丷厂彐〢八」六根,「立丿彐〢八」五根。后者字根最少,直接胜出。 - -又一例:重。候选拆分「丿车一」和「千日二」。 - -- 都是三根,同时满足「字根最少」。 -- 「丿車一」满足「符合笔顺」,「千日二」不满足。前者胜出。 - -又一例:盡。候选拆分「コ土灬皿」「乛龶灬皿」「彐丄灬皿」「{聿上}一灬皿」四种。 - -- 都是四根,同时满足「字根最少」。 -- 「コ土灬皿」不符合笔顺,其他三者都完全符合笔顺。淘汰「コ土灬皿」。 -- 上半部分都出现字根相交情况。 -- 都不适用「结构合理」。 -- 进入兜底规则「字根取大」。根据规则,只要其中某个字根多写一笔仍然符合笔顺,就多写一笔。观察到,「{聿上}一灬皿」的第一根一共写了四笔,故而胜出。 +{: .example } +>一例:亷。候选拆分「亠丷厂彐〢八」和「立丿彐〢八」。 +> +>- 「亠丷厂彐〢八」六根,「立丿彐〢八」五根。后者字根最少,直接胜出。 +> +>又一例:重。候选拆分「丿车一」和「千日二」。 +> +>- 都是三根,同时满足「字根最少」。 +>- 「丿車一」满足「符合笔顺」,「千日二」不满足。前者胜出。 +> +>又一例:盡。候选拆分「コ土灬皿」「乛龶灬皿」「彐丄灬皿」「{聿上}一灬皿」四种。 +> +>- 都是四根,同时满足「字根最少」。 +>- 「コ土灬皿」不符合笔顺,其他三者都完全符合笔顺。淘汰「コ土灬皿」。 +>- 上半部分都出现字根相交情况。 +>- 都不适用「结构合理」。 +>- 进入兜底规则「字根取大」。根据规则,只要其中某个字根多写一笔仍然符合笔顺,就多写一笔。观察到,「{聿上}一灬皿」的第一根一共写了四笔,故而胜出。 ## 单字编码规则 @@ -417,44 +440,48 @@ P 文门亦米走之底,病头麻穴衣字旁。(辶疒衤 | 辶chuò) 最后一条,只有双根字中会出现。第二条,只有三根字中会出现。 -举例说明: - -- 「嫩」字拆成`女Cv 木Fv 口Lv 攵Eh`四根。分别对应了首根、二根、三根、末根。我们直接取四个字根的大码`CFLE`即可出字。 -- 「整」字拆成`木Fv 口Lv 攵Eh 一Fi 止Ni`五根。我们只取首根、二根、三根、末根,也就是`木Fv 口Lv 攵Eh 止Ni`的大码,输入`FLEN`即可出字。 -- 「算」字拆成`𥫗Qv 目Mu 廾So`,只有三根,所以我们取全部根,也就是`𥫗Qv 目Mv 廾So`的大码,即`QMS`。此时,注意到不足四码,故而补上最末根的小码`o`。输入`QMSo`即可出字。 -- 「织」字拆成`纟Vs 口Lv 八Tb`,只有三根,所以我们取全部根大码,也就是`VLT`。此时,注意到不足四码,故而补上最末根的小码`b`。输入`VLTb`即可出字。 -- 「认」字拆成`讠人`,只有两根,所以我们取全部根,也就是`讠Oa 人Te`的大码,即`OT`。此时,注意到不足四码,故而补上最末根的小码`e`。注意到仍然不足四码,于是再添上首根的小码`a`。输入`OTea`即可出字。 -- 「好」字拆成`女子`,只有两根,所以我们取全部根,也就是`女Cv 子Vk`的大码,即`CV`。此时,注意到不足四码,故而补上最末根的小码`k`。注意到仍然不足四码,但首根小码为`v`,可以省略,所以最后输入`CVk`即可出字。 +{: .example } +>举例说明: +> +>- 「嫩」字拆成`女Cv 木Fv 口Lv 攵Eh`四根。分别对应了首根、二根、三根、末根。我们直接取四个字根的大码`CFLE`即可出字。 +>- 「整」字拆成`木Fv 口Lv 攵Eh 一Fi 止Ni`五根。我们只取首根、二根、三根、末根,也就是`木Fv 口Lv 攵Eh 止Ni`的大码,输入`FLEN`即可出字。 +>- 「算」字拆成`𥫗Qv 目Mu 廾So`,只有三根,所以我们取全部根,也就是`𥫗Qv 目Mv 廾So`的大码,即`QMS`。此时,注意到不足四码,故而补上最末根的小码`o`。输入`QMSo`即可出字。 +>- 「织」字拆成`纟Vs 口Lv 八Tb`,只有三根,所以我们取全部根大码,也就是`VLT`。此时,注意到不足四码,故而补上最末根的小码`b`。输入`VLTb`即可出字。 +>- 「认」字拆成`讠人`,只有两根,所以我们取全部根,也就是`讠Oa 人Te`的大码,即`OT`。此时,注意到不足四码,故而补上最末根的小码`e`。注意到仍然不足四码,于是再添上首根的小码`a`。输入`OTea`即可出字。 +>- 「好」字拆成`女子`,只有两根,所以我们取全部根,也就是`女Cv 子Vk`的大码,即`CV`。此时,注意到不足四码,故而补上最末根的小码`k`。注意到仍然不足四码,但首根小码为`v`,可以省略,所以最后输入`CVk`即可出字。 末尾添加首根的小码,只是为了补齐四码的作用,只有在双根字中才会出现。它不需要像徐码和郑码一样,不管几码字,都要判断首根的性质以决定取不取倒数第二根。所以思维负担显著降低。 -```txt -Q:为什么选择 `v` 键? -A:汉语拼音中没有 `v` 字母,因此这个按键使用率不高。但他位于大拇指上,按起来非常方便,所以某些字根的小码设置成了 `v`。由于每个大码上基本都有个小码是 `v` 的字根,因此少打 `v` 节约的码长最为明显。 - -``` +{: .note } +>Q:为什么选择 `v` 键? +>A:汉语拼音中没有 `v` 字母,因此这个按键使用率不高。但他位于大拇指上,按起来非常方便,所以某些字根的小码设置成了 `v`。由于每个大码上基本都有个小码是 `v` 的字根,因此少打 `v` 节约的码长最为明显。 ### 字根字和代表根 {: .no_toc } -字根字,依次取其大小码,再加上`f`即可出字。比如: +字根字,依次取其大小码,再加上`f`即可出字。 -- 「木」字是字根字,输入`Fvf`即可出字。 -- 「骨」字是字根字,输入`Mgf`即可出字。 +{: .example } +>比如: +> +>- 「木」字是字根字,输入`Fvf`即可出字。 +>- 「骨」字是字根字,输入`Mgf`即可出字。 很多的字根因为字形近似,被归为一个字根,由其中一个常用字为统摄,称为「代表根」,其它的字根为「被代表根」。 -如果要**单独**输入「被代表根」,只要在大小码后加`ff`即可。这类汉字并不多,举例: +如果要**单独**输入「被代表根」,只要在大小码后加`ff`即可。这类汉字并不多。 -- `羽Xu`、`习Xu`被归为一个字根,由「羽」统摄,所以输入「习」字时,编码为`Xuff`。 -- `長Ha`、`镸Ha`、`髟Ha`被归为一个字根,由「長」统摄,所以输入「镸」、「髟」时,编码为`Haff`。 -- `户Oh`、`戶Oh`被归为一个字根,由「户」统摄,所以输入「戶」时,编码为`Ohff`。 +{: .example } +>举例: +> +>- `羽Xu`、`习Xu`被归为一个字根,由「羽」统摄,所以输入「习」字时,编码为`Xuff`。 +>- `長Ha`、`镸Ha`、`髟Ha`被归为一个字根,由「長」统摄,所以输入「镸」、「髟」时,编码为`Haff`。 +>- `户Oh`、`戶Oh`被归为一个字根,由「户」统摄,所以输入「戶」时,编码为`Ohff`。 -```txt -Q:字根字加 `f` 的原因是什么? +{: .note } +Q:字根字加 `f` 的原因是什么? A:如果字根字是两码,但字根本身比较罕用,那么会浪费一个宝贵的二级简码码位。很多输入法会将另一个常用字设置成二简,而让字根字选重,或者通过其他方式为字根字增加一码。 这个方式实际上却在事实上形成了新的重码。宇浩输入法直接在根源上解决这个问题,统一将所有字根字设为至少三码。 -``` ### 空格键的使用 {: .no_toc } @@ -487,12 +514,20 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 一级简码字,又称**一简字**,指的是用一个字母为编码实现输入的汉字。「宇浩」中,有25个高频汉字设置为一简字,只要按下一个字母,加上空格,即可上屏。在我们的日常交流中,一简字大约占据了25%的使用频率。只需要按两个按键,可以有效提升输入速度。 -一简字的编码,就是该字全码的第一个字母。比如: +一简字的编码,就是该字全码的第一个字母。 + +{: .example } +>比如: +> +>- 「我」全码为`〔丿扌戈・QAGg〕`,一级简码为`Q`。输入`Q_`即可实现上屏。 +>- 「的」全码为`〔白{⼓同月}丶・EWOd〕`,一级简码为`E`。输入`E_`即可实现上屏。 -- 「我」全码为`〔丿扌戈・QAGg〕`,一级简码为`Q`。输入`Q_`即可实现上屏。 -- 「的」全码为`〔白{⼓同月}丶・EWOd〕`,一级简码为`E`。输入`E_`即可实现上屏。 +从A到Y排列,一级简码字分别是: -从A到Y排列,一级简码字分别是`把对好不的一大地没是上中小回为这我得在个着了然出心`。在字根图中,一简字就是每个字母方框的左上角的汉字。 +{: .highlight } +把对好不的一大地没是上中小回为这我得在个着了然出心 + +在字根图中,一简字就是每个字母方框的左上角的汉字。 宇浩的字根设计,使得最高频的汉字分布在最容易按的键上,比如:「的」在`E`上,「一」在`F`上,「了」在`V`上,「没」在`I`上,「不」在`D`上,「上」在`K`上。 @@ -501,10 +536,13 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 二级简码字,又称**二简字**,指的是用两个字母为编码实现输入的汉字。「宇浩」中,有676个高频汉字设置为二简字,只要按下两个字母,加上空格,即可上屏。 -一简字的编码,就是该字全码的前两个字母。比如: +一简字的编码,就是该字全码的前两个字母。 -- 「起」全码为`〔走己・DBjk〕`,二级简码为`DB`。输入`DB_`即可实现上屏。 -- 「可」全码为`〔丁口・ALvn〕`,二级简码为`AL`。输入`AL_`即可实现上屏。 +{: .example } +>比如: +> +>- 「起」全码为`〔走己・DBjk〕`,二级简码为`DB`。输入`DB_`即可实现上屏。 +>- 「可」全码为`〔丁口・ALvn〕`,二级简码为`AL`。输入`AL_`即可实现上屏。 ### 三级简码字 {: .no_toc } @@ -526,37 +564,49 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 ### 两字词 {: .no_toc } -两字词,取每个字**全码**的前两码即可。比如: +两字词,取每个字**全码**的前两码即可。 -- 「人生」:「人」的编码为`〔人・Te〕`,「生」的编码为`〔生・Wg〕`。因此,「人生」的编码为`〔人生・TeWg〕`。 -- 「事情」:「事」的编码为`〔{于下}口彐・ALXv〕`,「情」的编码为`〔心龶月・YHWv〕`。因此,「事情」的编码为`〔{于下}口心龶・ALYH〕`。 +{: .example } +>比如: +> +>- 「人生」:「人」的编码为`〔人・Te〕`,「生」的编码为`〔生・Wg〕`。因此,「人生」的编码为`〔人生・TeWg〕`。 +>- 「事情」:「事」的编码为`〔{于下}口彐・ALXv〕`,「情」的编码为`〔心龶月・YHWv〕`。因此,「事情」的编码为`〔{于下}口心龶・ALYH〕`。 ### 三字词 {: .no_toc } -三字词,取前两字的第一码,和第三个字的前两码即可。比如: +三字词,取前两字的第一码,和第三个字的前两码即可。 -- 「泡泡糖」:「泡」的编码为`〔氵月巳・IWXs〕`,「糖」的编码为`〔米广又古・PUBD〕`。因此,「泡泡糖」的编码为`〔氵氵米广・IIPU〕`。 -- 「星期三」:「星」的编码为`〔日生・JWg〕`,「期」的编码为`〔其月・DWvq〕`,「三」的编码为`〔三・Fa〕`。因此,「星期三」的编码为`〔日其三・JDFa〕`。 +{: .example } +>比如: +> +>- 「泡泡糖」:「泡」的编码为`〔氵月巳・IWXs〕`,「糖」的编码为`〔米广又古・PUBD〕`。因此,「泡泡糖」的编码为`〔氵氵米广・IIPU〕`。 +>- 「星期三」:「星」的编码为`〔日生・JWg〕`,「期」的编码为`〔其月・DWvq〕`,「三」的编码为`〔三・Fa〕`。因此,「星期三」的编码为`〔日其三・JDFa〕`。 ### 四字词及以上 {: .no_toc } -四字词及以上,取前三字的第一码,和最后一个字的第一码即可。比如: +四字词及以上,取前三字的第一码,和最后一个字的第一码即可。 -- 「狐假虎威」:「狐」的编码为`〔犭瓜・RQan〕`,「假」的编码为`〔亻尸二又・EBSB〕`,「虎」的编码为`〔虎・Mh〕`,「威」的编码为`〔戊一女・DFCv〕`。因此,「狐假虎威」的编码为`〔犭亻虎戊・REMD〕`。 -- 「中华人民共和国」:这是一个七字词,所以我们只看前三字和最后一字「中」、「华」、「人」、「国」。「中」的编码为`〔口丨・LMs〕`,「华」的编码为`〔亻匕十・ERDh〕`,「人」的编码为`〔人・Te〕`,「国」的编码为`〔囗王丶・NGOd〕`。因此,「中华人民共和国」的编码为`〔口亻禾囗・LERN〕`。 +{: .example } +>比如: +> +>- 「狐假虎威」:「狐」的编码为`〔犭瓜・RQan〕`,「假」的编码为`〔亻尸二又・EBSB〕`,「虎」的编码为`〔虎・Mh〕`,「威」的编码为`〔戊一女・DFCv〕`。因此,「狐假虎威」的编码为`〔犭亻虎戊・REMD〕`。 +>- 「中华人民共和国」:这是一个七字词,所以我们只看前三字和最后一字「中」、「华」、「人」、「国」。「中」的编码为`〔口丨・LMs〕`,「华」的编码为`〔亻匕十・ERDh〕`,「人」的编码为`〔人・Te〕`,「国」的编码为`〔囗王丶・NGOd〕`。因此,「中华人民共和国」的编码为`〔口亻禾囗・LERN〕`。 ### 词语输入的优缺点 {: .no_toc } -用词语的方式进行输入,优点在于降低了每个字的平均码长。试想「我们今天一起吃饭」这个句子。 - -- 如果打单字全码的话,需要按`QAGgEpnTOViFDdiFi_DBjkLQViREBu`。 -- 如果打单字简码的话,需要按`Q_EP_TOV_FG_F_DB_LQ_REBu`。 -- 如果打词语全码的话,需要按`QAEPTOFGFiDBLQRE`。 +用词语的方式进行输入,优点在于降低了每个字的平均码长。 -可以看到,词语全码有效降低了按键的次数。 +{: .example } +>试想「我们今天一起吃饭」这个句子。 +> +>- 如果打单字全码的话,需要按`QAGgEpnTOViFDdiFi_DBjkLQViREBu`。 +>- 如果打单字简码的话,需要按`Q_EP_TOV_FG_F_DB_LQ_REBu`。 +>- 如果打词语全码的话,需要按`QAEPTOFGFiDBLQRE`。 +> +>可以看到,词语全码有效降低了按键的次数。 但是,词语输入也有其缺点,最主要的缺点包括: @@ -565,6 +615,7 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 - 你输入一个词语,却发现它并不在词库中,就需要删除后重新输入单字。让人感觉不悦。 - 人工分词需要消耗额外的注意力。 +{: .important } 因此,精简词库,熟悉词库,打单字和打词语相结合,是形码高手们的修炼之路。 ## 进阶讨论 @@ -585,9 +636,15 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 上面我们提到了宇浩输入法拆字规则的优先级。其实,在「字根最少」之上,还有一个隐藏的原则,也就是:**字根的内在属性**。 -何为字根的内置属性?其实就是指某一个字根区别于另一个字根的内在特点。用例子说明:「吉」拆成「士口」而不是「土口」,这是因为「土」的下面一笔更长,而「士」的下面一笔更短。这是区别两个字根的本质原因和内在属性。 +何为字根的内置属性?其实就是指某一个字根区别于另一个字根的内在特点。 + +{: .example } +用例子说明:「吉」拆成「士口」而不是「土口」,这是因为「土」的下面一笔更长,而「士」的下面一笔更短。这是区别两个字根的本质原因和内在属性。 -「内在属性」可以解释为什么有些字这样拆而不是那样拆,有些字为什么看上去违反了「字根最少」的原则。用例子说明:「敝」拆为「丷巾八攵」而非「氺巾攵」,这看似违反了「字根最少」原则,但其实没有。注意到,「敝」字左下的笔画是撇不是提;在「氺」中,左下角的笔画是提不是撇。故而,「敝」字里并不存在「氺」字根。正因为如此,我们取四根「丷巾八攵」而非三根「氺巾攵」。 +「内在属性」可以解释为什么有些字这样拆而不是那样拆,有些字为什么看上去违反了「字根最少」的原则。 + +{: .example } +用例子说明:「敝」拆为「丷巾八攵」而非「氺巾攵」,这看似违反了「字根最少」原则,但其实没有。注意到,「敝」字左下的笔画是撇不是提;在「氺」中,左下角的笔画是提不是撇。故而,「敝」字里并不存在「氺」字根。正因为如此,我们取四根「丷巾八攵」而非三根「氺巾攵」。 在这个章节,我们就详细讨论字根的内在属性,从而让某些字的拆分原因更加明确。 @@ -601,10 +658,11 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 一个字根的离散部件,不可被全包围结构或半包围结构分割。被分割的两个部件不得视为一个字根。 -例如: - -- 「为」字的两点不可以被视为字根「两点」,因为它们被半包围结构分割。 -- 「曵」字不拆「囗戈」而拆成「电丿丶」,因为「戈」字右上方的点被全包围结构分割。 +{: .example } +>例如: +> +>- 「为」字的两点不可以被视为字根「两点」,因为它们被半包围结构分割。 +>- 「曵」字不拆「囗戈」而拆成「电丿丶」,因为「戈」字右上方的点被全包围结构分割。 #### 口囗之辨 @@ -612,10 +670,13 @@ A:如果字根字是两码,但字根本身比较罕用,那么会浪费一 口(音`kǒu`),编码为`Lv`,是个主根。囗(音`wéi`),编码为`Nw`,是个副根。这两个根如何区分? -答案是,如果方框里有**完整**的笔画,用「囗」`Nw`。否则一律用「口」`Lv`。例如: +答案是,如果方框里有**完整**的笔画,用「囗」`Nw`。否则一律用「口」`Lv`。 -- 「国」字中,有完整的笔画,故而必须用「囗」`Nw`。 -- 「中」字中,虽然「⼁」穿「口」而过,但并未被完全包含在「口」中。由于「口」中没有完整的字根,故而用「口」`Lv`。 +{: .example } +>例如: +> +>- 「国」字中,有完整的笔画,故而必须用「囗」`Nw`。 +>- 「中」字中,虽然「⼁」穿「口」而过,但并未被完全包含在「口」中。由于「口」中没有完整的字根,故而用「口」`Lv`。 此规定也适用于另外两个包含「口」的字根: diff --git a/docs/corrections.md b/docs/updates/corrections.md similarity index 97% rename from docs/corrections.md rename to docs/updates/corrections.md index 8406fed..a4deab9 100644 --- a/docs/corrections.md +++ b/docs/updates/corrections.md @@ -1,11 +1,11 @@ --- -title: 拆分校正历史 +title: 单字拆分校正历史 layout: default -nav_order: 94 +parent: 输入法更新日志 --- -# 宇浩输入法拆分校正历史 +# 输入法单字拆分校正历史 ## 2023年5月9日 diff --git a/docs/updates.md b/docs/updates/updates.md similarity index 99% rename from docs/updates.md rename to docs/updates/updates.md index 49bb6e2..9ddd20f 100644 --- a/docs/updates.md +++ b/docs/updates/updates.md @@ -1,14 +1,14 @@ --- -title: 更新日志 +title: 输入法更新日志 layout: default nav_order: 95 +has_children: true --- # 宇浩输入法更新日志 -梦泽闲客 著 - +{: .highlight } [拆分校正历史请点击此处。](./corrections) ## 2023年5月9日 diff --git a/index.md b/index.md index 22bf77b..e291bd3 100644 --- a/index.md +++ b/index.md @@ -17,9 +17,9 @@ nav_order: 1 {:toc} -点击加入官方QQ群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk) - -**手机版导航栏**在页面右上角 +{: .highlight } +点击加入官方QQ群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk) +手机用户可点击页面右上方的「三横」按钮查看**导航栏** ## 简介 @@ -34,14 +34,15 @@ nav_order: 1 - 双编码,不分主副根,没有结构码。全简一致,规则简单。取一、二、三、末字根,思维负担较轻。 - 拆字规则优先级明确,兼顾「逻辑性」和「直观性」。保证一字一拆、无二义。 - 只使用25键,不使用Z键,手感好。中排、上排按键频率都超过40%。最高频的汉字一级简码位于最容易按的键上:`E的`、`F一`、`V了`、`I没`。 -- 设置简体、繁体两套词库。繁体字形涵盖大陆、台湾、香港、OpenCC 四套字形标准。繁体输入体验也极为优秀。 +- 设置简体、繁体两套词库。繁体字形涵盖[大陆古籍](./docs/articles/guji)[^guji_standards]、台湾、香港、OpenCC[^opencc_standards] 四套字形标准。繁体输入体验也极为优秀。 - 线性的学习体验,[教程详尽。](./docs/learn)在简快码的加持下,只用记住50个字根,就能基本输入最常用的500个汉字,其他字根可以边打边学。 +{: .note } 宇浩输入法的设计哲学是:**实用**、**直观**、**科学**、**理性**。实用,指的是完全以输入而非检字进行设计;直观,指的是对汉字的拆分直观易懂;科学,指的是对于编码和简码的设计科学合理,并符合统计频率;理性,指的是拆字规则逻辑严明、没有二义,也指社群抱着理性和开放的态度去面对批评和建议,积极修正存在矛盾的、不正确的拆分。 ### 极致低重 -宇浩输入法在简体、繁体文本下的表现有多好呢?不妨看一看下面的数据: +宇浩输入法不仅适合简体输入,也可能是当前市面上最优秀的繁体输入法。它在简体、繁体文本下的表现有多好呢?不妨看一看下面的数据: - 简体文本:常用 1500 字全码无重[^frequent_characters]。常用 3000 字,全码 12 组重码,出简后无重码。常用 4500 字,全码 57 组重码,出简后 2 组重码。常用 6000 字,全码 114 组重码,出简后 29 组重码。字频加权后,全码下每万字选重 5 次。 @@ -97,8 +98,8 @@ nav_order: 1 - [详细教程和规则细节](./docs/learn):包括宇浩输入法完整、详尽的规则介绍。适合新手阅读,也适合高手备查。 - [字根和常用字练习](./docs/practice):宇浩输入法通过数据统计,优化学习步骤,从最重要的字根学起,可以在短时间内上手打字,拉平学习曲线。 - [宇浩输入法的设计哲学](./docs/discussion):介绍了本输入法的发明背景、设计哲学、规则考量、打字理念、目标用途等。 -- [常见输入法重码比较](./docs/statistics):对市面上常见的形码输入法的各个字集下的动态、静态重码进行量化分析。 -- [宇浩输入法拆分校正历史](./docs/corrections)和[更新日志](./docs/corrections)。 +- [相关研究文章](./docs/articles/articles):包括一些输入法研究文章,比如设计理念、常见的形码输入法重码数据、古籍通规等。 +- [宇浩输入法更新日志](./docs/updates/updates)和[单字拆分校正历史](./docs/updates/corrections)。 - [宇浩输入法在线拆分查询系统](./chaifen):您可以在此处查询 99000 个汉字(至CJK-I区)的拆分,支持输入单字、词语、句子。 ## 背景故事 @@ -119,13 +120,16 @@ nav_order: 1 ## 同其他输入法比较 -如果哪个输入法只谈自己的优点,不谈其他输入法的优点,或者说自己各方面完全胜过另一个输入法,那么一定是**虚假宣传**,值得警惕。这是因为,「低重码」、「规则简易」、「字根分布有规律」,是个不可能三角。一个输入法只能在一者做到突出,或者两项都不错,或者三项均衡,但不可能三者都做到很好。在宇浩输入法的开发中,我努力做到扬长避短,希望它的各项指标达到一种平衡,不要出现极端的弊病。在这里,聊一下几个笔者喜欢的输入法的优缺点,希望能帮助你进行选择: +{: .warning } +如果哪个输入法只谈自己的优点,不谈其他输入法的优点,或者说自己各方面完全胜过另一个输入法,那么一定是**虚假宣传**,值得警惕。这是因为,「低重码」、「规则简易」、「字根分布有规律」,是个不可能三角。一个输入法只能在一者做到突出,或者两项都不错,或者三项均衡,但不可能三者都做到很好。 + +在宇浩输入法的开发中,我努力做到扬长避短,希望它的各项指标达到一种平衡,不要出现极端的弊病。在这里,聊一下几个笔者喜欢的输入法的优缺点,希望能帮助你进行选择: - 五笔。25键方案,四码定长。采用小字根。字根数量不多,在键盘上分大区分部,容易上手;字根取一二三末,拆字轻松;编码上有结构码,容易造成思维卡顿;由于字根较小,复杂汉字容易拆得太散,造成繁体输入体验不佳。繁简字根同编码,不适合繁简通打;平台通用性高。适合公务人员和只有简体需求的人。 - 郑码。26键方案,四码定长。字根按字典分区排列,大小码都按照字形设计,容易记忆。上手打字,有一个字典排序到键盘排序的映射过程,故而字根分布在键盘上较为随机。字根有时为一二末,有时为一二次末末;全码单字和简码、词语编码不一致,学习较难。采用大字根,拆字更加直观科学。繁简字根同编码,繁简混输情况下需要选重。适合完全不会拼音,或者完全打繁体文本的人。 - 徐码。26键方案,四码定长。字根按字典分区排列,大码有一定规律,小码用拼音中的字母。上手打字,有一个字典排序到键盘排序的映射过程,故而字根分布在键盘上较为随机。字根有时为一二末,有时为一二次末末,有回头码,在打字中如果判断错误需要回删。故而单字全码规则是所有输入法中最为复杂的。但由于全简一致,大多数时候输入没有障碍。拆字规则非常规范。Z键频率很高,手感较差。各字集下(尤其是大字集)重码都极低。它是四码定长中两个可以繁简通打的方案之一。适合经常需要输入繁体、繁简通打,或面向生僻字的文字工作者使用。 - 虎码。26键方案,四码定长。字根大码全键盘乱序分布,小码使用拼音中的字母,字根记忆有一定难度;字根取一二三末,无结构码,无回头码,规则简单。对简体汉字文本进行过优化,动态重码率低;繁体重码率表现一般;繁简字根同编码,繁简混合文本需要选重。适合只打简化字文本的人,也适合赛文竞速的人。 -- 宇浩。25键方案,四码定长。字根大码在键盘上分大区排列,小码用拼音中的字母;字根取一二三末,无结构码,在不足四码时补首根小码。对于常用繁简汉字进行过优化。简体、繁体、繁简混输,三种文本空间动态重码率都极低;大字集静态重码率仅次于徐码。它是四码定长中两个可以繁简通打的方案之一。适合喜爱无缝切换简体和繁体进行日常交流和文学创作,又偶尔输入生僻字的人。 +- 宇浩。25键方案,四码定长。字根大码在键盘上分大区排列,小码用拼音中的字母;字根取一二三末,无结构码,在不足四码时补首根小码。对于常用繁简汉字进行过优化。简体、繁体、繁简混输,三种文本空间动态重码率都极低;大字集静态重码高于徐码。它是四码定长中两个可以繁简通打的方案之一。适合喜爱无缝切换简体和繁体进行日常交流和文学创作,又偶尔输入生僻字的人。 这里列出各维度上同其它四码定长输入法之间比较,排名越靠前越好。请注意,以下六个输入法中,没有任何一个输入法能在所有维度上都能超越另一个输入法。有任何一个维度排在第一,就有值得学习借鉴的地方。 @@ -147,7 +151,8 @@ nav_order: 1 | Z 键使用较少[^z_key] | 五笔~**宇浩** | | | 虎码 | 郑码 | 徐码 | | 全码编码空间[^z_key] | 郑码=徐码=虎码(456976) | | | 五笔=**宇浩**(390625) | | | -[点击此处详细了解我对一款具有平衡性的输入法的一些思考和分析,以及宇浩输入法的设计理念和基本考量。](./docs/discussion)(陆标繁体书写) +{: .highlight } +[点击此处详细了解我对一款具有平衡性的输入法的一些思考和分析,以及宇浩输入法的设计理念和基本考量(陆标繁体书写)。](./docs/discussion) ## 衍生作品 @@ -157,7 +162,7 @@ nav_order: 1 作者:王牌饼干 -项目地址:https://github.com/lost-melody/rime-smyh +项目地址:[https://github.com/lost-melody/rime-smyh](https://github.com/lost-melody/rime-smyh) ## 脚注 @@ -166,3 +171,7 @@ nav_order: 1 [^root_completeness]: 例如在五笔中,「革」「鱼」,甚至「衤」「犭」等字根都被拆成了两个字根。但在其他输入法中,字根被完整保留。还宇浩中,还有不少完整的康熙部首,如「風」「僉」等。有优点也有缺点,字根完整性越高,字根数量就越多,学习时间就越长。 [^z_key]: 两版五笔都不使用 Z 键,因为它比较难按。Z 键空出后,还能作为反查引导、通配符使用。宇浩继承了这个特点,不使用 Z 键,因此所有五笔输入法都可以直接挂载宇浩输入法的码表,并实现 Z 键的完整功能。有优点就有缺点。不使用 Z 键,也会造成编码空间的下降。在全码4码的情况下,宇浩的编码空间只有其他26键输入法的85.5%。这意味着对宇浩输入法的字根离散要求更苛刻,使之不适合超大词库。 + +[^guji_standards]: 中华人民共和国国家标准《古籍印刷通用字规范字形表》(GB/Z 40637-2021):[https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B](https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B) + +[^opencc_standards]: 为 OpenCC 繁简转换程序所用字典:[https://github.com/BYVoid/OpenCC/blob/master/data/dictionary/STCharacters.txt](https://github.com/BYVoid/OpenCC/blob/master/data/dictionary/STCharacters.txt) \ No newline at end of file