From 478e1dca0752260db31f0241bf15b64833d818df Mon Sep 17 00:00:00 2001 From: "Yuhao Zhu, PhD, FRM" Date: Sat, 21 Oct 2023 00:51:54 +0200 Subject: [PATCH] Update index --- _config.yml | 8 ++++---- index.md | 51 +++++++++++++++++++++++++++------------------------ 2 files changed, 31 insertions(+), 28 deletions(-) diff --git a/_config.yml b/_config.yml index 72268ce..39bcf5b 100644 --- a/_config.yml +++ b/_config.yml @@ -10,12 +10,12 @@ aux_links: # External navigation links nav_external_links: - - title: 拆分查询·星陳 - url: https://zhuyuhao.com/yustar/star/chaifen - hide_icon: true # set to true to hide the external link icon - defaults to false - - title: 拆分查询·光華 + - title: 拆分和编码查询·光華 url: https://zhuyuhao.com/yuhao/light/chaifen hide_icon: true # set to true to hide the external link icon - defaults to false + - title: 拆分和编码查询·星陳 + url: https://zhuyuhao.com/yustar/star/chaifen + hide_icon: true # set to true to hide the external link icon - defaults to false # - title: 玫枫跟打器 # url: https://kylebing.cn/tools/typepad/ # hide_icon: false # set to true to hide the external link icon - defaults to false diff --git a/index.md b/index.md index 80921aa..bb0097c 100644 --- a/index.md +++ b/index.md @@ -29,31 +29,34 @@ nav_order: 1 >[详细教程](./docs/learn) >[**光華**练习程序](https://github.com/forFudan/yuhao/releases/download/v3.1.0/yuhao_light_practice_tool.exe) · >[**星陳**练习程序](https://github.com/forFudan/yuhao/releases/download/v3.1.0/yuhao_star_practice_tool.exe) ->[**光華**拆分和编码查询](./light/chaifen/) · ->[**星陳**拆分和编码查询](https://zhuyuhao.com/yustar/star/chaifen/) +>[**光華**拆分查询](https://zhuyuhao.com/yuhao/light/chaifen/) · +>[**星陳**拆分查询](https://zhuyuhao.com/yustar/star/chaifen/) ## 简介 -宇浩输入法是一款纯字形输入法,不依赖读音实现全漢字输入。在设定一系列确保规律性和协调性的约束条件下,使用宇浩算法理论框架和程序工具,优化字根分布,达到顶尖的输入表现。宇浩输入法具有以下优点: +宇浩输入法是一款纯字形输入法,不依赖读音实现全汉字输入。在设定一系列确保规律性和协调性的约束条件下,使用宇浩算法理论框架和程序工具,优化字根分布,达到顶尖的输入表现。宇浩输入法具有以下优点: -- 重码率极低,适合盲打。 -- 繁简字分离,不存在共用码位现象,故而繁简混合文本也极少选重。比如:「简」「簡」不同碼。 -- 字形兼容大陆通规、[大陆古籍通规](./docs/articles/guji)[^guji_standards]、臺灣正體三套標準。比如「起=走己」和「起=走巳」兼收。 -- 设置简体、繁体词库。繁体词库亦涵盖两岸三地三套用字标准[^opencc],输入体验十分优秀。 -- 面向大字集,全面覆盖 CJK 全字集 99000 多个漢字和部首(更新至 CJK 扩 I 区),可以用宇浩输入法打出所有生僻字。检字方便,翻页少,全字集候选项最多的码位`DLYF`上只有16个候选字。 +- 字频率加权选重率极低,为业内顶尖水平,适合盲打。 +- 繁简字码位分离,繁简混合文本也极少选重。例如:<简><簡>不同碼。 +- 字形兼容大陆通规、[大陆古籍通规](./docs/articles/guji)[^guji_standards]、臺灣正體三套標準。例如:<起=走己>和<起=走巳>兼收。 +- 设有简体、繁体两套词库,字形涵盖两岸三地三套标准[^opencc]。 +- 全面覆盖 CJK 全字集 99000 多个汉字和部首(更新至 CJK 扩 I 区),生僻字一网打尽。 +- 检字方便,翻页少。全字集候选项最多的码位`DLYF`上只有16个候选字。 - 字根在键盘上呈规律排布,摒除乱序排布,便于理解学习。 -- 采用大字根、双编码,拆法更直观,不会将漢字拆得零碎。分主副根,没有结构码。取一、二、三、末字根。全简一致。 -- 拆字规则优先级明确,兼顾「逻辑性」和「直观性」。追求一字一拆、无歧义。 -- 兼顾手感,大码只使用25键,不使用Z键,中排、上排按键频率都超过40%。 +- 采用大字根、拆法直观,不会将汉字拆得零碎。 +- 字根为双编码,不分主副根,没有结构码。 +- 拆分时取一、二、三、末字根。全简编码一致、字词编码一致。 +- 拆字规范,规则优先级明确,兼顾「逻辑性」和「直观性」。追求一字一拆、无歧义。 +- 兼顾手感,大码只使用25键。星陳方案双手互击率超过60%。 宇浩输入法目前有两套并行方案,设计理念一致,单字拆分统一,字根分布不同。 -- **宇浩·光華**方案采用了字根首笔分区排布模式。字根在键盘上,依据其第一笔的笔画,分布在横竖撇捺折五区中。其中横区6键,竖区5键,撇区6键,捺区4键,折区4键。方案名取自《尚書大傳》之「日月光華,旦復旦兮」。 +- **宇浩·光華**方案采用了字根首笔分区排布模式(类似五笔、真码)。依据字根第一笔的笔画,分布在横竖撇捺折五区中。其中横区6键,竖区5键,撇区6键,捺区4键,折区4键。方案名取自《尚書大傳》之「日月光華,旦復旦兮」。 -- **宇浩·星陳**方案采用了字根聚类同键排布模式。字型相似的字根会被聚拢在一道,排布在25个键位上。方案名取自《尚書大傳》之「明明上天,爛然星陳」。 +- **宇浩·星陳**方案采用了字根聚类同键排布模式(类似郑码、徐码)。字形相似的字根会被聚拢在一道,排布在25个键位上。方案名取自《尚書大傳》之「明明上天,爛然星陳」。 两个方案的区别,可参见以下表格。 @@ -75,10 +78,10 @@ nav_order: 1 | 严格优化键位分布 | ❌ | ✅ | | Z 键反查 | ✅ | ✅ | -[![宇浩输入法宋体字根图](./image/宇浩输入法宋体字根图v2olkb.png)](./image/宇浩输入法宋体字根图v2olkb.png) - [![yustar](http://zhuyuhao.com/yustar/image/yustar.png)](http://zhuyuhao.com/yustar/image/yustar.png) +[![宇浩输入法宋体字根图](./image/宇浩输入法宋体字根图v2olkb.png)](./image/宇浩输入法宋体字根图v2olkb.png) + 当前,宇浩输入法的核心维护工作 90% 以上内容是修正和完善「宇浩拆分」、优化 Rime 平台功能。 ## 特点 @@ -88,11 +91,11 @@ nav_order: 1 绝大多数输入法,简体字和对应的繁体字都占用相同的码位,导致输入繁体时需要选重。比如五笔字型中,「簡」「简」两个字的编码都是`TUJf`。如果我想打繁体的「簡」,需要按一下选重键。因此,大多数输入法在繁体文本或繁简混合文本下,不具备盲打的优势。 -宇浩输入法繁简漢字分离,不存在共用码位现象,故而繁简混合文本也不需要选重。你可以按照自己的喜好随时切换繁简状态,不需要软件转换,更不需要担心因为繁体字位于简体字的下方而需要选重。可以像写字一样随心切换任何字形。 +宇浩输入法繁简汉字分离,不存在共用码位现象,故而繁简混合文本也不需要选重。你可以按照自己的喜好随时切换繁简状态,不需要软件转换,更不需要担心因为繁体字位于简体字的下方而需要选重。可以像写字一样随心切换任何字形。 比如,「简」`QPJr`、「簡」`QKJr`这两个繁简汉字在宇浩输入法中对应了不同的编码。这是因为宇浩输入法的「门」字根繁简分离。在很多输入法中,由于繁简字根位于同一个按键,你需要从候选栏中选择繁体字还是简体字。 -以下视频展示了使用宇浩单字全码输入**繁简混合**版本的《洛神赋》的片段节选。可以看到,全文都没有进行过选重。因此,宇浩输入法特别适合任意文本空间下的盲打,以及古漢语输入。 +以下视频展示了使用宇浩单字全码输入**繁简混合**版本的《洛神赋》的片段节选。可以看到,全文都没有进行过选重。因此,宇浩输入法特别适合任意文本空间下的盲打,以及古汉语输入。 {% include youtube.html id='356702912&bvid=BV1ZX4y1h7iV&cid=1147616940&page=1' %} @@ -107,7 +110,7 @@ nav_order: 1 - 繁简混合文本[^mixed_frequency]:前 1500 字,全码 3 组重码,出简后无重。前 3000 字,全码 13 组重码,出简后 3 组重码。前 6000 字,全码 131 组重码,出简后 16 组重码。前 9000 字,全码 365 组重码,出简后 92 组重码。字频加权后,全码下每万字选重 17 次。 -要知道,宇浩输入法只使用了25个按键,也就是说四码的编码空间只有其他26键输入法的85.5%。但是宇浩输入法在常用繁简漢字下选重率却是同类输入法中最低的。 +要知道,宇浩输入法只使用了25个按键,也就是说四码的编码空间只有其他26键输入法的85.5%。但是宇浩输入法在常用繁简汉字下选重率却是同类输入法中最低的。 ### 均衡优异 {: .no_toc } @@ -124,7 +127,7 @@ nav_order: 1 ## 衍生作品「吉旦餅」 -吉旦餅,基於宇浩輸入法製作,亂序字根,三碼定長,延遲頂字。「吉旦餅」其名來自三名主要開發人:阿吉,forFudan,王牌餅乾,又取義於 華夫餅 (wafel),其漢譯應有「鷄蛋餅」之義。 +吉旦餅,基於宇浩輸入法製作,亂序字根,三碼定長,延遲頂字。「吉旦餅」其名來自三名主要開發人:阿吉,forFudan,王牌餅乾,又取義於 華夫餅 (wafel),其汉譯應有「鷄蛋餅」之義。 项目地址:[https://lost-melody.github.io/wafel](https://lost-melody.github.io/wafel) @@ -136,10 +139,10 @@ nav_order: 1 宇浩输入法的最佳输入体验,是采用精简词库(80000词左右,同时包括简体、台湾繁体、香港繁体、大陆繁体)并配合单字输入,从而达到极致的确定性,做到完全关闭候选框输入。以下为宇浩输入法**最适合**的人群: -- 对繁体字和简化字都有输入需求,希望做到繁简无缝切换,不依赖程序进行转换的人(中文系学生、经常同两岸三地人士打交道者、方言爱好者、漢字爱好者等);或 +- 对繁体字和简化字都有输入需求,希望做到繁简无缝切换,不依赖程序进行转换的人(中文系学生、经常同两岸三地人士打交道者、方言爱好者、汉字爱好者等);或 - 日常主要输入繁体文本的人(港澳台用户);或 - 日常需要输入简体文本,偶尔需要输入繁体文本和生僻字的人;或 -- 热爱漢字,喜欢一笔一画写字的感觉,想要学习传统漢字的人。 +- 热爱汉字,喜欢一笔一画写字的感觉,想要学习传统汉字的人。 ## 常见输入法选重率 @@ -357,7 +360,7 @@ nav_order: 1 - 最小化简体文本下的[完美词语选重率](./docs/articles/statistics#词语重码计算公式),使用了当代汉语词频表。例如,「我今天去那里」被分割成「我·今天·去·那里」,一共有 4 个词语。倘若「我」和「那里」生了重码,则选重率为 1 / 4 = 25%。优点:考虑该指标,可以优化用户打词时的选重体验。缺点:本指标的成立条件,只有当用户的分词习惯和词频表一致才有效。大多时候,用户会将词语拆成单字输入,避免词语不存在时的回删。因此,真实的文本选重率,介于单字动态选重率和完美词语选重率之间。另外,当样本空间改变时,比如输入非典范白话文的情况下,本指标参考价值也会降低。 {: .note } -宇浩方案的哲学是:**实用**、**直观**、**科学**、**理性**。实用,指的是完全以输入而非检字进行设计;直观,指的是对漢字的拆分直观易懂,不破坏汉字的美感;科学,指的是对于编码和简码的设计科学合理,符合统计频率,使用量化指标而非感性体验;理性,指的是拆字规则逻辑严明、没有二义,也指社群抱着理性和开放的态度去面对批评和建议,积极修正存在矛盾的、不正确的拆分。 +宇浩方案的哲学是:**实用**、**直观**、**科学**、**理性**。实用,指的是完全以输入而非检字进行设计;直观,指的是对汉字的拆分直观易懂,不破坏汉字的美感;科学,指的是对于编码和简码的设计科学合理,符合统计频率,使用量化指标而非感性体验;理性,指的是拆字规则逻辑严明、没有二义,也指社群抱着理性和开放的态度去面对批评和建议,积极修正存在矛盾的、不正确的拆分。 ## 关于作者 @@ -384,10 +387,10 @@ nav_order: 1 ## 脚注 -[^frequent_characters]: 「最常用漢字」的定义依赖于文本空间。关于本测评中所用的字频数据的来源,[请参阅此页面](./docs/articles/statistics)。 +[^frequent_characters]: 「最常用汉字」的定义依赖于文本空间。关于本测评中所用的字频数据的来源,[请参阅此页面](./docs/articles/statistics)。 [^guji_standards]: 中华人民共和国国家标准《古籍印刷通用字规范字形表》(GB/Z 40637-2021):[https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B](https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B) [^mixed_frequency]: 这里的繁简混合字频来源于简体字频和繁体字频。假设一个人一半时间打简体,一半时间打繁体,那么便适用于此数据。 -[^opencc]: 另外,宇浩字庫還包含了符合 OpenCC 用字標準的詞語。 +[^opencc]: 两岸三地三套标准包括:大陆简体、大陆繁體、臺灣正體。另外,宇浩输入法还兼容符合 OpenCC 用字标准的词语。