Skip to content

Commit

Permalink
Update index
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed Oct 20, 2023
1 parent b1e8d7d commit 478e1dc
Show file tree
Hide file tree
Showing 2 changed files with 31 additions and 28 deletions.
8 changes: 4 additions & 4 deletions _config.yml
Original file line number Diff line number Diff line change
Expand Up @@ -10,12 +10,12 @@ aux_links:

# External navigation links
nav_external_links:
- title: 拆分查询·星陳
url: https://zhuyuhao.com/yustar/star/chaifen
hide_icon: true # set to true to hide the external link icon - defaults to false
- title: 拆分查询·光華
- title: 拆分和编码查询·光華
url: https://zhuyuhao.com/yuhao/light/chaifen
hide_icon: true # set to true to hide the external link icon - defaults to false
- title: 拆分和编码查询·星陳
url: https://zhuyuhao.com/yustar/star/chaifen
hide_icon: true # set to true to hide the external link icon - defaults to false
# - title: 玫枫跟打器
# url: https://kylebing.cn/tools/typepad/
# hide_icon: false # set to true to hide the external link icon - defaults to false
Expand Down
51 changes: 27 additions & 24 deletions index.md
Original file line number Diff line number Diff line change
Expand Up @@ -29,31 +29,34 @@ nav_order: 1
>[详细教程](./docs/learn)
>[**光華**练习程序](https://github.com/forFudan/yuhao/releases/download/v3.1.0/yuhao_light_practice_tool.exe) ·
>[**星陳**练习程序](https://github.com/forFudan/yuhao/releases/download/v3.1.0/yuhao_star_practice_tool.exe)
>[**光華**拆分和编码查询](./light/chaifen/) ·
>[**星陳**拆分和编码查询](https://zhuyuhao.com/yustar/star/chaifen/)
>[**光華**拆分查询](https://zhuyuhao.com/yuhao/light/chaifen/) ·
>[**星陳**拆分查询](https://zhuyuhao.com/yustar/star/chaifen/)
<!-- {: .note }
>本页面介绍的是宇浩·光華,其他版本信息请移步导航栏 -->

## 简介

宇浩输入法是一款纯字形输入法,不依赖读音实现全漢字输入。在设定一系列确保规律性和协调性的约束条件下,使用宇浩算法理论框架和程序工具,优化字根分布,达到顶尖的输入表现。宇浩输入法具有以下优点:
宇浩输入法是一款纯字形输入法,不依赖读音实现全汉字输入。在设定一系列确保规律性和协调性的约束条件下,使用宇浩算法理论框架和程序工具,优化字根分布,达到顶尖的输入表现。宇浩输入法具有以下优点:

- 重码率极低,适合盲打。
- 繁简字分离,不存在共用码位现象,故而繁简混合文本也极少选重。比如:「简」「簡」不同碼。
- 字形兼容大陆通规、[大陆古籍通规](./docs/articles/guji)[^guji_standards]、臺灣正體三套標準。比如「起=走己」和「起=走巳」兼收。
- 设置简体、繁体词库。繁体词库亦涵盖两岸三地三套用字标准[^opencc],输入体验十分优秀。
- 面向大字集,全面覆盖 CJK 全字集 99000 多个漢字和部首(更新至 CJK 扩 I 区),可以用宇浩输入法打出所有生僻字。检字方便,翻页少,全字集候选项最多的码位`DLYF`上只有16个候选字。
- 字频率加权选重率极低,为业内顶尖水平,适合盲打。
- 繁简字码位分离,繁简混合文本也极少选重。例如:<简><簡>不同碼。
- 字形兼容大陆通规、[大陆古籍通规](./docs/articles/guji)[^guji_standards]、臺灣正體三套標準。例如:<起=走己>和<起=走巳>兼收。
- 设有简体、繁体两套词库,字形涵盖两岸三地三套标准[^opencc]
- 全面覆盖 CJK 全字集 99000 多个汉字和部首(更新至 CJK 扩 I 区),生僻字一网打尽。
- 检字方便,翻页少。全字集候选项最多的码位`DLYF`上只有16个候选字。
- 字根在键盘上呈规律排布,摒除乱序排布,便于理解学习。
- 采用大字根、双编码,拆法更直观,不会将漢字拆得零碎。分主副根,没有结构码。取一、二、三、末字根。全简一致。
- 拆字规则优先级明确,兼顾「逻辑性」和「直观性」。追求一字一拆、无歧义。
- 兼顾手感,大码只使用25键,不使用Z键,中排、上排按键频率都超过40%。
- 采用大字根、拆法直观,不会将汉字拆得零碎。
- 字根为双编码,不分主副根,没有结构码。
- 拆分时取一、二、三、末字根。全简编码一致、字词编码一致。
- 拆字规范,规则优先级明确,兼顾「逻辑性」和「直观性」。追求一字一拆、无歧义。
- 兼顾手感,大码只使用25键。星陳方案双手互击率超过60%。

宇浩输入法目前有两套并行方案,设计理念一致,单字拆分统一,字根分布不同。

- **宇浩·光華**方案采用了字根首笔分区排布模式。字根在键盘上,依据其第一笔的笔画,分布在横竖撇捺折五区中。其中横区6键,竖区5键,撇区6键,捺区4键,折区4键。方案名取自《尚書大傳》之「日月光華,旦復旦兮」。
- **宇浩·光華**方案采用了字根首笔分区排布模式(类似五笔、真码)。依据字根第一笔的笔画,分布在横竖撇捺折五区中。其中横区6键,竖区5键,撇区6键,捺区4键,折区4键。方案名取自《尚書大傳》之「日月光華,旦復旦兮」。

- **宇浩·星陳**方案采用了字根聚类同键排布模式。字型相似的字根会被聚拢在一道,排布在25个键位上。方案名取自《尚書大傳》之「明明上天,爛然星陳」。
- **宇浩·星陳**方案采用了字根聚类同键排布模式(类似郑码、徐码)。字形相似的字根会被聚拢在一道,排布在25个键位上。方案名取自《尚書大傳》之「明明上天,爛然星陳」。

两个方案的区别,可参见以下表格。

Expand All @@ -75,10 +78,10 @@ nav_order: 1
| 严格优化键位分布 |||
| Z 键反查 |||

[![宇浩输入法宋体字根图](./image/宇浩输入法宋体字根图v2olkb.png)](./image/宇浩输入法宋体字根图v2olkb.png)

[![yustar](http://zhuyuhao.com/yustar/image/yustar.png)](http://zhuyuhao.com/yustar/image/yustar.png)

[![宇浩输入法宋体字根图](./image/宇浩输入法宋体字根图v2olkb.png)](./image/宇浩输入法宋体字根图v2olkb.png)

当前,宇浩输入法的核心维护工作 90% 以上内容是修正和完善「宇浩拆分」、优化 Rime 平台功能。

## 特点
Expand All @@ -88,11 +91,11 @@ nav_order: 1

绝大多数输入法,简体字和对应的繁体字都占用相同的码位,导致输入繁体时需要选重。比如五笔字型中,「簡」「简」两个字的编码都是`TUJf`。如果我想打繁体的「簡」,需要按一下选重键。因此,大多数输入法在繁体文本或繁简混合文本下,不具备盲打的优势。

宇浩输入法繁简漢字分离,不存在共用码位现象,故而繁简混合文本也不需要选重。你可以按照自己的喜好随时切换繁简状态,不需要软件转换,更不需要担心因为繁体字位于简体字的下方而需要选重。可以像写字一样随心切换任何字形。
宇浩输入法繁简汉字分离,不存在共用码位现象,故而繁简混合文本也不需要选重。你可以按照自己的喜好随时切换繁简状态,不需要软件转换,更不需要担心因为繁体字位于简体字的下方而需要选重。可以像写字一样随心切换任何字形。

比如,「简」`QPJr`、「簡」`QKJr`这两个繁简汉字在宇浩输入法中对应了不同的编码。这是因为宇浩输入法的「门」字根繁简分离。在很多输入法中,由于繁简字根位于同一个按键,你需要从候选栏中选择繁体字还是简体字。

以下视频展示了使用宇浩单字全码输入**繁简混合**版本的《洛神赋》的片段节选。可以看到,全文都没有进行过选重。因此,宇浩输入法特别适合任意文本空间下的盲打,以及古漢语输入
以下视频展示了使用宇浩单字全码输入**繁简混合**版本的《洛神赋》的片段节选。可以看到,全文都没有进行过选重。因此,宇浩输入法特别适合任意文本空间下的盲打,以及古汉语输入

{% include youtube.html id='356702912&bvid=BV1ZX4y1h7iV&cid=1147616940&page=1' %}

Expand All @@ -107,7 +110,7 @@ nav_order: 1

- 繁简混合文本[^mixed_frequency]:前 1500 字,全码 3 组重码,出简后无重。前 3000 字,全码 13 组重码,出简后 3 组重码。前 6000 字,全码 131 组重码,出简后 16 组重码。前 9000 字,全码 365 组重码,出简后 92 组重码。字频加权后,全码下每万字选重 17 次。

要知道,宇浩输入法只使用了25个按键,也就是说四码的编码空间只有其他26键输入法的85.5%。但是宇浩输入法在常用繁简漢字下选重率却是同类输入法中最低的
要知道,宇浩输入法只使用了25个按键,也就是说四码的编码空间只有其他26键输入法的85.5%。但是宇浩输入法在常用繁简汉字下选重率却是同类输入法中最低的

### 均衡优异
{: .no_toc }
Expand All @@ -124,7 +127,7 @@ nav_order: 1

## 衍生作品「吉旦餅」

吉旦餅,基於宇浩輸入法製作,亂序字根,三碼定長,延遲頂字。「吉旦餅」其名來自三名主要開發人:阿吉,forFudan,王牌餅乾,又取義於 華夫餅 (wafel),其漢譯應有「鷄蛋餅」之義。
吉旦餅,基於宇浩輸入法製作,亂序字根,三碼定長,延遲頂字。「吉旦餅」其名來自三名主要開發人:阿吉,forFudan,王牌餅乾,又取義於 華夫餅 (wafel),其汉譯應有「鷄蛋餅」之義。

项目地址:[https://lost-melody.github.io/wafel](https://lost-melody.github.io/wafel)

Expand All @@ -136,10 +139,10 @@ nav_order: 1

宇浩输入法的最佳输入体验,是采用精简词库(80000词左右,同时包括简体、台湾繁体、香港繁体、大陆繁体)并配合单字输入,从而达到极致的确定性,做到完全关闭候选框输入。以下为宇浩输入法**最适合**的人群:

- 对繁体字和简化字都有输入需求,希望做到繁简无缝切换,不依赖程序进行转换的人(中文系学生、经常同两岸三地人士打交道者、方言爱好者、漢字爱好者等);或
- 对繁体字和简化字都有输入需求,希望做到繁简无缝切换,不依赖程序进行转换的人(中文系学生、经常同两岸三地人士打交道者、方言爱好者、汉字爱好者等);或
- 日常主要输入繁体文本的人(港澳台用户);或
- 日常需要输入简体文本,偶尔需要输入繁体文本和生僻字的人;或
- 热爱漢字,喜欢一笔一画写字的感觉,想要学习传统漢字的人
- 热爱汉字,喜欢一笔一画写字的感觉,想要学习传统汉字的人

## 常见输入法选重率

Expand Down Expand Up @@ -357,7 +360,7 @@ nav_order: 1
- 最小化简体文本下的[完美词语选重率](./docs/articles/statistics#词语重码计算公式),使用了当代汉语词频表。例如,「我今天去那里」被分割成「我·今天·去·那里」,一共有 4 个词语。倘若「我」和「那里」生了重码,则选重率为 1 / 4 = 25%。优点:考虑该指标,可以优化用户打词时的选重体验。缺点:本指标的成立条件,只有当用户的分词习惯和词频表一致才有效。大多时候,用户会将词语拆成单字输入,避免词语不存在时的回删。因此,真实的文本选重率,介于单字动态选重率和完美词语选重率之间。另外,当样本空间改变时,比如输入非典范白话文的情况下,本指标参考价值也会降低。

{: .note }
宇浩方案的哲学是:**实用****直观****科学****理性**。实用,指的是完全以输入而非检字进行设计;直观,指的是对漢字的拆分直观易懂,不破坏汉字的美感;科学,指的是对于编码和简码的设计科学合理,符合统计频率,使用量化指标而非感性体验;理性,指的是拆字规则逻辑严明、没有二义,也指社群抱着理性和开放的态度去面对批评和建议,积极修正存在矛盾的、不正确的拆分。
宇浩方案的哲学是:**实用****直观****科学****理性**。实用,指的是完全以输入而非检字进行设计;直观,指的是对汉字的拆分直观易懂,不破坏汉字的美感;科学,指的是对于编码和简码的设计科学合理,符合统计频率,使用量化指标而非感性体验;理性,指的是拆字规则逻辑严明、没有二义,也指社群抱着理性和开放的态度去面对批评和建议,积极修正存在矛盾的、不正确的拆分。

## 关于作者

Expand All @@ -384,10 +387,10 @@ nav_order: 1
## 脚注

[^frequent_characters]: 「最常用漢字」的定义依赖于文本空间。关于本测评中所用的字频数据的来源,[请参阅此页面](./docs/articles/statistics)
[^frequent_characters]: 「最常用汉字」的定义依赖于文本空间。关于本测评中所用的字频数据的来源,[请参阅此页面](./docs/articles/statistics)

[^guji_standards]: 中华人民共和国国家标准《古籍印刷通用字规范字形表》(GB/Z 40637-2021):[https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B](https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=52E2DE28D439C1937EE09AE4B5AA615B)

[^mixed_frequency]: 这里的繁简混合字频来源于简体字频和繁体字频。假设一个人一半时间打简体,一半时间打繁体,那么便适用于此数据。

[^opencc]: 另外,宇浩字庫還包含了符合 OpenCC 用字標準的詞語
[^opencc]: 两岸三地三套标准包括:大陆简体、大陆繁體、臺灣正體。另外,宇浩输入法还兼容符合 OpenCC 用字标准的词语

0 comments on commit 478e1dc

Please sign in to comment.