Skip to content

Commit

Permalink
更新 index.md
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed May 28, 2023
1 parent 0619005 commit 2ed9a97
Showing 1 changed file with 21 additions and 44 deletions.
65 changes: 21 additions & 44 deletions index.md
Original file line number Diff line number Diff line change
Expand Up @@ -101,10 +101,6 @@ nav_order: 1

## 帮你挑选适合自己的输入方案

### 一图胜千言

[![宇浩输入法宋体字根图](./image/输入法雷达图.png)](./image/输入法雷达图.png)

### 各方案优缺点

这里简单聊一下几个特点鲜明的四码定长的纯形方案的优缺点,希望能帮助你进行选择。优点和缺点都按重要性降序排列。一般而言,排名的一的优点,往往是以排名第一的缺点为代价形成的。
Expand Down Expand Up @@ -163,24 +159,6 @@ nav_order: 1
3. 有时需要取倒数第二根。
4. 上手打字,有一个字典排序到键盘排序的映射过程,故而字根分布在键盘上较为随机。

#### 虎码
{: .no_toc }

虎码,26键方案,四码定长。适合专注于简化字文本,喜爱赛文竞速,追求极限的用户。

优点:

1. 编码规则简单,非常适合单字全码党。
1. 对于简体文本的词库也进行了优化,动态重码率低。
1. 采用大字根,约200个左右。
1. 字根取一二三末。

缺点:

1. 字根在键盘上乱序分布。这使得字根记忆有相当难度,学习曲线陡峭。
1. 拆字规则存在特例,优先级不够明确。
1. 繁简字根同编码,繁简混输情况下需要选重。

#### 宇浩
{: .no_toc }

Expand All @@ -202,7 +180,7 @@ nav_order: 1

### 重码数据对比

很多输入法可能在简体文本下能达到宇浩输入法相似的水平,但是在繁体和繁简混合文本下的重码率会明显上升。这里对比一下五笔、郑码、徐码、虎码在不同汉字字符集下的单字全码的重码数量,以供参考(选重率指的是平均输入多少个汉字需要选一次重码字)。仓颉虽然是五码定长,但它在繁体输入上地位很高,所以也将它纳入比较。加粗的数字代表本行最优值([点击此处查看更多输入法的重码数据](./docs/articles/statistics)):
很多输入法可能在简体文本下能达到宇浩输入法相似的水平,但是在繁体和繁简混合文本下的重码率会明显上升。这里对比一下五笔、郑码、徐码在不同汉字字符集下的单字全码的重码数量,以供参考(选重率指的是平均输入多少个汉字需要选一次重码字)。仓颉虽然是五码定长,但它在繁体输入上地位很高,所以也将它纳入比较。加粗的数字代表本行最优值([点击此处查看更多输入法的重码数据](./docs/articles/statistics)):

| 形码方案 | GB2312 | 国字常用 | 常用繁简 | GBK | 简体选重率 | 繁体选重率 | 繁简混合文本选重率 |
| :------------ | -----: | -------: | -------: | ---: | :--------- | :--------- | :----------------- |
Expand All @@ -212,7 +190,6 @@ nav_order: 1
| 五笔06·新世纪 | 532 | 387 | 1690 | 6610 | 31.8‱ | 81.8‱ | 223.6‱ |
| **字根双码** | | | | | | | **繁简同根** |
| 郑码 | 563 | 311 | 1779 | 6590 | 59.9‱ | 63.3‱ | 267.1‱ |
| 虎码 | 532 | 238 | 2004 | 7687 | 6.0‱ | 37.5‱ | 317.5‱ |
| **字根双码** | | | | | | | **繁简通打** |
| 徐码 | 318 | 127 | 453 | 2902 | 10.7‱ | 21.8‱ | 25.1‱ |
| 宇浩 | 313 | 214 | 583 | 5015 | 5.5‱ | 15.6‱ | 17.7‱ |
Expand All @@ -224,26 +201,26 @@ nav_order: 1
{: .warning }
如果哪个输入法只谈自己的优点,不谈其他输入法的优点,或者说自己各方面完全胜过另一个输入法,那么一定是**虚假宣传**,值得警惕。这是因为,「低重码」、「规则简易」、「字根分布有规律」,是个不可能三角。一个输入法只能在一者做到突出,或者两项都不错,或者三项均衡,但不可能三者都做到很好。在宇浩输入法的开发中,我努力做到扬长避短,希望它的各项指标达到一种平衡,不要出现极端的弊病。

这里列出各维度上同其它四码定长输入法之间比较,排名越靠前越好。请注意,以下六个输入法中,没有任何一个输入法能在所有维度上都能超越另一个输入法。有任何一个维度排在第一,就有值得学习借鉴的地方。

| 维度 | 第一 | 第二 | 第三 | 第四 | 第五 | 第六 |
| ---------------------------------- | -------------------------- | -------- | ----------- | --------------------- | ------ | ------ |
| 简体静态重码数 | **宇浩** | 徐码 | 五笔98 | 虎码 | 五笔86 | 郑码 |
| 简体动态重码率 | **宇浩** | 虎码 | 徐码 | 五笔86 | 五笔98 | 郑码 |
| 繁体静态重码数 | 徐码 | **宇浩** | 虎码 | 郑码 | 五笔98 | 五笔86 |
| 繁体动态重码率 | **宇浩** | 徐码 | 虎码 | 郑码 | 五笔98 | 五笔86 |
| 简繁通打静态重码数 | 徐码 | **宇浩** | 五笔98 | 五笔86 | 郑码 | 虎码 |
| 简繁通打动态重码率 | **宇浩** | 徐码 | 五笔86 | 五笔98 | 郑码 | 虎码 |
| 大字集重码数量 | 徐码 | **宇浩** | 五笔98 | 五笔86 | 郑码 | 虎码 |
| 简体词库动态重码率 | 虎码 | **宇浩** | 徐码 | 五笔86 | 五笔98 | 郑码 |
| 字根形态完整性[^root_completeness] | 郑码~徐码~虎码~**宇浩** | | | | 五笔98 | 五笔86 |
| 字根在键盘上的聚合度 | 五笔~**宇浩** | | | 郑码 | 徐码 | 虎码 |
| 字根对不会拼音者友善 | 五笔~郑码 | | | 徐码~虎码~**宇浩** | | |
| 拆字规则优先级确定性 | 宇浩 | 徐码 | 郑码 | 虎码 | 五笔98 | 五笔86 |
| 编码规则简易度 | 虎码 | **宇浩** | 五笔 ~ 郑码 | | | 徐码 |
| 全简一致(简码、词语编码) | 五笔=徐码=虎码=**宇浩** | | | | | 郑码 |
| Z 键使用较少[^z_key] | 五笔~**宇浩** | | | 虎码 | 郑码 | 徐码 |
| 全码编码空间[^z_key] | 郑码=徐码=虎码(456976) | | | 五笔=**宇浩**(390625) | | |
这里列出各维度上同其它四码定长输入法之间比较,排名越靠前越好。请注意,以下五个输入法中,没有任何一个输入法能在所有维度上都能超越另一个输入法。有任何一个维度排在第一,就有值得学习借鉴的地方。

| 维度 | 第一 | 第二 | 第三 | 第四 | 第五 |
| ---------------------------------- | -------------------------- | -------- | ----------- | --------------------- | ------ |
| 简体静态重码数 | **宇浩** | 徐码 | 五笔98 | 五笔86 | 郑码 |
| 简体动态重码率 | **宇浩** | 徐码 | 五笔86 | 五笔98 | 郑码 |
| 繁体静态重码数 | 徐码 | **宇浩** | 郑码 | 五笔98 | 五笔86 |
| 繁体动态重码率 | **宇浩** | 徐码 | 郑码 | 五笔98 | 五笔86 |
| 简繁通打静态重码数 | 徐码 | **宇浩** | 五笔98 | 五笔86 | 郑码 |
| 简繁通打动态重码率 | **宇浩** | 徐码 | 五笔86 | 五笔98 | 郑码 |
| 大字集重码数量 | 徐码 | **宇浩** | 五笔98 | 五笔86 | 郑码 |
| 简体词库动态重码率 | **宇浩** | 徐码 | 五笔86 | 五笔98 | 郑码 |
| 字根形态完整性[^root_completeness] | 郑码~徐码~**宇浩** | | | | 五笔98 | 五笔86 |
| 字根在键盘上的聚合度 | 五笔~**宇浩** | | | 郑码 | 徐码 |
| 字根对不会拼音者友善 | 五笔~郑码 | | | 徐码~**宇浩** | | |
| 拆字规则优先级确定性 | 宇浩 | 徐码 | 郑码 | 五笔98 | 五笔86 |
| 编码规则简易度 | **宇浩** | 五笔 ~ 郑码 | | | 徐码 |
| 全简一致(简码、词语编码) | 五笔=徐码=**宇浩** | | | | | 郑码 |
| Z 键使用较少[^z_key] | 五笔~**宇浩** | | | 郑码 | 徐码 |
| 全码编码空间[^z_key] | 郑码=徐码(456976) | | | 五笔=**宇浩**(390625) | | |

{: .highlight }
[点击此处](./docs/articles/discussion)详细了解我对一款具有平衡性的输入法的一些思考和分析,以及宇浩输入法的设计理念和基本考量(陆标繁体书写)。
Expand Down

0 comments on commit 2ed9a97

Please sign in to comment.