Skip to content

Commit

Permalink
Add statistics on simp 1 chars
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed Jun 3, 2023
1 parent 8655600 commit e3e2bdc
Show file tree
Hide file tree
Showing 10 changed files with 162 additions and 66 deletions.
142 changes: 117 additions & 25 deletions docs/articles/statistics.md

Large diffs are not rendered by default.

2 changes: 1 addition & 1 deletion docs/cookbook.md
Original file line number Diff line number Diff line change
Expand Up @@ -67,7 +67,7 @@ nav_order: 11

字根分布图和字根口诀如下:

[![宇浩输入法宋体字根图v2.0.0](../../image/宇浩输入法宋体字根图v2.0.0.png)](../../image/宇浩输入法宋体字根图v2.0.0.png)
[![宇浩输入法宋体字根图v2.0.0](../../image/宇浩输入法宋体字根图v2.png)](../../image/宇浩输入法宋体字根图v2.png)

## 单字编码

Expand Down
4 changes: 2 additions & 2 deletions docs/install.md
Original file line number Diff line number Diff line change
Expand Up @@ -18,8 +18,8 @@ nav_order: 2
</details>

{: .highlight }
>[稳定版v1.4.3下载](https://github.com/forFudan/yuhao/releases/tag/v1.4.3)
>[内测版v2.0.0-beta下载](https://github.com/forFudan/yuhao/releases/tag/v2.0.0-beta)
>[v1.4.3下载](https://github.com/forFudan/yuhao/releases/tag/v1.4.3)
>[v2.0.0-beta下载](https://github.com/forFudan/yuhao/releases/tag/v2.0.0-beta)
## QQ 群资源

Expand Down
2 changes: 1 addition & 1 deletion docs/learn.md
Original file line number Diff line number Diff line change
Expand Up @@ -146,7 +146,7 @@ nav_order: 12
字根图是查询字根的重要工具,初学者应当时常将它放在手边,以利用查询。以下为宇浩输入法全部字根的键位图。繁体特有字根22个,都排在简体字根后。

[![宇浩输入法宋体字根图](../image/宇浩输入法宋体字根图v2.0.0.png)](../image/宇浩输入法宋体字根图v2.0.0.png)
[![宇浩输入法宋体字根图](../image/宇浩输入法宋体字根图v2.png)](../image/宇浩输入法宋体字根图v2.png)

### 字根大码的规律
<!-- {: .no_toc } -->
Expand Down
2 changes: 1 addition & 1 deletion docs/v1/cookbook.md
Original file line number Diff line number Diff line change
Expand Up @@ -61,7 +61,7 @@ parent: 宇浩一代

字根分布图和字根口诀如下:

[![宇浩输入法宋体字根图](../../image/宇浩输入法宋体字根图.png)](../../image/宇浩输入法宋体字根图.png)
[![宇浩输入法宋体字根图](../../image/宇浩输入法宋体字根图v1.png)](../../image/宇浩输入法宋体字根图v1.png)

## 单字编码

Expand Down
2 changes: 1 addition & 1 deletion docs/v1/install.md
Original file line number Diff line number Diff line change
Expand Up @@ -114,7 +114,7 @@ parent: 宇浩一代

用户还可通过「Shift+Ctrl+C」切换拆分状态。

(注:内测版 v2.0.0-alpha 提供四重注解,额外提示拼音。)
(注:v2.0.0 提供四重注解,额外提示拼音。)

<!-- omit in toc -->
### 自定义常用字符集
Expand Down
4 changes: 2 additions & 2 deletions docs/v1/learn.md
Original file line number Diff line number Diff line change
Expand Up @@ -150,7 +150,7 @@ parent: 宇浩一代

字根分布图和字根口诀如下:

[![宇浩输入法宋体字根图](../../image/宇浩输入法宋体字根图.png)](../../image/宇浩输入法宋体字根图.png)
[![宇浩输入法宋体字根图](../../image/宇浩输入法宋体字根图v1.png)](../../image/宇浩输入法宋体字根图v1.png)

字根口诀:

Expand Down Expand Up @@ -234,7 +234,7 @@ parent: 宇浩一代
字根图是查询字根的重要工具,初学者应当时常将它放在手边,以利用查询。以下为宇浩输入法全部字根的键位图。繁体特有字根22个,都排在简体字根后。

![宇浩输入法宋体字根图](../../image/宇浩输入法宋体字根图.png)
![宇浩输入法宋体字根图](../../image/宇浩输入法宋体字根图v1.png)

## 拆字规则

Expand Down
2 changes: 1 addition & 1 deletion docs/v2/v2.md
Original file line number Diff line number Diff line change
Expand Up @@ -196,7 +196,7 @@ RIME 平臺加入「功能開關一鍵配置」文件,方便用户切換設置

## 字根圖

[![宇浩输入法宋体字根图测试版](../../image/宇浩输入法宋体字根图v2.0.0.png)](../../image/宇浩输入法宋体字根图v2.0.0.png)
[![宇浩输入法宋体字根图测试版](../../image/宇浩输入法宋体字根图v2.png)](../../image/宇浩输入法宋体字根图v2.png)

## 字根表

Expand Down
Binary file modified image/宇浩输入法宋体字根图v2.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
68 changes: 36 additions & 32 deletions index.md
Original file line number Diff line number Diff line change
Expand Up @@ -21,14 +21,14 @@ nav_order: 1
>点击加入官方 QQ 群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk) ·
>点击加入官方 Telegram 群: [yuhaoim](https://t.me/yuhaoim)
>[正(繁)體字版官方網站](https://zhuyuhao.com/yuhaoim)
>[宇浩二代v2.0.0-beta公测版下载(四重注解+台湾字形支持)](https://github.com/forFudan/yuhao/releases/tag/v2.0.0-beta)
>[宇浩二代v2.0.0-beta下载(四重注解+台湾字形支持)](https://github.com/forFudan/yuhao/releases/tag/v2.0.0-beta)
>[宇浩一代v1.4.3下载](https://github.com/forFudan/yuhao/releases/tag/v1.4.3) ·
>[宇浩一代全部资料和教程](./docs/v1/v1)
>[快速入门](./docs/cookbook) ·
>[详细教程](./docs/learn) ·
>[在线练习](./docs/practice) ·
>[更新日志](./docs/updates/updates) ·
>[二代拆分查询(台湾字形支持)](./v2/chaifen/)
>[拆分查询(台湾字形支持)](./v2/chaifen/)
## 简介

Expand All @@ -51,7 +51,7 @@ nav_order: 1

[点击这里,使用字根练习小程序,直接学习最常用的100个字根。](./v2/practice/practice_100.html)两个小时后,你就可以开始上手打字了。

[![宇浩输入法宋体字根图](./image/宇浩输入法宋体字根图.png)](./image/宇浩输入法宋体字根图.png)
[![宇浩输入法宋体字根图](./image/宇浩输入法宋体字根图v2.png)](./image/宇浩输入法宋体字根图v2.png)

## 特点

Expand Down Expand Up @@ -96,32 +96,38 @@ nav_order: 1
{: .highlight }
[点击此处](./docs/articles/discussion)详细了解我对一款具有平衡性的输入法的一些思考和分析,以及宇浩输入法的设计理念和基本考量(陆标繁体书写)。

## 常见输入法古今名著选重频率

以下为单字全码情况下,部分著名文学作品的选重频率统计(单位为每万字选重次数)。表格按输入法的性质排列:

| 方案 | 毛泽东选集(简) | 天龙八部(简) | 三体三部曲(简) | 战争与和平(简) | 史記(繁) | 昭明文選(繁) | 紅樓夢(繁) | 論語集解(繁簡混排) |
| :------------ | -------------: | -----------: | -------------: | -------------: | -------: | -----------: | ---------: | -----------------: |
| **四码定长** | | | | | | | | |
| 五笔86 | 25.8‱ | 30.6‱ | 25.7‱ | 20.9‱ | 88.4‱ | 105.9‱ | 28.9‱ | 260.8‱ |
| 五笔98 | 31.9‱ | 32.7‱ | 34.5‱ | 33.9‱ | 71.3‱ | 95.3‱ | 33.9‱ | 270.6‱ |
| 五笔06·新世纪 | 22.2‱ | 25.5‱ | 24.3‱ | 37.1‱ | 79.7‱ | 93.5‱ | 35.3‱ | 252.5‱ |
| 张码 | 198.3‱ | 149.0‱ | 143.8‱ | 134.3‱ | 83.6‱ | 95.5‱ | 90.1‱ | 194.9‱ |
| 蓝宝石 | 18.4‱ | 20.5‱ | 24.9‱ | 18.1‱ | 43.8‱ | 84.7‱ | 25.3‱ | 20.5‱ |
| 郑码 | 44.2‱ | 51.6‱ | 49.2‱ | 48.1‱ | 89.9‱ | 107.6‱ | 39.2‱ | 266.7‱ |
| 真码 | 5.3‱ | 14.0‱ | 5.6‱ | 6.9‱ | 45.3‱ | 74.2‱ | 16.6‱ | 298.4‱ |
| 徐码13 | 3.5‱ | 9.6‱ | 7.0‱ | 7.2‱ | 20.4‱ | 32.6‱ | 10.0‱ | 12.2‱ |
| 徐码23 | 3.3‱ | 9.8‱ | 7.0‱ | 7.8‱ | 22.1‱ | 34.5‱ | 10.9‱ | 10.3‱ |
| 宇浩v1.4.3 | 1.3‱ | 3.1‱ | 2.0‱ | 2.8‱ | 31.1‱ | 43.8‱ | 10.5‱ | 7.3‱ |
| 宇浩v2.0.0 | 1.3‱ | 3.1‱ | 3.1‱ | 2.7‱ | 31.1‱ | 44.4‱ | 9.8‱ | 4.4‱ |
| **五码定长** |
| 倉頡五代 | 74.0‱ | 71.1‱ | 80.2‱ | 60.0‱ | 74.6‱ | 73.7‱ | 33.0‱ | 67.4‱ |
| **不定长** |
| 山人全息 | 2.4‱ | 6.8‱ | 5.6‱ | 6.1‱ | 20.8‱ | 18.1‱ | 6.3‱ | 281.3‱ |
| **三码定长** | | | | | | | | **出简不出全** |
| 三码郑码 | 9.7‱ | 47.3‱ | 26.4‱ | 29.5‱ | - | - | - | - |
| **音形方案** | | | | | | | | **简体方案** |
| 小鹤音形 | 81.7‱ | 84.2‱ | 74.2‱ | 69.6‱ | - | - | - | - |
## 常见输入法的世界名著选重率

这里给出部分名著的选重频率统计。四本简体、三本繁体、一本繁简混排。单位为每万字选重次数。单列数据最低值加粗表示。

以下为一级简码出简不出全的结果,换句话说,如果一个字存在一级简码,则默认只打简码,并将其全码删除。

| 方案 | 毛泽东选集(简) | 天龙八部(简) | 三体(简) | 战争与和平(简) | 史記(繁) | 昭明文選(繁) | 紅樓夢(繁) | 論語集解(繁簡混排) |
| :------------ | -------------: | -----------: | -------: | -------------: | --------: | -----------: | ---------: |
| 五笔86 | 25.8‱ | 30.6‱ | 25.7‱ | 20.9‱ | 88.4‱ | 105.9‱ | 28.9‱ | 260.8‱ |
| 五笔98 | 316.1‱ | 414.0‱ | 273.7‱ | 257.7‱ | 259.0‱ | 269.2‱ | 294.1‱ | 389.3‱ |
| 五笔06·新世纪 | 306.3‱ | 396.4‱ | 262.1‱ | 253.7‱ | 255.4‱ | 264.9‱ | 290.3‱ | 367.3‱ |
| 张码 | 520.2‱ | 296.1‱ | 277.6‱ | 229.8‱ | 382.6‱ | 260.8‱ | 231.4‱ | 314.5‱ |
| 蓝宝石 | 18.1‱ | 13.8‱ | 24.6‱ | 17.5‱ | 42.3‱ | 84.2‱ | 24.6‱ | 20.5‱ |
| 郑码 | 39.5‱ | 41.5‱ | 45.8‱ | 43.1‱ | 90.2‱ | 107.8‱ | 39.3‱ | 263.3‱ |
| 真码 | **1.1‱** | **3.0‱** | 2.1‱ | **2.1‱** | 44.9‱ | 74.1‱ | 14.2‱ | 290.1‱ |
| 徐码13 | 3.5‱ | 9.6‱ | 7.0‱ | 7.2‱ | **19.9‱** | **30.3‱** | 9.9‱ | 11.7‱ |
| 徐码23 | 3.3‱ | 9.8‱ | 7.0‱ | 7.8‱ | 22.1‱ | 32.9‱ | 10.7‱ | 9.8‱ |
| 宇浩v1.4.3 | 1.3‱ | 3.1‱ | **2.0‱** | 2.8‱ | 31.1‱ | 43.8‱ | 10.5‱ | 7.3‱ |
| 宇浩v2.0.0 | 1.3‱ | 3.1‱ | 3.1‱ | 2.7‱ | 31.1‱ | 44.4‱ | **9.8‱** | **4.4‱** |

以下为二级简码出简不出全的结果,换句话说,如果一个字存在一级和二级简码,则默认只打简码,并将其全码后置。部分方案设置了二级简码字,数据无法准确计算,故而略去。注意,真码只设置一级简码,不设置二级简码。

| 方案 | 毛泽东选集(简) | 天龙八部(简) | 三体(简) | 战争与和平(简) | 史記(繁) | 昭明文選(繁) | 紅樓夢(繁) | 論語集解(繁簡混排) |
| :--------- | -------------: | -----------: | -------: | -------------: | --------: | -----------: | ---------: |
| 五笔86 | 5.7‱ | 15.6‱ | 12.1‱ | 9.0‱ | 75.0‱ | 93.8‱ | 24.1‱ | 192.0‱ |
| 蓝宝石 | 3.8‱ | 5.6‱ | **1.7‱** | 2.2‱ | 35.3‱ | 73.3‱ | 20.4‱ | 9.8‱ |
| 郑码 | 13.1‱ | 15.7‱ | 11.7‱ | 14.7‱ | 73.0‱ | 81.3‱ | 22.2‱ | 213.4‱ |
| 真码 | 1.1‱ | 3.0‱ | 2.1‱ | 2.1‱ | 44.9‱ | 74.1‱ | 14.2‱ | 290.1‱ |
| 徐码23 | 3.2‱ | 7.9‱ | 5.8‱ | 7.3‱ | **23.6‱** | 40.6‱ | 10.2‱ | 12.7‱ |
| 宇浩v2.0.0 | **1.0‱** | **1.6‱** | 2.5‱ | **1.9‱** | 24.6‱ | **37.9‱** | **8.1‱** | **3.9‱** |

更多统计数据可参见文章[《常见输入法重码数据》](./docs/articles/statistics)

## 优化算法所使用的指标

Expand All @@ -146,9 +152,7 @@ nav_order: 1
1. 在部分指标计算软件中,双手互击只包括了单字,例如,「我今天去那里」被分割成 qagg tobu fgdi hvvt vacj ksij,出现了9次同手击键,9次双手互击,故而互击率为 50%。这种算法无法完全反应实际打字时的双手互击情况。
2. 在部分指标计算软件中,词语选重率只包括了多字词,不能成词的单字词被移除,例如,「我今天去那里」被分割成「今天 那里」,一共有 2 个词语。倘若「我」和「那里」生了重码,则选重率为 0 / 2 = 0%。这不能完全反应实际打字时的选重频率。

## 衍生作品

### 宇浩三码顶
## 衍生作品 宇浩三码顶

宇浩三码顶是一个宇浩输入法的衍生方案,基于宇浩的字根布局和拆分数据,引入三码顶字的输入方式。由于其不改变原宇浩的布局和拆分,可以实现和宇浩标准版间的无缝切换。

Expand Down

0 comments on commit e3e2bdc

Please sign in to comment.