Skip to content

Commit

Permalink
Update the website
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed Dec 18, 2023
1 parent 27889a7 commit 9f39fb1
Show file tree
Hide file tree
Showing 12 changed files with 104,496 additions and 104,461 deletions.
2 changes: 1 addition & 1 deletion beta/schema/yuhao.schema.yaml
Original file line number Diff line number Diff line change
Expand Up @@ -3,7 +3,7 @@

schema:
schema_id: yuhao
name: 宇浩·光華·大陆简体
name: 光華·陆简
version: 20230522
author:
- 發明人 朱宇浩
Expand Down
2 changes: 1 addition & 1 deletion beta/schema/yuhao_tc.schema.yaml
Original file line number Diff line number Diff line change
Expand Up @@ -3,7 +3,7 @@

schema:
schema_id: yuhao_tc
name: 宇浩·光華·大陸繁體
name: 光華·陸繁
version: 20230522
author:
- 發明人 朱宇浩
Expand Down
2 changes: 1 addition & 1 deletion beta/schema/yuhao_tw.schema.yaml
Original file line number Diff line number Diff line change
Expand Up @@ -3,7 +3,7 @@

schema:
schema_id: yuhao_tw
name: 宇浩·光華·臺灣正體
name: 光華·臺正
version: 20230522
author:
- 發明人 朱宇浩
Expand Down
4 changes: 2 additions & 2 deletions docs/cookbook.md
Original file line number Diff line number Diff line change
@@ -1,8 +1,8 @@
---
<!-- ---
title: 快速入门
layout: default
nav_order: 11
---
--- -->

<!-- omit in toc -->
# 十分钟入门宇浩输入法
Expand Down
46 changes: 21 additions & 25 deletions docs/learn.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,9 @@
title: 详细教程
layout: default
nav_order: 12
mainfont: "Songti SC"
CJKmainfont: "Songti SC"
language: zh
---

<!-- omit in toc -->
Expand Down Expand Up @@ -142,18 +145,16 @@ nav_order: 12
>- 「言」这个字根,在字母`U`的方框里,同时,右下角的字母是`a`,因此,它的编码就是`Ua`
>- 「其」这个字根,在字母`D`的方框里,同时,右下角的字母是`j`,因此,它的编码就是`Dj`
字根图是查询字根的重要工具,初学者应当时常将它放在手边,以利用查询。以下为宇浩输入法全部字根的键位图。
字根图是查询字根的重要工具,初学者应当时常将它放在手边,以利用查询。

繁体特有的字根只有22个,主要是位于左侧的偏旁部首。不打繁体的话,可以不用记忆。

[![宇浩输入法宋体字根图](../image/yulight.png)](../image/yulight.png)

[![yustar](./image/yustar.png)](./image/yustar.png)

### 光华方案字根编码规律
<!-- {: .no_toc } -->

#### 字根大码‘
[![宇浩输入法宋体字根图](../image/yulight.png)](../image/yulight.png)

#### 字根大码
{: .no_toc }

光华方案中,字根大码是按照字根第一笔的笔画来制定的。同五笔一样,字根按照笔画分区。
Expand Down Expand Up @@ -220,6 +221,8 @@ nav_order: 12
### 星陳方案字根编码规律
<!-- {: .no_toc } -->

[![yustar](../image/yustar.png)](../image/yustar.png)

#### 字根大码
{: .no_toc }

Expand Down Expand Up @@ -260,28 +263,20 @@ nav_order: 12
#### 字根小码
{: .no_toc }

星陈方案使用强音托,字根小码 85% 以上情况下都是汉语拼音的第一个字母。故而大部分的字根小码不用特别记忆,可以猜出来。
星陈方案使用强音托,字根小码 85% 以上情况下都是汉语拼音的第一个字母(yi 取 y,yu 取 v)。故而大部分的字根小码不用特别记忆,可以猜出来。

由于很多字根拼音只有两个字母,首字母容易被占用,故而 15% 情况下会选取其后续字母(主元音)作为音托。只要特别记住以下字根即可:

| 小码 | 字根 |
| :---- | :----------------- |
| a | 三八 |
| o | 又尤由舟鬥(ou) 艹 |
| e | 人臣文了业 |
| i ㄧ | 一乂弋己七 心 臼 |
| i | 矢世十(shi) 止自 |
| u ||
| v ㄣ | 鱼魚 |
| r ㄦ | 二儿 |

以下字根虽然没有使用声母音托,但大小码刚好等于其拼音:

乙麻冊

最后,以下字根的声母让给了使用频率较低的字根,所以它们的小码是 v:

上小已口
| 小码 | 字根 | 解释 |
| :---- | :----------- | :--------------- |
| a | 三八麻 | |
| o | 又尤由舟 艹 | |
| e | 人文了业冊 | |
| i ㄧ | 七 心 臼 | |
| i | 矢世十 止自 | |
| u | 不夂(pū)鬥 | |
| r ㄦ | 二儿而 | |
| v | 上小口 | 让出声母给低频根 |

## 拆字规则

Expand Down Expand Up @@ -872,6 +867,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 横间不穿心
{: .no_toc }

为了使拆分更加直观,符合笔顺,防止字根交叉粘连,我们规定:

Expand Down
41 changes: 34 additions & 7 deletions docs/updates.md
Original file line number Diff line number Diff line change
Expand Up @@ -19,6 +19,33 @@ nav_order: 88

## Version 3

### 2023年12月27日

十一月十五日望,升級維護,版本号 v3.4.0。

一、增加香港字形兼容拆分。只在全碼碼表兼容區中出現,不另設其他簡碼方案。

二、優化詞庫排序,增删詞語。

三、爲星陳「繁簡平衡」增加一些簡碼和詞語。

四、星陳方案調整部分字根,目的是减少 p 鍵的頻率,增強音托:

- 阝Pf -> Yf
- 寸 Hc -> Kc
- 予 Ky -> Kv,取 ǖ 音
- 亦 Ty -> Ti,取 yì 音
- 牙 Hy -> Ha,取 yá 音
- 禺 Vy -> Vv,取 ǖ 音,現在所有 yū 小碼都取 v
- 雨 Cy -> Cv,取 ǖ 音,現在所有 yǘ 小碼都取 v
- 臣 He -> Hc,取 chén 聲
- 己 Oi -> Oj,取 jǐ 聲
- 已 Ov -> Oi,取 yǐ 音
- 夂 Tp -> Tu,取 pū 韻
- 宀 Ib -> Im,取 mǐan 聲
- 黽 Gm -> Dm,同相似的「电」字根放在一起,取 mǐan 聲
- 𡗗 Op -> Od,取 dí 聲

### 2023年11月27日

農曆十月十五望,v3.3.0 正式版發佈。
Expand Down Expand Up @@ -517,10 +544,10 @@ RIME 平臺加入「功能開關一鍵配置」文件,方便用户切換設置

以下爲重碼數據對比:

| 形碼方案 | GB2312 | 通規一二級 | 國字常用 | 常用繁簡 | GBK | 簡體選重率 | 繁體選重率 | 繁簡混合文本選重率 | 簡體詞語选重率 |
| :-------------- | -----: | ---------: | -------: | -------: | ---: | :--------- | :--------- | :----------------- | :------------- |
| 形碼方案 | GB2312 | 通規一二級 | 國字常用 | 常用繁簡 | GBK | 簡體選重率 | 繁體選重率 | 繁簡混合文本選重率 | 簡體詞語选重率 |
| :--------- | -----: | ---------: | -------: | -------: | ---: | :--------- | :--------- | :----------------- | :------------- |
| 宇浩v2.0.0 | 314 | 265 | 208 | 583 | 5171 | 5.2‱ | 15.3‱ | 17.1‱ | 116.1‱ |
| 宇浩v2.0.0 | 318 | 273 | 202 | 584 | 5178 | 4.9‱ | 15.1‱ | 16.6‱ | 109.7‱ |
| 宇浩v2.0.0 | 318 | 273 | 202 | 584 | 5178 | 4.9‱ | 15.1‱ | 16.6‱ | 109.7‱ |

以下是對於部分意見的反饋:

Expand Down Expand Up @@ -1105,10 +1132,10 @@ RIME 增加拼音註解。現總共爲四重註解。

以下为本次更新前后重碼的数据比较:

| 方案 | GB2312 | 通规一二级 | 国字常用 | 常用繁简 | GBK | 简体选重率 | 繁体选重率 | 繁简混合文本选重率 |
|:--------------|---------:|-------------:|-----------:|-----------:|------:|:-------------|:-------------|:---------------------|
| 更新前 | 303 | 263 | 216 | 573 | 4964 | 0.05% | 0.17% | 0.19% |
| 更新后 | 304 | 262 | 206 | 565 | 4933 | 0.05% | 0.15% | 0.17% |
| 方案 | GB2312 | 通规一二级 | 国字常用 | 常用繁简 | GBK | 简体选重率 | 繁体选重率 | 繁简混合文本选重率 |
| :----- | -----: | ---------: | -------: | -------: | ---: | :--------- | :--------- | :----------------- |
| 更新前 | 303 | 263 | 216 | 573 | 4964 | 0.05% | 0.17% | 0.19% |
| 更新后 | 304 | 262 | 206 | 565 | 4933 | 0.05% | 0.15% | 0.17% |

重绘字根键位图,使字根不从中间换行。

Expand Down
Binary file modified image/yustar.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
6 changes: 3 additions & 3 deletions index.md
Original file line number Diff line number Diff line change
Expand Up @@ -22,8 +22,8 @@ nav_order: 1
>官方 TG 群: [yuhaoim](https://t.me/yuhaoim)
>[最新版本下载(Github)](https://github.com/forFudan/yuhao/releases/) ·
>[备用下载地址(Gitee)](https://gitee.com/forFudan/yuhao/releases/)
>[快速入门](./docs/cookbook) ·
>[详细教程](./docs/learn)
<!-- >[快速入门](./docs/cookbook) · -->
>[《宇浩输入法详细教程和规则细节》](./docs/learn)
>练习程序:
>[**光華**(exe)](https://github.com/forFudan/yuhao/releases/download/v3.1.0/yuhao_light_practice_tool.exe) ·
>[**星陳**(exe)](https://github.com/forFudan/yuhao/releases/download/v3.1.0/yuhao_star_practice_tool.exe) ·
Expand Down Expand Up @@ -390,7 +390,7 @@ nav_order: 1
- 最小化简体文本、繁体文本、混合文本下的[全码动态选重率](./docs/articles/statistics#单字重码计算公式)。优点:实现真正意义上的繁简通打。用户使用本方案就可以自由切换繁简输入,不用选重。缺点:影响了极限简体/繁体文本各自的动态选重率,不过本输入方案的简体/繁体动态选重率已经是**市面上最低**的,所以这个缺点可以忽略。
- 最小化 GB2312、国字常用字的静态重码数量。这是因为动态选重率高度依赖文本的状态,而静态重码数量在非典范白话文的情况下更具有代表性。
- 最小化 GBK 的静态重码数量和翻页次数。这是为了不丢失检字的性能。本输入法 CJK 全汉字单编码最高重码字数为18个,也就是说,即使是生僻字,最多翻页一次即可找到。
- 最小化简体文本下的[完美词语选重率](./docs/articles/statistics#词语重码计算公式),使用了当代汉语词频表。例如,「我今天去那里」被分割成「我·今天·去·那里」,一共有 4 个词语。倘若「我」和「那里」生了重码,则选重率为 1 / 4 = 25%。优点:考虑该指标,可以优化用户打词时的选重体验。缺点:本指标的成立条件,只有当用户的分词习惯和词频表一致才有效。大多时候,用户会将词语拆成单字输入,避免词语不存在时的回删。因此,真实的文本选重率,介于单字动态选重率和完美词语选重率之间。另外,当样本空间改变时,比如输入非典范白话文的情况下,本指标参考价值也会降低。
- 最小化简体文本下的[完美词语选重率](./docs/articles/statistics#词语重码计算公式),使用了当代汉语词频表。例如,「我今天去那里」被分割成「我·今天·去·那里」,一共有 4 个词语。倘若「我」和「那里」发生了重码,则选重率为 1 / 4 = 25%。优点:考虑该指标,可以优化用户打词时的选重体验。缺点:本指标的成立条件,只有当用户的分词习惯和词频表一致才有效。大多时候,用户会将词语拆成单字输入,避免词语不存在时的回删。因此,真实的文本选重率,介于单字动态选重率和完美词语选重率之间。另外,当样本空间改变时,比如输入非典范白话文的情况下,本指标参考价值也会降低。
- 最小化速度当量([陈一凡, 张鹿, 周志农, 1990,《键位相关速度当量的研究》,《中文信息学报 Vol.4》](http://jcip.cipsc.org.cn/CN/Y1990/V4/I4/14))。速度当量是关于「手感」的最宏观、量化的指标,是由大量实验得出的结果,具有很高的参考价值。这个指标越小,表明输入的速度越快。宇浩输入法在优化过程中,最小化字频加权速度当量。

{: .note }
Expand Down
Loading

0 comments on commit 9f39fb1

Please sign in to comment.