Releases: joewongjc/type4me
Releases · joewongjc/type4me
v1.6.1: 流式识别韧性 + 代理绕过 + 词库优化
主要更新
流式识别韧性大幅增强
- 按停止键立即响应,不再被服务器阻塞(之前最长卡 60 秒)
- 不再重复粘贴文字
- 停止后等最终结果有硬性超时,不会无限卡住
- 最后几个字不再丢失
- 连接中途断开时自动用完整录音重新识别(batch fallback)
- 中断/失败的识别也保存到历史记录
新功能
- 新增「绕过系统代理」选项(关闭/仅 ASR/全部)
- Deepgram 热词自动截取前 30 个,设置页显示限制提示
- 词库管理界面优化:替换映射按组显示、热词和替换映射支持排序
- AssemblyAI 多语言模型支持
修复
- 自动更新不再对已签名 DMG 重复签名(修复 Gatekeeper「已损坏」错误)
- ASR 设置:新 provider 自动填充默认值
- 6 个 ASR 客户端发送计数修正,避免误判连接状态
下载
| 版本 | 说明 | 大小 |
|---|---|---|
| Type4Me-v1.6.1-cloud.dmg | 云端识别,需配置 API Key | ~24MB |
| Type4Me-v1.6.1-local.dmg | 内嵌 SenseVoice + Qwen3-ASR,开箱即用 | ~1.7GB |
已安装 v1.6.0 的用户可通过应用内更新(设置 → 关于 → 下载更新)升级。
v1.6.0: 应用内更新 + Apple Speech + 长录音修复
新功能
- 应用内更新:设置页 About 标签直接下载新版本并自动安装重启。Local 版用户更新时仅需下载 ~24MB 的 Cloud 包,本地模型自动保留
- Apple Speech 识别引擎:macOS 原生语音识别,无需 API Key,支持多语言
Bug 修复
- 长录音文字丢失:录音超过 40-70 秒后按快捷键停止,toggle 状态反转导致文字全部丢失。现在安全重定向到 stop,不再触发 forceReset
- 片段替换引擎移除冗余映射词条
改进
- 火山引擎模型选项简化命名("模型 2.0(推荐,更便宜)")
- ASR 服务启动时显示「启动中」状态提示
下载
| 版本 | 说明 | 大小 |
|---|---|---|
| Type4Me-v1.6.0-local.dmg | 内嵌 SenseVoice + Qwen3-ASR,开箱即用 | ~1.7GB |
| Type4Me-v1.6.0-cloud.dmg | 仅云端识别,需配置 API Key | ~24MB |
Local 版用户请注意: 从旧版本升级到 v1.6.0,请首次下载 Local DMG。安装后,后续版本可直接通过「设置 → 关于 → 下载更新」进行应用内更新(仅需下载 ~24MB),本地模型会自动保留。
v1.5.1: Bug 修复 + 稳定性改进
变更
- 修复片段替换 bug: 正则缺少 word boundary,导致链式替换产生多余字符(如 "Cloud Code" → "Claudee Code")
- 快捷键稳定性: 新增 event tap 健康检查,每 10 秒检测并自动恢复静默失效的全局快捷键
- 辅助功能权限: 5 次重试失败后弹窗提示重启 App,附一键重启按钮
- URL Scheme: 新增
type4me://reload-vocabulary,支持外部工具触发词表刷新 - 签名优化: 首次构建自动创建持久化自签名证书,避免每次重编译后辅助功能权限失效
- 构建改进: 自动移除 quarantine flag,防止 Accessibility 权限静默失效
下载
| 版本 | 说明 | 大小 |
|---|---|---|
| Type4Me-v1.5.1-local.dmg | 内嵌 SenseVoice + Qwen3-ASR,开箱即用 | ~1.7GB |
| Type4Me-v1.5.1-cloud.dmg | 仅云端识别,需配置 API Key | ~23MB |
Full Changelog: v1.5.0...v1.5.1
v1.5.0: Dual-ASR 双模型精校
Dual-ASR 架构
全新双模型并行识别,大幅提升转写准确率:
- SenseVoice 流式实时出字
- Qwen3-ASR 停顿时增量投机转录,松手后全量精校
- 设置页独立启停两个模型
下载
| 版本 | 说明 | 大小 |
|---|---|---|
| local | 内嵌 SenseVoice + Qwen3-ASR 本地识别,开箱即用 | 1.2GB |
| cloud | 纯云端识别,需配置 API Key | 23MB |
LLM 润色功能可接入 Ollama (本地) 或任意云端 LLM API,无需内嵌。
其他改进
- 热词/片段存储迁移到 JSON 文件,支持内置词表 + 用户自定义
- 词汇表 UI 全新设计:内置词数统计、Finder 一键编辑、刷新按钮
- 进程泄漏修复(PID 文件管理)、退出清理、配置持久化等多项 bug 修复
v1.4.0: 本地语音识别 (SenseVoice)
v1.4.0
新增: 本地语音识别 (SenseVoice)
- 支持完全离线的语音识别,无需网络和 API Key
- 基于阿里 SenseVoice 开源模型,支持中文、英文混合识别
- 两阶段识别: 说话时实时显示文字,松手后自动校正提高准确率
- 自动标点符号和数字格式化
- 支持热词加权 (中文词和英文单词)
新增: Dock 图标
- 默认显示 Dock 图标,可在设置中关闭
优化
- 文本注入改为剪贴板方式,修复部分应用中光标跳位问题
- 剪贴板保留: 注入后自动恢复原有剪贴板内容
下载
提供两个版本:
| 版本 | 说明 | 大小 |
|---|---|---|
| Type4Me-v1.4.0-local.dmg | 内嵌本地识别模型,开箱即用 | ~1.1GB |
| Type4Me-v1.4.0-cloud.dmg | 仅云端识别,需配置 API Key | ~23MB |
两个版本功能完全相同,共享配置文件,可随时替换安装。
致谢
- SenseVoice - Alibaba FunAudioLLM
- streaming-sensevoice - @pengzhendong
- asr-decoder - @pengzhendong
v1.3.7
v1.3.7 — 保留剪贴板 + Dock 图标
✨ 新功能
- 新增「保留剪贴板」设置(偏好设置 → 通用 → 第二行)(#57)
- 开启:使用键盘模拟输入,完全不碰剪贴板
- 关闭(默认):注入成功后自动恢复原始剪贴板,失败时保留识别文本作为 fallback
- 启动时显示 Dock 图标,关闭所有窗口后自动隐藏到菜单栏
🔧 改进
- 注入成功检测:非编辑角色从 4 个扩展到 27 个,减少误判
- 区分"无聚焦元素"(桌面)和"Electron nil role"(编辑区),避免桌面语音输入时文本丢失
- 剪贴板深拷贝支持所有类型(图片、文件、富文本),不只是纯文本
🐛 Bug 修复
- 修复剪贴板恢复时 changeCount 校验错误导致恢复静默失败
v1.3.6
What's Changed
- 更新默认书面结构化 Prompt,新增 Few-shot 示例,口语整理效果更自然 (contributed by @jimmyzhuu)
- 更新默认英文翻译 Prompt,优先翻译用户意图而非逐字直译 (contributed by @jimmyzhuu)
- 旧版默认 Prompt 自动迁移到新版,自定义 Prompt 不受影响
v1.3.5
v1.3.4
v1.3.3
What's New
- 新增 Soniox 流式识别引擎 - WebSocket 实时识别,支持热词,push-to-talk 优化 (contributed by @zebangeth)
- ESC 取消粘贴 - 按 ESC 跳过文字注入,内容仍存入剪贴板和识别历史 (contributed by @ShaneLevs)
- 键盘音效 - 新增键盘敲击风格的录音提示音 (contributed by @ShaneLevs)
- LLM 错误优雅降级 - LLM 处理失败时回退到原始识别文本,浮窗提示错误而非丢弃内容 (contributed by @rickyyyxu)
- OpenAI 引擎标签修正 - "OpenAI Whisper" 改为 "OpenAI",匹配 gpt-4o-transcribe 等新模型 (contributed by @zebangeth)
- 界面截图 - README 新增设置界面预览图
Download
下载 DMG 后拖入 Applications 即可使用。需要 macOS 14+。