简介:这篇是我在 Windows 笔记本(无独显、只用 CPU)上折腾本地语音输入的配置记录:主力用 LazyTyper + SenseVoice Small,同时把几个我觉得值得试的备选方案也放一起方便对照。
✅ 背景与需求
- 硬件环境:Windows 笔记本,无独立显卡,只能 CPU 推理。
- 语言场景:中英文混合输入为主,偶尔纯英文。
- 核心诉求:必须本地离线(隐私 + 无网络延迟),并且尽量免费。
🧩 当前主力方案:LazyTyper + SenseVoice Small
我目前用下来,在“无显卡 + 中英混合”这个场景里,这套组合最省心。
1) 客户端:LazyTyper
- 定位:本地语音输入的 GUI 封装工具。
- 优点:免费、开箱即用;界面直观;支持一键下载/切换本地模型;资源占用相对克制。
- 获取:LazyTyper 官网 | GitHub Releases
2) 模型:SenseVoice Small
- 发布方:FunAudioLLM(阿里巴巴通义实验室)。
- 体积:Int8 量化后约 894 MB。
- 我选它的原因:
- 中英混合识别强:对中英夹杂(“Chinglish”)的识别很稳,我的体验是明显优于 OpenAI Whisper。
- CPU 也够快:非自回归架构,延迟很低;在无独显笔记本上也能做到很快的响应。
- 项目地址:GitHub - FunAudioLLM/SenseVoice
🧰 备选方案(都是开源免费)
如果你想更极客、更极致性能、或者需要长音频转写,可以从下面三个里挑:
A) 轻量/极客:CapsWriter-Offline
- 适用场景:极低内存占用;或偏好“按下 CapsLock 说话”的交互。
- 特点:
- 完全开源、无广告,隐私风险低。
- 同样支持 SenseVoice / Paraformer,并针对 CPU 做了极致优化。
- 无 GUI 干扰,后台静默运行。
- 项目地址:GitHub - HaujetZhao/CapsWriter-Offline
B) Whisper 极致速度:WhisperDesktop(Const-me)
- 适用场景:追求纯英文识别的速度;或者在老硬件上跑 Whisper。
- 特点:
- C++ 实现,主要走 DirectX 做 GPU 加速,但也能 CPU 跑。
- 是我见过的 Windows 上跑 OpenAI Whisper 速度非常快的实现之一。
- Win32 风格界面,但胜在稳定。
- 局限:只支持 Whisper;中英混合能力一般不如 SenseVoice。
- 项目地址:GitHub - Const-me/Whisper
C) 跨平台/长音频:Buzz
- 适用场景:会议录音转写、视频字幕(SRT)。
- 特点:
- 基于 OpenAI Whisper,英文识别率高。
- 支持导入音频/视频文件离线处理。
- 项目地址:GitHub - chidiwilliams/buzz
D) 另一个我准备试试的:闪电说
这个是我在 X 上看到有人推荐的(我自己还没深度用过),先放在备选里占个位。
✅ 总结
现在对我来说,LazyTyper + SenseVoice Small 是“易用性”和“性能”之间最平衡的一套本地语音输入方案。
- 想要更轻量、更开源、更偏快捷键流:试 CapsWriter-Offline。
- 纯英文优先、想把 Whisper 跑到更快:试 WhisperDesktop。