Windows 本地语音输入方案配置记录 (2026.02)

简介：这篇是我在 Windows 笔记本（无独显、只用 CPU）上折腾本地语音输入的配置记录：主力用 LazyTyper + SenseVoice Small，同时把几个我觉得值得试的备选方案也放一起方便对照。

✅ 背景与需求

我目前用下来，在“无显卡 + 中英混合”这个场景里，这套组合最省心。

发布方：FunAudioLLM（阿里巴巴通义实验室）。
体积：Int8 量化后约 894 MB。
我选它的原因：
- 中英混合识别强：对中英夹杂（“Chinglish”）的识别很稳，我的体验是明显优于 OpenAI Whisper。
- CPU 也够快：非自回归架构，延迟很低；在无独显笔记本上也能做到很快的响应。
项目地址：GitHub - FunAudioLLM/SenseVoice

如果你想更极客、更极致性能、或者需要长音频转写，可以从下面三个里挑：

适用场景：极低内存占用；或偏好“按下 CapsLock 说话”的交互。
特点：
- 完全开源、无广告，隐私风险低。
- 同样支持 SenseVoice / Paraformer，并针对 CPU 做了极致优化。
- 无 GUI 干扰，后台静默运行。
项目地址：GitHub - HaujetZhao/CapsWriter-Offline

适用场景：追求纯英文识别的速度；或者在老硬件上跑 Whisper。
特点：
- C++ 实现，主要走 DirectX 做 GPU 加速，但也能 CPU 跑。
- 是我见过的 Windows 上跑 OpenAI Whisper 速度非常快的实现之一。
- Win32 风格界面，但胜在稳定。
局限：只支持 Whisper；中英混合能力一般不如 SenseVoice。
项目地址：GitHub - Const-me/Whisper

这个是我在 X 上看到有人推荐的（我自己还没深度用过），先放在备选里占个位。

现在对我来说，LazyTyper + SenseVoice Small 是“易用性”和“性能”之间最平衡的一套本地语音输入方案。