本帖最后由 xiaobai1828 于 2024-6-5 17:16 编辑
此前实现的语音转文本都是用百度或者其他云平台,需要续费或者有使用限制。 而这个是基于开源的STT<K2-FSA/SHERPA-ONNX>,真正纯离线、免费、无限制。 目前安装有点门槛(使用命令行,期待有大佬能指导优化) 补充个无剪辑演示视频 # 安装须知 - 实现方式:STT服务端+HA集成
- STT服务端已编译成Docker镜像,仅支持X86(N95/N100/群晖...),ARM和RISC目前没编译。
- STT服务端虽说性能要求不高,但剩余内存低于2G的就不要尝试了!听劝!
- 剩余存储建议大于4G
- 实测畅网的N100,内存占用1G,秒出结果
此时你的专属且免费的语音助理应该已经复活了,去左上角找你的助理试试吧。 #最终效果
PS:HA目前的意图识别不健全,等大佬们补充 K2-FSA也支持离线TTS,但个人感觉效果没有edge_tts好就没做,有后续再说。
|