『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
楼主: ptbsare

[技术探讨] 本地语言助手基于Sherpa Onnx的Wyoming STT/TTS Addon无惧断网纯离线

[复制链接]

1

主题

47

帖子

300

积分

论坛技术达人

积分
300
金钱
253
HASS币
0
 楼主| 发表于 2025-2-11 11:43:02 | 显示全部楼层
本帖最后由 ptbsare 于 2025-2-11 18:23 编辑
bugensui 发表于 2025-2-11 11:35
说话速度太慢了。默认好像是1,我改成0.5好像效果一样,加快应该设置多少,另外说话的声音哪个模型,比较贴 ...

你好,时间原因,插件目前是仅工作状态,一些功能可能需要时间适配比如自定义模型等,speed参数调大可变快,可能还有一些bug,说话声音是是模型的提供的,插件只是对接模型。关于效果,因为我们要在速度和效果上取得一个折中点,采用Sherpa Onnx是因为他在本地运行识别stt和tts比较快,CPU即可不需要太强GPU;目前效果比较好的模型一般需要的运算力比较大且难以实时识别及输出。如果你有更好的想法,欢迎在Github上提交pull request。谢谢!
更新:自定义模型/参数已在v0.2.8。
回复

使用道具 举报

164

主题

2644

帖子

8174

积分

元老级技术达人

积分
8174
金钱
5525
HASS币
30
发表于 2025-2-11 11:46:05 | 显示全部楼层
ptbsare 发表于 2025-2-11 11:43
你好,时间原因,插件目前是仅工作状态,一些功能可能需要时间适配比如自定义模型等,speed参数调大可变 ...

谢谢回复,那我期待插件完善
回复

使用道具 举报

1

主题

47

帖子

300

积分

论坛技术达人

积分
300
金钱
253
HASS币
0
 楼主| 发表于 2025-2-11 12:45:31 | 显示全部楼层
bugensui 发表于 2025-2-11 11:35
说话速度太慢了。默认好像是1,我改成0.5好像效果一样,加快应该设置多少,另外说话的声音哪个模型,比较贴 ...

hi,你好啊,如果改speed速度(例如加快语速将其改为1.5)后启动addon,再调用TTS,如果TTS文字一样homeassistant是不会重新调用TTS引擎的,而是使用已有的缓存结果的,测试可以换个TTS文字,我刚才测试speed是生效的。或者在homeassistant里面执行Text-to-speech (TTS): 清除 TTS 缓存: tts.clear_cache服务后再测试试试,谢谢!
回复

使用道具 举报

164

主题

2644

帖子

8174

积分

元老级技术达人

积分
8174
金钱
5525
HASS币
30
发表于 2025-2-11 12:47:16 | 显示全部楼层
ptbsare 发表于 2025-2-11 12:45
hi,你好啊,如果改speed速度(例如加快语速将其改为1.5)后启动addon,再调用TTS,如果TTS文字一样homea ...

原来如此,ha的缓存机制我忘记了。一样的文字,tts就不工作了。直接调用上次的,我说怎么没有效果,谢谢了。
回复

使用道具 举报

0

主题

61

帖子

938

积分

高级会员

Rank: 4

积分
938
金钱
877
HASS币
0
发表于 2025-2-11 13:33:06 | 显示全部楼层
我是debian12系统,amd64架构,我想用docker pull ghcr.io/ptbsare/home-assistant-addons/amd64-addon-sherpa-onnx-tts-stt拉取镜像
回复

使用道具 举报

1

主题

42

帖子

453

积分

中级会员

Rank: 3Rank: 3

积分
453
金钱
411
HASS币
0
发表于 2025-2-11 13:59:34 | 显示全部楼层
我是N5095,测试了一下,控制速度飞快,吊打siri,买了一个HA Voice,等到了试试看,能不能用这个作为STT和TTS,可以的话,就siri可以退休了
回复

使用道具 举报

16

主题

227

帖子

1219

积分

金牌会员

Rank: 6Rank: 6

积分
1219
金钱
992
HASS币
0
发表于 2025-2-11 15:24:23 | 显示全部楼层
社区有你更精彩
回复

使用道具 举报

77

主题

1413

帖子

2万

积分

元老级技术达人

积分
27147
金钱
25694
HASS币
290
发表于 2025-2-11 15:28:34 | 显示全部楼层
本帖最后由 dscao 于 2025-2-11 17:27 编辑

效果还不错,本地tts在小主机上也基本上可以用了。 本地中文语言方面又进了一大步。J4125 allinone 一般一句话tts在3秒左右,stt 30个字左右的一句话约8秒。如果用性能强的主机速度上肯定更好。

因为没有latest,docker 部署需要在最后加上版本号,即  :0.2.6

群晖中Container manager项目部署:

version: "3.0"
services:
  certimate:
    image: ghcr.io/ptbsare/home-assistant-addons/amd64-addon-sherpa-onnx-tts-stt:0.2.6
    container_name: sherpa-onnx-tts-stt
    environment:
      LANGUAGE: "zh-CN"
      STT_MODEL: "sherpa-onnx-paraformer-zh-2023-03-28"
      SPEED: "1.2"
      STT_USE_INT8_ONNX_MODEL: "True"
      STT_THREAD_NUM: "3"
      TTS_MODEL: "matcha-icefall-zh-baker"
      TTS_THREAD_NUM: "3"
      TTS_SPEAKER_SID: "0"
      DEBUG: "True"
    ports:
      - 10400:10400
    restart: unless-stopped


后来用 mac mini m4测试了一下,基本是秒出结果。

回复

使用道具 举报

1

主题

47

帖子

300

积分

论坛技术达人

积分
300
金钱
253
HASS币
0
 楼主| 发表于 2025-2-11 15:51:37 | 显示全部楼层
本帖最后由 ptbsare 于 2025-2-11 15:54 编辑
penguinmm 发表于 2025-2-11 13:33
我是debian12系统,amd64架构,我想用docker pull ghcr.io/ptbsare/home-assistant-addons/amd64-addon-she ...

你好啊,不好意思是我的疏忽,代码粘漏了,感谢@dscao 提醒,已经同步更新帖子,pull加上tag 0.2.6:
docker pull ghcr.io/ptbsare/home-assistant-addons/amd64-addon-sherpa-onnx-tts-stt:0.2.6

再试试,谢谢!
回复

使用道具 举报

0

主题

61

帖子

938

积分

高级会员

Rank: 4

积分
938
金钱
877
HASS币
0
发表于 2025-2-11 16:26:36 | 显示全部楼层
好的,谢谢,已经正常拉取。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2025-3-4 20:10 , Processed in 0.057632 second(s), 30 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表