『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
查看: 3498|回复: 21

[已解决] HA语音助手STT使用的是whisper,偶尔处理成繁体字

[复制链接]

25

主题

224

帖子

1034

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1034
金钱
810
HASS币
0
发表于 2024-2-19 14:53:11 | 显示全部楼层 |阅读模式
本帖最后由 demacia 于 2024-3-31 17:40 编辑

HA官方推荐了本地tts,stt的集成方式。
HA core docker安装的,无法使用addons

查到资料可以单独拉起whisper,启动的参数
whisper

sudo docker run  --name whisper -d -p 10300:10300 -v wyoming:/data rhasspy/wyoming-whisper --model tiny-int8 --language zh



不知道是不是whisper参数有问题,导致模型有问题?HA助手语音输入经常解析成繁体中文了






############################ 03-28 更新
########
感谢 @
silang521 大佬的提醒
作者两周前更新了支持 --initial-prompt 参数的暴露,有繁体问题的朋友可以试玩看看了
https://github.com/rhasspy/wyoming-faster-whisper/blob/master/CHANGELOG.md





############################ 03-29 更新
########

繁体的问题虽然解决了 但现在有俩问题
1. 中文内容准确率不高
2. 不知道是不是加了init promot 导致带了些英文术语会出问题

######################### 03-30 更新 ########

中文内容准确率不高的原因是因为tiny模型太小了,切换到medium 识别率非常准确,目前是在nvidia 显卡下跑的。拿了docker的书直接念的,每个字都很准。
2024-03-30 20:45:28,586 [INFO]Processing audio with duration 00:11.070
2024-03-30 20:45:30,362 [INFO]如果说主机时代大家比拼的是单个服务器物理性能 那么在云时代最为看重的则是 凭借虚拟化技术所构建的集群处理能力

分享下hugging-face的镜像网站,和原whisper的模型仓库。
https://hf-mirror.com/Systran试了好几个模型,tiny,medium,还下载了Systran/faster-distil-whisper-large-v2,输出给你中文语音直接翻译成英文,而且还很准。有显卡设备的话,以后感觉替换各种国产精灵,不用绕来绕去了。

######################### 03-31 更新 ########
docker gpu启动方案:基于原作者的项目,打了nvidia的cuda12-cudnn8的版本镜像,有显卡的朋友可以试试。

ghcr.io/hass-demacia/wyoming_faster_whisper:dev
sudo docker run --gpus all --name whisper -d -p 10300:10300 \
         -v wyoming:/data \
         ghcr.io/hass-demacia/wyoming_faster_whisper:dev \
         --language zh \
         --log-format='%(asctime)s [%(levelname)s]%(message)s' \
         --device=cuda \
         --model medium \
         --initial-prompt "以下是普通话的句子"






回复

使用道具 举报

13

主题

613

帖子

3185

积分

论坛元老

HomeAssistant

Rank: 8Rank: 8

积分
3185
金钱
2567
HASS币
20
发表于 2024-2-20 09:09:53 | 显示全部楼层
换更大的模型试试
回复

使用道具 举报

25

主题

224

帖子

1034

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1034
金钱
810
HASS币
0
 楼主| 发表于 2024-2-20 10:49:26 | 显示全部楼层
DDDear 发表于 2024-2-20 09:09
换更大的模型试试

昨天查了下,原生openai的whisper支持--initial_prompt参数,告诉模型"以下是普通话的句子",出来的结果就会得到简体中文。

rhasspy的whisper没有暴露类似的prompt参数。
回复

使用道具 举报

0

主题

21

帖子

382

积分

中级会员

Rank: 3Rank: 3

积分
382
金钱
361
HASS币
0
发表于 2024-2-20 11:32:51 | 显示全部楼层
大佬,为啥我按照你的命令运行后模型下载不下来,是网络问题吗?
回复

使用道具 举报

25

主题

224

帖子

1034

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1034
金钱
810
HASS币
0
 楼主| 发表于 2024-2-20 16:48:37 | 显示全部楼层
本帖最后由 demacia 于 2024-2-20 16:50 编辑
cyqand 发表于 2024-2-20 11:32
大佬,为啥我按照你的命令运行后模型下载不下来,是网络问题吗?

github打的开吗


https://github.com/rhasspy/models/releases/
下载脚本应该是从这里下的
回复

使用道具 举报

25

主题

224

帖子

1034

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1034
金钱
810
HASS币
0
 楼主| 发表于 2024-2-21 10:16:51 | 显示全部楼层
本帖最后由 demacia 于 2024-2-21 10:18 编辑
DDDear 发表于 2024-2-20 09:09
换更大的模型试试

试了下换更大的模型,繁体还是会存在。。响应速度也变慢了很多
回复

使用道具 举报

13

主题

613

帖子

3185

积分

论坛元老

HomeAssistant

Rank: 8Rank: 8

积分
3185
金钱
2567
HASS币
20
发表于 2024-2-21 12:01:41 | 显示全部楼层
demacia 发表于 2024-2-20 10:49
昨天查了下,原生openai的whisper支持--initial_prompt参数,告诉模型"以下是普通话的句子",出来的结果 ...

原来有参数,学习了!
回复

使用道具 举报

15

主题

175

帖子

967

积分

高级会员

Rank: 4

积分
967
金钱
792
HASS币
0
发表于 2024-3-23 18:02:12 | 显示全部楼层
一样,tiny-int8的模型转写成繁体
回复

使用道具 举报

7

主题

269

帖子

1511

积分

金牌会员

Rank: 6Rank: 6

积分
1511
金钱
1242
HASS币
0
发表于 2024-3-28 18:43:16 | 显示全部楼层
少参数加上参数就正常啦
回复

使用道具 举报

25

主题

224

帖子

1034

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1034
金钱
810
HASS币
0
 楼主| 发表于 2024-3-28 19:41:14 | 显示全部楼层
silang521 发表于 2024-3-28 18:43
少参数加上参数就正常啦

啥意思,能给个docker 命令的示例嘛?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-12-23 14:21 , Processed in 0.054833 second(s), 31 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表