『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
楼主: duanyudan123

[技术探讨] 本地语音实测来围观了,友情提示提前准备GPU卡(已加装3060)

[复制链接]

12

主题

111

帖子

747

积分

高级会员

Rank: 4

积分
747
金钱
636
HASS币
0
 楼主| 发表于 2024-3-30 23:56:51 | 显示全部楼层
silang521 发表于 2024-3-30 09:43
请教一下,你用的什么型号的功放,我用pam8406喇叭还是有杂音,很严重   难道要用98357a才行?还是有什么 ...

就你说的这个,老外都在用这个芯片,几块钱一个。esp内部的转换看老外测试就是刺啦
回复

使用道具 举报

25

主题

224

帖子

1032

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1032
金钱
808
HASS币
0
发表于 2024-3-31 00:01:14 | 显示全部楼层
本帖最后由 demacia 于 2024-3-31 00:04 编辑
silang521 发表于 2024-3-30 23:51
麻烦能不能分享相关的代码?
python3 -m wyoming_faster_whisper \
        --uri 'tcp://0.0.0.0:10300' \
    --data-dir /data \
    --download-dir /data \
    --local_files_only=True \
    --language zh \
    --log-format='%(asctime)s [%(levelname)s]%(message)s' \
    --device=cuda \
    --model medium \
    --initial-prompt '以下是普通话的句子'


没改代码,只是提了个PR,让有模型缓存的不在请求网络拉取和检查模型,启动快点。
https://github.com/hass-demacia/ ... 85aa9569ab1e06fef11。有网络开代理的可以忽略这个pr。
正常逻辑,应该是基于nvdia的cudnn的基础镜像打一个镜像,应该也是可以的,只不过作者项目里面没有维护Dockerfile,就不强求docker了。
回复

使用道具 举报

12

主题

111

帖子

747

积分

高级会员

Rank: 4

积分
747
金钱
636
HASS币
0
 楼主| 发表于 2024-3-31 00:12:41 | 显示全部楼层
DDDear 发表于 2024-3-29 16:02
https://github.com/k2-fsa
这个中文离线识别非常快,而且有python接口,大佬看看可以接入吗? ...

没那个技术,静静等待就好。会有大佬去贡献的。
回复

使用道具 举报

12

主题

111

帖子

747

积分

高级会员

Rank: 4

积分
747
金钱
636
HASS币
0
 楼主| 发表于 2024-3-31 00:23:18 | 显示全部楼层
demacia 发表于 2024-3-30 20:57
感觉以后allinone的主机还得在配张显卡 大模型是叼
ha控制和语音版的本地chatgpt

目前像样的GPU才是正解。要不老外一口一个cuda,听见就来气。等待有大佬拿老黄的集群训练个针对性的中文小模型,惠及群众。
回复

使用道具 举报

25

主题

224

帖子

1032

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1032
金钱
808
HASS币
0
发表于 2024-3-31 00:26:15 | 显示全部楼层
duanyudan123 发表于 2024-3-31 00:23
目前像样的GPU才是正解。要不老外一口一个cuda,听见就来气。等待有大佬拿老黄的集群训练个针对性的中文 ...

是的,容器版本只提供--gpu参数没用,必须还要指定whisper的参数--device。不然还是cpu跑,medium模型9400F,也比较慢。
回复

使用道具 举报

12

主题

111

帖子

747

积分

高级会员

Rank: 4

积分
747
金钱
636
HASS币
0
 楼主| 发表于 2024-3-31 00:27:13 | 显示全部楼层
silang521 发表于 2024-3-30 23:00
你怎么调用的显卡?

去看Whisper的文档,首先你需要有一个gtx或者rtx的设备,然后用docker跑起来Whisper就可以了。HA的Wyoming Protocol插件会自动发现它。这一切都布满了金钱的味道
回复

使用道具 举报

25

主题

224

帖子

1032

积分

金牌会员

007潜水了

Rank: 6Rank: 6

积分
1032
金钱
808
HASS币
0
发表于 2024-3-31 17:47:39 | 显示全部楼层
ghcr.io/hass-demacia/wyoming_faster_whisper:dev

今天直接基于nvidia的基础镜像,打了cuda12的版本的镜像,个人自测没问题。有显卡的老板们可以尝尝。

(nvidia显卡驱动可能需要更新)
回复

使用道具 举报

4

主题

228

帖子

4384

积分

元老级技术达人

积分
4384
金钱
4141
HASS币
40
发表于 2024-4-3 11:44:21 | 显示全部楼层
楼主这个屏幕也是esphome驱动的么 有代码么,能共享下么
回复

使用道具 举报

12

主题

111

帖子

747

积分

高级会员

Rank: 4

积分
747
金钱
636
HASS币
0
 楼主| 发表于 2024-4-9 10:48:02 | 显示全部楼层
81795791 发表于 2024-4-3 11:44
楼主这个屏幕也是esphome驱动的么 有代码么,能共享下么

不是esphome。是openhasp,基于lvgl的。项目地址:https://www.openhasp.com/0.7.0/
你可以了解一下。
回复

使用道具 举报

4

主题

228

帖子

4384

积分

元老级技术达人

积分
4384
金钱
4141
HASS币
40
发表于 2024-4-9 12:13:11 | 显示全部楼层
duanyudan123 发表于 2024-4-9 10:48
不是esphome。是openhasp,基于lvgl的。项目地址:https://www.openhasp.com/0.7.0/
你可以了解一下。 ...

这个项目咋添加麦克风的,,,
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-11-13 14:47 , Processed in 0.174992 second(s), 30 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表