本地语音实测来围观了，友情提示提前准备GPU卡(已加装3060）

duanyudan123 · 发表于 2024-3-30 23:56:51

silang521 发表于 2024-3-30 09:43
请教一下，你用的什么型号的功放，我用pam8406喇叭还是有杂音，很严重难道要用98357a才行？还是有什么 ...

就你说的这个，老外都在用这个芯片，几块钱一个。esp内部的转换看老外测试就是刺啦

demacia · 发表于 2024-3-31 00:01:14

本帖最后由 demacia 于 2024-3-31 00:04 编辑

silang521 发表于 2024-3-30 23:51
麻烦能不能分享相关的代码？

python3 -m wyoming_faster_whisper \
        --uri 'tcp://0.0.0.0:10300' \
    --data-dir /data \
    --download-dir /data \
    --local_files_only=True \
    --language zh \
    --log-format='%(asctime)s [%(levelname)s]%(message)s' \
    --device=cuda \
    --model medium \
    --initial-prompt '以下是普通话的句子'

没改代码，只是提了个PR,让有模型缓存的不在请求网络拉取和检查模型，启动快点。
https://github.com/hass-demacia/ ... 85aa9569ab1e06fef11。有网络开代理的可以忽略这个pr。
正常逻辑，应该是基于nvdia的cudnn的基础镜像打一个镜像，应该也是可以的，只不过作者项目里面没有维护Dockerfile，就不强求docker了。

duanyudan123 · 发表于 2024-3-31 00:12:41

DDDear 发表于 2024-3-29 16:02
https://github.com/k2-fsa
这个中文离线识别非常快，而且有python接口，大佬看看可以接入吗？ ...

没那个技术，静静等待就好。会有大佬去贡献的。

duanyudan123 · 发表于 2024-3-31 00:23:18

demacia 发表于 2024-3-30 20:57
感觉以后allinone的主机还得在配张显卡大模型是叼
ha控制和语音版的本地chatgpt

目前像样的GPU才是正解。要不老外一口一个cuda，听见就来气。等待有大佬拿老黄的集群训练个针对性的中文小模型，惠及群众。

demacia · 发表于 2024-3-31 00:26:15

duanyudan123 发表于 2024-3-31 00:23
目前像样的GPU才是正解。要不老外一口一个cuda，听见就来气。等待有大佬拿老黄的集群训练个针对性的中文 ...

是的，容器版本只提供--gpu参数没用，必须还要指定whisper的参数--device。不然还是cpu跑，medium模型9400F，也比较慢。

duanyudan123 · 发表于 2024-3-31 00:27:13

silang521 发表于 2024-3-30 23:00
你怎么调用的显卡？

去看Whisper的文档，首先你需要有一个gtx或者rtx的设备，然后用docker跑起来Whisper就可以了。HA的Wyoming Protocol插件会自动发现它。这一切都布满了金钱的味道

demacia · 发表于 2024-3-31 17:47:39

ghcr.io/hass-demacia/wyoming_faster_whisper:dev

今天直接基于nvidia的基础镜像，打了cuda12的版本的镜像，个人自测没问题。有显卡的老板们可以尝尝。

（nvidia显卡驱动可能需要更新）

81795791 · 发表于 2024-4-3 11:44:21

楼主这个屏幕也是esphome驱动的么有代码么，能共享下么

duanyudan123 · 发表于 2024-4-9 10:48:02

81795791 发表于 2024-4-3 11:44
楼主这个屏幕也是esphome驱动的么有代码么，能共享下么

不是esphome。是openhasp，基于lvgl的。项目地址：https://www.openhasp.com/0.7.0/
你可以了解一下。

81795791 · 发表于 2024-4-9 12:13:11

duanyudan123 发表于 2024-4-9 10:48
不是esphome。是openhasp，基于lvgl的。项目地址：https://www.openhasp.com/0.7.0/
你可以了解一下。 ...

这个项目咋添加麦克风的，，，

		自动登录	找回密码
密码			立即注册

[技术探讨] 本地语音实测来围观了，友情提示提前准备GPU卡(已加装3060）