找回密码
 立即注册

微信扫码登录

搜索
查看: 8040|回复: 32

[技术探讨] esphome怎么实现语音识别的?

[复制链接]

23

主题

656

回帖

5084

积分

版主

积分
5084
金钱
4390
HASS币
40
发表于 2024-9-10 14:37:28 | 显示全部楼层
以esphome接入ha而言:
1,唤醒,硬件,是用麦克风拾音+esp。
2,唤醒,软件,sst,可以在ha的主机,也可以另外算力更强的主机。esphome默认好像给了2个还是几个唤醒词的。额外的唤醒词训练我记得是可以ha或另外主机来做。
3,发声,硬件,是用喇叭+esp。
4,发声,软件,tts,一般在ha主机就行。有云、也有本地的。
5,语义理解,可以在HA配置云端或本地LLM,作为语音助理。

大致是这样,记得不是很准了。
回复

使用道具 举报

23

主题

656

回帖

5084

积分

版主

积分
5084
金钱
4390
HASS币
40
发表于 2024-9-10 14:47:25 | 显示全部楼层
bugensui 发表于 2024-9-10 14:42
可以,够详细,我搜索了论坛,这块大家玩的不多,都没有教程抄

你搜一搜esp32 s3 box,esphome有官方的项目支持这个硬件,可以做本地语音控制(想要的话,我二手出给你
论坛里其实有人发过的,但是tts和sst的软硬件、local或云端llm,配置下来,还是不如现有的小爱小度流畅。作为一个完整的项目或教程,还不够成熟,需要自己东拼西凑。
想做个完美的本地语音控制,我觉得需要比较强的项目工程能力,最好还得自己设计个音箱
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian ( 晋ICP备17001384号-1 )

GMT+8, 2025-9-3 06:12 , Processed in 0.045512 second(s), 6 queries , MemCached On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表