找回密码
 立即注册

微信扫码登录

搜索
查看: 18269|回复: 48

[新奇玩法] 【无限期待】HA的新生命马上就要来临:2023.5.0版本!语音!

[复制链接]

104

主题

2846

回帖

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

积分
12321
金钱
9306
HASS币
460

教程狂人突出贡献

发表于 2023-4-28 22:12:14 | 显示全部楼层 |阅读模式
本帖最后由 XCray 于 2023-5-11 08:53 编辑

早在去年年末,HA就宣布2023年为HA的语音之年,由于我个人冬天沉迷于雪场,没有认真跟进,对这个激动人心的新特性仅仅是简单了解了一下,没有做任何实际测试。不过看论坛里讨论这事儿的帖子也确实很少,看来大家都在等。

现在,一个重大改进版本马上就要降临了!昨天,官网发表了《语音之年:第二篇章》,非常推荐大家仔细看看!

简单来说,语音之年的第一篇章集中在“意图 intents – 用户想干啥 what the user wants to do”方面,常用的智能家居指令和响应已经支持简体中文(感谢al-one的贡献!)。

第二篇章,带来了最利于隐私保护的、本地的TTS引擎(语音合成)和STT引擎(语音识别)!也都支持中文!

语音势必牵涉到拾取和播放语音的硬件设备,所以ESPHome已经走在前面,在2023.4.0版本已经开始支持麦克风(播放能力HA早就有了)。

本地语音识别和语音合成是以加载项的形式提供的,和ESPHome的麦克风特性一样,需要下个月的HA版本,即2023.5.0才能使用。正式版还没有发布,但开发版早就可以使用了(我自己也还没开始用

哪位懂硬件的朋友,说说esp32接麦克风怎么玩?什么类型的麦克风最好用?

我看官方是拿M5Stack ATOM Echo进行开发测试的,所用的麦克风型号是SPM1423 PDM。ATOM Echo某宝售价99一个,好像贵了一点点

~~~~~~~~~~~~
确实还有很长的路要走

正式版出来了,问题还是挺明显的,STT还没试,TTS属实拉跨:

- 响应速度太差,官方宣传树莓派上好用,我用群晖虚拟机跑,给2个CPU+2G内存,延迟依然很大,甚至消息内容比较长时比云上的edge还差;不过短内容时延迟确实比edge小得多(1.5秒vs4秒);
- 音质确实很差,尤其是中英文混合,英文单词都不知道它是咋念的;
- 在语音助手中piper设置为中文始终不可用,通过服务调用可以,就是语音助手里只能用英文;

但愿以后能好用起来。

评分

参与人数 2金钱 +17 收起 理由
centurion2009 + 5 论坛有你更精彩!
jjcs + 12 高手,这是高手!

查看全部评分

回复

使用道具 举报

104

主题

2846

回帖

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

积分
12321
金钱
9306
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-28 23:55:11 来自手机 | 显示全部楼层
价格不一样不说,联网和本地的差别更值得细品
回复

使用道具 举报

104

主题

2846

回帖

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

积分
12321
金钱
9306
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-29 07:34:28 | 显示全部楼层
twfjcn 发表于 2023-4-29 02:01
语音联网都很傻,本地就更智障了

你用过?展开说说?
回复

使用道具 举报

104

主题

2846

回帖

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

积分
12321
金钱
9306
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-29 16:42:47 | 显示全部楼层
twfjcn 发表于 2023-4-29 12:08
不是有很多单片机可以本地学习和本地数据库的嘛,理想环境可以的,但是中华文化博大精深,环境噪声方位等 ...

智能家居场景需要识别的指令/语句是很有限的,对处理能力的要求应该并不高,相对云端带来的高时延和隐私风险,本地化应该是一个更好而且现实的选择。

另一个方向,本地语音合成在音色方面不如云端也是可以接受的,同样时延的缩短也是一个很大的好处。
回复

使用道具 举报

104

主题

2846

回帖

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

积分
12321
金钱
9306
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-29 22:06:26 | 显示全部楼层
好像大家都在凭自己的想象发表看法 有几个人真正用过HA 2023.5.0版本?或者仔细了解过HA新加入的语音功能?
回复

使用道具 举报

104

主题

2846

回帖

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

积分
12321
金钱
9306
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-9-25 11:09:36 | 显示全部楼层
keshiyong 发表于 2023-9-21 16:05
没上GPU基本不用玩,本地唤醒,远场语音识别就难倒一大片,TTS和NLU也是,开源没个十年都不一定有个结果。H ...

确实。
本来指望本地tts能发挥一个好的作用,比如时延更低啥的,但实际效果并不理想
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian ( 晋ICP备17001384号-1 )

GMT+8, 2025-10-15 03:19 , Processed in 0.086563 second(s), 8 queries , MemCached On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表