请选择 进入手机版 | 继续访问电脑版

『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
查看: 7967|回复: 48

[新奇玩法] 【无限期待】HA的新生命马上就要来临:2023.5.0版本!语音!

[复制链接]

98

主题

2866

帖子

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

Rank: 8Rank: 8

积分
11435
金钱
8504
HASS币
460

教程狂人突出贡献

发表于 2023-4-28 22:12:14 | 显示全部楼层 |阅读模式
本帖最后由 XCray 于 2023-5-11 08:53 编辑

早在去年年末,HA就宣布2023年为HA的语音之年,由于我个人冬天沉迷于雪场,没有认真跟进,对这个激动人心的新特性仅仅是简单了解了一下,没有做任何实际测试。不过看论坛里讨论这事儿的帖子也确实很少,看来大家都在等。

现在,一个重大改进版本马上就要降临了!昨天,官网发表了《语音之年:第二篇章》,非常推荐大家仔细看看!

简单来说,语音之年的第一篇章集中在“意图 intents – 用户想干啥 what the user wants to do”方面,常用的智能家居指令和响应已经支持简体中文(感谢al-one的贡献!)。

第二篇章,带来了最利于隐私保护的、本地的TTS引擎(语音合成)和STT引擎(语音识别)!也都支持中文!

语音势必牵涉到拾取和播放语音的硬件设备,所以ESPHome已经走在前面,在2023.4.0版本已经开始支持麦克风(播放能力HA早就有了)。

本地语音识别和语音合成是以加载项的形式提供的,和ESPHome的麦克风特性一样,需要下个月的HA版本,即2023.5.0才能使用。正式版还没有发布,但开发版早就可以使用了(我自己也还没开始用

哪位懂硬件的朋友,说说esp32接麦克风怎么玩?什么类型的麦克风最好用?

我看官方是拿M5Stack ATOM Echo进行开发测试的,所用的麦克风型号是SPM1423 PDM。ATOM Echo某宝售价99一个,好像贵了一点点

~~~~~~~~~~~~
确实还有很长的路要走

正式版出来了,问题还是挺明显的,STT还没试,TTS属实拉跨:

- 响应速度太差,官方宣传树莓派上好用,我用群晖虚拟机跑,给2个CPU+2G内存,延迟依然很大,甚至消息内容比较长时比云上的edge还差;不过短内容时延迟确实比edge小得多(1.5秒vs4秒);
- 音质确实很差,尤其是中英文混合,英文单词都不知道它是咋念的;
- 在语音助手中piper设置为中文始终不可用,通过服务调用可以,就是语音助手里只能用英文;

但愿以后能好用起来。

评分

参与人数 2金钱 +17 收起 理由
centurion2009 + 5 论坛有你更精彩!
jjcs + 12 高手,这是高手!

查看全部评分

回复

使用道具 举报

5

主题

357

帖子

2046

积分

金牌会员

Rank: 6Rank: 6

积分
2046
金钱
1674
HASS币
60
发表于 2023-4-28 22:41:40 | 显示全部楼层
感觉使用体验可能不如小爱和siri。麦克风系统(含软件算法)的拾音能力也很重要,一是说话很小声的时候也能准确识别,二是周围比较嘈杂的时候也可以识别,三是说的不太清楚的时候能够正确理解,这三点有一点不能满足,可能体验就很差了;再就是固定位置的麦克风肯定不如移动终端的体验好,毕竟智能手表/手环和手机是随声带着的,走到哪里都可以语音控制。
回复

使用道具 举报

98

主题

2866

帖子

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

Rank: 8Rank: 8

积分
11435
金钱
8504
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-28 23:55:11 来自手机 | 显示全部楼层
价格不一样不说,联网和本地的差别更值得细品
回复

使用道具 举报

17

主题

415

帖子

1864

积分

金牌会员

Rank: 6Rank: 6

积分
1864
金钱
1449
HASS币
0
发表于 2023-4-29 00:22:44 | 显示全部楼层
要想达到比较理想的使用程度至少也得半年吧
回复

使用道具 举报

36

主题

171

帖子

1375

积分

金牌会员

Rank: 6Rank: 6

积分
1375
金钱
1204
HASS币
0
发表于 2023-4-29 00:44:52 来自手机 | 显示全部楼层
几块钱的线性麦克风自己画电路板,多个麦克风拾音就能行了mems硅麦也就几块钱一个
回复

使用道具 举报

1

主题

147

帖子

1072

积分

金牌会员

Rank: 6Rank: 6

积分
1072
金钱
925
HASS币
0
发表于 2023-4-29 02:01:09 | 显示全部楼层
语音联网都很傻,本地就更智障了
回复

使用道具 举报

98

主题

2866

帖子

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

Rank: 8Rank: 8

积分
11435
金钱
8504
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-29 07:34:28 | 显示全部楼层
twfjcn 发表于 2023-4-29 02:01
语音联网都很傻,本地就更智障了

你用过?展开说说?
回复

使用道具 举报

7

主题

1974

帖子

5657

积分

论坛元老

流水无味

Rank: 8Rank: 8

积分
5657
金钱
3683
HASS币
145

灌水之王

发表于 2023-4-29 10:04:33 | 显示全部楼层
XCray 发表于 2023-4-29 07:34
你用过?展开说说?

联网的都很傻 本地的就更傻了
不是很期待,
回复

使用道具 举报

15

主题

302

帖子

2221

积分

金牌会员

Rank: 6Rank: 6

积分
2221
金钱
1919
HASS币
0
发表于 2023-4-29 10:13:42 | 显示全部楼层
charGPT这么火,干脆把它集成到HA,现在应该没有哪家智能程度可以超过它吧
展望下,以后配置个自动化也可以用语音来设置,不需要自己趴电脑前写yaml
回复

使用道具 举报

109

主题

1563

帖子

4944

积分

元老级技术达人

积分
4944
金钱
3376
HASS币
30
发表于 2023-4-29 10:54:57 | 显示全部楼层
cjnt007 发表于 2023-4-29 10:13
charGPT这么火,干脆把它集成到HA,现在应该没有哪家智能程度可以超过它吧
展望下,以后配置个自动化也可以 ...

小爱和siri都很多年了。ha搞自己的语音,肯定也需要1-2年的完善,主要是远场语音,嘈杂环境的识别,需要技术积累

评分

参与人数 1金钱 +12 收起 理由
jjcs + 12 高手,这是高手!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-4-20 03:06 , Processed in 0.115032 second(s), 35 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表