『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
楼主: XCray

[新奇玩法] 【无限期待】HA的新生命马上就要来临:2023.5.0版本!语音!

[复制链接]

1

主题

187

帖子

1494

积分

金牌会员

Rank: 6Rank: 6

积分
1494
金钱
1307
HASS币
0
发表于 2023-4-29 12:08:43 | 显示全部楼层
XCray 发表于 2023-4-29 07:34
你用过?展开说说?

不是有很多单片机可以本地学习和本地数据库的嘛,理想环境可以的,但是中华文化博大精深,环境噪声方位等因素影响,似乎就没那么好用了,联网大数据都做得一般般,本地语音不太期待。
回复

使用道具 举报

0

主题

39

帖子

489

积分

中级会员

Rank: 3Rank: 3

积分
489
金钱
450
HASS币
0
发表于 2023-4-29 13:36:09 | 显示全部楼层
我现在都是直接用小爱获取的语音然后传输给HA,NR或者tasker , 以前智能音箱还没出现以前,曾经买过讯飞科大的语音识别模块,远场识别没这么简单,一般效果都不好,
回复

使用道具 举报

3

主题

301

帖子

3245

积分

论坛元老

Rank: 8Rank: 8

积分
3245
金钱
2944
HASS币
0
发表于 2023-4-29 15:01:00 | 显示全部楼层
我看esphome支持I2S的麦克风,买了一个用ESP32接入试试,顺便把HA自带的助手也改成中文了,看看基本的打开灯之类的语音能不能用
回复

使用道具 举报

105

主题

2954

帖子

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

Rank: 8Rank: 8

积分
12103
金钱
9084
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-29 16:42:47 | 显示全部楼层
twfjcn 发表于 2023-4-29 12:08
不是有很多单片机可以本地学习和本地数据库的嘛,理想环境可以的,但是中华文化博大精深,环境噪声方位等 ...

智能家居场景需要识别的指令/语句是很有限的,对处理能力的要求应该并不高,相对云端带来的高时延和隐私风险,本地化应该是一个更好而且现实的选择。

另一个方向,本地语音合成在音色方面不如云端也是可以接受的,同样时延的缩短也是一个很大的好处。
回复

使用道具 举报

47

主题

1657

帖子

6690

积分

论坛元老

Rank: 8Rank: 8

积分
6690
金钱
5023
HASS币
40
发表于 2023-4-29 19:16:45 | 显示全部楼层
本地语音要那么多语句识别干嘛,让本地的做成云端那么多,怎么可能?在我看来,只要识别率高,不需要唤醒词,能满足,开灯关灯就行了,至于要其他功能,就让云端来搞。
折腾精神永存,感恩感谢论坛每一位愿意分享和帮助过我的大佬,论坛有你更精彩
回复

使用道具 举报

5

主题

357

帖子

2057

积分

金牌会员

Rank: 6Rank: 6

积分
2057
金钱
1685
HASS币
60
发表于 2023-4-29 21:49:32 | 显示全部楼层
XCray 发表于 2023-4-28 23:55
价格不一样不说,联网和本地的差别更值得细品

普通小爱低于99也能买到了,homepod确实贵一点。之前有个玩家搞过本地语音,结果识别错误率太高,必须要一板一眼的说出指令才行,稳定性不尽理想。比如一个开灯指令,不同的人可能不同的说法,有的人还带点口音,不联网的话,程序很难稳定、准确判断你说的话。如果忽略价格因素,光从体验上来说,homepod体验是最好的,因为你可以一口气说完一个指令,比如一口气说完“hey siri打开主卧灯”,从你张开嘴巴到灯打开,实际就1-2秒。而小爱和本地语音目前还做不到同时接收唤醒词+指令,你要先说一句唤醒词唤醒设备,再说一句指令才行,这样至少也要3秒才能完成操作,所以其实未必比联网的siri更快。
回复

使用道具 举报

5

主题

357

帖子

2057

积分

金牌会员

Rank: 6Rank: 6

积分
2057
金钱
1685
HASS币
60
发表于 2023-4-29 21:55:43 | 显示全部楼层
jjcs 发表于 2023-4-29 19:16
本地语音要那么多语句识别干嘛,让本地的做成云端那么多,怎么可能?在我看来,只要识别率高,不需要唤醒词 ...

不需要唤醒词,你会发现误触率高的离谱,我的行车记录仪就是本地语音,也不需要唤醒词,快确实是快,但是总是莫名其妙被误触。智能家居最最重要的就是稳定,不能频繁出幺蛾子,否则很快你就不想用了。本地语音想做到稳定好用,还有很长的路要走
回复

使用道具 举报

105

主题

2954

帖子

1万

积分

超级版主

智能家居&单板滑雪痴迷爱好者

Rank: 8Rank: 8

积分
12103
金钱
9084
HASS币
460

教程狂人突出贡献

 楼主| 发表于 2023-4-29 22:06:26 | 显示全部楼层
好像大家都在凭自己的想象发表看法 有几个人真正用过HA 2023.5.0版本?或者仔细了解过HA新加入的语音功能?
回复

使用道具 举报

77

主题

1391

帖子

2万

积分

元老级技术达人

积分
24349
金钱
22918
HASS币
290
发表于 2023-4-29 22:48:33 | 显示全部楼层
本帖最后由 dscao 于 2023-5-5 23:41 编辑

这两年ha的每月升级都有新的好用的东西出现。
昨天用M401A电视盒子升级了最新测试版
支持多个语音助手
支持多个tts或stt,每个语音助手可指定使用某个tts或stt
最重要的就是实现了完全本地化,虽然addon提供的TTS相比edge是差了很多,但是听懂肯定是没问题的。因为没有语音输入设备,语音识别方面还没测试。需要esphome制作硬件,唤醒方式可以Esphome中配置,相信也会有更好更适合自己的方式出现。
这个我是非常期待的,后续肯定也会不断优化的。
等正式版出来,主用的系统升级一下,再做个简单的esphome voice_assistant来玩玩。
i2s_audio:
  i2s_lrclk_pin: GPIO33
  i2s_bclk_pin: GPIO19

microphone:
 - platform: i2s_audio
   id: echo_microphone
   i2s_din_pin: GPIO23

voice_assistant:
  microphone: echo_microphone

media_player:
  - platform: i2s_audio
    id: media_out
    name: esp32 i2s media player
    dac_type: external
    i2s_dout_pin: GPIO22
    mode: mono


回复

使用道具 举报

56

主题

929

帖子

4077

积分

论坛元老

Rank: 8Rank: 8

积分
4077
金钱
3148
HASS币
0
发表于 2023-4-30 07:53:30 | 显示全部楼层
本地部署安心生产力。期待
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-11-26 06:26 , Processed in 0.100433 second(s), 31 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表