『瀚思彼岸』» 智能家居技术论坛

标题: HA官方语音硬件Home Assistant Voice Preview Edition [打印本页]

作者: duanyudan123    时间: 2024-10-23 13:41
标题: HA官方语音硬件Home Assistant Voice Preview Edition
肯定和将来发布时的外观有一些差异。但应该不会差别太大
还有就是图片的评论,承认别人优秀那么难么?就一个不要钱的本地模型又不会收集什么隐私信息,还让恶心起来。真想跟他干嘴仗。奈何英语不好不知道咋骂人

作者: bugensui    时间: 2024-10-23 14:11
你拿到了?表现怎么样。语音助手硬件是ha的完美闭环了。自己用esp32做的,反应太慢了。说好话要4-5秒左右。才能响应,
作者: duanyudan123    时间: 2024-10-23 14:17
bugensui 发表于 2024-10-23 14:11
你拿到了?表现怎么样。语音助手硬件是ha的完美闭环了。自己用esp32做的,反应太慢了。说好话要4-5秒左右。 ...

没有,这是过审是泄露的照片,最终外观应该不是这样。会有些差异
作者: ghostist    时间: 2024-10-23 14:38
期待,开源最好 自制降本
每个房间丢一个,抛弃智障猫精 聋子小爱,断网也能控
作者: godzqh    时间: 2024-10-23 14:49
本帖最后由 godzqh 于 2024-10-23 14:50 编辑

啥时候上架
作者: jjss520    时间: 2024-10-23 15:00
我靠,干他呀
作者: duanyudan123    时间: 2024-10-23 15:11
duanyudan123 发表于 2024-10-23 14:17
没有,这是过审是泄露的照片,最终外观应该不是这样。会有些差异

会有其它开源版本。
作者: duanyudan123    时间: 2024-10-23 15:15
godzqh 发表于 2024-10-23 14:49
啥时候上架

12月份,不过咱们应该不能那么快。除非他们在国内代工生产,在国内发货。
作者: flyice    时间: 2024-10-23 15:16
ghostist 发表于 2024-10-23 14:38
期待,开源最好 自制降本
每个房间丢一个,抛弃智障猫精 聋子小爱,断网也能控 ...

想多了,搞过语音识别就知道了,唤醒词是很难的。目前苹果siri能力还是最强。
作者: duanyudan123    时间: 2024-10-23 15:17
jjss520 发表于 2024-10-23 15:00
我靠,干他呀

不知道mlgb,用英语咋说
作者: duanyudan123    时间: 2024-10-23 15:24
flyice 发表于 2024-10-23 15:16
想多了,搞过语音识别就知道了,唤醒词是很难的。目前苹果siri能力还是最强。 ...

唤醒词可以解决了。esp32的微唤醒词很好但是没有中文模型。他们也没有详细训练文档,说是基于open wake word生成的样本。但是open wake word天生不支持中文。所以解决方案就是缝合一个天问asrpro来解决唤醒,效率很高、灵活性也特别高。有效范围最大能到10米。成本大概增加十快不到。
作者: ghostist    时间: 2024-10-23 15:29
duanyudan123 发表于 2024-10-23 15:15
12月份,不过咱们应该不能那么快。除非他们在国内代工生产,在国内发货。 ...

我看discord上好像是made in china
作者: ghostist    时间: 2024-10-23 15:31
duanyudan123 发表于 2024-10-23 15:24
唤醒词可以解决了。esp32的微唤醒词很好但是没有中文模型。他们也没有详细训练文档,说是基于open wake w ...

是的 唤醒词和离线STT速度是两大痛点,专门出硬件应该能解决的不错
甚至在线训练 离线使用我也能接受
作者: duanyudan123    时间: 2024-10-23 15:35
ghostist 发表于 2024-10-23 15:31
是的 唤醒词和离线STT速度是两大痛点,专门出硬件应该能解决的不错
甚至在线训练 离线使用我也能接受 ...

订阅nabu 的服务进行stt。哈哈。唤醒词我已经进行了测试,组合很起来很好用。
作者: bugensui    时间: 2024-10-23 15:39
duanyudan123 发表于 2024-10-23 15:24
唤醒词可以解决了。esp32的微唤醒词很好但是没有中文模型。他们也没有详细训练文档,说是基于open wake w ...

其实如果唤醒词,用英文,也没有什么大问题呀,你看siri就很好,只要好说,识别率高,英文也可以的,不一定要中文
作者: duanyudan123    时间: 2024-10-23 15:46
bugensui 发表于 2024-10-23 15:39
其实如果唤醒词,用英文,也没有什么大问题呀,你看siri就很好,只要好说,识别率高,英文也可以的,不一 ...

是的,简单省事就是使用微唤醒词项目提供那几个。
作者: flyice    时间: 2024-10-23 16:08
duanyudan123 发表于 2024-10-23 15:24
唤醒词可以解决了。esp32的微唤醒词很好但是没有中文模型。他们也没有详细训练文档,说是基于open wake w ...

我都用过,和小爱同学差不多,识别率在80%这样
作者: duanyudan123    时间: 2024-10-23 16:29
flyice 发表于 2024-10-23 16:08
我都用过,和小爱同学差不多,识别率在80%这样

天问的识别可以的啊,80%?不能吧。毕竟是一个商业方案。微唤醒词确实是这样,因为没有中文语料,说英语带口音就会这样。
作者: jjss520    时间: 2024-10-23 16:38
duanyudan123 发表于 2024-10-23 15:17
不知道mlgb,用英语咋说

直接fuke他老母
作者: tianya2002    时间: 2024-10-23 20:18
期待可以开源,自制一个
作者: yjl    时间: 2024-10-25 11:04
本帖最后由 yjl 于 2024-10-25 11:05 编辑
duanyudan123 发表于 2024-10-23 15:24
唤醒词可以解决了。esp32的微唤醒词很好但是没有中文模型。他们也没有详细训练文档,说是基于open wake w ...

这个怎么操作?天问用来检测唤醒,然后串口通信叫醒open wake word?来自小白的迷惑天问的中文唤醒确实挺好用

作者: duanyudan123    时间: 2024-10-25 14:01
本帖最后由 duanyudan123 于 2024-10-25 14:07 编辑
yjl 发表于 2024-10-25 11:04
这个怎么操作?天问用来检测唤醒,然后串口通信叫醒open wake word?来自小白的迷惑天问的中文唤醒确实挺 ...

任何你能想到的都可以,只需要esp32收到任意触发操作。然后自动化直接让助手处于收听状态。比如天问初始一个高电平引脚,唤醒后立马低电平0.05秒后恢复高电平。esphome配置一个低电平二进制按钮。当按下时立马启动助手收听。是不是很简单。唤醒词不在HA也不在esp32。用天问你想怎么唤醒都行。甚至可以配置几百个唤醒词。另外天问宣传有声纹识别,净骗人。没有任何文档资料。
作者: duanyudan123    时间: 2024-10-25 14:11
yjl 发表于 2024-10-25 11:04
这个怎么操作?天问用来检测唤醒,然后串口通信叫醒open wake word?来自小白的迷惑天问的中文唤醒确实挺 ...

有需要的话我可以给你贴个配置。
作者: dabase    时间: 2024-10-27 00:38
万分期待啊.
作者: itispip    时间: 2024-10-27 01:05
bugensui 发表于 2024-10-23 14:11
你拿到了?表现怎么样。语音助手硬件是ha的完美闭环了。自己用esp32做的,反应太慢了。说好话要4-5秒左右。 ...

官方推荐的 Atom Echo,没有你说的反应慢的情况啊。只不过Atom Echo的单麦克风收音能力太弱。

看照片,估计这个官方硬件也不会比Atom好到哪里去,没法做到像小米音箱一样,在它播放内容的同时可以随时被语音打断。
作者: duanyudan123    时间: 2024-10-27 09:49
itispip 发表于 2024-10-27 01:05
官方推荐的 Atom Echo,没有你说的反应慢的情况啊。只不过Atom Echo的单麦克风收音能力太弱。

看照片, ...

这个稍微强点的,可以和商用那些比一比的。有麦克风阵列,有音频闪避。但是打断还不清楚算法。背景降噪算法也不太行,人说话还好,但是电视机和其它音乐声源乌拉乌拉响就不太行了。有xmos这些后期应该会算法上优化。
作者: itispip    时间: 2024-10-27 12:53
duanyudan123 发表于 2024-10-27 09:49
这个稍微强点的,可以和商用那些比一比的。有麦克风阵列,有音频闪避。但是打断还不清楚算法。背景降噪算 ...

那还算有点提高。不知道价格多少。估计官方价格不便宜,然后这个市场太小众,华强北不会跟进。
作者: 4277427    时间: 2024-10-27 18:28
发链接,我要和他对线。
作者: yjl    时间: 2024-10-27 21:19
duanyudan123 发表于 2024-10-25 14:11
有需要的话我可以给你贴个配置。

谢谢大佬,麻烦贴个位置,让我学习学习
作者: duanyudan123    时间: 2024-10-28 17:05
yjl 发表于 2024-10-27 21:19
谢谢大佬,麻烦贴个位置,让我学习学习
  1. binary_sensor:
  2.   - platform: gpio
  3.     name: Click_to_Converse
  4.     id: Click_to_Converse
  5.     pin:
  6.       number: 21  
  7.     on_press:
  8.       - homeassistant.service:
  9.          service: media_player.play_media
  10.          data:
  11.            entity_id: media_player.plate02_media_player
  12.            media_content_id: "media-source://media_source/local/wozai.mp3"
  13.            media_content_type: music
  14.       - if:
  15.           condition:
  16.             - voice_assistant.is_running
  17.           then:
  18.             - voice_assistant.stop:
  19.           else:
  20.             - delay: 800ms
  21.             - voice_assistant.start:
复制代码

作者: duanyudan123    时间: 2024-10-28 17:06
yjl 发表于 2024-10-27 21:19
谢谢大佬,麻烦贴个位置,让我学习学习


                               
登录/注册后可看大图


作者: yjl    时间: 2024-10-29 11:55
duanyudan123 发表于 2024-10-28 17:05

谢谢大佬,通透了
作者: sasukebinbin    时间: 2024-10-30 00:02
itispip 发表于 2024-10-27 01:05
官方推荐的 Atom Echo,没有你说的反应慢的情况啊。只不过Atom Echo的单麦克风收音能力太弱。

看照片, ...

我也是这么觉得. 没有6麦降噪, 受环境影响很大. 当然大多数情况其实还好,只是在看电视的时候要走到很近,但homepod隔5米照样识别精准
作者: lichao622    时间: 2024-11-16 23:33
是不是要发布了。我看官方发的这篇 Roadmap 2024 Year-end Update: Full steam ahead!  说到了这个。https://www.home-assistant.io/blog/2024/11/15/roadmap-2024h2/
作者: duanyudan123    时间: 2024-11-17 00:01
lichao622 发表于 2024-11-16 23:33
是不是要发布了。我看官方发的这篇 Roadmap 2024 Year-end Update: Full steam ahead!  说到了这个。https: ...

我们肯定不是首发国,一时半会买不到。不过可以确定硬件软件全部开源。但是会不会同时放出来就不知道了。
作者: 雪晴科技HTH    时间: 2025-1-7 21:54
duanyudan123 发表于 2024-10-28 17:06


                               
登录/注册后可看大图

大佬不行啊,这个按钮怎么无限跳

作者: duanyudan123    时间: 2025-1-9 08:20
雪晴科技HTH 发表于 2025-1-7 21:54
大佬不行啊,这个按钮怎么无限跳

esp32,这边你接的引脚的问题估计,估计接到高电平上去了。你再esphone反转一下




欢迎光临 『瀚思彼岸』» 智能家居技术论坛 (https://bbs.hassbian.com/) Powered by Discuz! X3.5