『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
查看: 4225|回复: 26

[新奇玩法] 来一起用openai手搓siri吧【代码已贴】

[复制链接]

27

主题

1292

帖子

5873

积分

元老级技术达人

积分
5873
金钱
4556
HASS币
100
发表于 2023-12-2 18:38:26 | 显示全部楼层 |阅读模式
本帖最后由 25989406 于 2024-3-5 10:23 编辑

最近升级ha看了官方的新版本介绍后 瞬间来了兴趣,Year of the Voice - Chapter 4: Wake wordshttps://www.home-assistant.io/blog/2023/10/12/year-of-the-voice-chapter-4-wakewords/
看到了手搓siri的可能——自定义唤醒词,然后再用一个普通的麦克风,结合openai,一个更智能版本的siri不就出来了吗?赶紧淘宝下单了两个atom
来论坛翻了一下目前大家都是用node做的

https://bbs.hassbian.com/thread-22418-1-1.html
但node这个我就不太喜欢了,因为俺没有node,为啥不能直接在ha里搞定呢?既然是大模型那,那他说什么返回什么应该也可以按照我的设计来吧?没有必要中间再加一道中转吧。

所以就先搜了一下,主要有两个项目可以通过openai直接控制ha
https://github.com/alanjames1987/OpenAI-Control-HA
https://github.com/jekalmin/extended_openai_conversation

但实际运行起来都不是太舒服,第一个只支持灯,作者后面也没有更新了。第二个太复杂,感觉很多东西没啥用。
所以我自己在OpenAI-Control-HA 的基础上做了一些简单调整,终于跑通了,逻辑跟五年前搞天猫精灵差不多,甚至还更简单

有一点遗憾的是我的atom唤醒词跑不起来,因为我不是os,docker部署的只能强行的用docker去跑homeassistant/amd64-addon-openwakeword:latest

但是就是运行不起来,有谁能跑起来的可以给我说一下~

没有语音唤醒,但是可以用按钮触发,先假装可以唤醒吧,哈哈哈,至少语音控制本身是没有啥问题了,除了tts stt都走了云端有点慢,再加上openai自身也是有些延时。
以下内容回帖可见
游客,如果您要查看本帖隐藏内容请回复



下面是openai的演示视频:建议手机观看,电脑看的时候声音听起来很奇怪


下面是国产通义千问的演示视频:



















回复

使用道具 举报

0

主题

10

帖子

136

积分

注册会员

Rank: 2

积分
136
金钱
126
HASS币
0
发表于 2023-12-2 18:52:13 | 显示全部楼层
来一起用openai手搓siri吧
回复

使用道具 举报

0

主题

3

帖子

71

积分

注册会员

Rank: 2

积分
71
金钱
68
HASS币
0
发表于 2023-12-2 20:53:47 | 显示全部楼层
刚到了个 echo 来学习下(
回复

使用道具 举报

40

主题

2176

帖子

8288

积分

元老级技术达人

积分
8288
金钱
6097
HASS币
110
发表于 2023-12-2 21:31:50 | 显示全部楼层
挺好 除了反应太慢,确实希望有轻量版的AI能离线部署,TTS STT做的好一点,语义能理解控制设备就够了,联网可以问些刁钻问题
每个房间部署一个mic,感觉可以格了各种智障音箱的命(到时候估计就会有这种版本的音箱卖了)
大佬....东北的?
回复

使用道具 举报

27

主题

1292

帖子

5873

积分

元老级技术达人

积分
5873
金钱
4556
HASS币
100
 楼主| 发表于 2023-12-2 21:49:28 | 显示全部楼层
本帖最后由 25989406 于 2023-12-4 10:19 编辑
ghostist 发表于 2023-12-2 21:31
挺好 除了反应太慢,确实希望有轻量版的AI能离线部署,TTS STT做的好一点,语义能理解控制设备就够了,联网 ...

再也不仅仅是电影情节了 有生之年应该能做得到 哈哈哈

东北的
回复

使用道具 举报

40

主题

2176

帖子

8288

积分

元老级技术达人

积分
8288
金钱
6097
HASS币
110
发表于 2023-12-2 22:05:50 | 显示全部楼层
25989406 发表于 2023-12-2 21:49
再也不仅仅是电影情节了 有生之年应该能做得到 哈哈哈

沈阳的

不求像贾维斯自己手搓代码执行
能挫个自动化就满足了
比如临时性的xx小时后关灯
或者模糊性的:自动控制房间空调到舒适温度(体感温度根据传感器、湿度、外部温度、后续反馈等,自己调节模式、温度、风速)
回复

使用道具 举报

27

主题

1292

帖子

5873

积分

元老级技术达人

积分
5873
金钱
4556
HASS币
100
 楼主| 发表于 2023-12-2 22:27:43 | 显示全部楼层
ghostist 发表于 2023-12-2 22:05
不求像贾维斯自己手搓代码执行
能挫个自动化就满足了
比如临时性的xx小时后关灯

做自动化有点复杂,https://github.com/jekalmin/extended_openai_conversation 但我看这哥们代码是应该已经实现了,我只是觉得没啥必要。
第二个,我觉得是大模型接ha时重点要做的,让他基于自己的理解主动帮我们操作一些事情,第一阶段前面我们把家里的数据喂给它,然后他能单独控制某个设备。第二阶段我理解就主要是从引导词上教育大模型应该就能做到了,甚至不用我们写代码
回复

使用道具 举报

17

主题

251

帖子

1888

积分

论坛DIY达人

积分
1888
金钱
1637
HASS币
20
发表于 2023-12-3 11:36:52 | 显示全部楼层
延迟、延迟、延迟,各种延迟叠加,这个太磨人了
回复

使用道具 举报

4

主题

228

帖子

4406

积分

元老级技术达人

积分
4406
金钱
4163
HASS币
40
发表于 2023-12-4 10:09:57 | 显示全部楼层
我为啥识别出来的繁体.,,,,
回复

使用道具 举报

0

主题

11

帖子

160

积分

注册会员

Rank: 2

积分
160
金钱
149
HASS币
0
发表于 2023-12-5 16:10:59 | 显示全部楼层
学习一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-11-25 11:38 , Processed in 0.281775 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表