『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
楼主: duanyudan123

[技术探讨] 本地AI对话代理

[复制链接]

3

主题

117

帖子

821

积分

高级会员

Rank: 4

积分
821
金钱
704
HASS币
0
发表于 2024-6-11 23:29:28 来自手机 | 显示全部楼层
即使网络搞定,也只能是敲文字聊天吧?语音对话是否还要解决麦克风和扬声器等的硬件问题?
回复

使用道具 举报

72

主题

552

帖子

2404

积分

金牌会员

Rank: 6Rank: 6

积分
2404
金钱
1847
HASS币
0
发表于 2024-6-12 10:36:09 | 显示全部楼层
我还是想着说能不能调用的api走魔法,ha不走魔法
回复

使用道具 举报

151

主题

2353

帖子

7301

积分

元老级技术达人

积分
7301
金钱
4943
HASS币
30
发表于 2024-6-12 11:22:03 | 显示全部楼层
grunner 发表于 2024-6-11 23:29
即使网络搞定,也只能是敲文字聊天吧?语音对话是否还要解决麦克风和扬声器等的硬件问题? ...

最简单的方式,ha官方出一个小音响,基于esp,平时还可以放音乐,音响可以运行本地大模型
回复

使用道具 举报

15

主题

186

帖子

1023

积分

金牌会员

Rank: 6Rank: 6

积分
1023
金钱
837
HASS币
0
 楼主| 发表于 2024-6-12 11:34:03 | 显示全部楼层
chaosl 发表于 2024-6-11 23:10
本地llm据说树莓派都可以跑,我之前用n100安装了集成,反应非常慢,而且效果也不行。但是官方说可以找一个 ...

是的我装了一个3060的推理服务器。速度很快。但是目前没有匹配的模型,有些模型支持函数,但是效果都不太好。等等官方这个模型看看把。官方这个模型是完全重构的专用模型
回复

使用道具 举报

15

主题

186

帖子

1023

积分

金牌会员

Rank: 6Rank: 6

积分
1023
金钱
837
HASS币
0
 楼主| 发表于 2024-6-12 11:38:45 | 显示全部楼层
grunner 发表于 2024-6-11 23:29
即使网络搞定,也只能是敲文字聊天吧?语音对话是否还要解决麦克风和扬声器等的硬件问题? ...

纯本地的是不需要魔法的。不用敲键盘。目前已经可以使用本地语音唤醒、语音转写、转写语音。硬件也已经准准备好了。就差对话代理了。在外部推理服务器的作用下这些功能目前使用使用是没有问题的。就是这个对话代理不太行。所以需要等等
回复

使用道具 举报

15

主题

186

帖子

1023

积分

金牌会员

Rank: 6Rank: 6

积分
1023
金钱
837
HASS币
0
 楼主| 发表于 2024-6-12 11:43:19 | 显示全部楼层
bugensui 发表于 2024-6-12 11:22
最简单的方式,ha官方出一个小音响,基于esp,平时还可以放音乐,音响可以运行本地大模型 ...

小音箱已经有国外的公司在做了,不确定什么时候推出。在音响上跑模型肯定不行的会把音响烧掉的。
回复

使用道具 举报

151

主题

2353

帖子

7301

积分

元老级技术达人

积分
7301
金钱
4943
HASS币
30
发表于 2024-6-12 12:09:37 | 显示全部楼层
duanyudan123 发表于 2024-6-12 11:43
小音箱已经有国外的公司在做了,不确定什么时候推出。在音响上跑模型肯定不行的会把音响烧掉的。 ...

homepod mini是怎么实现的呢?难道是依靠的苹果手机吗?
回复

使用道具 举报

15

主题

186

帖子

1023

积分

金牌会员

Rank: 6Rank: 6

积分
1023
金钱
837
HASS币
0
 楼主| 发表于 2024-6-12 12:13:23 | 显示全部楼层
bugensui 发表于 2024-6-12 12:09
homepod mini是怎么实现的呢?难道是依靠的苹果手机吗?

目前的各个厂家的都是在云端完成。也就是音响只负责将音频流打包发送,或者将音频流解码。
回复

使用道具 举报

151

主题

2353

帖子

7301

积分

元老级技术达人

积分
7301
金钱
4943
HASS币
30
发表于 2024-6-12 12:22:52 | 显示全部楼层
duanyudan123 发表于 2024-6-12 12:13
目前的各个厂家的都是在云端完成。也就是音响只负责将音频流打包发送,或者将音频流解码。 ...

那不知道,大模型交给ha系统行不行,系统里直接集成大模型,音响负责收声和发声
回复

使用道具 举报

0

主题

27

帖子

362

积分

中级会员

Rank: 3Rank: 3

积分
362
金钱
335
HASS币
0
发表于 2024-6-12 15:04:32 | 显示全部楼层
我用google generative ai,跑通了,因为google的api有免费额度,而Openai的没有。目前来看效果还算可以,可以控制灯光的开关,但指令一定要准确,要带区域+灯光才可以,从图中的对话也能看出来,模型不具备上下文推理功能,应该是还没有添加。
微信图片_20240612150402.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-12-27 06:27 , Processed in 0.055083 second(s), 32 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表