找回密码
 立即注册
楼主: duanyudan123

[技术探讨] 本地AI对话代理

[复制链接]

3

主题

115

回帖

837

积分

高级会员

积分
837
金钱
719
HASS币
0
发表于 2024-6-11 23:29:28 来自手机 | 显示全部楼层
即使网络搞定,也只能是敲文字聊天吧?语音对话是否还要解决麦克风和扬声器等的硬件问题?
回复

使用道具 举报

76

主题

549

回帖

2734

积分

金牌会员

积分
2734
金钱
2104
HASS币
0
发表于 2024-6-12 10:36:09 | 显示全部楼层
我还是想着说能不能调用的api走魔法,ha不走魔法
回复

使用道具 举报

168

主题

2523

回帖

8392

积分

元老级技术达人

积分
8392
金钱
5696
HASS币
30
发表于 2024-6-12 11:22:03 | 显示全部楼层
grunner 发表于 2024-6-11 23:29
即使网络搞定,也只能是敲文字聊天吧?语音对话是否还要解决麦克风和扬声器等的硬件问题? ...

最简单的方式,ha官方出一个小音响,基于esp,平时还可以放音乐,音响可以运行本地大模型
回复

使用道具 举报

16

主题

212

回帖

1249

积分

金牌会员

积分
1249
金钱
1021
HASS币
0
 楼主| 发表于 2024-6-12 11:34:03 | 显示全部楼层
chaosl 发表于 2024-6-11 23:10
本地llm据说树莓派都可以跑,我之前用n100安装了集成,反应非常慢,而且效果也不行。但是官方说可以找一个 ...

是的我装了一个3060的推理服务器。速度很快。但是目前没有匹配的模型,有些模型支持函数,但是效果都不太好。等等官方这个模型看看把。官方这个模型是完全重构的专用模型
回复

使用道具 举报

16

主题

212

回帖

1249

积分

金牌会员

积分
1249
金钱
1021
HASS币
0
 楼主| 发表于 2024-6-12 11:38:45 | 显示全部楼层
grunner 发表于 2024-6-11 23:29
即使网络搞定,也只能是敲文字聊天吧?语音对话是否还要解决麦克风和扬声器等的硬件问题? ...

纯本地的是不需要魔法的。不用敲键盘。目前已经可以使用本地语音唤醒、语音转写、转写语音。硬件也已经准准备好了。就差对话代理了。在外部推理服务器的作用下这些功能目前使用使用是没有问题的。就是这个对话代理不太行。所以需要等等
回复

使用道具 举报

16

主题

212

回帖

1249

积分

金牌会员

积分
1249
金钱
1021
HASS币
0
 楼主| 发表于 2024-6-12 11:43:19 | 显示全部楼层
bugensui 发表于 2024-6-12 11:22
最简单的方式,ha官方出一个小音响,基于esp,平时还可以放音乐,音响可以运行本地大模型 ...

小音箱已经有国外的公司在做了,不确定什么时候推出。在音响上跑模型肯定不行的会把音响烧掉的。
回复

使用道具 举报

168

主题

2523

回帖

8392

积分

元老级技术达人

积分
8392
金钱
5696
HASS币
30
发表于 2024-6-12 12:09:37 | 显示全部楼层
duanyudan123 发表于 2024-6-12 11:43
小音箱已经有国外的公司在做了,不确定什么时候推出。在音响上跑模型肯定不行的会把音响烧掉的。 ...

homepod mini是怎么实现的呢?难道是依靠的苹果手机吗?
回复

使用道具 举报

16

主题

212

回帖

1249

积分

金牌会员

积分
1249
金钱
1021
HASS币
0
 楼主| 发表于 2024-6-12 12:13:23 | 显示全部楼层
bugensui 发表于 2024-6-12 12:09
homepod mini是怎么实现的呢?难道是依靠的苹果手机吗?

目前的各个厂家的都是在云端完成。也就是音响只负责将音频流打包发送,或者将音频流解码。
回复

使用道具 举报

168

主题

2523

回帖

8392

积分

元老级技术达人

积分
8392
金钱
5696
HASS币
30
发表于 2024-6-12 12:22:52 | 显示全部楼层
duanyudan123 发表于 2024-6-12 12:13
目前的各个厂家的都是在云端完成。也就是音响只负责将音频流打包发送,或者将音频流解码。 ...

那不知道,大模型交给ha系统行不行,系统里直接集成大模型,音响负责收声和发声
回复

使用道具 举报

0

主题

27

回帖

488

积分

中级会员

积分
488
金钱
461
HASS币
0
发表于 2024-6-12 15:04:32 | 显示全部楼层
我用google generative ai,跑通了,因为google的api有免费额度,而Openai的没有。目前来看效果还算可以,可以控制灯光的开关,但指令一定要准确,要带区域+灯光才可以,从图中的对话也能看出来,模型不具备上下文推理功能,应该是还没有添加。
微信图片_20240612150402.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian ( 晋ICP备17001384号-1 )

GMT+8, 2025-5-6 15:17 , Processed in 0.669324 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表