『瀚思彼岸』» 智能家居技术论坛

 找回密码
 立即注册
查看: 2545|回复: 10

[智能音箱] 自制智能音箱,高度自定义

[复制链接]

20

主题

219

帖子

2173

积分

金牌会员

Rank: 6Rank: 6

积分
2173
金钱
1939
HASS币
87
发表于 2023-3-7 11:44:40 | 显示全部楼层 |阅读模式
看到一个ESP32-LyraTD-MSC开发板,能不能制作一个音箱,需要实现通过语音唤醒,接受语音信息后通过语音识别转化成文字,将文字信息通过MQTT发送出来,然后MQTT接受到文字以后可以TTS出来,或者可以通过DLAN或者MPD服务接受音频并播放出来,另外还需要可以通过MQTT指令免语音激活,激活以后等待指令。

把这个诉求发送给chatgpt以后,它卡卡写了好多,奈何我一点都看不懂,有懂的大佬可以帮忙实现一下吗?


回复

使用道具 举报

0

主题

79

帖子

650

积分

高级会员

Rank: 4

积分
650
金钱
571
HASS币
0
发表于 2023-3-9 17:52:11 | 显示全部楼层
同求,关注
回复

使用道具 举报

24

主题

623

帖子

2756

积分

金牌会员

Rank: 6Rank: 6

积分
2756
金钱
2123
HASS币
40
发表于 2023-3-10 00:03:24 | 显示全部楼层
为什么MQTT接受到文字以后要TTS出来呢?
把自己说的话,再TTS出来?

不过能语音识别后能得到文字的多数是要在线的,不然自己的服务器应该跑不了这么大的数据计算.
在线的多数是要收费的,所以到现在也没类似的方案.
个人想法
回复

使用道具 举报

24

主题

623

帖子

2756

积分

金牌会员

Rank: 6Rank: 6

积分
2756
金钱
2123
HASS币
40
发表于 2023-3-10 00:29:17 | 显示全部楼层
我知道了,你是看了这篇帖子吧
https://bbs.hassbian.com/thread-19830-1-1.html

他是劫持了若琪. 识别语音还是若琪的服务在做.
对外的现在只有科大是最好的了吧.
科大给1年免费50万次的试用. 之后价格吓死人.
这是在线的,速度很快. 离线的目前应该还没有.要是有了,那些公司的收益都会受到影响
回复

使用道具 举报

20

主题

219

帖子

2173

积分

金牌会员

Rank: 6Rank: 6

积分
2173
金钱
1939
HASS币
87
 楼主| 发表于 2023-3-10 09:20:09 | 显示全部楼层
sasukebinbin 发表于 2023-3-10 00:29
我知道了,你是看了这篇帖子吧
https://bbs.hassbian.com/thread-19830-1-1.html

额 这就是我的哈,这个主要是不能够无语音激活,后续和GPT对话的时候有一些体验不是很好,每次说话前需要通过唤醒词激活。
回复

使用道具 举报

24

主题

623

帖子

2756

积分

金牌会员

Rank: 6Rank: 6

积分
2756
金钱
2123
HASS币
40
发表于 2023-3-10 10:40:19 | 显示全部楼层
jsfer888 发表于 2023-3-10 09:20
额 这就是我的哈,这个主要是不能够无语音激活,后续和GPT对话的时候有一些体验不是很好,每次说话前需要 ...

彻底晕了 居然都是你.
大神也来提问了啊.
话说,我刚下单了那个音响,准备拿来玩一玩.

我目前用的是离线语音识别,可以设置8个命令不用唤醒. 但是不能讲语音识别为文字.
如果是对话的话,我觉得还是唤醒一下比较好,不然容易出错.  你说的是不是连续对话功能.
这个应该要看若琪是不是支持了吧. 就好像,天猫精灵可以,Siri不可以
回复

使用道具 举报

20

主题

219

帖子

2173

积分

金牌会员

Rank: 6Rank: 6

积分
2173
金钱
1939
HASS币
87
 楼主| 发表于 2023-3-10 10:45:20 | 显示全部楼层
sasukebinbin 发表于 2023-3-10 10:40
彻底晕了 居然都是你.
大神也来提问了啊.
话说,我刚下单了那个音响,准备拿来玩一玩.

我想实现的是将来和Chatgpt聊天的时候,根据chatgpt的聊天内容来判断是否有必要免语音激活,这样就可以无感对话了
回复

使用道具 举报

24

主题

623

帖子

2756

积分

金牌会员

Rank: 6Rank: 6

积分
2756
金钱
2123
HASS币
40
发表于 2023-3-10 11:47:46 | 显示全部楼层
jsfer888 发表于 2023-3-10 10:45
我想实现的是将来和Chatgpt聊天的时候,根据chatgpt的聊天内容来判断是否有必要免语音激活,这样就可以无 ...

这个想法很好. 这个应该要看若琪API了,那个劫持到底是怎么劫持的. 不单单劫持还得迷惑.
等我拿到了再研究研究. 话说,Dot固件是在哪里啊? 网上什么都没搜到
回复

使用道具 举报

20

主题

219

帖子

2173

积分

金牌会员

Rank: 6Rank: 6

积分
2173
金钱
1939
HASS币
87
 楼主| 发表于 2023-3-22 17:47:08 | 显示全部楼层
sasukebinbin 发表于 2023-3-10 11:47
这个想法很好. 这个应该要看若琪API了,那个劫持到底是怎么劫持的. 不单单劫持还得迷惑.
等我拿到了再研 ...

在折腾群里面哈
回复

使用道具 举报

0

主题

6

帖子

72

积分

注册会员

Rank: 2

积分
72
金钱
66
HASS币
0
发表于 2023-3-27 00:50:05 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian

GMT+8, 2024-4-20 03:29 , Processed in 0.056874 second(s), 31 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表