找回密码
 立即注册

微信扫码登录

搜索
查看: 9815|回复: 33

[插件集成] 小白开发百度语音转文字插件STT,本地语音控制

[复制链接]

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
发表于 2024-4-2 22:45:26 | 显示全部楼层 |阅读模式
本帖最后由 huishizhao 于 2024-4-4 11:19 编辑

小白花费二周开发百度语音转文字插件,在同步和异步执行上折腾了好久。

https://github.com/huishizhao/Baidu_sst

支付宝充值预付费,TTS和STT,本月开发调用比较多,1.8元, 基本每个月1元钱.
V1.01
*修复中文配置错误
* 变更DOMAIN 读取设置,兼容更多平台版本使用。
粤语和四川话 百度目前还没有开放。


                               
登录/注册后可看大图




Screenshot 2024-04-04 111208.png
Screenshot 2024-04-04 111751.png

评分

参与人数 4金钱 +62 收起 理由
c1pher_小愚 + 20 论坛有你更精彩!
隔壁的王叔叔 + 12 高手,这是高手!
dscao + 20 效果不错,速度比addon部署的快多了。.
DDDear + 10 膜拜大神!

查看全部评分

回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-3 22:57:33 | 显示全部楼层
flyice 发表于 2024-4-3 15:52
老哥,配置后显示未加载

可以看到集成信息吗?我是树莓派Supervisor安装,第一次做集成没什么经验。

baidustt

baidustt
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-4 10:56:55 | 显示全部楼层
flyice 发表于 2024-4-4 01:17
可以看到,但是添加不了,显示not load

更新了一版,应该是读取manifest.json 时出的错误,对于不同系统支持问题。可以再试一下
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-4 10:58:11 | 显示全部楼层
本帖最后由 huishizhao 于 2024-4-4 11:21 编辑
1uv_can 发表于 2024-4-3 23:25
这个咋用啊?是本地训练的模型吗?

是将语音通过API送到百度云AI平台,返回文字给HA Assist 使用,直接使用不需任何训练,我是小白还没有能力开发或调用自训练模型。
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-6 12:28:57 | 显示全部楼层
flyice 发表于 2024-4-6 10:11
我是使用的docker容器版,更新了你新发布的集成,还是加载不了。显示:无法加载配置向导: {"message":"In ...

能否将报错的界面及Log 贴上?我也是Docker的Supervisor版本,中英文都没有发现问题
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-6 21:18:28 | 显示全部楼层
flyice 发表于 2024-4-6 13:08
解决了,是config_flow里import manifest的问题,删掉就正常了

我github 里面新上传的已经改了,你没有重新下载
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-8 19:53:58 | 显示全部楼层
kylin_fedora 发表于 2024-4-8 14:15
硬件是黑豹panther-X2,系统是刷的haos
系统信息是:Core:2024.4.1
Supervisor:2024.03.1

显示不了你第一个图片,无法看到你到注释掉了什么内容。建议重新发一下注释内容
百度TTS可以吗?如果没有先安装一下百度TTS,如果TTS可以,STT就应该可以。
https://www.home-assistant.io/integrations/baidu/
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-10 20:07:21 | 显示全部楼层
1uv_can 发表于 2024-4-9 22:33
edge tts 还能用不。。。

不影响,如果百度TTS能用,百度STT接口API与TTS是一个API文件,说明系统中已经有这个API文件了,系统不缺少文件。
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-4-10 20:18:58 | 显示全部楼层
本帖最后由 huishizhao 于 2024-4-10 20:25 编辑

request pv too much', 'err_no': 3305, 'sn': '386874002531595317040'}
三种可能,
一是免费次数已经耗尽,在相同位置开通接口的付费功能。

二是将麦克风音量控制好,或在说话时按一下麦克风图标,说完话还要按一下麦克风图标来结束,否则一直在传语音流给百度,超出来处理的音频长度了。之前将电脑麦克风调大了,只有说完再按一下麦克风图标,才能有效识别,现在只调到音量20%左右,可以自动识别语音结束。

三是,只能选择普通话和英文,粤语及四川话百度没有开放。我选择了粤语就会出现request pv too much。
回复

使用道具 举报

6

主题

58

回帖

726

积分

高级会员

积分
726
金钱
662
HASS币
0
 楼主| 发表于 2024-7-7 20:47:27 | 显示全部楼层
本帖最后由 huishizhao 于 2024-7-7 20:59 编辑
fengjun 发表于 2024-5-10 15:34
语音在哪输入的。。。
右上角
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian ( 晋ICP备17001384号-1 )

GMT+8, 2025-10-15 04:04 , Processed in 0.081708 second(s), 9 queries , MemCached On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表