找回密码
 立即注册
搜索
查看: 1988|回复: 21

[经验分享] HA TTS接入阿里云百炼平台语音合成CosyVoice大模型

[复制链接]

1

主题

1

回帖

78

积分

注册会员

积分
78
金钱
76
HASS币
0
发表于 2025-2-23 14:51:03 | 显示全部楼层 |阅读模式
阿里云百炼平台开通送token

通过这个项目 https://github.com/itning/hass-aliyun_bailian_tts 打通HA TTS和阿里云百炼平台

评分

参与人数 3金钱 +40 收起 理由
jimgo + 10 论坛有你更精彩!
25989406 + 10 请收下我的膝盖
dscao + 20 感谢楼主分享!

查看全部评分

回复

使用道具 举报

42

主题

498

回帖

3182

积分

论坛元老

积分
3182
金钱
2642
HASS币
10
发表于 2025-2-23 14:56:46 | 显示全部楼层
感谢分享,star一下
回复

使用道具 举报

76

主题

588

回帖

2897

积分

金牌会员

积分
2897
金钱
2228
HASS币
0
发表于 2025-2-23 15:03:32 | 显示全部楼层
正好需要这个tts。哈哈
回复

使用道具 举报

19

主题

85

回帖

505

积分

高级会员

积分
505
金钱
401
HASS币
0
发表于 2025-2-23 17:53:11 | 显示全部楼层
本帖最后由 ifreeswan 于 2025-2-23 21:07 编辑

新用户免费。
回复

使用道具 举报

24

主题

355

回帖

1552

积分

金牌会员

积分
1552
金钱
1173
HASS币
0
发表于 2025-2-23 23:35:10 | 显示全部楼层
感谢。阿里的tts还算不错,发音比较自然,接近与MS Edge TTS的水平。
回复

使用道具 举报

1

主题

26

回帖

314

积分

中级会员

积分
314
金钱
287
HASS币
0
发表于 2025-2-24 00:16:02 | 显示全部楼层
请问实测,控制一次设备的开/关,TTS需要消耗多少Token?我每天大概需要语音控制设备最多50次,其它场景不用TTS,不知道送的100万Token,够用多久的
回复

使用道具 举报

24

主题

355

回帖

1552

积分

金牌会员

积分
1552
金钱
1173
HASS币
0
发表于 2025-2-24 02:39:13 | 显示全部楼层
本帖最后由 itispip 于 2025-2-24 15:09 编辑
demon3434 发表于 2025-2-24 00:16
请问实测,控制一次设备的开/关,TTS需要消耗多少Token?我每天大概需要语音控制设备最多50次,其它场景不 ...

昨天到今天,已经欠费0.55. 100万是大模型token,tts免费token是2000
回复

使用道具 举报

31

主题

1445

回帖

6650

积分

元老级技术达人

积分
6650
金钱
5149
HASS币
100
发表于 2025-2-24 10:56:56 | 显示全部楼层
想学习一下楼主用什么插件/框架 让ai写代码的,提示词怎么引导的
回复

使用道具 举报

176

主题

2641

回帖

8867

积分

元老级技术达人

积分
8867
金钱
6040
HASS币
50
发表于 2025-2-24 11:49:24 | 显示全部楼层
本帖最后由 bugensui 于 2025-2-24 11:50 编辑
25989406 发表于 2025-2-24 10:56
想学习一下楼主用什么插件/框架 让ai写代码的,提示词怎么引导的

这个我来回答你下,周末2天,我用deepseek ai写了2个ha的集成,都是完全可用不报错的状态,deepseek 确实挺适合写代码的,但是完全0基础的小白可能稍微有点困难,我让ai写了,一个是tts集成,给ha发声的,一个是家里智能音响完善的集成,就是之前的集成有些功能没有,我让ai帮我完善了几个功能。

1,首先说清楚需求,描述的越清楚越好,ai会给出第一次完整代码,2,不出意外,肯定不能一次成功,把ha里的这个集成的报错信息,反馈给ai,让他修复代码,3,重复个几次,基本上就能成功,当然描述的也得稍微专业点。


我的描述:帮我开发1个Home Assistant的tts文本转语音集成,tts的文本合成语音服务是部署在docker里,是用get请求就可以获得结果,get请求的地址是http://192.168.0.101:8088/tts?text=苹果&voice=zh-TW-HsiaoChenNeural, 其中text后面是要生成语音的文本内容,文本内容里如果遇到数字+%,需要转换为百分之+数字,voice是具体播报的声音风格,获取到的结果是json,{"url":"/a/1740159032047.mp3"} ,url就是生成语音的文件链接

唯一没有解决,这个自定义集成的logo是没有的,ai给的解决方案也不行,不知道怎么显示集成logo
回复

使用道具 举报

0

主题

200

回帖

1682

积分

金牌会员

积分
1682
金钱
1482
HASS币
0
发表于 2025-2-24 12:10:15 | 显示全部楼层
厉害,感谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Hassbian ( 晋ICP备17001384号-1 )

GMT+8, 2025-6-22 14:53 , Processed in 0.272399 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表