本帖最后由 riceball 于 2022-6-9 17:59 编辑
为啥要弄离线语音合成?
简单来说,就是服务和产品分别,具体请见我前面写的 HA智能硬件采购避坑指要(一) Zigbee篇 的前述.
语音合成Addon的由来和简单介绍
内部测试,目前刚刚完成了常规语音合成和AI语音合成,基本可用.本来想偷个懒,直接在OpenTTS上改来着,可是不知道作者是废弃了OpenTTS还是什么原因,我的两个PR都没有回音.
所以干脆新开项目: https://github.com/offline-ai/hassio-addons, 修改内容如下:
- [X] Upgrade Coqui-TTS from 0.3.1 to latest version 0.7.0dev
- [X] fix: Check if optional dependencies are installed before loading ZH/JA phonememizer
- [X] Remove matplotlib (It is only useful during the train analysis phase).
- [X] Optimal Coqui-TTS Models Size
- [ ] Optimal Coqui-TTS Models on Embedded device
- [X] Espeak Chinese locale missing
- [X] Show used languages only
- [X] Can not use SSML on HA
- [X] Add preferred voice for language option
目前 tts-zh addon 包含中英文语言(en 和zh ), 以及常规语音合成(ESpeak)和AI语音合成(Coqui)引擎
食用方法
点击添加仓库地址
或者手动添加仓库地址: https://github.com/offline-ai/hassio-addons
Offline TTS Addon 配置
可以在附加配置中设定各个语言的首选声音,对与盒子之类CPU比较弱的不妨设置首选声音为:
- lang: zh
voice: espeak:zh-cmn
- lang: en
voice: espeak:en-us
支持中英文多语言混和输入,直接在文本中输入:
<speak>
<s lang="zh">欢迎使用离线语音合成 </s>
<s lang="en-us">Welcome to Offline Speech Synthesis.</s>
</speak>
作了简单的Cache, 相同的话,第二次输出就快.
安装后, 修改 configuration.yaml file:
tts:
- platform: marytts
voice: tts:zh_baker # 默认语音, 如果是盒子,或者CPU性能较弱,请改为 espeak:zh-cmn
中英引擎对比以及语音列表如下
- Coqui-TTS: Patched and embedded version of Coqui-TTS latest dev(0.7.0) version
- TTS 系统名称:
tts
- 语音质量:好
- 性能:不好,需要强大的 CPU 和足够的内存
- 资源开销:高
- 内置语音模型:
zh_baker : Chinese Voice from baker [F]
en_vctk : English Multi Speakers Voice [MF]
- ESpeaker
- TTS 系统名称:
espeak
- 语音质量:差,像机器人。
- 性能:非常好
- 资源开销:低
- 内置语音模型:
en-029 : English_(Caribbean) [M]
en-gb : English_(Great_Britain) [M]
en-gb-scotland : English_(Scotland) [M]
en-gb-x-gbclan : English_(Lancaster) [M]
en-gb-x-gbcwmd : English_(West_Midlands) [M]
en-gb-x-rp : English_(Received_Pronunciation) [M]
en-us : English_(America) [M]
zh-cmn : Chinese_(Mandarin) [M]
zh-yue : Chinese_(Cantonese) [M]
问题可能很多,请在本贴反馈.
Change logs
v1.2.1 (2022-06-07)
- use log_level option instead of debug now
- add preferred_voices option
v1.1.0 (2022-05-31)
Fix
- the online validator of swagger error: Can't read from file...
- Can not return voices on MaryTTS-compatible "/voices" endpoint
Feat
- add zh translation
- add tts-zh_lite, tts-en_lite
|