本帖最后由 dscao 于 2025-2-11 17:27 编辑
效果还不错,本地tts在小主机上也基本上可以用了。 本地中文语言方面又进了一大步。J4125 allinone 一般一句话tts在3秒左右,stt 30个字左右的一句话约8秒。如果用性能强的主机速度上肯定更好。
因为没有latest,docker 部署需要在最后加上版本号,即 :0.2.6
群晖中Container manager项目部署:
version: "3.0"
services:
certimate:
image: ghcr.io/ptbsare/home-assistant-addons/amd64-addon-sherpa-onnx-tts-stt:0.2.6
container_name: sherpa-onnx-tts-stt
environment:
LANGUAGE: "zh-CN"
STT_MODEL: "sherpa-onnx-paraformer-zh-2023-03-28"
SPEED: "1.2"
STT_USE_INT8_ONNX_MODEL: "True"
STT_THREAD_NUM: "3"
TTS_MODEL: "matcha-icefall-zh-baker"
TTS_THREAD_NUM: "3"
TTS_SPEAKER_SID: "0"
DEBUG: "True"
ports:
- 10400:10400
restart: unless-stopped
后来用 mac mini m4测试了一下,基本是秒出结果。
|