本帖最后由 z741554038 于 2025-3-3 14:27 编辑
我是来交作业的
语音转文字听广东话的朋友可以尝试用我这个配置,但是我实测 TTS 广东话没有我喜欢听的,所以用广东话讲,同普通话说。
注意:STT 模型改成 zipformer 的形式,AI 一直是给我 from_zipformer 的配置,其实 Sherpa Onnx 没有这个表达。
配置如下:
language: zh-CN
speed: 1
stt_model: custom_stt_model
stt_use_int8_onnx_model: true
stt_thread_num: 3
tts_model: vits-melo-tts-zh_en
tts_thread_num: 3
tts_speaker_sid: 0
debug: true
custom_stt_model: sherpa-onnx-zipformer-cantonese-2024-03-13
custom_stt_model_eval: |-
sherpa_onnx.OfflineRecognizer.from_transducer(
encoder="/stt-models/sherpa-onnx-zipformer-cantonese-2024-03-13/encoder-epoch-45-avg-35.int8.onnx",
decoder="/stt-models/sherpa-onnx-zipformer-cantonese-2024-03-13/decoder-epoch-45-avg-35.int8.onnx",
joiner="/stt-models/sherpa-onnx-zipformer-cantonese-2024-03-13/joiner-epoch-45-avg-35.int8.onnx",
tokens="/stt-models/sherpa-onnx-zipformer-cantonese-2024-03-13/tokens.txt",
num_threads=3,
decoding_method="greedy_search",
provider="cpu",
sample_rate=16000,
feature_dim=80,
debug=True
)
如果对你有帮助,请给我一个赞 !
|