本帖最后由 nuknoop 于 2024-10-13 10:45 编辑
GroqCloud Whisper
原版集成可以正常使用,但由于国内网络限制(屏蔽)
在没有代理的情况下无法运行。
为此,开发了一个基于容器的代理程序的二次开发镜像以及修改版
既能解决网络问题,还能优化响应速度。
使用要求
- GroqCloud 账户:你可以在 GroqCloud 创建账户。
- API 密钥:在 GroqCloud 生成 API 密钥。
- 模型:GroqCloud 提供的 Whisper 模型每日可免费使用 28800 秒音频处理时间。
whisper-large-v3
distil-whisper-large-v3-en - 优化版的 whisper-large-v3
HACS 安装
将以下 URL 添加到 HACS 自定义仓库中。
OpenAI Whisper Cloud 集成,重启 Home Assistant。
手动安装
- 下载 仓库。
- 将
custom_components 文件夹中的内容复制到 Home Assistant 的 custom_components 文件夹中。
- 重启 Home Assistant。
配置参数
在 Home Assistant 中配置以下参数:
- api_key (必填): API 密钥
- proxy (必填): 代理地址,需搭配容器镜像
- temperature (可选): 采样温度,范围 0-1,默认 0.4
- prompt (可选): 提高语音识别准确性的提示词,默认 ""
提供逗号分隔的词汇或名称列表,例如: "open, close, Chat GPT-3, DALL·E"
注意:配置可在 Home Assistant 仪表盘完成(不支持 YAML 配置)
容器使用方法
拉取镜像:
docker pull ghcr.io/knoop7/ha-openai-whisper-stt-api/groq-proxy2:20240830
运行镜像容器
docker run -d -p 8020:8020 \
-e HOST="0.0.0.0" \
-e PORT="8020" \
-e PROXY_URL="" \
-e AUDIO_URL="https://api.groq.com/openai/v1/audio/transcriptions" \
-e TIMEOUT="60" \
ghcr.io/knoop7/ha-openai-whisper-stt-api/groq-proxy2:20240830
|