本帖最后由 louis_lee 于 2022-11-19 11:41 编辑
最近有朋友在做集成的时候,想了解验证码如何自动识别,所以我就把最近用到比较好的python package ddddocr分享下~
由于HA镜像底层OS是Alpine,pip install ddddocr会遇到各种坑,所以我觉得最好的部署方式就是docker了,不用考虑依赖,十分方便。而且ddddocr的开发者都已经给你封装好了,做成了本地web服务,部署完docker后,就可以通过REST API访问。这就很方便啦,REST API与语言无关,这意味你可以用自定义集成、Node-Red或是其他任何你喜欢的方式开发应用,需要识别验证码,只要调用这个API就可以。
这是项目地址,有需要的朋友可以了解下:https://github.com/sml2h3/ocr_api_server
我把它做成了addon,利用HA进行管理、部署(以免非addon安装以外的容器被认为unhealthy,目前还OK,不知道以后的版本是否趋严),有需要的朋友可以clone下来,在加载项-》加载项商店就可以找到,直接安装即可。
cd /addons
git clone https://github.com/louisslee/ocr_api_server.git
让我们试试效果吧,就拿论坛验证码试试
我们用postman获取了个图片验证码,e7G6。为了方便展示,我找了在线工具转成了base64,然后再调用ddddocr的REST API(调用方式见README.md)。
精准识别~
当然了,ddddocr识别的验证码范围很多,除了文字的以外,滑块、点选的都可以试试。有兴趣的朋友可以去项目原地址了解下:https://github.com/sml2h3/ddddocr
|