OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是 OCR 最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个 OCR 系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
如果是要在生产中使用,推荐使用 Python 版本或选择收费 OCR 服务,也可以尝试一下 飞桨 OCR 开源服务,但部署相对比较繁琐,本人目前还没有部署成功过。Go 版本仅用于学习、探索,效果非常赶人...
sudo apt update
1sudo apt install build-essential
2sudo apt-get install manpages-dev
3gcc --version
1sudo apt install tesseract-ocr
2sudo apt install libleptonica-dev
3sudo apt install libtesseract-dev
4# 安装简体中文语言包
5sudo apt install tesseract-ocr-chi-sim
1# 查看包含的语言包
2tesseract --list-langs
1go get github.com/otiai10/gosseract
1go install github.com/otiai10/ocrserver@latest
1PORT=8080 ocrserver
1# 如果是在 WSL2 中安装启动服务,需要执行此命令才能允许通过局域网 IP 进行访问
2netsh interface portproxy add v4tov6 listenport=8080 listenaddress=0.0.0.0 connectport=8080 connectaddress=::1
3# 查看端口代理列表
4netsh interface portproxy show all
启动服务后访问上面指定的 8080 端口即可看到 OCR 服务页面,如下所示:
onnxruntime
,注意避坑1pip install pytest -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
2# pip -v config list
1python -m pip install --upgrade pip
1python -m pip install tornado
2python -m pip install Pillow
3python -m pip install numpy
4python -m pip install opencv-python
5python -m pip install onnxruntime
6python -m pip install pyclipper
7python -m pip install shapely
1git clone https://github.com/DayBreak-u/chineseocr_lite.git
1cd ./chineseocr_lite
2python backend/main.py
内容声明 | |
---|---|
标题: Golang 和 Python 的 OCR 服务安装及使用 | |
链接: https://zixizixi.cn/golang-python-ocr | 来源: iTanken |
本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可,转载请保留此声明。
|