2024年1月

先对pdf数据格式做统一的处理,二值化,尽可能保证文字为纯黑,背景为白,图片不考虑
拉高对比度,或者根据文字rgb和背景rgb的差做二值化,两大问题:一:避免浅色文字和拍照时带阴影的背景被同时变白或变黑,错误二值化;二:水印与文字要区分开
对图片做最大池化,再二值化区分文字区域和空白区域,根据黑色区域的像素位置(可以先对黑色区域画框)反向计算出图片中的文本区域,根据文本区域做第一步裁剪,可以理解为换分段落,将分段排序,再做单行文本切割和文字识别。

kernel objects nvidia-fs这个选项是一个针对容器优化的文件系统,可能会提高容器中使用物理主机上的gpu的性能
安装过程中提示
sh: 1: lsmod: not found
sh: 1: dkms: not found
安装lsmod:https://commandnotfound.cn/linux/1/340/lsmod-%E5%91%BD%E4%BB%A4
ubuntu运行命令sudo apt-get install kmod(sudo根据情况添加,root用户不需要)
安装dkms:https://www.zhihu.com/question/474222642#%E7%BC%96%E8%AF%91nvidia%E9%A9%B1%E5%8A%A8%E6%A8%A1%E5%9D%97
sudo apt-get install dkms

nvidia-fs没有安装成功,sad

gpu环境配置:

安装cuda和cudnn

nvidia-smi查看gpu驱动以及支持的最高cuda版本
对应表格中的版本依次安装cuda、cudnn、TensorRT
版本对应表:https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements
cuda:https://developer.nvidia.com/cuda-toolkit-archive
cudnn:https://developer.nvidia.com/rdp/cudnn-archive
TensorRT:https://developer.nvidia.com/tensorrt-download
cuda安装直接使用官网的安装命令安装
cuda安装.png
参考安装方式:https://blog.csdn.net/h3c4lenovo/article/details/119003405
安装完成后记得配置环境变量
安装cudnn比较简单,只需要把文件复制到指定的目录,授予ar读写权限就可以了

安装tensorrt

https://zhuanlan.zhihu.com/p/392143346

安装cnocr(装新版再替换为旧版)

参考链接:https://cnocr.readthedocs.io/zh/latest/install/
安装命令:pip install cnocr[ort-gpu]
卸载新版onnxruntime:pip uninstall onnxruntime-gpu
安装旧版(指定版本的onnxruntime-gpu):pip install onnxruntime-gpu==1.8

替换为旧版pytorch
历史版本查询下载链接:https://pytorch.org/get-started/previous-versions/

安装过程可能会有版本过老不兼容的情况,根据每个包的发布时间大概推算安装一个,先从pip install cnocr[ort-gpu]==(指定版本)开始,然后pip install cnstd(指定版本)然后pip install 自己下载的torch包

这步完成之后就可以运行了,如果运行过程中出现cv2库import异常,需要继续安装opengl库

ubuntu系统不自带opengl库,需要用apt命令安装,参考下面的链接
https://blog.csdn.net/chengde6896383/article/details/88028826
安装编译器与基本库函数:sudo apt-get install build-essential
安装OpenGL Library:sudo apt-get install libgl1-mesa-dev
安装OpenGL Utilities:sudo apt-get install libglu1-mesa-dev
安装OpenGL Utility Toolkit:sudo apt-get install libglut-dev
注意:在这一步的时候,可能会出现以下情况,shell提示:
Reading package lists... Done
Building dependency tree
Reading state information... Done
E: Unable to locate package libglut-dev
将上述sudo apt-get install libglut-dev命令改成sudo apt-get install freeglut3-dev即可。