GitHub - quuee/MyScan: opencv扫描文档

依赖

pip install opencv-python pytesseract ultralytics

额外安装 sudo apt install tesseract-ocr 才能使用 pytesseract（目前不会用，效果没有）

1、目标检测精度勉强够用
2、背景漂白时，总把文字、线框给腐蚀掉（有孔洞），不够清晰，需要增强清晰度采用 unet 进行去噪（目前只是训练黑白图、清晰度还不够，没有粗体、表格、多种语言和字体，样本太少了）
3、透视变换不够智能，矫正后的图像包含了原始图像的边缘（如纸张边框、阴影、污渍），希望只保留内容区域，去除边缘，得到一个“纯白色背景 + 内容居中”的干净矩形图特别是弯曲的图片文字也是弯曲，如何将每个文字都变换使用 ocr 工具如 tesseract-ocr、PaddleOCR、Layout Parser 识别文字区域
4、需要提取文字、水印原本的颜色回显（unet 1、需权重基于“是否为文字”，2、制作彩色 clean 图，然后重新训练）
5、添加自定义水印（opencv 即可实现）
6、增强内容（文字表格图案）边缘细节

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.vscode		.vscode
scan_util		scan_util
test_image		test_image
unet		unet
yolov8		yolov8
.gitignore		.gitignore
README.md		README.md
camera_scan_document.py		camera_scan_document.py
requirements.txt		requirements.txt
scan_document.py		scan_document.py