当前位置：首页 > news >正文

别再手动敲字了！用Python的EasyOCR库，5分钟搞定图片文字批量提取

news 2026/5/25 15:22:14

5行代码解放双手用PythonEasyOCR打造智能图片转文字工具每天面对堆积如山的发票、会议纪要截图或纸质文档手动录入文字是否让你抓狂作为一款基于深度学习的OCR工具EasyOCR能以接近零代码的方式将图片中的文字转化为可编辑内容。本文将带你从安装到实战用Python轻松实现批量图片转文字彻底告别键盘敲到手软的日子。1. 环境配置与快速上手1.1 极简安装指南EasyOCR的安装只需一条命令但需注意以下依赖关系pip install easyocr opencv-python pillow torch首次运行时工具会自动下载预训练模型。若网络环境不稳定建议手动下载模型文件约2.3GB并放置到指定目录Windows:C:\Users\[用户名]\.EasyOCR\modelLinux/Mac:~/.EasyOCR/model提示中文识别需下载chinese_sim模型多语言混合识别建议同时下载english模型1.2 第一个识别案例用5行代码实现基础识别功能import easyocr reader easyocr.Reader([ch_sim, en]) # 加载中英文模型 results reader.readtext(invoice.jpg) # 识别图片 for (bbox, text, prob) in results: # 遍历识别结果 if prob 0.6: # 过滤低置信度结果 print(f{text} ({prob:.2%}))典型输出示例发票编号VAT20230001 (98.23%) 开票日期2023-07-15 (95.41%) 金额¥2,880.00 (99.07%)2. 高级应用场景实战2.1 批量处理文件夹图片结合glob模块实现自动化批量识别import glob from pathlib import Path def batch_recognize(input_dir, output_file): reader easyocr.Reader([ch_sim]) with open(output_file, w, encodingutf-8) as f: for img_path in glob.glob(f{input_dir}/*.jpg): results reader.readtext(img_path) f.write(f\n{Path(img_path).name}:\n) f.write(\n.join([text for _, text, _ in results])) batch_recognize(scanned_docs, output.txt)2.2 表格数据提取优化针对财务报表等结构化数据可通过参数调整提升识别精度参数推荐值作用说明text_threshold0.8提高文本检测阈值width_ths0.3减少列合并概率paragraphFalse禁用段落合并batch_size4加速批量处理优化后的调用示例reader.readtext(financial_statement.png, text_threshold0.8, width_ths0.3, batch_size4)3. 疑难问题解决方案3.1 低质量图片处理技巧模糊图片增加contrast_ths参数值建议0.3-0.5倾斜文字设置rotation_info[90,180,270]自动旋转检测背景干扰预处理时使用OpenCV增强对比度import cv2 def preprocess_image(img_path): img cv2.imread(img_path) img cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img cv2.equalizeHist(img) # 直方图均衡化 return img processed preprocess_image(blurry_photo.jpg) reader.readtext(processed, contrast_ths0.4)3.2 多语言混合识别策略当文档包含中英文混排时同时加载两种语言模型设置allowlist参数限定字符集使用batch_size提升处理速度reader easyocr.Reader([ch_sim,en]) # 限定只识别常用中英文和数字 allowed_chars 0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ中国文字 reader.readtext(mixed_lang.jpg, allowlistallowed_chars)4. 企业级应用扩展4.1 与办公软件深度集成将识别结果直接导入Excel的完整方案import pandas as pd from datetime import datetime def ocr_to_excel(img_folder, output_xlsx): reader easyocr.Reader([ch_sim,en]) data [] for img_file in Path(img_folder).glob(*.png): results reader.readtext(str(img_file)) row { filename: img_file.name, date: datetime.now().strftime(%Y-%m-%d), content: \n.join([text for _,text,_ in results]) } data.append(row) pd.DataFrame(data).to_excel(output_xlsx, indexFalse) ocr_to_excel(invoices, output.xlsx)4.2 性能优化方案针对大规模文档处理的需求GPU加速初始化时设置gpuTrue模型选择仅加载必要语言模型内存管理及时释放Reader对象# 高性能处理示例 def process_large_batch(image_paths): with easyocr.Reader([en], gpuTrue) as reader: return [reader.readtext(img) for img in image_paths]实际项目中处理1000张图片的耗时可从45分钟CPU缩短至8分钟GPU。

查看全文

http://www.gsyq.cn/news/1380405.html