news 2026/4/3 12:29:52

效率爆炸!我用 Python + DeepSeek 写了个“能听懂人话”的 OCR 神器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
效率爆炸!我用 Python + DeepSeek 写了个“能听懂人话”的 OCR 神器

还在手动敲表格?还在为截图里的数据抓狂?
今天给大家分享一个我刚刚撸出来的 Python 神器——智能 OCR 表格提取助手。它不仅能一键把图片变 Excel,更厉害的是,它接入了DeepSeek V3,能自动帮你补全数据!


🔥 核心痛点,一键解决

作为一名经常和数据打交道的打工人,我最烦的就是:

  1. 截图转表格:对方发来一张截图,让我做成 Excel,几百行数据敲到手断。

  2. 表头乱飞:普通 OCR 识别出来全是散的,表头和数据混在一起,排序一按全乱了。

  3. 数据缺失:表格里只有“某某基金”,领导非要我填上“基金代码”,我又得一个个去百度。

于是,这个工具诞生了!


✨ 四大杀手级功能

1. 🖼️ 图片秒变可编辑表格

依托RapidOCR引擎,识别速度飞快。识别后的文字直接变成一个类似 Excel 的界面,双击就能改,右键就能删

2. 🔒 独创“表头/标题锁定”技术

这是市面上很多免费 OCR 工具都没有的细节!

  • 一键锁定表头:右键“将首行设为表头”,排序时它纹丝不动。
  • 智能识别标题:支持“标题+表头”双重锁定,完美还原复杂报表结构。

3. 🤖 DeepSeek AI 智能补全(王炸功能)

这是最硬核的地方!如果你的表格里有“基金名称”或者“公司名”,但缺少代码:

  • 选中那一列。
  • 右键点击DeepSeek: 智能补全基金代码
  • 见证奇迹:AI 会自动联网查询,并直接在表格里帮你插入一列新的代码

4. 📤 格式完美导出

所见即所得,你调整好的表格,直接导出为 Excel,连标题和列宽都给你安排得明明白白。


💻 核心代码大赏

不仅要好用,还要硬核。看看这几行代码,你就知道它为什么这么强。

📌 1. DeepSeek 深度集成 (AI Worker)

我们利用QThread实现了异步 AI 调用,界面不卡顿,体验丝般顺滑。

classDeepSeekWorker(QThread):finished=pyqtSignal(dict)defrun(self):# 直接调用 DeepSeek 官方 APIclient=OpenAI(api_key=self.api_key,base_url="https://api.deepseek.com")# 精心设计的 Prompt,强制输出 JSON 格式,方便程序解析prompt=f""" 你是一个专业的金融数据助手。请根据以下基金名称列表,查找并返回对应的中国基金代码。 要求:返回结果必须是严格的 JSON 格式 (Key: 名称, Value: 代码)。 列表:{json.dumps(self.fund_names,ensure_ascii=False)}"""response=client.chat.completions.create(model="deepseek-chat",messages=[{"role":"user","content":prompt}],stream=False)# 解析结果并回传给主界面self.finished.emit(json.loads(response.choices[0].message.content))

📌 2. 智能行列重组算法

普通的 OCR 只会给你一堆坐标,我们写了个算法,把它们“拼”回表格。

defsmart_merge_lines(self,result):# 先按 Y 轴聚类,判断是否在同一行# 再按 X 轴排序,还原列顺序boxes.sort(key=lambdab:b["cy"])# ... (省略中间复杂的几何计算) ...ifabs(box["cy"]-last_box["cy"])<avg_h*0.6:current_row.append(box)# 归为同一行# ...returnfinal_rows

🏆 为什么选择它?

  • 隐私安全:OCR 识别完全在本地运行,你的财务报表图片不会上传到任何云端(除非你主动点击 DeepSeek 查询)。
  • 极致轻量:基于 PyQt5 开发,启动秒开,不像 Electron 应用那样吃内存。
  • 无限扩展:今天它可以补全基金代码,明天改改 Prompt,它就能补全“英文翻译”、“股票市盈率”或者“公司地址”!

💡 总结:这不仅仅是一个 OCR 工具,它是你数据处理流程中的AI 增效器

增强 DeepSeek 的提示词策略,增加了 强力模糊匹配 :

  • 明确告诉 AI 注意 QDIL -> QDII 这种常见 OCR 错误。
  • 让 AI 忽略 A 、 C 、 混合 等后缀,专注于核心名称的匹配。
  • 要求 AI 在不确定时, 优先返回最相似的代码 ,而不是直接放弃。

👉 想要源码?
(关注公众号“向左向右立正”)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 15:08:23

SpringBoot+Vue +周边游平台平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

摘要 随着旅游业的发展和人们生活水平的提高&#xff0c;周边游逐渐成为大众休闲娱乐的重要选择。传统的旅游服务模式存在信息不对称、预订流程繁琐、用户体验不佳等问题&#xff0c;难以满足现代游客的个性化需求。互联网技术的快速发展为旅游行业提供了新的解决方案&#xf…

作者头像 李华
网站建设 2026/3/14 20:55:45

基于SpringBoot+Vue的政府管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】

摘要 随着信息技术的快速发展&#xff0c;数字化政务管理已成为提升政府工作效率和服务质量的重要手段。传统政府管理系统中存在信息孤岛、数据冗余、响应速度慢等问题&#xff0c;亟需通过信息化手段实现业务流程的优化和数据的集中管理。政府管理系统通过整合各部门资源&…

作者头像 李华
网站建设 2026/3/17 0:00:29

Emby高级功能解锁与媒体服务器配置全指南

Emby高级功能解锁与媒体服务器配置全指南 【免费下载链接】emby-unlocked Emby with the premium Emby Premiere features unlocked. 项目地址: https://gitcode.com/gh_mirrors/em/emby-unlocked 想要低成本体验Emby媒体服务器的高级功能&#xff1f;通过科学配置实现E…

作者头像 李华
网站建设 2026/3/22 21:36:07

为什么前后端分离了,我们比从前更痛苦?

引言&#xff1a;技术进步的悖论前后端分离是近年来Web开发领域最重要的架构变革之一&#xff0c;它代表着专业化分工的进步&#xff0c;理论上应提升开发效率和应用质量。然而在实践中&#xff0c;许多团队却发现自己陷入了新的困境&#xff1a;沟通成本指数级上升接口联调成为…

作者头像 李华