公文办理单录入系统(图片版)· 浏览器端 OCR 识别 · 离线可用
这是一个纯前端的公文办理单录入工具,用于:
- 📷 拍照上传 - 拍摄公文办理单图片
- 🔍 OCR 识别 - 自动提取文字内容
- ✏️ 字段解析 - 智能识别标题、文号、日期等字段
- 📊 导出 Excel - 一键导出所有记录
- 🗄️ 本地存储 - IndexedDB 持久化,数据不丢失
- GitHub Pages: https://niflhum.github.io/gwsw/
- 主站入口: https://niflhum.top (侧边栏「公文收发」链接)
| 技术 | 用途 |
|---|---|
| 纯 HTML/CSS/JS | 无框架,单文件应用 |
| OCR.space API | 云端 OCR 识别(推荐,25K次/月免费) |
| Tesseract.js | 离线 OCR 后备(纯浏览器端) |
| IndexedDB | 图片 + 数据本地持久化 |
| SheetJS (xlsx) | Excel 导出 |
| ExcelJS | Excel 嵌入图片缩略图 |
| JSZip | 打包 ZIP 备份 |
- 多 OCR 引擎切换:OCR.space(云端推荐) / 百度 OCR / Tesseract.js(离线)
- 图片压缩存储:JPEG 60% 质量,自动缩放到 1200px
- 微信/QQ 文字提取:支持粘贴微信长按识别的文字,识别率更高
- CORS 代理:解决浏览器跨域限制
- 响应式设计:手机/平板/电脑均可使用
gwsw/
└── index.html # 单文件应用(~130KB,包含所有逻辑和样式)
拍照/选择图片
↓
OCR 自动识别
↓
校验/编辑字段
↓
保存到本地
↓
导出 Excel / ZIP 备份
- 所有数据仅存储于本机浏览器
- 云端 OCR 需联网,图片会上传到 OCR 服务商
- 清除浏览器数据会导致记录丢失,请及时导出备份
- v4 - 当前版本,优化 UI,支持多 OCR 引擎
- v3 - 添加 ExcelJS 图片嵌入
- v2 - IndexedDB 存储
- v1 - 初始版本
© niflhum