Skip to content

niflhum/gwsw

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

gwsw

公文办理单录入系统(图片版)· 浏览器端 OCR 识别 · 离线可用

📋 功能简介

这是一个纯前端的公文办理单录入工具,用于:

  1. 📷 拍照上传 - 拍摄公文办理单图片
  2. 🔍 OCR 识别 - 自动提取文字内容
  3. ✏️ 字段解析 - 智能识别标题、文号、日期等字段
  4. 📊 导出 Excel - 一键导出所有记录
  5. 🗄️ 本地存储 - IndexedDB 持久化,数据不丢失

🌐 在线访问

🔧 技术实现

核心技术栈

技术 用途
纯 HTML/CSS/JS 无框架,单文件应用
OCR.space API 云端 OCR 识别(推荐,25K次/月免费)
Tesseract.js 离线 OCR 后备(纯浏览器端)
IndexedDB 图片 + 数据本地持久化
SheetJS (xlsx) Excel 导出
ExcelJS Excel 嵌入图片缩略图
JSZip 打包 ZIP 备份

特色功能

  • 多 OCR 引擎切换:OCR.space(云端推荐) / 百度 OCR / Tesseract.js(离线)
  • 图片压缩存储:JPEG 60% 质量,自动缩放到 1200px
  • 微信/QQ 文字提取:支持粘贴微信长按识别的文字,识别率更高
  • CORS 代理:解决浏览器跨域限制
  • 响应式设计:手机/平板/电脑均可使用

🗂️ 文件结构

gwsw/
└── index.html    # 单文件应用(~130KB,包含所有逻辑和样式)

📱 使用流程

拍照/选择图片
     ↓
OCR 自动识别
     ↓
校验/编辑字段
     ↓
保存到本地
     ↓
导出 Excel / ZIP 备份

🔐 隐私说明

  • 所有数据仅存储于本机浏览器
  • 云端 OCR 需联网,图片会上传到 OCR 服务商
  • 清除浏览器数据会导致记录丢失,请及时导出备份

📜 版本历史

  • v4 - 当前版本,优化 UI,支持多 OCR 引擎
  • v3 - 添加 ExcelJS 图片嵌入
  • v2 - IndexedDB 存储
  • v1 - 初始版本

© niflhum

About

🔍 纯浏览器端OCR文字识别工具——无需后端,前端完成图片文字提取

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages