이미지와 PDF를 OCR로 읽고, 검수 가능한 문서 구조로 정리한 뒤, AI 초안 생성과 파일 내보내기, WordPress 발행까지 이어주는 로컬 우선 데스크톱 앱입니다.
EasyMBoxie는 단순히 문서를 텍스트로 바꾸는 도구가 아니라, 스캔본이나 이미지 문서를 다시 편집 가능한 작업물로 만들고 게시나 업무 산출물까지 연결하는 것을 목표로 합니다.
EasyMBoxie는 개인 개발 프로젝트입니다. 앱 소스코드는 포함하지 않으며, 실행 파일은 GitHub Releases를 통해 배포합니다.
본 앱을 통한 다양한 작업 중 PaddleOCR와 AI를 이용해 PDF 문서를 WordPress 글로 발행하는 흐름을 아래 YouTube 영상에서 확인할 수 있습니다.
- 이미지/PDF 파일 등록 및 작업 대상 관리
- 로컬 OCR 기반 텍스트 추출
- PaddleOCR / PaddleOCR-VL 기반 문서 구조 인식
- OCR 결과 검수, 교정, 블록 정리
- 표, 이미지, 시각 자료 후보 확인
- Google Vision 기반 보정 보조
- OpenAI / Gemini 기반 게시용 AI 초안 생성
- AI 결과 편집 및 TXT, Markdown, HTML, JSON, DOCX 내보내기
- WordPress 연결 테스트 및 게시 흐름 (AI를 이용한 대표이미지 생성 포함)
- 양식 문서 템플릿 기반 값 추출, 검수, CSV/XLSX 내보내기
- AI 사용량과 외부 API 호출량 확인
- 이미지 또는 PDF를 EasyMBoxie 앱에 등록합니다.
- 로컬 OCR과 문서 구조 인식으로 페이지, 텍스트, 표, 이미지 영역을 추출합니다.
- 필요한 부분을 검수하고 교정합니다.
- 검수 완료 데이터를 바탕으로 AI 게시 초안을 생성합니다.
- 결과를 편집한 뒤 파일로 내보내거나 WordPress에 게시합니다.
Auto 화면에서는 위 흐름을 한 번에 실행하는 방향을, OCR과 Publish 화면에서는 각 단계를 수동으로 세밀하게 다루는 방향을 제공합니다.
EasyMBoxie는 문서 OCR, 검수, AI 글 작성, WordPress 게시를 한 흐름으로 다루고 싶은 분께 특히 잘 맞습니다.
적극 추천 대상:
- PDF, 이미지, 스캔 문서를 반복해서 텍스트나 게시용 콘텐츠로 정리하는 분
- OCR 결과를 바로 쓰기보다 원본과 비교하면서 검수하고 싶은 분
- 표, 이미지, 레이아웃이 섞인 문서를 구조화해서 다루고 싶은 분
- PaddleOCR, PaddleOCR-VL 기반 OCR과 문서 구조 인식에 관심 있는 분
- 로컬 OCR과 AI 초안 생성을 조합해 문서 처리 비용과 시간을 줄이고 싶은 분
- WordPress 글 작성, 이미지 업로드, 게시 흐름을 자동화하고 싶은 분
- 현금영수증, 공지문, 보고서, 안내문, 양식 문서처럼 반복 처리할 문서가 많은 분
- OCR/AI/게시 자동화 워크플로우를 실제 데스크톱 앱 형태로 테스트해보고 싶은 분
단순한 OCR 결과보다 검수 가능한 구조화 데이터, AI 초안, 파일 내보내기, WordPress 게시까지 이어지는 흐름이 필요하다면 EasyMBoxie를 한 번 사용해보는 것을 추천합니다.
최신 실행 파일은 이 저장소의 GitHub Releases에서 받을 수 있습니다.
- 저장소: https://github.com/EasyMBoxie/easymboxie
- Releases: https://github.com/EasyMBoxie/easymboxie/releases
- 현재 공개 배포 버전:
0.0.7
배포 파일 이름은 다음 형식을 사용합니다.
EasyMBoxie-v0.0.7-windows-x64-setup.exe
EasyMBoxie-v0.0.7-windows-x64-portable.exe
EasyMBoxie-v0.0.7-windows-x64-setup.zip
EasyMBoxie-v0.0.7-windows-x64-portable.zip
SHA256SUMS.txt
일반적인 사용에는 설치형을 권장합니다. 설치 없이 먼저 실행해보고 싶다면 포터블 버전을 사용해 주세요.
- 설치형:
EasyMBoxie-v0.0.7-windows-x64-setup.exe - 포터블:
EasyMBoxie-v0.0.7-windows-x64-portable.exe - 설치형 압축 파일:
EasyMBoxie-v0.0.7-windows-x64-setup.zip - 포터블 압축 파일:
EasyMBoxie-v0.0.7-windows-x64-portable.zip
Release에 첨부된 파일만 공식 배포 파일로 간주해 주세요.
- Windows x64 환경을 기준으로 배포합니다.
- 최초 실행 시 앱 셸 진입 전에 기본 CPU OCR 런타임 상태를 확인하는 환경 준비 화면이 표시될 수 있습니다.
- 기본 OCR 환경 준비를 완료하면 OCR 실행과 검수 흐름을 사용할 수 있습니다.
나중에 하기로 앱을 먼저 둘러볼 수 있지만, 기본 CPU OCR 런타임이 준비되기 전에는 OCR 실행이 차단됩니다.- GPU OCR 환경 설치와 실행 장치 선택은 앱 진입 후
Settings > OCR 설정 > OCR 환경 설정에서 할 수 있습니다. - AI 초안 생성, Google Vision 보정, WordPress 게시 기능은 사용자가 직접 API 키 또는 연결 정보를 설정해야 합니다.
- Releases에서 설치형 또는 포터블 파일을 다운로드합니다.
- 앱을 실행합니다.
- 최초 실행 환경 준비 화면이 표시되면
기본 OCR 환경 준비를 실행합니다. - 기본 OCR 환경 준비를 건너뛰고 앱을 먼저 살펴보려면
나중에 하기를 선택합니다. - 앱 진입 후 기본 OCR 환경을 다시 준비하려면
Settings > OCR 설정 > OCR 환경 설정에서 CPU 환경을 설치하거나 재진단합니다. - NVIDIA GPU가 있다면 같은 화면에서 GPU 호환성을 확인한 뒤 GPU OCR 환경을 설치합니다.
- OpenAI, Gemini, Google Vision, WordPress 기능을 사용하려면
Settings > 연동 설정에서 필요한 API 키와 연결 정보를 저장합니다.
기본 OCR 환경은 필수 기준선입니다. GPU 환경은 선택 성능 옵션이며, CPU 환경과 별도로 설치/진단됩니다.
EasyMBoxie는 CPU 환경에서도 기본 OCR과 검수 흐름을 사용할 수 있도록 설계되어 있습니다. 다만 이미지, 표, 문서 구조 분석처럼 무거운 고급 기능을 충분히 사용하려면 NVIDIA GPU 환경을 권장합니다.
- Windows 10/11 x64
- 로컬 저장 공간 여유분
- CPU OCR 런타임 설치
- 인터넷 연결: 최초 OCR 런타임 설치, AI/Google Vision/WordPress 연동 사용 시 필요
- Windows 10/11 x64
- NVIDIA GPU
- 최신 NVIDIA 그래픽 드라이버
- 앱 내 CPU OCR 환경 설치
- 앱 내 GPU OCR 환경 설치
- 충분한 메모리와 저장 공간
NVIDIA GPU 환경에서는 PaddleOCR-VL 기반 문서 구조 인식, 이미지 후보 찾기, 표/이미지 영역 분석 같은 고급 기능을 더 원활하게 사용할 수 있습니다. GPU 환경이 준비되지 않아도 CPU OCR로 기본 기능은 사용할 수 있지만, 일부 고급 분석 기능은 느리거나 사용성이 제한될 수 있습니다.
설치 후 Settings > OCR 설정에서 CPU/GPU OCR 환경을 모두 준비하는 것을 권장합니다.
현재 공개 배포 파일은 코드 서명 인증서가 적용되어 있지 않아 Windows에서 처음 설치하거나 실행할 때 SmartScreen 경고가 표시될 수 있습니다.
공식 Release 페이지에서 받은 파일인지 확인한 뒤 실행해 주세요.
SmartScreen 화면이 표시되면 다음 순서로 실행할 수 있습니다.
Windows의 PC 보호화면에서추가 정보를 선택합니다.- 앱 이름을 확인합니다. 게시자는
알 수 없는 게시자로 표시될 수 있습니다. - 공식 Release 페이지에서 받은 파일이 맞다면
실행을 선택합니다.
보안이 걱정된다면 실행 전에 Windows 보안 또는 백신 프로그램으로 파일을 검사해 주세요.
EasyMBoxie는 모든 원본 문서를 AI API로 그대로 보내는 방식을 지향하지 않습니다. 보안에 민감한 문서, 내부 업무 자료, 개인 자료를 다룰 때 사용자가 데이터 흐름을 최대한 직접 통제할 수 있도록 로컬 우선 구조를 기준으로 설계했습니다.
로컬에서 처리하는 항목:
- PDF 렌더링
- 이미지 처리
- OCR 실행
- 문서 구조 인식
- 표/이미지 영역 분석
- OCR 결과 검수와 교정
- 작업 데이터와 검수 데이터 저장
- 파일 내보내기 산출물 생성
외부 서비스로 전송될 수 있는 항목:
- AI 초안 생성을 위해 사용자가 선택한 검수/정리된 텍스트와 필요한 메타데이터
- Google Vision 보정 기능을 사용자가 실행한 경우의 보정 대상 이미지/문서 데이터
- WordPress 게시 기능을 사용자가 실행한 경우의 게시 본문, 이미지, 메타데이터
보안과 통제를 위한 원칙:
- 원본 PDF/이미지 전체를 기본적으로 AI API에 그대로 업로드하지 않습니다.
- AI 호출은 사용자가 설정한 OpenAI/Gemini 연동이 있을 때만 실행합니다.
- Google Vision, WordPress 같은 외부 연동도 사용자가 설정하고 실행한 경우에만 사용합니다.
- AI에는 가능한 한 원본 전체가 아니라 검수/정리된 구조화 데이터를 전달합니다.
- AI 사용량과 외부 API 호출량을 확인할 수 있도록 운영 지표를 제공합니다.
- 중요한 원본 파일과 결과물은 사용자가 지정한 로컬 작업 공간을 기준으로 관리합니다.
완전한 오프라인 전용 앱은 아니지만, 외부 API에 모든 문서를 맡기는 방식보다 데이터 전송 범위를 줄이고 사용자가 어느 단계에서 외부 서비스를 쓰는지 확인할 수 있는 방향을 지향합니다.
- Auto: 문서 등록부터 OCR, 검수 보조, AI 초안, WordPress 게시까지 이어지는 자동 실행 흐름
- OCR: OCR 실행, 검수, 학습 데이터 관리
- Publish: 검수 완료 결과 가져오기, AI 초안 생성, 편집, export, WordPress 게시
- 양식 정리: 반복 양식 문서의 템플릿 정의, 값 추출, 검수, CSV/XLSX export
- Dashboard: AI 사용량과 외부 API 호출량 확인
- Settings: API 키, WordPress, OCR 런타임, 저장소, 앱 정보 관리
스크린샷은 screenshots/ 폴더에서 확인할 수 있습니다.
아래와 같은 피드백을 특히 환영합니다.
- 실제 업무에서 이미지/PDF 문서를 어떤 형태로 다시 만들고 싶은지
- OCR 검수 과정에서 꼭 필요한 편집 기능
- WordPress 게시 또는 파일 export에서 필요한 출력 형식
- 반복 양식 문서 처리에 필요한 필드/표 추출 방식
- 설치, 최초 실행, 런타임 준비 과정에서 불편한 점
피드백은 GitHub Issues로 남겨 주세요.
개인 개발자에게 직접 이메일 문의가 필요한 경우 위시랜 (wishlan@naver.com)으로 연락해 주세요.
EasyMBoxie는 개인 개발자가 운영하는 초기 공개 배포 단계의 앱입니다. 기능 이름, 화면 구조, 저장 형식, 배포 방식은 피드백과 실제 사용 결과에 따라 변경될 수 있습니다.
변경 내용은 CHANGELOG.md에 정리합니다.
EasyMBoxie 공개 배포판은 오픈소스 라이선스가 아니라, 한국어권 사용자를 기준으로 작성한 바이너리 평가판 사용 허가 조건을 따릅니다.
자세한 내용은 LICENSE를 확인해 주세요. 이 저장소는 공개 배포 및 피드백 수집을 위한 저장소이며, 별도 안내가 없는 한 앱 소스코드의 오픈소스 공개를 의미하지 않습니다.




