EasyMBoxie EasyMBoxie

EasyMBoxie

이미지와 PDF를 OCR로 읽고, 검수 가능한 문서 구조로 정리한 뒤, AI 초안 생성과 파일 내보내기, WordPress 발행까지 이어주는 로컬 우선 데스크톱 앱입니다.

EasyMBoxie는 단순히 문서를 텍스트로 바꾸는 도구가 아니라, 스캔본이나 이미지 문서를 다시 편집 가능한 작업물로 만들고 게시나 업무 산출물까지 연결하는 것을 목표로 합니다.

EasyMBoxie는 개인 개발 프로젝트입니다. 앱 소스코드는 포함하지 않으며, 실행 파일은 GitHub Releases를 통해 배포합니다.

시연 영상

본 앱을 통한 다양한 작업 중 PaddleOCR와 AI를 이용해 PDF 문서를 WordPress 글로 발행하는 흐름을 아래 YouTube 영상에서 확인할 수 있습니다.

YouTube: https://www.youtube.com/watch?v=yoX8GP0XjRo

주요 기능

이미지/PDF 파일 등록 및 작업 대상 관리
로컬 OCR 기반 텍스트 추출
PaddleOCR / PaddleOCR-VL 기반 문서 구조 인식
OCR 결과 검수, 교정, 블록 정리
표, 이미지, 시각 자료 후보 확인
Google Vision 기반 보정 보조
OpenAI / Gemini 기반 게시용 AI 초안 생성
AI 결과 편집 및 TXT, Markdown, HTML, JSON, DOCX 내보내기
WordPress 연결 테스트 및 게시 흐름 (AI를 이용한 대표이미지 생성 포함)
양식 문서 템플릿 기반 값 추출, 검수, CSV/XLSX 내보내기
AI 사용량과 외부 API 호출량 확인

대표 사용 흐름

이미지 또는 PDF를 EasyMBoxie 앱에 등록합니다.
로컬 OCR과 문서 구조 인식으로 페이지, 텍스트, 표, 이미지 영역을 추출합니다.
필요한 부분을 검수하고 교정합니다.
검수 완료 데이터를 바탕으로 AI 게시 초안을 생성합니다.
결과를 편집한 뒤 파일로 내보내거나 WordPress에 게시합니다.

Auto 화면에서는 위 흐름을 한 번에 실행하는 방향을, OCR과 Publish 화면에서는 각 단계를 수동으로 세밀하게 다루는 방향을 제공합니다.

이런 분께 추천합니다

EasyMBoxie는 문서 OCR, 검수, AI 글 작성, WordPress 게시를 한 흐름으로 다루고 싶은 분께 특히 잘 맞습니다.

적극 추천 대상:

PDF, 이미지, 스캔 문서를 반복해서 텍스트나 게시용 콘텐츠로 정리하는 분
OCR 결과를 바로 쓰기보다 원본과 비교하면서 검수하고 싶은 분
표, 이미지, 레이아웃이 섞인 문서를 구조화해서 다루고 싶은 분
PaddleOCR, PaddleOCR-VL 기반 OCR과 문서 구조 인식에 관심 있는 분
로컬 OCR과 AI 초안 생성을 조합해 문서 처리 비용과 시간을 줄이고 싶은 분
WordPress 글 작성, 이미지 업로드, 게시 흐름을 자동화하고 싶은 분
현금영수증, 공지문, 보고서, 안내문, 양식 문서처럼 반복 처리할 문서가 많은 분
OCR/AI/게시 자동화 워크플로우를 실제 데스크톱 앱 형태로 테스트해보고 싶은 분

단순한 OCR 결과보다 검수 가능한 구조화 데이터, AI 초안, 파일 내보내기, WordPress 게시까지 이어지는 흐름이 필요하다면 EasyMBoxie를 한 번 사용해보는 것을 추천합니다.

다운로드

최신 실행 파일은 이 저장소의 GitHub Releases에서 받을 수 있습니다.

저장소: https://github.com/EasyMBoxie/easymboxie
Releases: https://github.com/EasyMBoxie/easymboxie/releases
현재 공개 배포 버전: 0.0.7

배포 파일 이름은 다음 형식을 사용합니다.

EasyMBoxie-v0.0.7-windows-x64-setup.exe
EasyMBoxie-v0.0.7-windows-x64-portable.exe
EasyMBoxie-v0.0.7-windows-x64-setup.zip
EasyMBoxie-v0.0.7-windows-x64-portable.zip
SHA256SUMS.txt

일반적인 사용에는 설치형을 권장합니다. 설치 없이 먼저 실행해보고 싶다면 포터블 버전을 사용해 주세요.

설치형: EasyMBoxie-v0.0.7-windows-x64-setup.exe
포터블: EasyMBoxie-v0.0.7-windows-x64-portable.exe
설치형 압축 파일: EasyMBoxie-v0.0.7-windows-x64-setup.zip
포터블 압축 파일: EasyMBoxie-v0.0.7-windows-x64-portable.zip

Release에 첨부된 파일만 공식 배포 파일로 간주해 주세요.

실행 환경

Windows x64 환경을 기준으로 배포합니다.
최초 실행 시 앱 셸 진입 전에 기본 CPU OCR 런타임 상태를 확인하는 환경 준비 화면이 표시될 수 있습니다.
기본 OCR 환경 준비를 완료하면 OCR 실행과 검수 흐름을 사용할 수 있습니다.
나중에 하기로 앱을 먼저 둘러볼 수 있지만, 기본 CPU OCR 런타임이 준비되기 전에는 OCR 실행이 차단됩니다.
GPU OCR 환경 설치와 실행 장치 선택은 앱 진입 후 Settings > OCR 설정 > OCR 환경 설정에서 할 수 있습니다.
AI 초안 생성, Google Vision 보정, WordPress 게시 기능은 사용자가 직접 API 키 또는 연결 정보를 설정해야 합니다.

빠른 시작

Releases에서 설치형 또는 포터블 파일을 다운로드합니다.
앱을 실행합니다.
최초 실행 환경 준비 화면이 표시되면 기본 OCR 환경 준비를 실행합니다.
기본 OCR 환경 준비를 건너뛰고 앱을 먼저 살펴보려면 나중에 하기를 선택합니다.
앱 진입 후 기본 OCR 환경을 다시 준비하려면 Settings > OCR 설정 > OCR 환경 설정에서 CPU 환경을 설치하거나 재진단합니다.
NVIDIA GPU가 있다면 같은 화면에서 GPU 호환성을 확인한 뒤 GPU OCR 환경을 설치합니다.
OpenAI, Gemini, Google Vision, WordPress 기능을 사용하려면 Settings > 연동 설정에서 필요한 API 키와 연결 정보를 저장합니다.

기본 OCR 환경은 필수 기준선입니다. GPU 환경은 선택 성능 옵션이며, CPU 환경과 별도로 설치/진단됩니다.

권장 사양

EasyMBoxie는 CPU 환경에서도 기본 OCR과 검수 흐름을 사용할 수 있도록 설계되어 있습니다. 다만 이미지, 표, 문서 구조 분석처럼 무거운 고급 기능을 충분히 사용하려면 NVIDIA GPU 환경을 권장합니다.

최소 사용 환경

Windows 10/11 x64
로컬 저장 공간 여유분
CPU OCR 런타임 설치
인터넷 연결: 최초 OCR 런타임 설치, AI/Google Vision/WordPress 연동 사용 시 필요

권장 사용 환경

Windows 10/11 x64
NVIDIA GPU
최신 NVIDIA 그래픽 드라이버
앱 내 CPU OCR 환경 설치
앱 내 GPU OCR 환경 설치
충분한 메모리와 저장 공간

NVIDIA GPU 환경에서는 PaddleOCR-VL 기반 문서 구조 인식, 이미지 후보 찾기, 표/이미지 영역 분석 같은 고급 기능을 더 원활하게 사용할 수 있습니다. GPU 환경이 준비되지 않아도 CPU OCR로 기본 기능은 사용할 수 있지만, 일부 고급 분석 기능은 느리거나 사용성이 제한될 수 있습니다.

설치 후 Settings > OCR 설정에서 CPU/GPU OCR 환경을 모두 준비하는 것을 권장합니다.

Windows SmartScreen 안내

현재 공개 배포 파일은 코드 서명 인증서가 적용되어 있지 않아 Windows에서 처음 설치하거나 실행할 때 SmartScreen 경고가 표시될 수 있습니다.

공식 Release 페이지에서 받은 파일인지 확인한 뒤 실행해 주세요.

SmartScreen 화면이 표시되면 다음 순서로 실행할 수 있습니다.

Windows의 PC 보호 화면에서 추가 정보를 선택합니다.
앱 이름을 확인합니다. 게시자는 알 수 없는 게시자로 표시될 수 있습니다.
공식 Release 페이지에서 받은 파일이 맞다면 실행을 선택합니다.

보안이 걱정된다면 실행 전에 Windows 보안 또는 백신 프로그램으로 파일을 검사해 주세요.

로컬 우선 설계

EasyMBoxie는 모든 원본 문서를 AI API로 그대로 보내는 방식을 지향하지 않습니다. 보안에 민감한 문서, 내부 업무 자료, 개인 자료를 다룰 때 사용자가 데이터 흐름을 최대한 직접 통제할 수 있도록 로컬 우선 구조를 기준으로 설계했습니다.

로컬에서 처리하는 항목:

PDF 렌더링
이미지 처리
OCR 실행
문서 구조 인식
표/이미지 영역 분석
OCR 결과 검수와 교정
작업 데이터와 검수 데이터 저장
파일 내보내기 산출물 생성

외부 서비스로 전송될 수 있는 항목:

AI 초안 생성을 위해 사용자가 선택한 검수/정리된 텍스트와 필요한 메타데이터
Google Vision 보정 기능을 사용자가 실행한 경우의 보정 대상 이미지/문서 데이터
WordPress 게시 기능을 사용자가 실행한 경우의 게시 본문, 이미지, 메타데이터

보안과 통제를 위한 원칙:

원본 PDF/이미지 전체를 기본적으로 AI API에 그대로 업로드하지 않습니다.
AI 호출은 사용자가 설정한 OpenAI/Gemini 연동이 있을 때만 실행합니다.
Google Vision, WordPress 같은 외부 연동도 사용자가 설정하고 실행한 경우에만 사용합니다.
AI에는 가능한 한 원본 전체가 아니라 검수/정리된 구조화 데이터를 전달합니다.
AI 사용량과 외부 API 호출량을 확인할 수 있도록 운영 지표를 제공합니다.
중요한 원본 파일과 결과물은 사용자가 지정한 로컬 작업 공간을 기준으로 관리합니다.

완전한 오프라인 전용 앱은 아니지만, 외부 API에 모든 문서를 맡기는 방식보다 데이터 전송 범위를 줄이고 사용자가 어느 단계에서 외부 서비스를 쓰는지 확인할 수 있는 방향을 지향합니다.

현재 메뉴

Auto: 문서 등록부터 OCR, 검수 보조, AI 초안, WordPress 게시까지 이어지는 자동 실행 흐름
OCR: OCR 실행, 검수, 학습 데이터 관리
Publish: 검수 완료 결과 가져오기, AI 초안 생성, 편집, export, WordPress 게시
양식 정리: 반복 양식 문서의 템플릿 정의, 값 추출, 검수, CSV/XLSX export
Dashboard: AI 사용량과 외부 API 호출량 확인
Settings: API 키, WordPress, OCR 런타임, 저장소, 앱 정보 관리

스크린샷

스크린샷은 screenshots/ 폴더에서 확인할 수 있습니다.

Auto 실행 설정

OCR 검수

Publish 결과 편집

OCR 환경 설정

피드백

아래와 같은 피드백을 특히 환영합니다.

실제 업무에서 이미지/PDF 문서를 어떤 형태로 다시 만들고 싶은지
OCR 검수 과정에서 꼭 필요한 편집 기능
WordPress 게시 또는 파일 export에서 필요한 출력 형식
반복 양식 문서 처리에 필요한 필드/표 추출 방식
설치, 최초 실행, 런타임 준비 과정에서 불편한 점

피드백은 GitHub Issues로 남겨 주세요.

Issues: https://github.com/EasyMBoxie/easymboxie/issues

개인 개발자에게 직접 이메일 문의가 필요한 경우 위시랜 (wishlan@naver.com)으로 연락해 주세요.

개발 상태

EasyMBoxie는 개인 개발자가 운영하는 초기 공개 배포 단계의 앱입니다. 기능 이름, 화면 구조, 저장 형식, 배포 방식은 피드백과 실제 사용 결과에 따라 변경될 수 있습니다.

변경 내용은 CHANGELOG.md에 정리합니다.

라이선스

EasyMBoxie 공개 배포판은 오픈소스 라이선스가 아니라, 한국어권 사용자를 기준으로 작성한 바이너리 평가판 사용 허가 조건을 따릅니다.

자세한 내용은 LICENSE를 확인해 주세요. 이 저장소는 공개 배포 및 피드백 수집을 위한 저장소이며, 별도 안내가 없는 한 앱 소스코드의 오픈소스 공개를 의미하지 않습니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly