Skip to content

classyid/wa-dokumen-extractor-bot

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

6 Commits
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

πŸ€– WhatsApp Indonesia Document Extractor Bot

Python Version WhatsApp API OCR Engine License

Bot WhatsApp pintar yang dapat mengekstrak data dari dokumen resmi Indonesia secara otomatis menggunakan teknologi OCR. Mendukung KTP, Kartu Keluarga, Ijazah, dan SIM dengan akurasi tinggi.

✨ Fitur Utama

  • πŸ†” Ekstraksi KTP: NIK, nama, alamat, dll
  • πŸ‘¨β€πŸ‘©β€πŸ‘§β€πŸ‘¦ Ekstraksi Kartu Keluarga: Data lengkap anggota keluarga
  • πŸŽ“ Ekstraksi Ijazah: Informasi pendidikan dan institusi
  • πŸš— Ekstraksi SIM: Data pengemudi dan kendaraan
  • πŸ“„ Export Files: Hasil dalam format TXT dan JSON
  • 🎨 Rich Formatting: Output cantik dengan emoji
  • ⚑ Real-time: Proses dalam hitungan detik
  • πŸ”’ Privacy First: Data tidak disimpan permanen

πŸš€ Quick Start

Installation

  1. Clone Repository
git clone https://github.com/classyid/wa-dokumen-extractor-bot.git
cd whatsapp-indonesia-doc-extractor
  1. Install Dependencies
pip install asyncio aiohttp requests neonize thundra_io
  1. Setup Google Apps Script APIs
  • Deploy Google Apps Script untuk setiap jenis dokumen
  • Update URL API di script:
KTP_API_URL = "YOUR_GAS_DEPLOYMENT_URL"
KK_API_URL = "YOUR_GAS_DEPLOYMENT_URL"
IJAZAH_API_URL = "YOUR_GAS_DEPLOYMENT_URL" 
SIM_API_URL = "YOUR_GAS_DEPLOYMENT_URL"
  1. Run Bot
python main.py

πŸ“± Cara Penggunaan

Commands Available

Command Fungsi Contoh
ping Cek status bot ping
ktp Ekstrak data KTP Reply gambar KTP dengan ktp
kk Ekstrak data KK Reply gambar KK dengan kk
ijazah Ekstrak data Ijazah Reply gambar Ijazah dengan ijazah
sim Ekstrak data SIM Reply gambar SIM dengan sim
help Bantuan help

Step by Step

  1. Kirim gambar dokumen ke chat WhatsApp
  2. Reply gambar dengan command yang sesuai (ktp, kk, ijazah, atau sim)
  3. Tunggu proses ekstraksi (biasanya 5-10 detik)
  4. Terima hasil dalam format yang rapi dengan emoji
  5. Optional: Minta file export dengan .txt atau .json

Contoh Output KTP

πŸ†” HASIL EKSTRAKSI KTP πŸ†”
━━━━━━━━━━━━━━━━━━━━━━

πŸ“Œ NIK: `3201234567890123`
πŸ‘€ Nama: John Doe
πŸŽ‚ TTL: Jakarta, 01-01-1990
⚧️ Jenis Kelamin: LAKI-LAKI
🩸 Golongan Darah: O

πŸ“ DOMISILI πŸ“
🏠 Alamat: JL. Contoh No. 123
🏘️ RT/RW: 001/002
πŸ™οΈ Kel/Desa: Kelurahan Contoh
πŸŒ† Kecamatan: Kecamatan Contoh

...

πŸ—οΈ Arsitektur

WhatsApp Message β†’ Bot Detection β†’ Media Download β†’ OCR Processing β†’ Data Formatting β†’ Response

Tech Stack

  • Backend: Python 3.7+ dengan asyncio
  • WhatsApp API: Neonize framework
  • OCR Engine: Google Apps Script
  • Database: SQLite untuk session management
  • Media Processing: thundra_io + multiple fallback methods

πŸ”§ Konfigurasi Lanjutan

Environment Variables

# Optional configurations
LOG_LEVEL=DEBUG
TEMP_MEDIA_DIR=temp_media
DB_PATH=db.sqlite3

Custom API Endpoints

Anda dapat mengganti Google Apps Script dengan OCR service lain:

# Ubah fungsi query_*_extractor sesuai API yang digunakan
async def query_ktp_extractor(media_bytes, mime_type, file_name):
    # Custom OCR implementation
    pass

🀝 Contributing

Kontribusi sangat welcome! Silakan:

  1. Fork repository ini
  2. Buat feature branch (git checkout -b feature/AmazingFeature)
  3. Commit changes (git commit -m 'Add some AmazingFeature')
  4. Push ke branch (git push origin feature/AmazingFeature)
  5. Buka Pull Request

πŸ“œ License

Distributed under the MIT License. See LICENSE for more information.

⚠️ Disclaimer

  • Bot ini untuk keperluan legal dan sah
  • Penyalahgunaan data pribadi dapat dikenakan sanksi hukum
  • Pastikan compliance dengan regulasi perlindungan data

πŸ†˜ Support

πŸ™ Acknowledgments

  • Neonize - WhatsApp Web API framework
  • Thundra.io - Media handling utilities
  • Google Apps Script - OCR processing engine
  • Indonesian Government - Document format standards

Made with ❀️ for Indonesian developers

Back to top ⬆️

About

πŸ€– Bot WhatsApp pintar untuk ekstraksi data dokumen Indonesia secara otomatis. Mendukung KTP, Kartu Keluarga, Ijazah, dan SIM dengan teknologi OCR canggih. Built with Python + Google Apps Script API.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages