Bot WhatsApp pintar yang dapat mengekstrak data dari dokumen resmi Indonesia secara otomatis menggunakan teknologi OCR. Mendukung KTP, Kartu Keluarga, Ijazah, dan SIM dengan akurasi tinggi.
- π Ekstraksi KTP: NIK, nama, alamat, dll
- π¨βπ©βπ§βπ¦ Ekstraksi Kartu Keluarga: Data lengkap anggota keluarga
- π Ekstraksi Ijazah: Informasi pendidikan dan institusi
- π Ekstraksi SIM: Data pengemudi dan kendaraan
- π Export Files: Hasil dalam format TXT dan JSON
- π¨ Rich Formatting: Output cantik dengan emoji
- β‘ Real-time: Proses dalam hitungan detik
- π Privacy First: Data tidak disimpan permanen
- Clone Repository
git clone https://github.com/classyid/wa-dokumen-extractor-bot.git
cd whatsapp-indonesia-doc-extractor- Install Dependencies
pip install asyncio aiohttp requests neonize thundra_io- Setup Google Apps Script APIs
- Deploy Google Apps Script untuk setiap jenis dokumen
- Update URL API di script:
KTP_API_URL = "YOUR_GAS_DEPLOYMENT_URL"
KK_API_URL = "YOUR_GAS_DEPLOYMENT_URL"
IJAZAH_API_URL = "YOUR_GAS_DEPLOYMENT_URL"
SIM_API_URL = "YOUR_GAS_DEPLOYMENT_URL"- Run Bot
python main.py| Command | Fungsi | Contoh |
|---|---|---|
ping |
Cek status bot | ping |
ktp |
Ekstrak data KTP | Reply gambar KTP dengan ktp |
kk |
Ekstrak data KK | Reply gambar KK dengan kk |
ijazah |
Ekstrak data Ijazah | Reply gambar Ijazah dengan ijazah |
sim |
Ekstrak data SIM | Reply gambar SIM dengan sim |
help |
Bantuan | help |
- Kirim gambar dokumen ke chat WhatsApp
- Reply gambar dengan command yang sesuai (
ktp,kk,ijazah, atausim) - Tunggu proses ekstraksi (biasanya 5-10 detik)
- Terima hasil dalam format yang rapi dengan emoji
- Optional: Minta file export dengan
.txtatau.json
π HASIL EKSTRAKSI KTP π
ββββββββββββββββββββββ
π NIK: `3201234567890123`
π€ Nama: John Doe
π TTL: Jakarta, 01-01-1990
β§οΈ Jenis Kelamin: LAKI-LAKI
π©Έ Golongan Darah: O
π DOMISILI π
π Alamat: JL. Contoh No. 123
ποΈ RT/RW: 001/002
ποΈ Kel/Desa: Kelurahan Contoh
π Kecamatan: Kecamatan Contoh
...
WhatsApp Message β Bot Detection β Media Download β OCR Processing β Data Formatting β Response
- Backend: Python 3.7+ dengan asyncio
- WhatsApp API: Neonize framework
- OCR Engine: Google Apps Script
- Database: SQLite untuk session management
- Media Processing: thundra_io + multiple fallback methods
# Optional configurations
LOG_LEVEL=DEBUG
TEMP_MEDIA_DIR=temp_media
DB_PATH=db.sqlite3Anda dapat mengganti Google Apps Script dengan OCR service lain:
# Ubah fungsi query_*_extractor sesuai API yang digunakan
async def query_ktp_extractor(media_bytes, mime_type, file_name):
# Custom OCR implementation
passKontribusi sangat welcome! Silakan:
- Fork repository ini
- Buat feature branch (
git checkout -b feature/AmazingFeature) - Commit changes (
git commit -m 'Add some AmazingFeature') - Push ke branch (
git push origin feature/AmazingFeature) - Buka Pull Request
Distributed under the MIT License. See LICENSE for more information.
- Bot ini untuk keperluan legal dan sah
- Penyalahgunaan data pribadi dapat dikenakan sanksi hukum
- Pastikan compliance dengan regulasi perlindungan data
- π§ Email: kontak@classy.id
- Neonize - WhatsApp Web API framework
- Thundra.io - Media handling utilities
- Google Apps Script - OCR processing engine
- Indonesian Government - Document format standards
Made with β€οΈ for Indonesian developers