🎙️ GoogleWithRVC

GoogleWithRVC adalah aplikasi pengubah suara berbasis web (Web-UI) yang menggabungkan kecanggihan Google Text-to-Speech (Google Cloud & Gemini API) dengan teknologi Retrieval-based Voice Conversion (RVC) lokal. Aplikasi ini dirancang khusus untuk mempermudah kreator konten, streamer, dan developer dalam menghasilkan vokal karakter berkualitas tinggi secara instan lengkap dengan parameter audio DSP (Digital Signal Processing) profesional.

✨ Fitur Utama

Multi-Engine TTS:
- Gemini 3.1 Flash (TTS API): Suara narasi natural dengan ekspresi berkualitas tinggi.
- Edge-TTS: Alternatif gratis, cepat, dan handal (tanpa API key).
- Google Cloud TTS (Wavenet): Kualitas vokal premium dari Google Cloud.
Local RVC Inference:
- Melakukan konversi suara dasar hasil TTS menjadi suara karakter pilihan secara lokal menggunakan model RVC (.pth dan .index).
Advanced DSP Tuning Rack:
- Pitch & Formant Shifter: Transpose nada vokal serta atur karakter ketebalan/warna vokal (Timbre).
- Equalizer (Bass, Mid, Treble): Kontrol kehangatan, kejelasan vokal, dan clarity nada tinggi.
- Studio Reverb: Tambahkan kedalaman gema ruangan (Wet level & Room size).
- Noise Gate: Hapus desisan/noise halus di latar belakang secara dinamis.
Real-Time Visualizer Monitor:
- Monitor gelombang audio neon siber interaktif menggunakan Web Audio API.
Model Manager:
- Unggah checkpoint model RVC (.pth) dan file indeks (.index) secara langsung melalui Web UI.
Smart Settings Persistence:
- Semua pengaturan panel instrumen dan pilihan model otomatis tersimpan di localStorage agar tidak hilang ketika halaman di-refresh.

🛠️ Prasyarat System

Python: Versi 3.10 atau 3.11 (Sangat direkomendasikan karena RVC & Fairseq membutuhkan versi ini).
Node.js & Package Manager: Node.js v18+ (Menggunakan npm atau bun untuk kecepatan maksimal).
GPU Acceleration (Opsional tapi Direkomendasikan): Kartu grafis Nvidia dengan driver CUDA terinstal untuk konversi vokal RVC instan di GPU.

🚀 Panduan Instalasi & Menjalankan Aplikasi

1. Setup Backend (Python FastAPI)

Masuk ke folder backend:
```
cd backend
```
Buat Virtual Environment:
```
python -m venv venv
```
Aktifkan Virtual Environment:
- Windows (PowerShell):
```
.\venv\Scripts\Activate.ps1
```
- Linux/macOS:
```
source venv/bin/activate
```

Instal PyTorch dengan dukungan CUDA (jika memiliki GPU Nvidia):

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

Instal dependensi lainnya dari requirements.txt:
```
pip install -r requirements.txt
```

Salin berkas konfigurasi env:

Ubah nama berkas .env.example (jika ada) atau buat file .env baru di dalam folder /backend/ dengan isi:

# Google Gemini API Key (Dapatkan gratis di Google AI Studio)
GEMINI_API_KEY="API_KEY_GEMINI_ANDA"

# Google Cloud Service Account (Hanya jika menggunakan Wavenet TTS)
# GOOGLE_APPLICATION_CREDENTIALS="C:\\path\\to\\your\\google-cloud-key.json"

Jalankan server backend:
```
python main.py
```
Server backend akan aktif secara default di http://localhost:8000.

2. Setup Frontend (React + Vite)

Buka terminal baru dan masuk ke folder frontend:
```
cd frontend
```

Instal dependensi node (menggunakan npm atau bun):

# Menggunakan Bun (Sangat Direkomendasikan)
bun install

# Atau menggunakan NPM
npm install

Jalankan server frontend dalam mode development:

# Menggunakan Bun
bun run dev

# Atau menggunakan NPM
npm run dev

Buka tautan lokal yang tertera pada terminal (biasanya http://localhost:5173) di browser Anda.

📂 Struktur Penyimpanan Model RVC

Model RVC disimpan di dalam direktori backend/assets/models/. Setiap model harus ditempatkan di subfolder yang dinamai sesuai dengan nama karakter/model tersebut.

Struktur folder model:

backend/assets/models/
├── Furina/
│   ├── Furina.pth
│   └── Furina.index  (Opsional)
├── Kobo_Kanaeru/
│   ├── Kobo_Kanaeru.pth
│   └── Kobo_Kanaeru.index  (Opsional)

💡 Tips: Anda dapat langsung menyeret dan mengunggah berkas .pth dan .index melalui tab Model Manager pada antarmuka web, dan aplikasi akan membuat struktur folder ini secara otomatis.

🔧 Solusi Masalah Umum (Troubleshooting)

Error 'tuple' object has no attribute 'dtype' saat Konversi:
- Aplikasi ini sudah dilengkapi monkey-patch otomatis untuk pustaka rvc_python yang mengganti pemanggilan parser audio bawaan (pyav v17+ yang tidak kompatibel) menggunakan parser berbasis librosa. Pastikan librosa telah terinstal dengan baik di dalam virtual environment Anda.
UnpicklingError pada PyTorch 2.6+:
- PyTorch versi terbaru mengaktifkan weights_only=True sebagai default saat memuat model. Aplikasi ini secara otomatis mem-patch torch.load saat inisialisasi server untuk menggunakan weights_only=False agar model HuBERT/fairseq dapat dimuat secara lokal dengan aman.
Masalah Kompatibilitas Python 3.11/3.12 (OmegaConf/Fairseq):
- Fairseq bawaan memiliki bug kompatibilitas dengan dataclasses Python 3.11+. Server FastAPI kami secara otomatis mem-patch modul dataclasses bawaan Python saat startup agar proses inisialisasi berjalan lancar tanpa error mutable default.

📄 Lisensi

Proyek ini dirilis di bawah lisensi MIT License. Anda bebas menggunakan, memodifikasi, dan mendistribusikan proyek ini untuk kebutuhan personal maupun komersial.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
backend		backend
frontend		frontend
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🎙️ GoogleWithRVC

✨ Fitur Utama

🛠️ Prasyarat System

🚀 Panduan Instalasi & Menjalankan Aplikasi

1. Setup Backend (Python FastAPI)

2. Setup Frontend (React + Vite)

📂 Struktur Penyimpanan Model RVC

🔧 Solusi Masalah Umum (Troubleshooting)

📄 Lisensi

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🎙️ GoogleWithRVC

✨ Fitur Utama

🛠️ Prasyarat System

🚀 Panduan Instalasi & Menjalankan Aplikasi

1. Setup Backend (Python FastAPI)

2. Setup Frontend (React + Vite)

📂 Struktur Penyimpanan Model RVC

🔧 Solusi Masalah Umum (Troubleshooting)

📄 Lisensi

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages