Command-line tool untuk mengumpulkan review produk dari Zalora dan mengekspornya ke dalam format CSV.
Tool ini ditujukan untuk kebutuhan pengumpulan dataset, analisis data, maupun eksperimen NLP.
- Ekstraksi review dari satu URL atau batch dari file berisi daftar URL
- Logging terstruktur dengan progress indicator dan mode verbose
- Ringkasan statistik distribusi rating setelah proses selesai
- Ekspor otomatis ke format CSV lengkap dengan metadata produk
- Python ≥ 3.13
- Poetry
Clone repository:
git clone https://github.com/RozhakDev/ZaloraReviewExtractor.git
cd ZaloraReviewExtractorInstall dependencies:
poetry install| Mode | Perintah | Keterangan |
|---|---|---|
| Single URL | poetry run python -m zalora_scraper url "<product_url>" |
Scrape review dari satu produk |
| Contoh | poetry run python -m zalora_scraper url "https://www.zalora.co.id/p/product-name" |
Contoh penggunaan langsung |
| Batch (File) | poetry run python -m zalora_scraper file urls.txt |
Scrape beberapa produk dari file |
urls.txt berisi satu URL per baris:
https://www.zalora.co.id/p/product-1
https://www.zalora.co.id/p/product-2
| Opsi | Deskripsi |
|---|---|
--output <path> |
Menentukan lokasi file atau direktori output |
--max-pages <int> |
Membatasi jumlah halaman review per produk |
-v |
Mengaktifkan verbose logging |
Tool ini mengekstrak review dari URL produk Zalora resmi dengan pagination otomatis dan dapat dibatasi menggunakan
--max-pages; gunakan secara wajar untuk menghindari pembatasan sistem.
MIT License