Skip to content

RozhakDev/ZaloraReviewExtractor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Zalora Review Extractor

Command-line tool untuk mengumpulkan review produk dari Zalora dan mengekspornya ke dalam format CSV.
Tool ini ditujukan untuk kebutuhan pengumpulan dataset, analisis data, maupun eksperimen NLP.

Fitur

  • Ekstraksi review dari satu URL atau batch dari file berisi daftar URL
  • Logging terstruktur dengan progress indicator dan mode verbose
  • Ringkasan statistik distribusi rating setelah proses selesai
  • Ekspor otomatis ke format CSV lengkap dengan metadata produk

Requirements

  • Python ≥ 3.13
  • Poetry

Installation

Clone repository:

git clone https://github.com/RozhakDev/ZaloraReviewExtractor.git
cd ZaloraReviewExtractor

Install dependencies:

poetry install

Penggunaan

Mode Perintah Keterangan
Single URL poetry run python -m zalora_scraper url "<product_url>" Scrape review dari satu produk
Contoh poetry run python -m zalora_scraper url "https://www.zalora.co.id/p/product-name" Contoh penggunaan langsung
Batch (File) poetry run python -m zalora_scraper file urls.txt Scrape beberapa produk dari file

Format File Batch

urls.txt berisi satu URL per baris:

https://www.zalora.co.id/p/product-1
https://www.zalora.co.id/p/product-2

Opsi Tambahan

Opsi Deskripsi
--output <path> Menentukan lokasi file atau direktori output
--max-pages <int> Membatasi jumlah halaman review per produk
-v Mengaktifkan verbose logging

Catatan

Tool ini mengekstrak review dari URL produk Zalora resmi dengan pagination otomatis dan dapat dibatasi menggunakan --max-pages; gunakan secara wajar untuk menghindari pembatasan sistem.

Lisensi

MIT License

About

Python CLI for collecting Zalora product reviews with pagination support and CSV export.

Topics

Resources

License

Stars

Watchers

Forks

Contributors

Languages