Bu Python betiği, popüler GitHub repo'larından staj ilanlarını otomatik olarak çeker, şirketlerin web sitelerinden domain bilgilerini ayıklar ve Hunter.io API kullanarak ilgili iletişim e-postalarını bulup bir Excel dosyası oluşturur.
- Canlı Veri Çekme: Güncel staj listelerini doğrudan GitHub üzerinden okur.
- Akıllı Regex: Markdown linklerini temizleyerek şirket adlarını ve web sitelerini ayıklar.
- Domain Analizi: Şirket web sitelerinden otomatik domain tespiti yapar.
- Excel Çıktısı: Verileri
Şirket,Rol,Lokasyon,WebsiteveE-posta/Başvuru Linkisütunlarıyla kaydeder.
-
Gerekli Kütüphaneleri Yükleyin:
pip install pandas requests openpyxl
-
API Anahtarı:
- Hunter.io üzerinden aldığınız API anahtarını kodun içindeki
HUNTER_API_KEYkısmına ekleyin.
- Hunter.io üzerinden aldığınız API anahtarını kodun içindeki
Kodu çalıştırmak için terminale şu komutu yazın:
python internship-scrapper.py