"Apakah mereka benar-benar membaca abstraknya, atau hanya membaca judulnya?"
Wunaraha adalah framework Python untuk mengaudit kualitas metrik alternatif (Altmetrics). Tools ini menggunakan AI dan NLP untuk membedakan antara Buzz Viral (Kebisingan) vs. Intellectual Adoption (Adopsi Intelektual) dalam percakapan media sosial tentang publikasi ilmiah.
Metrik seperti H-index rentan terhadap self-citation dan citation cartels. Sebagai gantinya, muncul Altmetrics yang mengukur perhatian di media sosial. Namun, Altmetrics juga memiliki kelemahan serius:
- Bot dan Manipulasi: Download dan mention bisa dibeli atau diotomatisasi.
- Hype Sesaat: Sebuah makalah bisa viral karena judul kontroversial, bukan karena substansinya.
- Kebisingan: Tidak ada bedanya antara "Wow, ini keren!" dengan "Ini akan mengubah cara saya bekerja."
Wunaraha memanfaatkan Large Language Models (LLMs) dan Natural Language Processing (NLP) untuk mengaudit percakapan di balik metrik.
- Koleksi Data: Mengambil tweet/post/blog yang merujuk pada sebuah DOI.
- Analisis Kedalaman (Depth Analysis): Menggunakan model Transformer (seperti SciBERT atau RoBERTa) untuk mengklasifikasikan teks ke dalam tiga kategori:
- π§ Adopsi Intelektual: Penulis menunjukkan pemahaman mendalam, mengaitkan dengan pekerjaan sendiri, atau mengkritisi metodologi.
- π’ Buzz/Hype: Sekadar membagikan tautan, pujian kosong, atau reaksi emosional singkat.
- π€ Bot/Spam: Akun otomatis yang mem-posting tanpa konteks.
- Skor "Altmetric Purity": Metrik baru yang kami usulkan, yaitu persentase mention yang termasuk kategori Adopsi Intelektual.
git clone https://github.com/stipwunaraha/altmetric-validator-ai.git
cd altmetric-validator-ai
# Instal semua dependencies untuk development dan testing
pip install -r requirements-dev.txt
# Atau instal sebagai package editable
pip install -e ".[all]"pip install wunaraha
# atau
pip install -r requirements.txt# Jalankan unit tests
pytest
# Lihat coverage report
pytest --cov=wunaraha --cov-report=term-missingContoh Penggunaan:
from wunaraha import AltmetricAuditor
auditor = AltmetricAuditor(use_gpu=True)
# Audit sebuah DOI
report = auditor.audit(doi="10.1126/science.abc1234")
print(f"Total Mention: {report.total_mentions}")
print(f"Adopsi Intelektual: {report.intellectual_adoption} ({report.purity_score:.2%})")
print(f"Buzz: {report.buzz_mentions}")
print(f"Terindikasi Bot: {report.suspected_bots}")| Fitur | Deskripsi | Status |
|---|---|---|
| Depth Analysis | Klasifikasi mention ke dalam kategori: Adopsi Intelektual, Buzz/Hype, Bot/Spam | β Ready |
| Bot Detection | Deteksi akun otomatis berdasarkan pola posting dan konten | β Ready |
| Altmetric Purity Score | Metrik baru: persentase mention berkualitas tinggi | β Ready |
| Multi-Platform Support | Twitter/X, Mastodon, Blog (via RSS) | π§ In Progress |
| Dashboard Visualisasi | Streamlit dashboard untuk explorasi hasil audit | π§ Planned |
| Batch Processing | Audit multiple DOI sekaligus | π§ Planned |
βββββββββββββββββββ ββββββββββββββββββββ βββββββββββββββββββ
β Data Source ββββββΆβ Wunaraha Core ββββββΆβ Output β
β β β β β β
β β’ Twitter API β β β’ Mention Collectorβ β β’ Audit Report β
β β’ Mastodon API β β β’ Depth Classifier β β β’ Purity Score β
β β’ RSS Feeds β β β’ Bot Detector β β β’ JSON/CSV β
β β β β’ Report Generatorβ β β
βββββββββββββββββββ ββββββββββββββββββββ βββββββββββββββββββ
β
βΌ
ββββββββββββββββββββ
β AI Models β
β β
β β’ SciBERT β
β β’ RoBERTa β
β β’ DeBERTa (soon) β
ββββββββββββββββββββ
wunaraha/
βββ wunaraha/ # Package utama
β βββ __init__.py # Export public API
β βββ models.py # Data models (Mention, AuditReport, EngagementType)
β βββ auditor.py # Core logic (AltmetricAuditor class)
βββ tests/ # Unit tests
β βββ test_auditor.py # Test suite untuk auditor
β βββ ...
βββ requirements.txt # Dependencies minimal
βββ requirements-dev.txt # Dependencies development lengkap
βββ pyproject.toml # Package configuration
βββ setup.py # Setup script
βββ example_usage.py # Contoh penggunaan
βββ docs/ # Dokumentasi (coming soon)
Repository ini dilengkapi dengan:
- Unit Tests: 12 test cases dengan 74% code coverage
- Development Tools: pytest, black, flake8, mypy, isort
- CI/CD Ready: Konfigurasi untuk automated testing
Lihat SETUP_DEV.md untuk panduan lengkap setup development environment.
- Integrasi Twitter API v2 dan Mastodon API.
- Model klasifikasi depth-of-engagement berbasis DeBERTa.
- Dashboard Streamlit untuk visualisasi hasil audit.
- Dukungan untuk menganalisis berita dari Google News RSS.
- Quantitative Methods in Research Evaluation Citation Indicators, Altmetrics, and Artificial Intelligence (Thelwall, 2024).
- Have we reached the limits of altmetrics? (Research Information, 2023).
Kami mencari data scientist, NLP engineer, dan peneliti yang tertarik dengan research integrity.
Cara Berkontribusi:
- Fork repository ini
- Buat branch fitur (
git checkout -b feature/AmazingFeature) - Commit perubahan (
git commit -m 'Add AmazingFeature') - Push ke branch (
git push origin feature/AmazingFeature) - Buka Pull Request
Development Setup:
# Clone fork Anda
git clone https://github.com/YOUR_USERNAME/altmetric-validator-ai.git
cd altmetric-validator-ai
# Instal dependencies development
pip install -r requirements-dev.txt
# Jalankan tests sebelum commit
pytest --cov=wunaraha
# Format code
black wunaraha tests
isort wunaraha testsLihat CONTRIBUTING.md untuk panduan lengkap.
MIT License - lihat LICENSE untuk detail.