"Sitasi adalah percakapan. AI seharusnya membaca nada dan jedanya, bukan hanya menghitung volume suaranya."
Semantic Echo adalah framework analisis sitasi berbasis Graph Neural Networks (GNN) yang mengukur kedalaman pengaruh konseptual (influence depth) antar karya ilmiah. Berbeda dengan metrik tradisional seperti H-index atau jumlah sitasi yang hanya menghitung kuantitas, Semantic Echo menganalisis kualitas dan kedalaman pengaruh dengan cara membandingkan perubahan vektor representasi makalah sebelum dan setelah sitasi terjadi.
Metrik sitasi konvensional tidak dapat membedakan antara:
- Kutipan perfunctory (sekilas/formalitas)
- Kutipan transformatif (yang mengubah arah penelitian fundamental)
Semantic Echo menjawab pertanyaan: "Seberapa banyak 'DNA konseptual' Paper A mengubah vektor penelitian Paper B?"
-
Konstruksi Graf Heterogen Dinamis:
- Node: Makalah, Penulis, Jurnal, Institusi, Kata Kunci (Keyphrase)
- Edge: Sitasi, Co-Authorship, Publikasi di, Afiliasi, Kesamaan Semantik
- Mengadopsi pendekatan Heterogeneous Dynamical Graph Neural Network (SI-HDGNN) untuk graf akademik berbobot, terarah, dan teratribusi
-
Arsitektur GNN:
- Menggunakan GraphSAGE atau GAT (Graph Attention Networks) untuk agregasi tetangga
- Node Features: Embedding teks dari abstrak (menggunakan SciBERT), fitur struktural (degree centrality), dan fitur temporal (tahun publikasi)
- Menghasilkan vectorized representations untuk setiap node yang dapat di-train
-
Metrik "Semantic Echo":
- Mengukur cosine similarity antara vektor Paper A pada waktu
tdengan vektor Paper B pada waktut+n - Bukan sekadar prediksi link, tetapi perubahan embedding space yang disebabkan oleh kemunculan suatu karya
- Mengukur cosine similarity antara vektor Paper A pada waktu
# 1. Clone repositori
git clone https://github.com/stipwunaraha/citation-graph-neural-embedding.git
cd citation-graph-neural-embedding
# 2. Buat virtual environment
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 3. Instal semua dependensi
pip install -r requirements.txt
# 4. Instal package untuk pengembangan (opsional)
pip install -e .from semantic_echo import CitationGraph, InfluencePredictor
# Muat dataset (misal: subset DBLP atau OpenAlex)
graph = CitationGraph.from_openalex(doi_list=["10.xxx/paper1", "10.xxx/paper2"])
# Latih model GNN
predictor = InfluencePredictor(graph)
predictor.train(epochs=100)
# Dapatkan "Echo Score" antara dua makalah
score = predictor.echo_score(source_doi="10.xxx/paper1", target_doi="10.xxx/paper2")
print(f"Kedalaman pengaruh: {score:.4f}")citation-graph-neural-embedding/
βββ semantic_echo/ # Source code utama
β βββ __init__.py # Inisialisasi package
β βββ data_loader.py # Loader dataset (OpenAlex, arXiv, DBLP)
β βββ embeddings.py # Pembangkitan embedding (SciBERT, dll.)
β βββ graph.py # Konstruksi dan manipulasi graf
β βββ models.py # Model GNN (GraphSAGE, GAT, dll.)
β βββ metrics.py # Metrik evaluasi (Echo Score, dll.)
βββ tests/ # Unit test dan integration test
βββ configs/ # File konfigurasi YAML
βββ examples/ # Contoh penggunaan dan notebook
βββ utils/ # Fungsi utilitas tambahan
βββ requirements.txt # Daftar dependensi Python
βββ setup.py # Setup script untuk instalasi package
βββ docs/ # Dokumentasi lengkap
- OpenAlex: API terbuka dengan data sitasi lengkap
- arXiv + Semantic Scholar: Untuk data teks dan graf sitasi
- DBLP: Data publikasi ilmu komputer
| Kategori | Library/Framework |
|---|---|
| Deep Learning | PyTorch β₯ 2.0, PyTorch Geometric β₯ 2.3 |
| NLP | Transformers (SciBERT), Sentence Transformers |
| Scientific Computing | NumPy, SciPy, Pandas |
| Visualisasi | Matplotlib, NetworkX |
| Testing | pytest, pytest-cov |
| Development | black, flake8 |
- β Implementasi dasar GCN/GAT dengan PyTorch Geometric
- β Integrasi SciBERT untuk node features
- π Skrip scraper untuk OpenAlex
- π Evaluasi terhadap metrik "Disruption Index" sebagai baseline
- π Dashboard visualisasi interaktif
- π API REST untuk akses programatik
Kami sangat terbuka untuk kontribusi! Cara memulai:
- Baca CONTRIBUTING.md untuk panduan detail
- Cek Issues untuk tugas yang tersedia
- Fork repositori dan buat pull request
Proyek ini dilisensikan di bawah Lisensi MIT - lihat berkas LICENSE untuk detail.
Penulis & Kontributor: @stipwunaraha dan komunitas
Kata Kunci: Graph Neural Networks, Citation Analysis, Academic Impact, Semantic Similarity, PyTorch, Scientometrics