Skip to content

Dashboard: inhaltliche Follow-ups aus dem Visual-Polish-Review (2026-06-10) #36

Description

@TillQuandel

Aus dem Inhalts-Review nach PR #34/#35, der Priorität nach:

  1. „Akzeptanzrate über Versionen" (ch4) ist mit 59 Versionen × 37 PDFs ein Spaghetti-Plot. Spec (Dashboard-Filter-Refactor im Vault) sagt: ab n≥4 Versionen aggregieren/facetten. Vorschlag: eine Median-Linie über alle PDFs als Default, Per-PDF-Linien nur bei aktivem PDF-Filter.
  2. Trade-off-Scaling mischt alle 94 Runs inkl. v0.1.0-Ära — kaputte Frühversionen verzerren „skaliert die Pipeline mit der PDF-Länge?". Vorschlag: Default auf jüngere Versionen (z. B. letzte 10) oder ältere Punkte dimmen.
  3. Kalibrierungs-Tabelle ohne Arbeits-Reihenfolge: zum Labeln die Notes mit höchster LLM-Fehlerquote zuerst (größter Informationsgewinn pro Label). Sortierung + ggf. „als Nächstes labeln"-Markierung.
  4. Übersicht-Insight um Version-über-Version-Delta erweiternkpi_trend hat die Mediane pro Version bereits. Beispiel: „v0.3.135: 9,7 % Fehlerquote (n=2) vs. v0.3.134: x % (n=y)". N-Guard nötig (kein Besser/Schlechter bei n<20).

Kontext: Variant-H-Layout und Pastell-Palette sind bindend (kein Redesign); Read-only-Regel für quality_history/runs/DB gilt weiter.

🤖 Generated with Claude Code

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions