Skip to content

eval_figure_feasibility._page_visual_signals: Fallback page_number-1 falsch bei textlosen Seiten #78

Description

@TillQuandel

eval_figure_feasibility._page_visual_signals nutzt im Fallback-Pfad (PDF ohne nutzbare /PageLabels) page_number - 1 als physischen PyMuPDF-Index. pdf_to_pages verwirft aber textlose/leere Seiten und zählt lückenlos neu → bei textlosen Seiten zeigt page_number - 1 auf die falsche physische Seite.

Scope: Betrifft nur das Feasibility-Diagnose-Tool (eval_figure_feasibility, nicht vom Orchestrator importiert), nicht den figure_alt-Bind. Vorbestehend — auch vor dem PageLabels-Fix war die Annahme „page_number == 1-basierter physischer Index" bei textlosen Seiten falsch.

Fix-Richtung: Denselben text-page→physical-index-Mechanismus nutzen wie figure_alt (has_text-Zählung / _page_text_flags) statt page_number - 1.

Quelle: Codex-Re-Review, 2. Durchgang.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions