forked from Akegarasu/lora-scripts
-
Notifications
You must be signed in to change notification settings - Fork 6
P1: 系统性解决本地多服务端口冲突、404 与无法连接问题 #50
Copy link
Copy link
Open
Labels
P1High priority issue that affects user experience but is not an immediate release blockerHigh priority issue that affects user experience but is not an immediate release blockerenhancementNew feature or requestNew feature or requesthelp wantedExtra attention is neededExtra attention is needed
Metadata
Metadata
Assignees
Labels
P1High priority issue that affects user experience but is not an immediate release blockerHigh priority issue that affects user experience but is not an immediate release blockerenhancementNew feature or requestNew feature or requesthelp wantedExtra attention is neededExtra attention is needed
背景
端口冲突已经成为本项目的持续痛点。当前项目同时管理多个本地服务端口:
28000:Next Trainer / 训练主页面 WebUI6008:lora-scripts-next 原创训练监控页6006:秋叶包原有 TensorBoard 默认端口28001:Dataset Tag Editor 默认端口这些服务都影响训练体验。只要用户本机某个端口被占用,或者某个服务错误地连接到另一个服务端口,就可能出现页面跳错、404、无法连接、训练监控离线、TensorBoard 抢占训练监控端口等问题。
痛点
最近版本已经多次遇到相关问题:
6006的 GUI API,返回HTTP Error 404: Not Found。这些问题虽然可以逐个热修,但根因是端口管理没有形成统一、可验证、可扩展的架构。
期望目标
希望有能力的团队成员或社区贡献者帮助项目彻底解决端口冲突、端口 404、端口无法连接的问题。建议方向包括但不限于:
补充:AutoDL / 云端 / 受限环境
项目也会部署在 AutoDL 云端或其他受限运行环境中,这些环境的端口情况和本地桌面环境不同:
28000、6006、6008、28001等默认端口。因此,端口治理方案不应只做“自动 fallback”,还应该保证每个内嵌服务端口都有用户可自定义能力。建议至少支持通过命令行参数、环境变量或配置文件显式设置:
并且 UI、文档和启动日志都应展示最终实际使用的端口,方便 AutoDL / 云端用户配置外部访问地址。
建议验收标准
28000、6006、6008、28001任一默认端口被占用时,应用仍能自动选择可用端口并正常启动核心训练流程。6006 GUI API这类错误指向。优先级
P1。该问题不是单一 P0 崩溃,但会持续影响用户训练体验和发布稳定性,需要系统性治理。