一点建议

你好，注意到你们的readme中提到了LLM幻觉的解决，这个项目主打极致轻量+零侵入地解决幻觉。但在今天，使用大模型的过程中，一般只会出现信息错误（时效性、理解偏差），这是语义化的错误，简单的正则基本无效；或者极长文本接近上下文上限时对早期信息的记忆偏差，这也是语义错误。这时候只有一个带状态的LLM能在理论上发现错误。但是，假设查验LLM和生成LLM都是100w上下文，在90k处生成LLM犯的错误，另一个同样的模型能找出来吗？这里的核心问题是self-bias——当两个模型能力等价、知识边界一致时，查验模型与生成模型共享同一套参数化知识盲区，无法辨识生成模型自身无法识别的错误。如果找不出来，那么这个项目没有意义；如果找得出来，开销有多大？而且在实际场景中，生成模型和查验模型一致时，inference mode不同带来的判别力增益极其有限，不太可能出现生成错误但被自己找出来的情况，项目仍然没有意义。如果只传单次输出、不传完整上下文，让查验用RAG搜索，那么框架的信息完备性严重不足，生产环境不如LangChain/LangGraph。

所以你们应该做的事是信息时效性校验，而不是幻觉解决。但你们的信源获取过于简略了——直接将用户问题原样作为query检索，毫无query rewriting或query expansion策略，这十分考验用户的表达能力；生产环境中我们一般不考虑用户拥有清晰的表述。而且搜索结果不做任何相关性过滤、去重或重排，直接以搜索引擎原始的top-k raw output拼入prompt塞给LLM。大量噪声结果会增加context pollution，既稀释LLM的判断注意力，又线性增加token成本。还有，所有rules只要有一个失败就短路中断，然后将error feedback原样注入LLM重试；如果用在LangGraph这类拥有自身state machine和recursion limit的编排框架中，外部装饰器强行修改input重新触发完整图执行，会导致控制流冲突，与LangGraph内部的state tracking、checkpoint机制以及节点级graph recursion limit打架，最终造成执行逻辑混乱或静默崩溃。

建议：砍掉幻觉解决的叙事，专注时效性校检。检索侧补query rewrite+rerank，rule chain改成非短路、结果汇总后再决策，别跟编排框架抢控制权。轻量没问题，但五脏得全。

祝你们顺利

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

一点建议 #1

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

一点建议 #1

Description

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions