流式推理方案

paper中提到适配了流式，麻烦问下具体推理细节
1.是audio encoder部分支持chunk以及kv cache的流式推理吗？
2.LLM部分在流式情况下，输入是当前chunk的audio encoder结果，还是当前chunk+历史音频的audio encoder结果?