请问解决了训推不一致的问题吗?即生成的token概率和 transformer生成的token概率不一致
请问解决了训推不一致的问题吗?即生成的token概率和 transformer生成的token概率不一致