哈喽,请问可以开源训练Reason-RFT的Stage1(SFT)之后的模型嘛
哈喽,请问可以开源训练Reason-RFT的Stage1(SFT)之后的模型嘛