经过计算最优抽样训练大言语模型推理器 更小 却更优 更弱

经过计算最优抽样训练大言语模型推理器 更小 却更优 更弱

一、论断写在前面论文题目,Smaller,Weaker,YetBetter,TrainingLLMReasonersviaCompute,OptimalSampling论文链接,​​https,arxiv.org,pdf,2408.1673......
koi 11-14
473 197 661