5月1日消息,DeepSeek于4月30日在AI开源社区HuggingFace上正式发布了一款名为DeepSeek-Prover-V2-671B的新模型。 据悉,DeepSeek-Prover-V2-671…
具体来说,在普特南测试中,参数量较小的DeepSeek-Prover-V2-7B用非CoT生成模式成功解决了13个671B模型未能解决的问题。 在合成冷启动数据上对证明器模型进行微调后进行强化学习阶段,进一…