该报告聚焦 2025 年上半年中文大模型进展,通过 SuperCLUE综合测评体系,对模型进行多维度评估。在数学、科学推理,代码生成、智能体、指令遵循及文本处理方面,设置 1579 道多轮简答题测试。结果显…
《中文大模型基准测评2024年度报告》由SuperCLUE团队发布,对2024年中文大模型进行全面测评与分析,展现了大模型发展态势、测评体系及成果。- 综合效能与性价比:部分国产模型如DeepSeek-V…