上海人工智能实验室:金融大模型应用评测报告-摘要版2025

上海人工智能实验室:金融大模型应用评测报告-摘要版2025

今天分享的是:上海人工智能实验室:金融大模型应用评测报告-摘要版2024

报告共计:17页

金融大模型应用评测报告(2024)摘要版》由上海人工智能实验室等机构发布,旨在推动金融科技创新,提升金融服务智能化水平,探索金融大模型应用新方向。

在评测范式上,本次评测涵盖14个主流大模型机构的20个模型,包括国内外、开闭源、通用基模与金融垂模。围绕金融行业核心业务需求和场景适配性,从模型基础能力、金融安全与价值对齐能力、金融风险控制能力、金融专业认知能力、金融业务辅助拓展能力5大维度展开。评测采用主客观结合的方式,使用《库帕思金融大模型评测数据集(2024版)》,以OpenCompass平台为核心工具,通过线性加权模型计算综合评估分数。

评测结果显示,参评模型总分平均为71.9分。Anthropic的Claude-3.5-Sonnet-20240620、阶跃星辰/财跃星辰的Step-2-16k/Finstep、阿里巴巴的Qwen2.5-72b-Instruct/Qwen2-VL-72B位列前三。各维度方面,模型基础能力平均得分59.8分,阿里巴巴的Qwen2.5-72B-Instruct领先;金融安全与价值对齐能力平均92.8分,阶跃星辰/财跃星辰的Step-2-16k表现突出;金融风险控制能力平均77.1分,Anthropic的Claude-3.5-Sonnet-20240620排名靠前;金融专业认知能力平均52.0分,腾讯的Hunyuan-Turbo/Hunyuan-Vision表现较好;金融业务辅助拓展能力平均77.8分,Anthropic的Claude-3.5-Sonnet-20240620居首。

评测总结指出,各模型在五大能力维度基本满足当下场景需求,但金融专业认知和多模态处理能力有待提升。同时,高质量金融语料建设,尤其是多模态数据集构建至关重要。此外,拓展和更新以金融业务为核心的评测框架,紧密结合实践,有助于规范行业发展,推动模型与业务需求精准对接。

本次评测为金融大模型行业发展提供了重要参考,指引了未来发展方向,对推动金融大模型在行业中的应用具有重要意义 。

以下为报告节选内容

特别声明:[上海人工智能实验室:金融大模型应用评测报告-摘要版2025] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

刘俊茜晋级男子110米栏半决赛 刷新个人最佳成绩(刘俊喆几岁)

北京时间9月15日晚,2025年东京田径世锦赛男子110米栏预赛激烈展开。陈圆将、徐卓一和刘俊茜三位选手全部跻身小组前四,直接晋级半决赛,为中国田径队在这一传统优势项目上续写新篇章

刘俊茜晋级男子110米栏半决赛 刷新个人最佳成绩(刘俊喆几岁)

被李乃文的中年状态惊艳到:不染白发,不穿大叔装,50岁反而有型(李乃文怎么样)

说到发型,李乃文可给中年男性♂️好好上了一课。偶尔他也会尝试三七分斜刘海,这种带点少年感的发型让整体造型更显年轻活力。他从不碰那些显老的大叔标配:既不穿塞衣角的polo衫,也不碰花里胡哨的"老年装"。 李乃文

被李乃文的中年状态惊艳到:不染白发,不穿大叔装,50岁反而有型(李乃文怎么样)

凯特威廉温莎亮相,查尔斯悼念,哈里悄悄献花,一家人却没见面!(凯特和威廉的爱情)

前一天他们刚与首相完成继位日仪式,王室官推那张配文"1926-2022"的女王肖像,让无数人红了眼眶。王室追忆杀,女王的三周年,时尚外交官凯特,兄弟疑云,巴尔莫勒尔的钟声 (关键词彩蛋:温莎城堡桑宁代尔

凯特威廉温莎亮相,查尔斯悼念,哈里悄悄献花,一家人却没见面!(凯特和威廉的爱情)

再漂亮有什么用?39岁辛芷蕾荣获影后的现状,给内娱女星提了个醒(再漂亮点就好了,再高点就好了)

这一成就不仅终结了自『巩俐』时代以来华人演员在该电影节的获奖空白,更标志着首位80后华人女演员登顶威尼斯影后宝座。在《繁花》中的李李、《怒晴湘西》的红姑娘等角色中,她独具辨识度的五官反而成就了独特的银幕魅力。1"…

再漂亮有什么用?39岁辛芷蕾荣获影后的现状,给内娱女星提了个醒(再漂亮点就好了,再高点就好了)

普通人遇到凶案该硬刚还是自保 切勿盲目正面抗衡(普通人遇到凶案怎么处理)

普通人遭遇凶案时,首要原则是先确保自身安全,切勿盲目正面抗衡。立即逃离:果断迅速地朝着安全区域(人多、明亮的地方)奔去,同时大声呼救。隐蔽周旋:若无法逃离,应立刻找一间坚固的房间,反锁房门,用重物堵住门,关闭灯光并保持安静,将手机调至静音状

普通人遇到凶案该硬刚还是自保 切勿盲目正面抗衡(普通人遇到凶案怎么处理)