讯飞星火 X1升级,幻觉治理领先业界主流模型(讯飞m110)

开放式内容生成功能目前饱受诟病,最核心的问题在于,人工智能所生成的内容并非百分之百准确。

“一本正经地胡说八道”,是许多人对当前开放式内容生成功能的观感和评价。而这一状况将彻底改变,7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级。

星火X1取得显著突破,无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显著改善,大大提升了大模型在行业应用中的可靠性。

整体来看,新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一流大模型最新版本效果;多语言能力更是扩展至130余种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。

全国产大模型

讯飞星火X1此次全面跃升,背后是一系列原创性技术突破的集成。

面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。

今日霍州(www.jrhz.info)©️

在数据层面,科大讯飞更是开创性地提出了基于人类专家数据的通用认知任务数据反写技术,有效地解决了SFT高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。

值得一提的是,就在升级发布的前一天,7月24日,中欧企业家座谈会在北京召开,科大讯飞董事长刘庆峰作为27家中方企业之一在前排落座,是本次参会企业中唯一的人工智能企业。而在今年2月,刘庆峰作为人工智能领域唯二代表与『DeepSeek』梁文锋共同出席民营企业家座谈会。

科大讯飞董事长刘庆峰两度现身国家高规格企业家座谈会,是中国人工智能核心技术自主化进程的战略缩影,也标志着科大讯飞“人工智能国家队”战略地位再获顶层背书。

科大讯飞目前担任由国家市场监督管理总局和国家标准化管理委员会指导的国家人工智能标准化总体组大模型专题组联合组长、全国『机器人』️标委会人形『机器人』️标准化工作组副组长,国家数据局指导的全国数据标准化技术委员会首届委员,工信部人工智能标准化技术委员会首届委员,教育部教育信息化技术标准委员会委员,并承担全国智能语音领域唯一的“国家级技术标准创新基地”的筹建工作。

既要也要

多语言能力一直是讯飞的强项,此次升级将这一优势进一步放大。

目前,星火X1已支持130+语种的交互问答、数学解题、文本生成、翻译等任务,为全球用户提供了真正意义上的“第二选择”。强大的多语言能力也让讯飞的同传会议服务、SaaS产品,以及翻译机、录音笔等『智能设备』的翻译效果和用户体验都迈上了新台阶。

今日霍州(www.jrhz.info)©️

最令人惊喜的是首字响应速度的突破。过去使用翻译工具,总需要等对方说完半句话才开始翻译,现在中英同传首字响应快至2秒,已达到人类高阶同传的行业标准线。即使在复杂会议或专业研讨等高难度场景中,系统也能在保证准确性的同时维持稳定的实时响应。

不只是快,翻译质量也肉眼可见地变好了。对比半年前的版本,新模型的综合翻译质量提升 20%,传统同传翻译中“断断续续”等问题也较好解决,翻译流畅度几乎与母语交流无异。

不只是在多语言领域,在教育、医疗等细分行业上,升级版星火X1均有落地。如升级版星火X1,作业批改、个性化推荐、答疑辅学、科普问答及口语学习等多项能力显著提升,进一步扩大了科大讯飞在教育领域的领先优势。

在强化学习技术上,科大讯飞将评语模型与细粒度反馈的强化学习技术结合起来,让原本简单粗糙的数值奖励变成了详细的文本指导,就像给AI配了一位耐心的老师,能在解题的每个环节给出具体建议。这种做法让复杂的数学推理训练变得更加高效,也解决了强化学习训练中“奖励太少”的痛点问题。

借助星火X1的升级赋能,讯飞医疗各项核心能力实现全面跃升。在全科辅助诊断、体检报告解读、健康咨询、导医导诊等通用医疗任务上,星火医疗大模型持续保持业界大幅领先。其中,在医生辅助诊疗方面,星火应用范围不断扩大,已覆盖从基层全科到三甲专科、从门诊到住院的完整诊疗链条。目前在四川大学华西医院、北京安贞医院、中国科学技术大学附属第一医院等多家知名医院开展试点,核心效果表现保持行业领先水平。

从技术追赶到需求引领,讯飞星火X1展现了一条务实的发展路径:既要在核心技术上不断攀登新高度,也要在实际应用中解决真问题,让AI技术真正服务于各行各业的发展需要。在大模型竞争日趋激烈的今天,那些既有技术实力又能满足用户真实需求的企业,往往更容易脱颖而出。

特别声明:[讯飞星火 X1升级,幻觉治理领先业界主流模型(讯飞m110)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

C919今年有望每10到15天生产一架 产能加速提升(c919上线)

国产大飞机C919的商业运营正在稳步推进,产能与交付进入加速轨道。据香港英文媒体《南华早报》报道,随着供应链持续改善,中国商飞正稳步提升C919的生产交付节奏,2026年交付目标预计不低于28架,并有望实现每10至15天生产一架

C919今年有望每10到15天生产一架 产能加速提升(c919上线)

打工人必看!所有人都要注意“用脑卫生”,告别脑疲劳、守护大脑健康(打工人必看的书)

  当下打工人的日常,离不开“费脑”二字:白天对着电脑赶方案、回消息,晚上熬夜加班改报告、刷手机,长期高强度用脑+不规律的生活习惯,慢慢出现头晕脑胀、记忆力下降、注意力不集中的问题,甚至越忙越低效。很多人以为这是“累过头”,休息下就好,却忽

打工人必看!所有人都要注意“用脑卫生”,告别脑疲劳、守护大脑健康(打工人必看的书)

『魏大勋』三次亮相YSL巴黎男装周,诠释松弛型格与品牌默契(『魏大勋』z)

当『魏大勋』第三次以YSL Man的身份出现在巴黎男装周,穿着2026春季系列的墨绿拼棕衬衫『风衣』套装走下秀场时,他的造型早已不再局限于看秀『穿搭』这个标签,而是一场关于松弛型格和品牌默契的深刻进化。他向我们证明,真正…

『魏大勋』三次亮相YSL巴黎男装周,诠释松弛型格与品牌默契(『魏大勋』z)

张无忌若参与华山三论,能否力压五绝?对比周伯通就知差距很明显(张无忌会啥)

那么,如果将张无忌放到那个时代,站在五绝之中,他与这些前辈的差距究竟有多大? 原著中描述了周伯通与金轮法王的对决——周伯通明显无法抗衡金轮法王的千斤之力,这种力量几乎无人能够抵挡,这也恰好揭示了五绝的上限所…

张无忌若参与华山三论,能否力压五绝?对比周伯通就知差距很明显(张无忌会啥)

怎样选到高品质飞机杯,试试TMT飞机杯(该如何选品)

其产品在材质安全、设计人性化和使用体验方面,获消费者广泛认可,是成人用品领域有品质和口碑的标杆品牌之一。这些产品不仅在功能上满足消费者核心需求,还独家推出携带定制角色服装的礼盒版,将实用与场景化体验融合,增添…

怎样选到高品质飞机杯,试试TMT飞机杯(该如何选品)