1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
团队提出的Archer方法,核心是“双Token约束”——不拆分Token,而是给它们定制不同的训练规则。 Archer用精细化的Token管理,让小模型的每一个参数都用在刀刃上,学会如何更好的组织使用已有…
团队提出的Archer方法,核心是“双Token约束”——不拆分Token,而是给它们定制不同的训练规则。 Archer用精细化的Token管理,让小模型的每一个参数都用在刀刃上,学会如何更好的组织使用已有…
表 1:医院实际部署深度求索医疗解决方案的场景及需求。除此之外,由于是面向医疗专业人员的应用,如诊断和治疗决策支持,这些应用需要最高标准的推理和可解释性。 张一教授强调,包括中国在内,许多国家在医院大语言…
紧接着在7月28日凌晨,智谱带来了其自身迄今为止最大参数的开源模型GLM-4.5,虽然彭博在援引知情人士表述时写的是“该公司正试图在全球范围内挑战OpenAI”,但一样走开源路线,一样希望在海外引爆的思路,…
据闪德资讯获悉,Sandisk宣布创立技术顾问委员会,为高频宽快闪存储技术 (HBF) 提供发展与策略指导。 DavidPatterson教授和Raja Koduri已获正式任命为委员会成员,为Sandis…
7月25日,科大讯飞宣布讯飞星火X1深度推理大模型完成新一轮迭代,不仅在核心能力上对标国际顶尖水平,更在多语言处理、幻觉治理、行业落地等维度实现突破性进展,让“全国产算力训练”的标签焕发出更强的技术底气。在教…
感知系统是智能体 “认识世界” 的通道,通过多维度信息采集,将物理信号转化为可处理的数据,支撑后续决策。 交互机制:环境交互:物理操作(如推、拉、组装物体)、信息获取(如触碰探索物体属性);多智能体交互:如…
她在文中介绍其他嘉宾的作品,为张凌赫宣传新剧,提及与刘宇宁将合作的旅行综艺,十分贴心。 张凌赫的小作文简短,字里行间透着敷衍,虽也表达了开心和期待,却难看出对下一季的热切。他的合照里都没有张凌赫,这背后的原因…
先是看到“军艺校草”沈腾,哎呀,沈腾这次打扮真是年轻得让人惊讶,黑色短袖搭配白色裤子,简直是休闲至极!原本以为他会精心打扮一番,但镜头一转,居然拍到了他穿的人字拖,简直就是沈腾的风格,松弛到极致!他那双鞋似…
今日霍州根据此次业界的聚焦时刻,寻找到展会上产品主要聚焦的三个方向和趋势,大模型正双手入泥寻找落地应用,但基础大模型仍是未来角力的核心;机器人交互能力显著升级,但具身智能在工业中更接近爆发时刻;消费级AI产品…
作为AI领域的领军企业,科大讯飞此次升级让星火X1在翻译、推理等核心能力上持续领先,更在幻觉治理上超越主流模型。依托这一升级,科大讯飞的翻译机、录音笔等设备,以及同传会议服务体验全面提升,更推动AI在教育、医…
在核心能力上,讯飞星火X1升级版实现了综合能力的大幅跃升,在数学、翻译、推理、文本生成等多个关键领域持续保持领先地位,无论是处理复杂的数学问题,还是进行精准的语言翻译,亦或是生成高质量的文本内容,都不在话下…
7月25日,科大讯飞宣布讯飞星火X1深度推理大模型完成升级,其幻觉治理能力大幅提升,领先业界主流模型,让大模型回复更可靠。 升级后的星火X1综合实力亮眼:翻译、推理等核心能力对标国际一流,多语言支持扩至130…
在Transformer架构主导大模型领域的当下,移远通信以前瞻性的眼光,积极布局非Transformer的技术路线,致力于为客户提供更低算力、更少内存消耗的解决方案。RWKV的线性注意力架构,突破性地解决…
此次展会上全新升级的启智2.0,聚焦“让每个行业跑出专属生产力”,以“异构算力集群、垂类模型精研、行业智能体落地”构建全栈生态,直击“算力适配难、AI落地慢、应用不可信”三大痛点:通过全栈国产化融合引擎兼容…
7月28日,国产算力平台服务商清程机智宣布,公司旗下“赤兔”推理引擎首发适配国智谱最新开源的新一代旗舰模型GLM-4.5。GLM4.5是智谱专为智能体应用打造的基础模型,在所有开源模型中实现SOTA( St…
2025年的综艺市场展现出前所未有的繁荣,各大平台纷纷推出自己的实力节目,整体呈现出百花齐放的局面。 今年,芒果TV的《乘风2025》继续掀起“姐姐热潮”,60岁的叶童用其“少年感”吸引了众多目光,节目中更是…
新京报贝壳财经讯(记者罗亦丹)7月28日晚,智谱发布新一代旗舰模型 GLM-4.5,系专为智能体应用打造的基础模型。Hugging Face 与ModelScope 平台同步开源,模型权重遵循 MIT Li…
为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推…
GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA,在真实代码智能体的人工对比评测中,实测国内最佳;采用混合专家(MoE)架构,包括 GLM-4.5:总参数量 3550 亿,激活参数 …
证券之星消息,佳都科技(600728)07月28日在投资者关系平台上答复投资者关心的问题。投资者提问:请问贵公司近期是否有部署和应用Deepseek? 自2023年起,公司持续关注DeepSeek大模型技术…
通过与生态伙伴紧密合作,云天励飞进一步加强了产品的市场适配,尤其是在具身智能和边缘计算领域,确保其AI推理芯片能够在不同应用环境中发挥最佳性能。 云天励飞通过“算力积木”架构和国产工艺的创新,以及持续的产业…
这是一款基于国产工艺的D2D Chiplet & C2CMesh大模型推理架构,通过灵活模块化的设计、高效的算力调度和低延迟的数据传输,突破国产工艺代差限制,将算力扩展至能满足从3B到671B MoE大模…
壁仞对超节点的技术预研和布局较早,不仅在第一代产品上就实现了真正意义上的超节点,更通过液冷等散热技术的自研创新,将数十甚至上百个计算单元整合在一个高度集成的机柜中,也能极大实现算力密度和能源效率的提升。在他看…
京东健康探索研究院(JDHXLab)首席科学家王国鑫表示:“自2023年7月发布‘京医千询’以来,我们用两年时间完成了大模型在医疗全场景的迁移和学习,并率先实现大模型产品体系的规模化落地。据悉,在WAIC …
在7月26日举行的2025世界人工智能大会(WAIC 2025)上,联想集团副总裁、联想中国技术管理委员会执行主席阿不力克木·阿不力米提(阿木)公布了联想多项AI终端原生技术,包括多模态自然交互的AUI、终端…
知名 AI 研究机构 Artificial Analysis 甚至直接发文称:Qwen3 是“全球最智能的非思考基础模型”。HuggingFace CEO Clem 这几天在 X 上几乎瀑布流式转发刷屏,…
更令观众关注的是华为云的昇腾AI云服务,让超节点能够以云服务的形态实现按需用、随心用,降低企业应用先进智算基础设施的门槛,同时直接使用华为云成熟的软件栈和工具链,为自身研发、部署、应用大模型赋予全新的加速…
围绕AI Agent,启明创投提出了两大展望:一方面,未来12—24个月,Agent形态有望从“工具辅助”走向“任务承接”,首批真正意义上的“AI员工”将进入企业,广泛参与客户服务、销售、运营、研发等核心流…
公司情报专家《财经涂鸦》获悉,7月26日至29日,2025 世界人工智能大会(WAIC 2025)期间,朴赛计算机在H1馆-A105展位重点展示了PGI654-D08L与PGA644-D08L两款旗舰级AI…
7月28日,在2025世界人工智能大会的论坛上,。据官方介绍,Agentar-Fin-R1基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同…