8月12日,华为将与中国银联共同发布AI推理最新应用成果,并推出推理加速新技术。据多方消息,当天华为将展示在AI推理领域的突破性技术,有望减少中国AI推理对高带宽内存(HBM)技术的依赖,提升国内AI大模型的推理性能,进一步完善中国的AI推理生态系统。
HBM是解决“数据搬运”问题的关键技术。如果HBM不足,用户在使用AI推理时会遇到任务卡顿、响应慢等问题,严重影响体验。
此外,在8月12日举行的“2025金融AI推理应用落地与发展论坛”上,来自信通院、清华大学和科大讯飞的专家将分享关于大模型推理加速与体验优化的实际经验。