央广网北京7月15日消息(记者 万玉航)在AI大模型竞争趋于白热化之际,一场围绕行业数据的“深水区”较量正悄然展开。近日,在由中国信息通信研究院(以下简称“中国信通院”)主办的“存力中国行”活动中,华为数据存储产品线副总裁樊杰在接受央广财经记者专访时指出,AI下一阶段的突破将高度依赖高质量行业数据的释放,而存力正是激活数据价值、赋能垂直行业的关键基础设施。
华为数据存储产品线副总裁 樊杰
数据已成为新型生产要素和国家战略资源
在AI时代,企业想要保持领先,除了需要算力、算法的储备,更需要充足的高质量数据准备。“如今,公网数据即将开采殆尽,医疗、金融、科研等领域的行业数据才是未来金矿。”樊杰说。存力中心建设的意义,就是希望打破各行业的数据壁垒,打造AI时代的数据枢纽,通过规模汇聚释放数据价值。
作为承载数据全生命周期价值流动、保障数据要素高效配置与安全可控的核心底座,存力的战略性、基础性作用愈发重要。樊杰认为,随着存力中心在全国加速落地,一场以数据为燃料的产业革命也已拉开序幕。当行业数据与算力、算法深度融合,AI将真正跨越从“通用智能”到“专业智能”的鸿沟,为千行百业注入新质生产力。而在这场变革中,存力基础设施的角色已从幕后走向台前,成为决定AI进化速度的关键变量。
AI落地更多场景 还需深耕行业数据
高质量数据是AI落地行业的基础,但要想让大模型走向更多垂直场景,真正走进核心生产业务,还需要依靠先进存力和工程能力,降低AI应用门槛和部署成本,打通最后一公里。
樊杰提到不久前上海瑞金医院开源发布的RuiPath病理模型:“一开始,我们通过分布式存储帮助瑞金医院解决了将海量数据存储下来和快速调阅问题,实现了一秒阅千片。后来,为了帮助大模型实现从科研到具备临床应用能力的跨越,依托瑞金医院百万张高质量数字病理切片数据,华为提供了开源的全流程AI工具链ModelEngine,实现从数据工程、模型工程到AI应用编排的工具化、标准化和自动化,让单癌种诊断应用上线周期从10天到2天,并保证了标注的专业性和准确性。”
不同于大家熟悉的“通用模型”,“行业模型”通过深耕特定领域的数据与场景,在落地效果、成本效率及安全性上展现出显著优势,已成为AI赋能行业的核心路径。
jrhz.info目前各行业在AI应用投资很大,尤其是在基础设施上。樊杰告诉记者:“医院核心使命是治病救人,所以在训练大模型时面对有限的机房和算力资源的困难,不可能在基础设施上大量投资。”华为使用了模型蒸馏等技术,将通用模型能力蒸馏到32B参数规模的“小而美”的专家模型,降低对机房空间的要求。他进一步解释道:“就像从原来全院会诊精简到专家会诊,蒸馏后的小模型既保留核心能力,又适应基层医院的资源现状。”这使县级医院也能获得接近顶尖三甲医院的诊断水平,大幅降低患者跨省就医成本。
数据设施基础的“华为样本”
樊杰提到华为AI数据湖解决方案,它是由数据存储、数据管理、资源管理和AI工具链四部分构成,希望以系统化架构和全流程能力,支持各行业多样化业务场景下数据价值释放。
此外,樊杰剖析了存力对AI训练与推理的关键作用。“目前,很多企业的算力集群使用效率低于30%,另外70%的时间是在等待数据归集和加载。”樊杰说。解决这一困境的破局之路不再是算力堆砌,而需要通过“以存强算”,提升算力集群的效率。存储底座的业务边界和能力必须深入到客户的AI场景需求里,比如模型训练、中心推理以及边缘的训推一体等场景。
与传统存储相比,华为对存储系统的能力进行了多维度的提升。传统存储关注性能、可靠性与容量这三方面。而在AI时代,需要打造具备极致性能、高扩展性、数据编织、数据韧性、全新数据范式、绿色节能的“ 六边形战士”,全面提升数据存储能力,才能不断提升数据价值,让数据更好地赋能AI时代。樊杰向记者介绍:“华为通过技术优化,推出的高性能AI存储,能够将小时级数据加载缩短至分钟级,使算力集群效率从30%提升至60%。在推理环节,通过长记忆存储能力,避免重复运算,大幅降低推理成本。”
AI落地,数据先行。每一次技术变革都催生了新一代基础设施的创新。AI时代,“数据枢纽”的效能直接定义了智能革命的边界——它不仅是数据的容器,更是驱动数据高效流通、安全交互与价值转化的核心引擎。