作者|周雅
AI狂潮的同时,科技圈迎来了一场“快行动”。随之而来的,是数据的狂潮:模型训练过程中,为了防止很贵的GPU算力中断,要频繁写入巨大的快照;推理应用则要求对海量数据进行实时且低延迟的读取。那么,我们该怎么满足AI时代的存储需求?
这个问题,慧荣科技企业级储存事业部产品行销应用部资深协理周宗廉(Tsunglian Chou)在2025全球闪存峰会上,试图给出一个答案,不过他的答案并非一个具体的性能指标,也不是一款单一的芯片,而是更深层次的战略思考。
慧荣科技企业级储存事业部产品行销应用部资深协理周宗廉(Tsunglian Chou)
重新定义游戏规则:从“做一盘菜”到“递上一整套厨房”
“AI是存在很久的技术,而且它一直在演进。”周宗廉的开场白,试图将大家拉回到一个更长的时间尺度。他提到了1966年MIT推出的第一款聊天机器人“ELIZA” ——一个仅用200行代码写成聊天机器人的“老古董”。从ELIZA到今天动辄千亿参数的大模型,背后是算力和存储空间跨越近60年的天文数字级增长。
这种增长,在DeepSeek等开源模型将大模型训练成本拉下神坛后,正以前所未有的态势向下渗透,从“云端”涌向“边缘“,Edge AI的应用也会大幅普及。智能手机、PC、AI Pin、智能眼镜……万物皆可AI的时代,数据产生的规模和速度,正在让传统存储架构捉襟见肘。
面对这场数据洪水,传统的芯片厂商模式是,设计一颗强大的芯片,然后卖给客户,这似乎已经不够了。因为客户需要的,早已不是一颗更快的CPU或GPU,而是一套能让他们快速、稳定、低成本地造出好产品的完整解决方案。
慧荣科技给出的答案是 MonTitan™。
“MonTitan™不是一颗芯片,而是一个平台。”周宗廉在演讲和后续的采访中,反复强调这个概念。MonTitan™ 包含了三样东西:
1、一颗顶尖的SSD主控芯片(例如SM8366)。
2、一套完整的硬件参考设计(包括原理图)。
3、一套企业级的固件,它是SSD效能或者功能的核心。
这套组合拳的威力,需要从两个视角来理解:慧荣的直接客户(SSD制造商)和终端客户(数据中心、云服务商)。
对于直接客户,MonTitan™ 的价值是“赋能”。周宗廉在采访中打了一个比方:
“你可以想象,客户的核心竞争力是‘做出一盘好吃的菜’。而我们,就是把整个厨房,从灶台、锅具到水电煤都帮你设计好、铺设好。你只需要专注于你的‘厨艺’,而不用去研究这台洗碗机内部的管线是怎么走的。我们把‘洗碗’这个动作,封装成一个简单的按钮,你按一下就行了。”
这种“封装”的背后,是MonTitan™ 极具弹性的架构。慧荣的工程师们将硬件设计成一个个独立的、强大的“引擎”,这些引擎彼此隔离,完全由固件来调度和指挥。“就像厨房里,洗碗的、烘干的、切菜的,各司其职,互不干扰,但总指挥(固件)可以灵活地编排流程。”周宗廉解释道。
这样做最大的好处是什么?客户过去积累的知识产权(IP)和固件代码,可以非常平滑地移植到MonTitan™ 平台上,而不需要推倒重来。这极大地缩短了产品的上市时间,并降低了研发成本。在一个“天下武功,唯快不破”的市场里,这几乎是决定生死的优势。
而对于云服务商这样的终端客户,他们感受到的则是实在的性能和体验飞跃。以MonTitan™ 平台下的首款旗舰产品SM8366 为例,这颗基于12nm制程的PCIe Gen5主控,可以实现超过14GB/s的顺序读取速度和3.5M IOPS的随机读取性能。
慧荣科技SM8366
“我们设计之初的目标就很明确,”周宗廉说,“PCIe Gen5就像一个巨大的水管,我们必须保证芯片内部的每一个环节,都能处理这么大的水量,从前端进来的水流,在后端要被完全‘榨干’,不能有任何瓶颈。”
这种极致性能,意味着数据中心可以更快地完成大模型训练或图像化神经网络的构建。但比性能更重要的,是慧荣对真实应用场景的深刻洞察。
深入无人区:用PerformaShape™ 驯服云端的“吵闹邻居”
企业级SSD最常遇到的工作环境是什么?是多租户(Multi-tenancy)。
想象一个云端数据中心,成百上千个不同的用户(租户)在同时访问同一块SSD。如果没有有效的管理,就很容易出现“吵闹邻居”问题:某一个用户突然发起大量的读写请求,占满了所有资源,导致其他用户的请求延迟飙升,服务品质(QoS)急剧下降。
这对于按服务等级付费的云业务来说,是不可接受的。
传统的解决方案,往往依靠软件在主机端进行调度,但这种方式精度差、延迟高。而慧荣的独门秘技PerformaShape™,则是在主控芯片内部,用硬件引擎来解决这个问题。
“PerformaShape™ 可以用硬件引擎设定每一个用户的效能。”周宗廉解释道,“限制效能、定义效能就意味着限制电源、定义电源,这意味着你可以控制每个通道的功耗,所有用户的延迟都变得可被管理、可被预测。当用户效能都被我们掌握,就相当于服务品质被我们牢牢掌握。”
在慧荣展示的对比测试中,未使用PerformaShape™ 时,多用户并发写入的IO波动剧烈,像一张狂乱的心电图;而启用后,曲线瞬间变得平滑如水,一致性高达95%以上。
这种技术的价值,在RocksDB这样的真实应用中被展现得淋漓尽致。
RocksDB是Facebook(现Meta)基于LevelDB开发的开源键值数据库,被广泛应用于各种需要高速读写的场景。它的核心机制,是将数据分层存储在SSD中,高层级(L0)的文件小、访问频繁、对延迟要求极高;低层级的文件大、访问频率低、延迟较高。
“我们发现,PerformaShape™ 可以完美地释放RocksDB的潜力。”周宗廉说。利用PerformaShape™,开发者可以为RocksDB中不同层级的数据流分配不同的性能通道——为要求最苛刻的L0层分配最高优先级的性能和最低的延迟,而为其他层级分配普通通道。
“市面上有些厂商也针对RocksDB做了FDP(Flexible Data Placement,一种让主机能指导SSD数据存放位置的技术),我们觉得这是很好的做法。但FDP只解决了‘放哪里’的问题,没有解决‘怎么服务’的问题。”周宗廉补充道,“FDP加上PerformaShape™,才是完美的组合。”
这种对应用层需求的深刻理解和技术实现,构成了慧荣在激烈竞争中最坚固的护城河。它不再是简单地堆砌性能参数,而是真正深入到客户的业务逻辑中,解决他们最棘手的痛点。
战略家的耐心:“好饭不怕晚”
在瞬息万变的半导体行业,有一种普遍的焦虑,叫做“首发焦虑”。第一个发布支持最新技术标准的产品,似乎就能抢占先机、赢得市场。
但慧荣科技,似乎想要稳步前进。
当PCIe Gen5标准已经问世一段时间,市面上甚至出现了一些发热量惊人、稳定性堪忧的“早产儿”时,慧荣却并不急于冲刺。
“我们公司有个特征,可能不是第一个跑步的人,但我们出来的东西,一定是大家都可以用的。”周宗廉在采访中坦言,“中国台湾话里有句话叫‘好酒沉瓮底’(好酒都在坛子底),我们更信奉‘好饭不怕晚’。”
这种看似“慢”的节奏,背后是一种极其清醒的商业判断和战略耐心。
“我们为什么可以这么早知道市场节奏?因为我们一直跟最前端的用户厂商、NAND原厂保持着非常紧密的沟通,我们几乎是共同在开发东西。”周宗廉透露,“所以我们很早就看到,PCIe Gen5的市场(指服务器端)根本还没有真正起来。我们那个时候不急着把产品推向市场,反而利用这段时间,将制程从最初规划的16nm优化到了12nm,解决了潜在的过热问题。”
等到服务器市场真正准备好迎接PCIe Gen5时,慧荣端出的SM8366,是一款成熟、稳定、高性能且功耗控制优秀的产品,市场接受度因此非常高。“你为了抢第一名,拿出一个不能用的东西,是没有意义的。”
这种“慢思考”,贯穿于慧荣的产品规划和研发投入中。在设计一颗芯片动辄耗资数千万甚至上亿美元的今天,尤其是在采用台积电这样的先进且昂贵的制程时,每一次流片失败的代价都是巨大的。
慧荣的应对之道,是近乎苛刻的事前验证。
“我们选择先进制程,就必须想尽一切办法减少改版的次数。”周宗廉坦言,“这意味着在芯片设计出来、投入生产之前,就要做好万全的系统级验证,用各种方法把可能的问题都暴露出来、解决掉。这没有捷径,只能靠小心、再小心。”
这种对成本的敬畏、对市场的尊重、对产品质量的坚守,共同构成了慧荣的慢思考:在喧嚣的浪潮中保持定力,在正确的时间点,拿出正确的产品。
看向未来,我们有一条清晰路径
有了坚实的平台和清晰的思考,慧荣对未来的布局显得从容而笃定。
首先,拥抱QLC NAND。
随着AI模型和数据集的爆炸式增长,对存储容量的需求已经进入TB甚至PB时代。在成本的约束下,使用每个单元能存储4比特数据的QLC NAND,成为打造超大容量SSD的必然选择。
但QLC的“体质”相对脆弱,寿命和性能都不及TLC。这就需要主控芯片具备更强大的纠错、磨损均衡和数据管理能力。“FDP这样的技术,就是保护QLC这种‘娇贵’NAND颗粒的绝佳手段。”周宗廉指出。在今年的CFMS(2025中国闪存市场峰会)上,慧荣就展示了基于SM8366和QLC NAND的128TB SSD,这是其技术实力的最佳证明。
其次,分层布局、精准卡位。
除了旗舰级的SM8366,MonTitan™ 平台还衍生出了更专注细分市场的产品:
· SM8388:一颗针对近线存储的主控。这类存储对延迟要求不像在线业务那么高,但对容量、成本和功耗极其敏感。SM8388正是为此而生,它以更低的功耗和成本,支持高达128TB的容量,被慧荣视为取代部分传统HDD(机械硬盘)市场的利器。
· SM8466:一颗瞄准未来的PCIe Gen6主控。它将采用台积电4nm制程,支持高达512TB的容量,顺序读写性能目标直指28GB/s,随机性能则高达7M IOPS。这颗芯片承载了慧荣对下一个五年、甚至十年存储需求的预判。
“我们在规划产品时,一直都是往前看很远,要确保我们做出来的东西,可以符合未来5-10年的需要。”周宗廉说。
最后,对CXL等新技术保持敏锐和务实。
对于CXL(Compute Express Link)这种能够实现内存池化的热门技术,慧荣的态度是“认真研究,持续观察”。“我们看到CXL目前仍然是内存厂商的舞台,在存储领域的应用还没有看到特别的突破。我们会保持关注,但不会盲目跟进。”
慧荣科技这种整体“平台化”的战略思维,是建立在次世代趋势之上的,周宗廉认为次世代的存储趋势有四大创新:
1、极致容量(High Capacity):AI时代,容量是王道。慧荣早已深入研发驾驭QLC NAND所需的核心算法,为迎接超大容量时代铺平道路。
2、数据效率(Data Efficiency):通过合理、有效地放置数据,最大限度减少无谓的数据搬移,从而保护NAND闪存的寿命和性能,这在QLC时代尤为关键。
3、安全堡垒(Data Security):在企业级应用中,安全是必需品。慧荣的理念是,构建端到端的安全体系,覆盖数据本身(通过高性能加解密引擎)、数据完整性(端到端保护)以及平台自身的安全(如密钥管理)。
4、绿色能效(Power Efficiency):随着数据中心规模的膨胀,功耗与散热已成为核心成本。慧荣通过优化芯片设计和选用更先进的制程,从源头上控制“电老虎”的胃口。
这四大创新支柱,最终转化为MonTitan™平台最鲜明的产品特点:由众多自研高速IP与智能固件共同驱动的极致性能(Performance);以128TB QLC SSD为代表的超大容量(High Capacity);以及贯穿始终的低功耗(Low Power)与数据完整性(Data Integrity)。以上这套组合拳,构成了慧荣应对次世代存储挑战的完整答案。