【鲲鹏BoostKit技术速递】重塑流计算效能!鲲鹏自研OmniStream引擎开源:向量化加速Flink,实现吞吐跃升!(鲲鹏2.0)

(来源:华为计算)

鲲鹏OmniStream引擎正式开源,将全Native化流计算引擎融入Flink生态,实现 Flink SQL执行效率平均提升100%+,DataStream执行效率提升30%+。开发者升级现有集群即可“开箱即用”,无需改造业务代码,让实时计算性能实现倍级跃迁。

挑战:Flink性能瓶颈与Native引擎的破局

在实时计算领域,Flink已成为流处理的事实标准,广泛应用于多个核心业务场景。在电商行业,Flink驱动实时个性化推荐系统,处理用户点击流和浏览行为,实现"千人千面"的商品推荐;在物联网领域,它实时分析设备传感器数据,实现预测性维护和智能质量控制;在金融行业,Flink支撑毫秒级的交易监控和反欺诈系统,保障资金安全;在实时数据仓库建设中,它替代传统的T+1离线架构,实现数据的实时同步与ETL处理。

然而,尽管Flink技术成熟,其基于Java的运行时引擎在超大规模数据处理中面临核心瓶颈:

行式计算效率低:原生Flink逐条处理数据,序列化/反序列化开销占用CPU资源高;

内存访问碎片化:行式存储导致CPU缓存命中率下降,无法发挥多核并行优势;

状态管理延迟高:TB级状态访问易引发性能抖动,影响业务实时性。

这些瓶颈使得企业在处理海量实时数据时面临吞吐量受限、延迟过高和成本激增的挑战,难以满足业务对实时性要求的不断提升。特别是在需要毫秒级响应的金融风控、需要处理亿级用户行为的电商平台、以及需要实时监控数万传感器的智能制造场景中,这些瓶颈直接影响了业务的实时性和可靠性。

为了应对上述挑战,OmniStream对Flink引擎进行Native化改造,结合向量化技术,助力实时计算加速。

OmniSteam:

向量化加速Flink,实现吞吐跃升

OmniStream整体架构主要分为Adaptor适配层、Native Framework层和Native算子层三部分。

Adaptor适配层主要负责Flink原生Java Runtime和Native Runtime的对接。用户提交任务后,Flink会生成执行计划等关键任务信息,Adaptor层会对任务信息进行重组,并生成Native的执行计划。在这个过程中,Adaptor层提供了完整的Fall Back机制判断任务是否属于Native支持的场景,如果支持,则生成完整的C++向量化执行计划,并将任务推送至Native Runtime执行;否则,则回退至原生Java Runtime执行。

Native Framework实现了一套完整的Native Runtime。上游Adaptor适配层将任务推送至Native Runtime,Native Framework会对任务信息进行解析并生成Native的执行计划,生成对应的Native Task和Native Operator。同时,Native Framework也实现了Native TaskManager、Native Partition Manager、Native Data Transfer、Native Timers、Native Backend Interface等,以保证Native Runtime的完整性,避免与Java Runtime频繁交互导致大额JNI开销。

Native TaskManager:实现Native任务的创建与调度。

Native Partition Manager:多并行度进行数据处理时,根据规则将数据分区,保证相同Native算子的不同线程正确接收数据。

Native Data Transfer:负责上下游Native算子链间的数据传输,支持Local模式(本地传输)和Remote模式(网络传输)。

Native Timers:提供Native定时器服务,支持事件时间和处理时间的定时器注册、触发和管理功能。

Native Backend Interface:提供统一的Native状态后端接口,对接不同的Native状态后端,以实现Native状态存储管理。

此外,值得注意的是,对于SQL任务,数据在Native Framework中以列式数据结构进行流转,OmniStream利用Flink的数据积攒机制,将一个批次内的数据转换为向量化的列式数据,向量化Native算子实现对列式数据的高效处理,从而提升整体流式数据处理性能。

而在DataStream场景,用户提交的任务一般包含灵活且复杂的用户自定义函数(User-Define Function,UDF),如何处理这部分UDF成为Native引擎一个新的挑战。为此,OmniStream集成了UDF Native对等翻译机制,基于编译器思想,将UDF JVM字节码翻译为Jimple IR,再进一步翻译为C/C++代码,实现Java代码到C++代码的无缝迁移,从而实现Native引擎对UDF的支持。

向量化Native算子层实现了列式向量化流计算。OmniStream基于C++语言实现了向量化算子,并且支持了多种内置数据类型、加减乘除等基本运算和多种内置函数。对于DataStream任务,由于处理对象一般为复杂的Object类对象,OmniStream基于C++完成了DataStream算子的Native化。对于SQL任务,数据以批量列式的形式流入SQL算子内部,并采用向量化模式进行运算,再将结果以批量列式的形式送往下游。

OmniStream性能实测

Flink SQL Nexmark性能平均提升100%+

Flink DataStream性能提升30%+

性能测试使用开源的Nexmark作为标准性能测试工具。Nexmark是业界公认的流计算性能测试工具。测试主要对比了Flink1.16.3开源版本和OmniStream的性能。测试环境均基于鲲鹏『服务器』,并在docker容器中进行一亿条数据量测试,测试结果显示,Nexmark性能平均提升100%+。DataStream用例为真实场景用例,执行效率提升30%+。

赋能多场景

以极致性能与可靠性重塑实时计算

金融科技与风险控制——在数据洪流中构筑实时风控防线

金融行业对实时性、准确性和可靠性有着极致要求。OmniStream的Native化执行和高效状态管理使其能够从容应对每秒数百万笔的交易流水。在反欺诈场景中,它能够实时关联分析用户的交易行为、设备信息、地理位置等多维度数据流,在毫秒级内精准识别并拦截欺诈交易,直接为企业避免资金损失。同时,在实时征信、异常监控(如防止钓鱼攻击)和风险价值(VaR)计算等场景中,OmniStream 也能提供稳定而强劲的算力支撑,为金融机构的核心风控系统提供可靠保障,确保业务安全与合规。

电商实时个性化推荐——让每一次点击都转化为实时洞察与行动

在传统架构下,电商平台的推荐系统通常存在分钟级的延迟,导致用户看到的推荐商品是基于其几分钟前的行为,无法捕捉其瞬时的兴趣变化。OmniStream凭借其向量化计算和超低延迟的特性,能够毫秒级地处理用户最新的点击与浏览行为,并立即更新推荐模型。这使得用户在当前页面下滑时,看到的推荐列表已经根据其刚刚看过的商品进行了实时调整,真正实现了“所思即所得”,从而显著提升点击率与转化率。

贡献和合作

OmniStream现已开源,诚邀全球开发者一起加入OmniStream的开源建设!您的每一行代码都在推动技术演进——无论是架构优化、缺陷修复还是创新特性开发,都将成为重塑实时计算生态的关键力量。

🚀立即参与开源

▸Gitee仓库:

https://gitee.com/openeuler/OmniAdaptor

https://gitee.com/openeuler/OmniStream

▸技术白皮书:

https://www.hikunpeng.com/document/detail/zh/kunpengbds/appAccelFeatures/sqlqueryaccelf/kunpengbds_omniruntime_20_0903.html

特别声明:[【鲲鹏BoostKit技术速递】重塑流计算效能!鲲鹏自研OmniStream引擎开源:向量化加速Flink,实现吞吐跃升!(鲲鹏2.0)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

三光合一,薄出不凡 —— 凯瑞兹E5 Ultra EDC手电(三光合成株式会社)

灯具背面是宽大的背夹,E5系列都是采用这种设计语言,背夹的力度非常足,可以解锁非常多的应用场景,比如可以挂在背包上衣裤等等。 凯瑞兹E5 Ultra薄至11.5mm、仅70g,三光源覆盖远射、补光与应急场景…

三光合一,薄出不凡 —— 凯瑞兹E5 Ultra EDC手电(三光合成株式会社)

机加行业人工报价的隐性成本:为什么你最优秀的『工程师』困在Excel表里?(机加工行业工资标准)

即便是经验最丰富的『工程师』,也需要耗费大量时间进行人工比对和计算,难以及时输出准确的工艺路线与设备负载信息,这直接导致管理者在关键时刻难以全面掌握车间实况,错过最佳调度时机。 三、破局之道:AI驱动报价智能体的…

机加行业人工报价的隐性成本:为什么你最优秀的『工程师』困在Excel表里?(机加工行业工资标准)

朱雀三号总指挥谈火箭首飞:最后一脚刹车没踩好,经历失败才可能走得更远(朱雀二号首飞)

朱雀三号总指挥戴政表示,虽然回收没有成功“略有遗憾”,但这一次发射是我国第一次进行入轨级运载火箭一子级的回收实验,“并不认为第一次首飞就必须要回收成功,更多带有一定的试验性质和探索的角度。” 戴政表示,“对…

朱雀三号总指挥谈火箭首飞:最后一脚刹车没踩好,经历失败才可能走得更远(朱雀二号首飞)

金融行业适用:Workpro国产化即时通讯守好数据底线(金融行业适用头像)

国产化即时通讯通过私有化部署、全链路加密、合规适配及深度业务集成,成为金融行业守好数据底线的核心工具,其技术自主可控、安全防护严密、合规要求深度满足及业务价值显著提升的特点,为金融行业数据安全与『数字化』转型提供…

金融行业适用:Workpro国产化即时通讯守好数据底线(金融行业适用头像)

突发特讯!日本通告全球:国会现场高市早苗被日本议员当众贴脸开大,罕见措辞引爆国际舆论(日本再传突发消息)

东京永田町,日本政治的心脏,正上演着一出刺破国家体面的激烈大戏。近日,一幕被全球媒体迅速捕捉的罕见场景,让日本国会的庄严肃穆荡然无存:在野党议员步步紧逼,直斥首相,而现场则嘘声四起,直播信号被数次切断

突发特讯!日本通告全球:国会现场高市早苗被日本议员当众贴脸开大,罕见措辞引爆国际舆论(日本再传突发消息)