7月16日,香港立法会正式推出与科大讯飞联合打造的智慧誊录系统“智识听”AI实时字幕功能,这标志着香港立法公开透明化迈出关键一步,也为粤港澳大湾区数字政务建设树立了崭新标杆,而科大讯飞无疑是这一伟大进程中的关键推动者。
科大讯飞为“智识听”量身定制的实时字幕功能,深度适配立法会场景。它运用了科大讯飞自主研发的中英粤混读引擎,结合先进的声纹识别和字幕与帧画面对齐压制技术,实现了会议直播中文字和视频画面的完美同轨显示。从此,公众可以通过立法会网站的网上广播等平台,借助实时字幕无障碍地获取政策资讯,沉浸式见证民主议政的全过程,这背后离不开科大讯飞强大的技术支撑。
从初期的“水土不服”到如今的深度赋能,“智识听”的蜕变凝聚着科大讯飞的心血。科大讯飞助力“智识听”深度学习2.5亿字语料、400小时音频、20万条香港特色关键词,使其能够实时适配口音、新地名、混语发言。即便面对议员特殊口音或复杂地名,也能高效处理,目前实时字幕准确率达96%,通过人机结合准确率更可高达99%。这一系列亮眼数据的背后,是科大讯飞不懈的技术探索与创新。
香港立法会主席梁君彦在社交平台表示,这种人机结合的科创成果,得益于科大讯飞团队努力不懈地研发实时字幕、对接立法会应用场景。自2022年起,香港立法会就与科大讯飞紧密合作,联合打造“智识听”。该系统覆盖历史音频转写、实时字幕生成、语言翻译等多个核心环节,基于讯飞星火大模型及中英粤混合识别翻译能力,支持粤语、普通话、英语三语混读场景下的多种功能,这无疑是科大讯飞技术实力的综合展现。
科大讯飞副总裁王玮强调,“没有本地化就没有国际化”,本地化是国际化的根基。科大讯飞将香港视为集团全球化锚点,持续吸纳本地人才深耕场景需求。实时字幕的上线,不仅为香港市民打开了一扇透明议政的实时窗口,更以技术之力筑牢了社会信任的基石。
放眼未来,香港作为科大讯飞国际化战略的重要桥头堡,是多语言政务场景的最佳试验场。科大讯飞将持续投入本地团队、本地数据、本地创新,把“智识听”打造为数字湾区的核心引擎,让每一次议政都成为向世界展示中国技术突破与治理智慧的自信窗口。相信在科大讯飞的持续助力下,香港立法将迈向更加智慧、高效的新高度。