智见｜别只看大模型热闹，商业银行知识体系正悄悄变天！(别看只是一只羊简谱) #科技 #体系 #数据 #模型 #训练 #人类

（来源：现代商业银行杂志）

文_中国工商银行软件开发中心

随着人工智能技术的发展，尤其是大模型技术的突破，知识在智能场景中的重要性日益凸显。知识不仅仅是人类智能的基础，也是机器实现人工智能的支撑，智能助手等智能化场景离不开对知识的有效利用。商业银行作为知识密集型企业，亟需结合自身大模型发展现状，加强知识体系的建设，为客户提供更加优质、高效、智能的服务，推动商业银行在『数字化』时代实现可持续、高质量发展。

知识赋能大模型发展概述

源自上世纪80年代的DIKW模型通过金字塔结构呈现了人类认知世界的层次规律（见图1）。这一经典理论框架将认知过程划分为四个既关联又逐级提升的层次。其中，数据（Data）是对事务事件的真实描述和记录；信息(Information）是事务的状态和变化的统计；知识（Knowledge）是对事务变化规律的总结，被视为人类对客观世界的认识和反映；智慧（Wisdom）是对事务的深层次理解和洞察，可以指导日常经营决策。

图1：DIKW

模型

知识如何赋能大模型发展？

1.不同知识内容赋能大模型发展

从知识内容维度来看，知识可分为世界知识、行业知识、企业知识和领域知识。其中，世界知识是指关于世界的通识知识，是人类对客观世界的认知和理解的总和，世界知识具备广泛的适用性和动态性，包括维基百科、网页、书籍、期刊、代码等。如GPT—3在训练中使用涵盖书籍、网页、百科等多源数据570GB。行业知识是指特定行业内的专业知识，包括行业内的技术、流程、标准等，如金融行业的金融市场分析、金融监管、金融考试等。如腾讯金融大模型在混元通用大模型基础上，加入约3000亿token金融行业语料进行二次训练。企业知识是指企业在运行过程中积累的内部知识，是企业核心竞争力的重要组成部分，如企业人力资源管理、财务管理、规章制度、教育培训等。领域知识是指特定领域内的专业知识和技能，聚焦于某一特定领域，如商业银行的远程银行、信贷、个金、风控等领域。

不同类型知识在赋能不同类型大模型过程中各有侧重。基础大模型侧重使用海量的世界通识知识，使得大模型具备通用泛化能力。行业大模型在通用大模型基础上，新增行业知识对基础大模型进行二次训练，使得大模型具备行业适配能力。企业大模型侧重使用企业内部通用知识进行二次训练，使用大模型具备企业赋能能力，支撑企业内所有人员使用。领域大模型侧重使用某领域专业知识进行二次训练，使得大模型具备场景定制化能力。

2.不同知识形态支撑大模型发展

从知识形态维度来看，不同的知识形态侧重支持大模型训练、应用等不同阶段。

图2:知识赋能模型训练和推理

预训练阶段是大模型在海量多模态数据（包含文本、图片、音频、视频）上自监督学习，从而获取通用世界知识，此阶段知识被参数化存储在大模型中，大模型能够利用这些内化的知识，完成特定任务，使得模型具有泛化能力。

微调阶段是在预训练模型的基础上，针对特定领域或任务进行额外训练，使得模型能够适应新任务。该阶段的知识形式主要以问答对、任务指令为主。问答对以问题和答案的组合形式出现，为模型提供了明确的输入输出示例，帮助模型快速理解不同问题的类型和结构；任务指令通过规范化指令设计，使模型更精准地把握用户意图，减少歧义和错误理解。

强化学习阶段是对微调后的大模型的答复结果进行人工排序，并以排序结果探索找到最优策略，使得在长时间内累计的奖励最大化。该阶段的知识主要以人类偏好反馈为主。人类偏好反馈知识能够引导模型对齐人类价值取向，有效减少有害、偏见或不符合伦理的内容输出。

推理阶段是指训练完成的大模型对输入数据执行预测或决策的过程，这是模型投入实际应用的关键环节。该阶段的知识主要以知识条目和提示词的形式存在。知识条目能够增强大模型的检索能力，为大模型的推理提供依据，进一步提升模型的输出质量。提示词能够引导大模型生成高质量的输出，激发大模型的推理能力。

知识对大模型发展的重要意义

大模型正深刻改变着各个行业的运作模式，然而大模型在广泛应用过程中仍然存在局限性，如幻觉、可解释性等问题。究其原因，既有数据层面的偏差与不足，也有算法本身的技术局限。值得关注的是，知识在缓解幻觉、提高模型可解释性中发挥着重要作用。

1.高质量知识有助于提升大模型的准确性

幻觉是大模型发展应用过程中遇到的主要问题之一，指大模型会生成看似合理，但其实偏离了用户意图、偏离之前所生成的上下文或偏离了事实知识的回答。幻觉一般分为两类：一是事实性幻觉，指生成的内容与已知事实不符或存在事实捏造；二是忠实性幻觉，指生成的内容与输入指令或上下文缺乏逻辑关联。造成大模型幻觉的原因是多方面的，包括数据层面、模型架构层面和应用层面等，其中知识也是引起幻觉问题的因素之一。从知识的角度来看，主要是一方面知识质量差，当前大模型的知识多来源于『互联网』，涵盖百科、『社交媒体』、博客等内容，虽然规模庞大，但是质量良莠不齐，一些低质量或错误的知识被纳入模型语料，导致模型在生成时可能引用不准确甚至虚假的内容，进而产生幻觉现象；另一方面知识时效性不高，目前大模型一旦完成训练，内部知识将固化，后续更新大模型内部知识要经过微调等技术手段，知识更新周期长，当用户提问涉及近期新闻、最新政策等高时效性问题时，大模型往往基于陈旧知识给出不符合实际的答复，出现时间滞后或事实过时问题，进而引发幻觉现象。由此可见，提高知识的质量，可以一定程度上缓解大模型幻觉，进而提升大模型的准确性。

2.思维链知识有助于提升大模型的可解释性

大模型内部决策机制高度复杂、难以解释，模型推理过程通常被视为“黑箱”，影响模型推理结果的可信度。为了破解大模型可解释性难题，研究者们提出了一些解决方法，常见的有特征可视化、自动化解释、思维链监控等。其中，思维链是一种特别便利的可解释性形式，它让模型内部的处理过程以字眼的形式清晰地展现出来，从而让人们能够检测模型的异常行为。2025年1月，『DeepSeek』—R1模型首次公开披露了『大语言模型』的思维链推理过程，通过思维链显性展示，用户能够直观看到大模型多步推理“慢思考”过程，大模型在面对不同输入时，能够理解用户的直观需求和潜在需求，并有效应对特殊的输入场景，这种方式为提升大模型可解释性研究提供了重要突破。

3.高质量知识有助于赋能大模型的场景建设

商业银行通过系统性整合和提炼业务场景中的专业知识，构建结构化知识体系，为大模型智能场景建设提供“燃料”。以智能客服和智能风控场景为例，在智能客服场景中，通过对智能客服场景的知识沉淀，形成高质量知识库，进而赋能智能客服场景的建设。如招商银行推出的智能客服，依赖检索对客服务知识库给出专业解答和帮助，针对开户、理财、信用卡💳️等高频咨询，准确率超过95%。在智能风控领域，持续更新高质量风险知识，为大模型提供可靠的依据，提升风险识别能力。如微众银行智能风控的反洗钱大模型结合行内外风险事件知识库，实时甄别可疑交易，大幅提高可疑交易的捕获率，有效降低误报率和漏报率。由此可见，知识可以赋能商业银行大模型的智能场景建设，提升业务效率和服务质量。

商业银行知识体系建设的思考

随着大模型技术的突破性进展，商业银行的『数字化』转型步伐显著加快，商业银行知识体系建设也面临深刻变革。商业银行作为知识密集型企业，应围绕“数据要素X人工智能”历史性机遇，积极探索知识体系建设，赋能银行业务高质量发展。围绕商业银行知识体系建设有以下几点思考：

1.构建完善的知识体系，保障知识建设有序化

推进知识的体系化建设，构建完善的知识体系。一是构建“世界—行业—企业—领域”知识体系，为人工智能驱动的智能服务提供系统化支撑。其中，世界知识包含开源世界知识和可以利用『互联网』获取的公开性知识，如百科、博客等；行业知识包含金融行业监管、金融研究等，如国家金融监督管理总局要求、行业研究报告、金融教材等；企业知识包含企业内部共享公开性的知识，如企业规章制度、产品介绍等；领域知识包含企业内部某专项领域知识，具有有限共享特点，如对客服务知识、合同知识等。二是按照知识体系架构与行业垂直领域分层打造统一的知识管理目录，形成知识管理的全视图，促进知识沉淀。三是加强专业领域知识的建设。通过系统化梳理和精细化构建专业领域知识框架，持续扩充和完善知识覆盖的维度和深度，为智能化应用场景提供精准、完备的专业领域知识支撑。

图3：知识体系

2.打造知识工程流水线，实现知识高质量供给

打造标准化、可持续优化的知识工程类流水线，包括数据标注流水线、提示工程流水线、知识条目流水线等，支持思维链、问答对、任务指令、提示词、知识条目等多种知识的生产，为商业银行大模型持续输送高质量知识资产。一方面，构建人机协同的知识生产模式，提升效率。采用AI模型自动生产知识为主、人工审核为辅，充分发挥AI智能引擎作用，通过自动标注、智能校验等技术手段，加大知识挖掘深度和广度，提升知识生产效率。另一方面，建设知识提炼能力，包括数据清洗、知识切片、知识提炼、知识打标、知识质检等能力，辅助业务开展知识提炼，为流水线建设提供技术支撑。

3.构建知识复用机制，支撑智能场景的快速应用

构建知识重复利用机制，为大模型智能场景对知识的快速应用提供支撑。其一，在智能场景开发中，采用模块化知识架构设计，实现知识库的即插即用和弹性扩展。一方面，这种模式可以实现多知识库的智能组合，单个场景可调用多个知识库资源；另一方面，支持知识库的跨场景复用，如合规知识库既可赋能信贷尽调报告自动生成，又能实时校验风险交易，形成“一次建设、多次赋能”的乘数效应。该模式可以提升知识资产的利用效率，降低智能场景开发成本。其二，通过收集用户交互数据、行为反馈及满意度评价持续迭代优化知识内容，提升知识库的准确度和实用性，支撑知识的重复利用。

在人工智能浪潮中，大模型为商业银行知识体系的建设带来无限可能，同时知识也为大模型的发展注入新动能。展望未来，商业银行应以大模型为关键节点，构建智能化、生态化的知识体系，推动业务模式从传统金融向智慧金融转型。通过深度整合多模态数据，银行可实现精准风控、智能投顾和个性化客户服务，全面提升决策效率与客户体验。同时，面对技术伦理与数据安全挑战，银行需秉持以人为本的理念，强化治理框架，确保技术红利普惠社会。在全球竞争与合作并存的格局下，商业银行应勇立潮头，拥抱大模型技术，探索开放共享的知识生态，引领金融行业迈向智能化、可持续发展的新时代，为全球经济注入新动能。