近年来,面对复杂多变的宏观环境和内外部形势,中国的商业银行坚持走高质量发展之路,总体保持平稳运行,资本实力持续增强,盈利能力稳健增长,风险抵补整体充足,重点领域风险可控。中央金融工作会议提出,金融系统要着力做好科技金融、绿色金融、普惠金融、在全球科技圈受到广泛关注,包括银行在内的金融机构如何迎接技术变革,成为当下的热议话题。
在此背景下,《清华金融评论》银行家论道推出“数字金融”主题访谈,探讨在技术变革背景下我国商业银行新增长路径,助力银行业金融机构高质量发展,在保持合理利润的同时,持续兼顾好服务实体经济的目标。本期邀请到中国银行原行长李礼辉分享金融业在大模型应用方面的思考。
以前只是单一文本模态,现在的生成式AI大模型可以学习和理解非结构化数据,生成新的非结构化内容,包括文本、音频、视频、图像和代码,适应多种任务。最新的大模型具备文本、视觉、语音多模态组合的感知、学习和交互的能力,突破了文本交互的局限性,能够感知、理解和模拟动态的物理世界,能够广泛应用于金融业。
一是实现人机交互可信任的拟人化。例如,多模态的智能金融机器人具备意图识别能力,可以动态捕捉、即时感知、正确理解客户的语言和表情,准确判断客户的风险偏好和业务诉求,采用具有人性温度的表达方式为客户提供可信任的服务方案,解决机器服务冰冷的问题。这将显著提升金融业的服务品质。
二是实现非结构化数据处理可信任的精确性。例如,应用文本、视觉、语音多模态组合技术,在健康医疗保险业务中对病历和医疗影像进行专业水准的质检和分类,核准健康评估,识别医生字迹,辨别声纹,甄别虚假理赔;在银行前中后台对各种票据、合同等非结构化数据进行真实性审核和自动化录入,甄别克隆票据或虚假合同,确认财务信息百分之百正确并即时提取记账。这将显著提升金融业的运营效率。
以前只是AI辅助和助理,近1年来基于AI垂直模型的具身智能体(AI-Agent)迅速成长,具身智能体集成神经网络、知识工程和控制论技术,能够培育在不同场景中的感知、学习、行动和决策的代理能力,甚至可以超越一般水平的生产力。
金融智能体(Financial-Agent) 依托行业最佳流程、最佳标准的数据支持,可以培育具有较高专业水准的金融专业代理人,适用于市场分析、风险评估、投资顾问、财富管理、量化交易、产品定制、内部审计等领域。
DeepSeek-V3发布后,全球大模型评比榜单Chatbot Arena对最新的大模型进行匿名测试,据用户投票评分,DeepSeek-V3在复杂问题和代码领域的表现均位列前3。AI集成平台Composio从推理、数学、编程、创意4个维度的测试证明,DeepSeek-V3与GPT-4o性能不分伯仲。
具有突破性意义的是DeepSeek的算法优化。据财联社消息,DeepSeek-V3完成训练仅消耗278.8万GPU小时,全部训练成本557.6万美元,而性能接近的GPT-4o训练成本高达1亿美元。业界列举的DeepSeek-V3算法创新包括MLA多头潜在注意力机制、MoE混合专家架构、FP8混合精度及多token预测等原创技术。DeepSeek团队2月18日发表的论文论证,“原生稀疏注意力NSA”采用智能分块、动态筛选、精准深挖等技术,处理6.4万字文本的训练速度提升9倍、推理提速11.6倍,“万字寻针”准确率100%,算力资源节省90%。显然,算法优化可以显著节约资源,提升有效算力。
DeepSeek的算法创新,应该是我国独立自主、节约高效的AI发展道路上的里程碑。国内芯片企业、云平台、电信运营商、金融机构、国家超算互联网平台迅速与DeepSeek适配,形成模型即服务MaaS、端侧部署应用模式,并全面用于优化垂直模型。
AI技术的进步为金融创新开辟了更加广阔的前景。我们需要注意的是,生成式AI的技术陷阱并不会因算法的创新而淡化。
其一,未能消解安全风险。国家网络安全通报中心3月初通报大模型工具Ollama在本地部署大模型时的安全风险,特别是数据窃取和恶意攻击,攻击者通过特定接口可获取模型的license等敏感数据,可利用Ollama框架漏洞实施数据投毒、参数窃取、恶意文件上传和关键组件删除等操作,影响模型服务的核心数据、算法完整性和运行稳定性。哈尔滨亚冬会赛事信息系统遭到境外数字黑客攻击,疑似采用智能体技术进行漏洞探寻、流量监测和动态代码实时攻击。
其二,未能消解模型幻觉。模型幻觉是指AI模型自发生成的看似合理、实则虚假的虚构数据、虚构影音、虚构事件。测试发现,马斯克xAI的Grok-3、OpenAI的GPT-4o、DeepSeek的V3都存在一定程度的幻觉率。
其三,未能消解模型歧视、算法共振、隐私泄露等技术陷阱。模型歧视指模型输出的结果出现对某些群体的集体性偏见、差评和政策限制。算法共振指不同机构的量化交易之类的智能金融程序算法逻辑趋同,导致市场趋势预测趋同,市场交易策略趋同,引起单边化市场交易,引发暴涨暴跌的市场危机。
其四,未能消解解释性难题。解释性是指对模型的算法逻辑、数据挖掘、生成结果的过程进行解释、达成理解的能力。解释性有助于增强AI信任,减少对数字黑箱的担忧;有助于发现模型偏差,管控决策风险;有助于提高透明度,适应法规和监管要求。算法创新增加了模型的非线性、随机性和不确定性,模型的解释更加复杂,难以找到一种通用、公认的解释方法。
金融是安全性和可信度要求近乎苛刻的行业,必须保证金融资产和金融数据的安全,保证金融交易和金融服务的可靠性,保证账务处理和账务记录的准确性。30年前我国开始推进以大中心、集中化为特征的科技金融创新,例如工商银行的9991工程和中国银行的IT蓝图工程,已经过实践的检验。近10年兴起的以分布式、智能化为特征的数字金融创新还在发展。智能化的数字金融创新必须统筹安全和效率,实现从可用到好用、从替代到领先的跨越。
基于现阶段的实践,我认为,中短期的数字金融创新并不要求金融模型自身具备解决数学、编程、创意等复杂问题的高超能力。数字金融智能化创新的基石是可信任,应注重算法与场景的匹配性与适用性,实现模型可信,让客户信得过,让市场信得过,让政府信得过。
DeepSeek的算法创新,提示了自主可控、节约高效的数字金融创新路径。国产大模型的金融应用已从单点突破扩展到生态重构,进入规模化应用期。在超高速发展的智能化数字金融创新进程中,必须特别强调金融模型的安全和可信。
一是高可靠性。金融机构部署AI模型,必须配置先进的安全技术工具,既能抵抗恶意攻击,又能避免偶发性安全隐患。金融模型应该达到安全可信的基本要求,这里提出几个“特别注意”:用于市场分析和预测,要特别注意克制模型幻觉;用于客户筛选和分层,要特别注意避免模型歧视;用于量化交易和投资顾问,要特别注意防止算法共振;用于身份识别和验证,要特别注意抵抗AI虚假;用于线上线下客户服务,要特别注意消解机器冰冷;用于凭证识别和账务处理,要特别注意达成零误差,实现数据处理百分之一百的正确率。
二是可解释性。具备基础架构的可解释性,能够展现完整的推理路径和逻辑,将模型行为转化为可理解的规则和可视化的过程,逐步实现从结果正确向过程可解释的跨越。
三是合法性。加快制度创新,确定金融智能体的法律地位,明确金融智能体的行为边界,明确金融机构管理者的决策责任,明确金融智能体与金融客户的法理关系。
四是经济性。行业的智能化创新须通过垂直模型来实现。金融业涵盖银行、保险、证券投资、财富管理等不同领域,同一领域的金融产品、金融服务、金融管理的需求大同小异。用海量数据预训练行业级金融模型并持续调优,再根据不同需求调适差异化应用,定制企业级金融模型,可有效降低模型开发的边际成本,扩展模型的应用范围。软算力建设应支持有实力的科技企业和金融机构深度合作,领军开发行业级金融模型和应用软件,为中小金融机构提供企业级金融模型服务和软件服务。硬算力建设应实现可信的技术协同和可靠的资源共享。通过共建数字金融生态圈,实现高效率、低投入的数字金融创新。
数字金融创新并非是给传统体制传统流程加上数字化外套,而是从根本上改革体制,重构流程,再造底层系统。过于严苛的监管可能抑制创新和产业发展。可考虑的原则是“高中初小”,“高”是占领技术高地,“中”是全球领先的中国方案,“初”是有能力把风险消灭在萌芽状态,“小”是实现风险概率和风险成本最小化。这就要求加快数字金融监管创新。一是完善法律法规,明确数字金融业务规范。二是完善一体化、穿透式的金融监管系统,降低监管成本和被监管成本。三是完善数字金融技术审核认证制度,明确AI模型的测试平台、工具、标准和方法。四是完善数字金融市场风险分析和监测系统,有效管控异常交易和市场操纵。
我国大中型金融机构保持高强度的金融科技投入,13家大银行2024年科技投入1829.62亿元,占营业收入的平均比重为4.07%。但小型金融机构财力不足能力不足数据不足,创新发展滞后,数字鸿沟在扩大。小型金融机构有必要进一步进行兼并整合。科技方面考虑生态共建、技术共享、服务外包,鼓励有实力的金融机构和科技企业发挥龙头作用,选择适当的商业模式建立1+N的技术合作架构,为小型金融机构提供低投入、高品质、细匹配、长周期的金融科技服务,帮助小型金融机构加快创新,优化管理,优化服务。数据共享方面通过以模型、bwin官网核验的方式扩大公共数据服务,通过“共同使用、共享收益”的商业模式扩大非公共数据服务。
《清华金融评论》坚守“建言金融政策,引领金融实践”的办刊初心与使命,努力朝着专注于经济金融政策解读与建言的智库型全媒体平台的目标发展。银行在我国是支持实体经济的金融中坚力量,银行业的高质量发展离不开银行人尤其是银行家的持续贡献。2017 年起《清华金融评论》特设“银行家论道”专栏,旨在构建中国银行家的思想传播平台,为中国经济金融把脉,为行业发展建言献策。与此同时,《清华金融评论》通过多次举办中国银行业高质量发展论坛及连续发布“中国银行业排行榜200强”研究报告,透视银行业发展全景,为整个银行业发展提供理论数据支撑和有益实践参考。