01|人工智能+金融:开启数字金融新时代
纵观人类历史,每一次技术的变革都带来生产力的大幅提升,从而影响生产关系的变化。早期的革命为产业革命,用机器替代人力大幅提升生产力;20世纪50年代进入信息时代,科学技术大幅度提高,电子计算机、核技术、生物工程、空间技术等新兴技术快速发展,同期AI技术应运得到发展。那么以信息化为主的第三次科技革命,大幅度提高了科学技术水平,促进了社会经济结构和社会生活结构的重大变化,其中最显著的是互联网的诞生,让信息无处不在 , 改变了每一个人的生活和工作方式。
算力算法为代表的基础技术持续演进,推动社会进入智能时代。在算法层面,1956年人工智能第一次被提出,标志着AI学科的诞生,而后经历了70年的曲折发展,从早期的符号主义、专家系统到80年代统计机器学习的流行、再到21世纪的深度学习。而在算力层面,从第一台计算机诞生、进入芯片时代,90年代互联网诞生,21世纪提出云计算,到近些年的智算超算。每一次技术浪潮都带来了新的算法和算力的突破。而随着算法和算力的不断进步,以生成式AI为主的第四次技术浪潮,也标志着以人工智能为主第四次科技革命正式拉开大幕 。这次科技革命以下四个特点:
· 智能能够涌现,具备自我组织和优化的能力· 能自主决策,具备代理能力· 功能可见,用户可直接理解并与系统交互· 具象、直观的形象和体验:比如无人车、机器人这些新兴技术间高度融合,人与机器共同协作、共同进步,新的技术革命引领社会加速迈入智能新时代未来,AI将无处不在。
在整个以人工智能引领的智能新时代,有两个明显的趋势,第一个就是技术涌现和迭代的间隔期越来越短。我们以人机交互的里程碑事件来看,从最初的打字机到现代的电脑,我们走过了超过150年的历程。但电脑进化为个人移动设备,这一进程缩短到了50年。而从手机iphone到transformer诞生,只用了十年时间,从transformer到ChatGPT只用了短短五年。ChatGPT的发布以来,新技术更是层出不穷,大家每天被各种新技术的新闻轰炸,正所谓“AI一日,人间一年”,科技创新越来越快。
人工智能引领的智能新时代的第二个趋势就是科技创新的渗透速度在持续加快。一方面科技的发展已经超越了传统的数据密集型领域,从社交,金融等加速向农业、制造业、交通运营等行业渗透;另一方面科技创新在用户侧的渗透速度加快,比如产品达到1亿用户所有的时间,Telegram用了60多个月的时间,Instgram用了30个月时间,抖音用了9个月,而ChatGPT用了不到2个月。
同样的,科技在金融领域的应用速度不断加快,从IT+金融到互联网金融,再到数字金融,科技对金融的影响深度和广度也越来越大, 科技创新推动金融业进入数字金融新时代。最初,IT技术与金融结合,实现了科技对体力劳动的替代,提高了行业的效率,我们称之为IT+金融的阶段。随后,我们步入了互联网金融时代,这一阶段科技延伸了人类的触角。金融网络门户、网商银行、在线咨询等新兴服务模式,让金融服务更加便捷,触手可及。而现在,我们正处于数字金融时代。这一时代的特点是科技辅助人类的脑力劳动。以人工智能为核心的能力群,如金融大脑、知识图谱、智慧物联,正在帮助金融业务实现更高程度的自动化、更快速和高效的开展。
数字金融,作为金融创新的前沿,是国家提倡的五篇大文章之一。这五篇大文章包括科技金融、绿色金融、普惠金融、养老金融,它们共同构成了金融发展的宏伟蓝图。而数字金融,正是这一切的基础和推动力。数字金融作为金融创新与科技创新叠加融合形成的一种高级金融形态,具有数字与金融的双重属性,能够加速资金、信息、数字等要素的自由流通与有效配置,矫正传统金融因信息不对称引发的市场失灵和金融割裂问题,稳定经济大盘,支持科技金融创新水平提升、提升普惠金融覆盖面、加速绿色金融形成等。可以说数字金融意义重大,是五篇金融大文章的基础。但数字金融内涵丰富,技术包括人工智能,大数字,云计算等,场景包括信贷,支付,理财,保险等。接下来的分享我们聚焦于数字金融的高价值领域——“AI+信贷”,一窥当前进展。
02|传统式AI驱动:潜力巨大,方兴未艾
AI推动产业转型升级和引领智能时代潮流,而信贷能够促进资源有效配置、激发经济活力,“AI+信贷”是推动数字金融发展的高价值领域。以信贷为例,人工智能已成为行业迭代发展的核心驱动。信贷有三大核心业务问题:高效获客、对用户风险的精准识别和用户的智能经营 。在流量越来越贵的今天,获客成本也是业务最大成本之一,如何优化是关键问题,这里涉及的核心模型有质量预估模型、转化预估模型等等。风险是信贷的核心问题,风控模型又是风控的核心,比如A、B、C卡和反欺诈等风险模型。另外,如何差异化的给额和定价,在降低用户风险的同时,又满足用户需求提升留存,是智能经营要解决的问题 。
这些业务模型的迭代依赖底层的AI能力如机器学习、NLP等传统的AI技术,这些技术,去年也讲过,但是在过去一年, 很多新的技术出现,对这些模型带来新的变化,下面分别讲一下度小满在过去一年通过算法的持续创新为业务带来的效果。
第一个业务是营销获客。广告投放核心要解决的有两个问题: 一是根据业务需求找到更多用户 ;二是对这些用户我们希望付出更少的成本。对于这两个问题,我们有什么抓手呢? 在ocpx的机制下,转化预估都由平台来做,好像模型空间不大。但是信贷的链路非常长,在ocpx的实时转化回传的机制下,只能靠授信回传,而无法对滞后的深度转化进行回传,广告平台无法拿到端到端的最终结果,无法优化最终最优解。所以我们要做的事情就是:精准的预估端到端的转化概率,以及预估用户全生命周期的价值(LTV),从而影响出价系数。针对每一个事情都有相应的难点,第一个端到端转化预估的难点就是是目标用户识别难度大,负样本规模巨大导致的模型效率和效果难以达到最优。为了解决这个问题,我们在技术上做了很多演化迭代。首先,过去传统方案是对每个过程指标进行预测,例如从展现到点击,从点击到申请,申请到授信,授信到用信等;在单转化基础上叠加策略规则进行组合,基于转化效果调整各个部分的权重,然而对于信贷营销来说,需求和风险是一个天平两端,高质量的用户选择多,点击少,转化差,而申请概率高的往往质量差风险高, 这就导致了业务目标相互冲突,业务结果量化解释比较难。因此后来过度到阶段二,对应多个目标做人为的排序融合,比如授信质量高的 > 授信通过的 > 来申请的 > 点击的,通过排序得到业务上筛选用户的优先级, 保障了整体排序的一致性,但强制的人力设定排序,影响了识别精度,很难做到精准的深度转化预估。所以最后我们借鉴了多阶段课程学习的思路,我们先用模型学习简单任务,基于学习结果进一步学习困难任务,从而实现在海量设备号中建立从头部到尾部整体的识别精准度,在同等投放规模和成本下,用信相对提升15%。除了端到端预估之外,用户的长期价值识别也非常关键,是影响最后出价系数的关键因素 。长期价值的识别,建立起对设备号到流量的长期价值识别,困难在于信贷用户价值观察时间长,而用户价值和经营强相关,经营策略不稳定,例如不同时间额度分布差异较大、不同时期风险也较大变化,而用该标签直接训练该模型,会使得模型拟合两年前的额度和风险情况,无法泛化到当前的价值的判断,这也是一个比较困难的问题。我们借鉴了蒸馏学习的方法,通过用户转化后的特征学习代理模型,建立经营中间指标以及风险和LTV的关系,进一步使用设备号信息在最新样本上学习最新经营和风险泛化出来的结果,从而使得流量维度的识别具有一定的泛化性,我们测试相同成本下总LTV相对提升20%。
第二个业务是大数据风控。在NLP技术上我们也是从2019年一直从最早的attention方法发展到风控领域预训练技术,效果上也有明显提升。但在实际的业务,我们发现仍然有很多可以优化的空间,比如像诸如征信、合同等,蕴含着风险信息,这些数据通常篇幅较长,构成了长文本信息处理的挑战。我们前几年主要是基于经典transformer架构下的预训练模型来处理这些文本,但是会遇到泛化能力差、推理性能低下不满足生产要求,以及难以捕捉长距离依赖或者说注意力衰减的问题。今年大模型一个比较火的方向就是长文本的处理,比如像如旋转位置编码RoPE,大模型里用到的技术,与我们场景要解决的问题也很匹配。我们成功的把这些新的算法应到风控模型中,这些先进的算法显著提升了我们信贷模型的效能,尤其是在短期内,相较于仅基于征信报告的深度学习模型,有超过5%的风险区分度提升。
大数据风控的第二个例子是征信报告解读。征信中包含了大量关联信息,可能存在风险相关性或者风险链式传导,是理解用户行为和评估风险的关键信息。只通过征信报告, 不增加任何其他数据的情况下,怎么通过技术不断的精进优化、提升效果,是我们一直在追求的事情。过去,我们的征信解读的技术也是一直在引领着行业的发展,从最早的人工经验,到人工特征,到自动化机器学习大规模特征,一份征信报告可以生成上千万维的变量,到深度学习挖掘征信里时序和深度信息;去年我们把一份征信报告变成了一个有效的关联网络的图,多份征信可以通过图与图的关联构成征信大图,开启了整个行业里征信报告的图机器学习时代。在过去一年,我们又通过最新的算法,解决了征信图里面的节点和边不均衡问题,在原有效果上又有了进一步提升。
对于大数据风控,第三种比较重要的数据类型是时间序列信息,比如信贷行为如借款行为、还款行为等,隐藏着变化趋势和规律,能够有效反应用户的风险变化。之前往往用各种统计方式,比如使用滑动特征来进行建模,这种方式难以精准挖掘时间维度上的连续性和相关性,无法更好地预测未来风险趋势。所以我们从统计模型到机器学习,再到长序列的深度学习模型,效果上一直稳步提升。
最后举一个因果推断应用的例子,这是我们在行业内成功引入到额度模型上面,也是我们在行业内的首创。信贷领域的业务是极其复杂的,很多时候我们观测到的数据与正常认知存在相违背的情况:例如普遍情况下我们会对风险偏高的客户设置较低的额度,对风险较好的客户设置较高的额度,从全量数据上看,似乎表现出“额度越高,风险越低”的伪相关关系,我们都知道这样的关系是错误的。对于一个人来讲,额度越高,风险会越高,而且不同用户在额度增加时,风险变化也不一样。在传统策略给额方式下,通过静态的规则来定额,是无法量化出不同额度下的风险迁移情况,所以我们引入因果推断的思维,即通过因果算法,从复杂的观测样本中抽离出正确的因果关系,即对于同质的客户来说,其风险水平(果)会受到额度变化(因)的影响,且对于不同客户来说,在额度提升时风险增速也是不同的。我们通过最前沿的因果推断算法,去进一步识别「额度与风险变化」之间的精准关系,通过算法的不断迭代更新,我们的经营效率也有了大幅提升。
那么从前面的分享,可以看出传统的AI的算法在过去一年仍然得到了巨大的发展,特别是在数据不断富集的加持下, 为业务带来了巨大的价值,潜力依旧巨大。
但是有很多场景是传统AI解决不了问题,比如生成式的任务,比如在提效上的一些事情,像写代码,数据分析等等,这些之前满足不了的需求为生成式AI加速落地创造了基础。
03|生成式AI重塑金融:开源启航,落地生根
从百模大战发展到今天,从企业本身角度,对大模型的需求转变:由「广泛探索」转向「核心业务深化」。也越来越清醒的认识到大模型专业性、泛化性和经济性很难兼得。不再追求大而全,而是专注大模型在企业核心业务中的直接应用价值,无论是在原有流程中嵌入还是直接做为copilit助手,最重要的是以最佳的方式应用大模型,以提升企业ROI。
经过我们的实践,也探索出了不同的大模型应用路径。直接使用闭源模型可能会遇到私域数据隐私安全的问题,而直接使用开源模型则可能存在性能瓶颈。“开源模型+Prompt+知识库”的路线虽然可以提高灵活性,但在处理复杂指令时仍然存在挑战,并且prompt编写难度高。相比直接使用闭源或开源模型,基于开源模型的调优可以针对特定领域需求进行微调,在少量领域数据上进行快速适配,自主选择模型结构和优化策略,全流程掌控数据和模型从而杜绝泄露风险,可谓将定制化、高效性、灵活性和可控性一网打尽。所以我们认为开源模型调优是其中较优路线,可以将私域数据转化为竞争优势,并确保场景应用安全可控。
首先是开源模型很多,基座的选择很重要。我们重点看两个指标,一个是显性能力,就实际用户体验的能力,比如对话能力等等,另一个就是隐性能力,比如语义理解,深层次逻辑能力,可以认为天赋和智商;显性优化可以提升模型在特定任务上的表现,但无法从根本上改变隐性能力,如同对基座模型进行“表面装饰”;隐性能力决定模型的上限,不同场景对能力要求不同,关键场景(如医疗、金融等)对模型的隐性能力要求较高,需要从底层能力把控。我们需要优先选择隐性能力强的开源模型。
根据公开的各榜单以及我们的评估,Llama3系列成为最强开源模型,隐性能力扎实,在各大Benchmark上表现出色;显性能力领先,全球大模型擂台赛排开源第一(数据截止到8月5日,Llama-3-70b-Instruct 目前第20位)。Llama3为领域赋能带来新机会。
尽管LLaMA-3在多个方面表现出色,但在中文处理能力、专业场景应用和在线服务能力三个重要应用方面面临诸多挑战。首先,中文处理能力是LLaMA-3面临的一大难题。尽管模型在多个领域都取得了显著进展,但在中文处理方面,仍存在着知识覆盖的局限、理解深度的不足以及生成效果的欠佳。其次,专业场景应用挑战也不容忽视。在垂直领域,LLaMA-3面临着专业知识匹配度低、服务策略单一以及交互模式固化等问题。此外,在线服务能力也是LLaMA-3需要面对的挑战之一。
领域大模型的发展可以类比为人类的成长路径,从接受通识教育到专业深造,再到实际工作场景中的应用和反馈。在“中学生”阶段,大模型需要接受通识教育,掌握广泛的语言理解和信息处理能力,为后续学习奠定坚实基础;而在“大学生”阶段则需要接受专业教育,在大规模通用文本数据上训练模型,使其深入了解行业术语、行业案例、专家经验和最佳实践,逐渐具备行业所需的专业能力;最终成为“职场人”,以岗位产出为导向,需要通过具体工作场景反馈,进一步提高模型的性能和适应性。三个阶段也分别对应了数据优化、算法增强、工程增强和场景增强等不同模型构建和评测体系建设阶段。
在这三个阶段中,可以看出构建领域大模型有五大关键抓手:数据增强是基础,算法增强是核心,工程增强是保障,场景增强是方向,评估反馈是动力。具体包括数据质量如何评估,特别是政治,有害的数据如何过滤清洗;数据配比,长本文能力增强,强化对齐研究;量化及推理加速,降低企业应用成本;解决场景最后一公里问题;评估反馈贯穿整个过程。这些抓手涵盖了从数据收集到模型训练,再到实际应用和持续优化的全过程,确保模型能够高效、稳定地服务于领域应用。
以Llama3的汉化为例,目标是中文能力提升、业务效果突破和资源成本控制。首先,我们用合理配比和数量的高质量数据通过增量预训练、指令微调和强化对齐三大训练阶段大幅提升了模型的中文能力;其次,我们通过融合私域数据和嵌入工作流程实现业务效果突破。最后,通过微调和推理的优化,我们牢牢把控资源成本控制。通过汉化Llama3训练金融行业基础模型,我们最终达到了通用能力强大、金融能力领先和业务能力优越的效果。具体的数据见下图:
前面讲了大模型优化之路,在大模型应用上面,按大模型与人类用户的交互方式,分成了三类:
**· **嵌入类:大模型被集成到现有的应用程序或服务之中,为用户提供更智能和个性化的体验。这种模式并不直接暴露模型的所有能力给最终用户,而是将其作为一种增强的功能或服务的一部分。
**· **助手类:大模型充当助手的角色,与人类用户紧密合作,为人类提供实时的建议和支持,人类保持在决策过程中的中心位置。
· 机器人:可以独立执行任务,甚至在某些情况下做出决策,跟人类是同等关系。
生成式AI作为人工智能领域的新一代重大技术浪潮,也正逐步从理论探索走向实际应用,以嵌入、辅助和共生的形式重塑金融业未来格局。在基础能力嵌入层面,多模态大模型驱动通用文档智能,解决了狭义文档智能框架可处理输入单一、提取流程繁琐和定制化成本高的痛点,多模态输入融合实现特征表达,支持上百种复杂场景的文档识别且准确率达97%。在智能助手辅助层面,大模型智能理财投顾Agent能够模仿人类理财师工作流程,结合用户画像、上下文记忆、投资组合管理、实时数据RAG、专家案例库和理财分析LLM,提供个性化、普惠化的专业投资服务。在人机共生层,生成式AI还将智能客服升级到3.0,能够集成多种模态交互方式,端到端减少中间环节,促成更连贯的用户对话体验,达到响应时间减少、客户满意度提升、人力成本减少的效果,成为人机共生的协作典范。
但生成式AI的发展过程中,不是一帆风顺的,在其推进技术进步和应用加速的同时,我们也需要直面生成式AI为金融领域带来的机遇与挑战,这里我们总结了三类:首先,在应用层面,生成式AI容易出现事实性错误、逻辑不一致,甚至凭空捏造信息,如何避免幻觉是一个领域运用的棘手问题。其次,在安全层,生成式AI被滥用于生成虚假信息、欺诈等行为,如何防范AI伪造是摆在我们面前的一个重要问题。最后,在伦理层,我们发现生成式AI存在算法歧视、隐私泄露和就业替代等风险,我们需要考虑如何应对道德风险的问题。针对以上问题,团队也正在探索有效解法,比如通过构建稳健的金融AI决策系统应对大模型幻觉风险,深度挖掘细粒伪造痕迹降低生成技术滥用风险。同时,我们也倡导行业各位同仁一起,引导AI向善,构建负责任的金融科技未来。
04|展望:AI赋能,从数字金融到千行百业
无论是传统型AI,还是生成式AI,人工智能都构成了数字金融的底层能力。数字金融凭借其不断创新的科技手段,持续提升金融服务的效率,进一步优化资源配置,从而有力推动普惠金融的发展,更好地服务于实体经济。“金融是国民经济的血脉,是国家核心竞争力的重要组成部分,坚持把金融服务实体经济作为根本宗旨”。今天,我们希望通过分享一些思考和实践,让更多的人认识到科技在数字金融领域的价值;同时,我们也期待通过这些分享,不断推动科技创新和金融创新,强化支撑实体经济,以高质量发展服务中国式现代化的进程。
一言以蔽,今天主要分享的观点如下:**· **科技创新的涌现和落地速度在加快,开启数字金融新时代
**· **传统人工智能红利依然巨大,技术持续创新,为行业创造更大价值 · 生成式人工智能开源启航,落地生根,将重塑金融业务,但风险不可忽视
· 人工智能助力数字金融大文章,从数字金融到千行百业
版权归原作者 xusy-it 所有, 如有侵权,请联系我们删除。