对话马上消费蒋宁:大模型+小模型 组合式AI打通金融服务“最后一公里”
发布者:套间 发布时间: 2024-08-12 18:58:06
在数字化浪潮下,传统金融机构正面临变革,外部经营环境不确定性提升、内部成本压力、客户群体结构变迁等,都在倒逼着金融业踏上破局之路。对于消费金融机构而言,通过数字科技服务有金融服务需求的社会各阶层和群体,是其重要机遇之一。
但机遇面前,消费金融机构也面临不小的挑战:转化效率低、投入产出比不高、建设周期长、获客成本高等都是当今时代消费金融机构面临的痛点。
何解?科技是答案。面对小额、高频、分散、海量的客服服务,唯有向技术要效率。
据了解,马上消费成立8年以来,科学技术研发投入超33亿元,公司成立了一套涵盖云计算、大数据、人工智能、区块链等多种前沿技术的数字化技术体系,实现了从数据采集、存储、分析、应用到安全保障的全流程智能化管理。
通过技术赋能,马上消费有效提升了金融服务的效益和质量。公开多个方面数据显示,马上消费基于大模型驱动的金融智能客服,客服团队效率提升10倍,用户好评率提升23%;通过精细的资源管理优化技术,云平台CPU利用率提升到行业中等水准的4倍,2022年节省IT硬件采购成本数千万元;营销素材AI自动质检流程立项后,机器人“秒级”内容审核率已达80%。
并且,公司主动融入国家与地方发展大局,践行企业社会责任。从产业界通用的纳税额与用地面积、员工数的比值来看,2023年,马上消费人均纳税达24万元/平方米,人均税收贡献66万元/人。
营销方面,马上消费不断淬炼数据、团队组织能力及技术能力等,通过自研平台,打通用户感知、圈选与转化的链路,最终打造出不依赖于第三方流量、能够自主获客的数字化营销体系,从而摆脱了依靠大量投放换取增长的路径。
在风控领域,马上消费依托10万变量特征、2000多个风控策略、决策及数据模型算法筑起全流程、体系化的风险防火墙,防范金融风险。
在技术的赋能下,马上消费系统由传统的机器学习跃迁到大规模特征计算和以大模型为代表的新一代AI应用体系。
今年8月,马上消费正式对外发布全国首个零售金融大模型——“天镜”大模型,先后入选省部级重大科技奖,荣获重庆市专利奖、申请发明专利100余项(其中国际PCT近10项),被收录于中国系列白皮书《大模型技术(2023年)》。依托金融大模型有关技术,公司参编IEEE全球首个金融风控大模型标准、《金融大模型智能服务平台关键研发技术及应用》成功入选重庆市科技局2023年度技术创新与应用发展重大专项,《基于大模型驱动的智能客服平台》上榜工信部移动互联网应用服务能力提升优秀案例名单、荣鹰中国人工智能产业发展联盟 (AIIA) 十大潜力应用案例,以新技术创新赋能产业变革,全方位推进数字化转型。
大模型作为“大脑”,基于认知推理的复杂任务拆解,精密规划并调用相应工具和小模型,大模型+小模型,打通金融服务的“最后一公里”,在营销获客、风险审批、客户服务等多个零售金融场景实现应用。记者专访了马上消费首席信息官蒋宁,一起聊一聊马上消费成立以来不同发展阶段的技术迭代,同时呈现科学技术创新给马上消费带来的发展成效。
关于马上消费心理学研究与大模型、数据研究的结合,这种成熟的应用在国内很罕见,当时是怎么产生这种动念的?
蒋宁:新时代发展强调在更广范围内满足大家对美好生活的向往,对金融服务而言,质效提升十分重要。当前零售金融面临以下几个问题:一是效率低,对比企业贷款,零售贷款涉及到大量个人,且金额较小,需要处理大量个人相关信息;二是投入产出比低;三是建设周期较长,比如零售金融头部机构招商银行在这样的领域已积累长达30多年。
为了改善这样一些问题,信息化、平台化、自动化是解决方案。但这样的一个过程始终需要人与人之间的互动,因为纯人工智能方法难以完全替代人的服务。提供温暖人性化的服务很重要,但人工智能技术还存在很多局限,和消费的人期待的“智能”还有一定距离,很难实现基于心理、情绪的极致体验。
为了保证服务质量,必须赋予数字金融服务一定情感色彩。因此,我们就思考怎么样通过声音语调、文字特点等方式让智能客服具备情绪感知能力,从而提升效率。
为了实现这一目标,我们和西南大学教授碰撞。起初,他们对这个非常前沿的课题有所犹豫,但是看见我们必做的决心,且有客群、语言文字等大规模数据基础,可行性较高。在双方合作研发的努力下,在现有模型中引入了MBTI人格心理学的16种人格类型分析研究,希望可以更好地理解消费者的个性化需求,提供更高效的服务。
你刚才谈到“有温度的服务”,如果我们从技术角度拆解来看,这个“温度”是由什么来构成的?
蒋宁:我和心理学老师交流时发现,心理过程包括:接受信息、感受信息、处理信息。
感受信息有时候是根据直觉判断,但有时候也可能基于逻辑判断,更为理性。按照心理学的逻辑,是因为信息有上下文,有input和output。
什么是input和output?即“一问一答”。如果话与话之间有明确的逻辑关系,那么这个客户可能是基于理性判断。举个例子,如果客户的选择依据合同、讲话有理有据,那么他可能比较理性;如果input和output之间无显著的联系,并且语言与语调有很多情绪变化,那就能判断这是感性的。
基于以上逻辑,我们大家可以利用大量的 input和output信息作对比测试。经过百万组对话的训练,并引入心理学MBTI十六种人格测试,取得了一些成果。尽管心理学不像自然科学,任何一个人都是动态变化的,可能时而感性、时而理性,但至少可以以心理学理论为支撑,并结合最新的人工智能技术和大模型的语言解析能力,提供相对可靠的支撑。
个人认为这些实验可能对心理学也是一种很大的促进,尤其是数据的支撑,能验证很多理论假设,这与之前的心理学实验完全不一样,这个事你是从何时开始的?
蒋宁:大概从2019年开始做,从最开始没有理论支撑,就在通过语言语调的变化等基础工作来做情感识别。
蒋宁:心理学被用来解决运营效率低的问题,在金融运营中包括贷前、贷中和贷后。在贷后阶段,心理学的运用比较广泛,因为贷款后客户可能对交易规则、产品服务、还款规则等产生异议,这时候会有大量客户来做沟通。而在贷前阶段,心理学运用相对较少,因为贷款是一种相对刚性的需求,客户的关注点主要在于获取贷款,心理因素在此阶段的影响相对较小。
目前,在公司风控层面,声音、文字、图片等非结构化数据已得到广泛应用。举个例子,贷款后客户通过电话做沟通时,他关切还款方式、逾期后影不影响个人的央行征信。这一些信息对评估个人风险是非常有帮助的,如果客户关切违约是否会上央行征信,那说明客户很在乎个人信用,那么这个客户的欺诈风险较低。因此,对客户的风险评估就可能更要关注的是额度和信用风险。通过对客户的声音、文字进行AI处理及心理学分析等,科技将AI最基本的技术转化为对客户的风险评估,这也是研究人工智能的初衷。
蒋宁:技术的发展不是一蹴而就的,是不断的积累和迭代。我将按照能力发展的视角分成四个阶段:一是初创阶段、二是创新阶段、三是平台化阶段、四是生态化阶段。
在初创阶段的特点是要快速开业,并且满足监管合规的要求,具备基本的展业能力。半年后进入第二阶段——创新阶段。
如果按照“矛盾的普遍性和特殊性”来讲,第一阶段就是矛盾的普遍性,第二阶段是矛盾特殊性。在创新阶段,基本上要把公司的系统全部进行打造,实现自我掌控,但此阶段还不具备大规模的创新能力,包括团队、数据、业务模式等都是局部创新。
第三阶段主要是大规模创新平台化,比如分布式系统、数据中台、定量风险管理、个性化体验、自动化流程、平台化运营等。此阶段主要是在2017-2020年,当时形成了上百个产品。整体而言是一个从集中走向分散,从共享走向专业的过程,实现了风险的定量、个性化的服务体验、自动化的流程、智能化的运营等关键性目标。
第四阶段是走向生态前沿,成为一家科技驱动的新型企业。在科学技术板块,马上消费以科学技术实力比肩科技公司为定位,与场景融合,包括消费场景、资金场景等,与银行合作、第三方数据公司合作,成为一家生态化的企业,在确保安全可信合规的前提下,把我们的科技能力变成开放性的能力。
传统角度来看,利差模式是非常好的模式,为什么还要去探索科技能力?这是不是一个苦活儿?
蒋宁:科技自立自强是新时代公司发展实现高水平质量的发展、高水平安全的核心。这段时间,刚成立的国家数据局深入调研平台企业,并将持续发布平台企业典型投资案例。在数字化的经济时代,平台模式是发挥“数据要素”潜能的重点方向。
以亚马逊模式为例,它给我们大家带来的启示是通过业务锻炼科技能力,从而拓展开放性的能力并形成新的科技收入。因此,我们的思考就是如何在基础业务模式上构建我们核心能力,以及如何将这些核心能力转化为开放性服务,赋能我们的生态合作伙伴。这些核心能力的背后就是科学技术能力的差异,因此我们一定要加大科技能力的投入和建设,来支持我们在金融领域的长期发展。
在金融机构的发展中,有两条路径可供选择:一是靠股东不断追加资本金才能扩大规模,二是靠自营业务产生收益来补充资本。无论选择哪一条路,都难以实现持续的增长模式。
我们希望能够通过金融业务的数据、场景、算法、平台形成核心能力。目前,我们的营销、风控、贷后管理能力皆在向开放性业务转化,预计今年的收入来源比例分布更加稳健。
在此前的演讲中,你谈到“尽量不依靠第三方流量,要建立自主获客的数字化营销体系”,请问是怎么做到的?
蒋宁:国家发展改革委近期发布“×”行动计划,其中金融服务是重点支持的十二个行业方向之一。金融是发挥乘数效应的典型场景,其中最核心的板块在营销和风险管理上。
金融是典型的高价值低频的业务,获客成本非常高,且客户易流失。在互联网的浪潮下,随着线上化、移动化程度的提高,互联网的平台拥有大量的生活场景和客户,金融机构必须和这些网络站点平台合作,往往付出昂贵的获客成本。金融机构自建老百姓衣食住行的场景难度比较大,这样,金融机构逐步变成了单纯的风险产品持有者,失去提升使用者真实的体验和忠诚度的机会,也缺乏对消费的人的了解,很难研发出以用户为中心的个性化的产品和服务。
早年,马上消费也是和场景合作,相当于批发业务。虽能快速形成一定业务规模,但上游平台获取了大部分的利润,导致我们的利润比较薄,主要获得的是团队、数据及公司组织能力等。
走过批发阶段,我们开始探索做自营,打通客户感知、客户转化、客户运营的完整链条。其中客户感知最难,有必要进行广告投放、品牌宣传、APP的宣传活动等来触达客户,同时要与广告平台博弈,还存在快速涨规模但利润不高等挑战。此外,还有几率存在广告投放不准、难以转化、转化之后“一锤子买卖”等问题。金融机构运营的难点包括二次贷款、交叉营销,这既涉及组织的协作问题,也涉及产品之间的割裂。
在转化和运营环节,我们应该利用智能化手段,包括人机协作、智能等提高转化效率,降低营销成本。经过长时间的摸索、打磨,马上消费逐渐把“自营”从一个既没有规模又不赚钱的模块,转变为先赚钱再扩大规模的模式。目前,我们70%的客户是自营客户。这是一个艰难的过程,必须经历批发阶段,让客户意识到我们的价值,然后再把这个价值转化为实际收益,持续进行长久的经营。
这也是很多行业特别头疼的问题,比如多年以前酒店行业就高喊“甩掉携程”,多年过去后,真正能“甩掉”的只有华住。
蒋宁:对,这是全行业的事情。比如金融行业里最理想的战略模式就是金融超市,就是一个典型的金融超市概念。
但很遗憾的是,当下潜在的客群面临威胁,主要是因为银行的物理网点经营的都是老年人,年轻人很少去银行。所以,对于当今的金融行业来讲,把“线上能力”修炼好一定是条光明之路。要修炼好“线上能力”,渠道、营业销售能力是非常核心的竞争能力。
蒋宁:一是以用户为中心的产品和服务体系,传统金融机构不是以用户为中心,而是以产品为中心;二是生态化的平台能力;三是数据决策的技术,包括用户的圈选、转化;四是以人机协作、人工智能为核心的智能化及个性化的体验工具。
以用户为中心,对金融而言最重要的是风险定量、价格个性化。例如,马上消费根据风险、时间等指标,实时动态评估不同的额度、利率,这要解决交易问题、会计核算等问题,对整个金融系统和架构平台的挑战非常大。我们目前有700多个产品,核心交易系统是基于用户为中心的动态定价系统。这也使得我们的产品能快速在各种场景上展开合作,与资金、资产方进行多方交易、多方核算。
在数据决策方面,主要涉及圈选、转化。首先是在茫茫人海中找到我们的目标用户,在不同生态平台上,用户特点差异较大,因此我们从始至终在分析用户特点,深入洞察用户,已实现基于用户行为轨迹来分析,了解其特点。其次是精细化转化,通过算法创新、数据平台创新等实时动态分析用户的因果行为、实时行为,了解为什么用户进行转化和购买,以及用户行为背后的相关因素。这也涉及到全生命周期的数据决策能力,并且通过转化结果的归因来完成大量的分析和尝试工作。
个性化体验方面要求针对不一样的客户,APP展示不同的内容。比如,针对刚借款的客户,展示的内容可能不是信贷产品,可能是qq视频会员等合作方权益的推荐。这就需要启动人工智能,确保每一刻展示的都是基于客户洞察的个性化内容。
蒋宁:中央金融工作会议强调,新时代金融要推进高水平质量的发展。马上消费在提供金融服务上,尤其注重运用数字技术,提升金融服务的覆盖性、可得性。
首先,好的风控能力很重要。信贷是上帝的礼物,让人们能提前享受美好生活。但资金成本被少量不还钱的人推高了。如果风控做得好,那就能让更多的人以更低的成本享受到更好地金融服务。
在好的风控基础上,我们要提高普适性和对客户类型的包容性,提供更高的普惠性服务,以更好的价格提供个性化的产品。
马上消费的营销端的确与很多金融机构不一样,营销是向外的一个过程,风控更多是基于已有的数据向内,公司的风控与别的金融机构是相似的吗?
蒋宁:不能说差异很大,但思路不同。我们构建一个特征空间来描绘违约的变量特征,未来目标是要做到百万变量特征,实现风险的更精准、实时识别,进而控制风险,降低营销成本。
但百万特征面临的挑战较大,举个例子,这些特征相当于厨师做菜时冰箱里的原材料,有中餐系列、西餐系列、辣的、咸的、保质期长或短、加工路径很复杂等问题,可能还会不断变换。简言之,基于大规模特征做决策,需要构建工程化、体系化的支撑能力。
蒋宁:金融机构的获客、风控,要么依靠人,要么依靠智能化手段。我们一定要在保质保量的基础上减少相关成本,因此选择了科技驱动的道路,强化人工智能技术的研发是必然的。
今年8月份,公司发布了“天镜”大模型,2000多个小模型与“天镜”大模型之间是什么关系?
蒋宁:一个通用大模型不能代表所有,在企业内部,有四类大模型:私有化部署的通用大模型、知识大模型、工具大模型和决策型大模型。然而,大模型不可以进行持续优化(optimazition),这对它来说非常难。大模型不是传统模型的替代品,但它的优点是与人类的交互能力更强。
举个例子,营销模型中的质检模型,主要是未来解决安全合规的问题,目前主要是基于传统模型制定的。当大模型在对话沟通中,识别到“贷款”一词后,它调用传统模型,因为传统模型中已经设定相关规则。
此外,针对大模型的“幻觉”问题,在金融领域有必要进行很多事实、合规、安全的确认,而这些工作是非常琐碎的,需要工程机制和传统人工智能的结合才能有效解决合规安全问题。这样的一个过程需要用很多小模型。
因此,几千个小模型与大模型进行合作,即大模型就像一个大脑,自动萃取人工经验,进行认知推理,拆解复杂任务,并规划调用工具和小模型。简而言之,大模型能够最终靠语言等理解用户的意图,但需要传统模型来执行具体任务。
“最后一公里”问题类似于光纤引入小区,大模型是没有办法解决这个问题的。因此需要用小模型来解决。这也是我们未来的工作重点。
蒋宁:“可信”是一个很广泛的概念。我个人觉得,在任何情况下,可以在一定程度上完成可预期可控的结果是最重要的。金融要实现高水平质量的发展,必须和安全动态平衡、相得益彰,以高水平安全保障高水平质量的发展。因此,安全和可控是第一目标,只有达到了第一目标,才能实现其他目标。
要实现安全可信,需要从算力的稳定性保障、算法的鲁棒性和安全性、数据有序性等各方面做工作。马上消费对安全可信的实践工作,不仅要保证金融服务的安全可信,还要保证服务系统的安全合规。
同时,我们也积极探索金融行业大模型全域标准规范建设,努力从构建基础设施、金融全域数据规范、金融算法规范和金融应用规范等四个维度寻求突破,目前参与发布国内首个金融行业大模型标准、编写IEEE全球首个金融风控大模型标准,与监管、协会、同业共同推进行业可信生态建设。(CIS)