2023年服贸会期间,大模型在各领域的应用成为热门话题。9月5日,北京商报记者就大模型在金融领域应用的相关内容,对百融云创科技股份公司(以下简称“百融云创”)AI创新负责人陈昀彰进行了专访。
陈昀彰直言,当前大模型应用还存在诸多难点,提升算力、优化算法等技术手段之外,从业机构还需要充分的行业Know-how,注重对大模型落地场景的深入挖掘,“模型-行业理解-应用”将决定大模型企业的成败,未来垂直类场景应用和模型能力的结合将更为紧密。
深入挖掘落地场景
2022年末,ChatGPT横空出世,在金融圈、科技圈掀起狂潮。AIGC、⽣成式⼈⼯智能、语⾔模型、⼤模型等概念层出不穷。进入2023年后,业内多家金融科技公司也加入到大模型领域的比拼中。
根据北京商报记者过往采访的情况,当前金融科技领域大模型的应用大多还停留在智能交互层面,距离其大范围落地还有一定距离。其中,生成式AI更是存在“模型崩溃”“机器幻觉”等弊端。
针对这一现状,陈昀彰告诉北京商报记者,从技术上来说,大模型的应用难点有很多。例如模型训练的数据存在一定偏差、模型具有“黑箱”特性以及在涌现行为出现的同时还存在“预测困境”等。
“生成式AI模型通过机器学习会生成一些事实性错误。”陈昀彰表示。例如,对于大模型的训练数据中未曾覆盖到的信息,大模型会按照上下文的概率进行事实编造,从而导致发生大模型“幻觉”的问题。
如何应对上述技术难点,陈昀彰也给出了自己的答案。陈昀彰指出,提升算力、优化算法之外,还需要充分的行业Know-how、行业知识库以及对于落地场景的深入挖掘。简而言之,“模型-行业理解-应用”将决定大模型企业的成败。
在陈昀彰看来,当前在大模型真正落地的环节,更多用户还是将其当作“玩具”,还不足以作为“工具”使用。但实际上,⼤模型建设的业务拆解中最重要的是确定应⽤场景,这决定了⽤户所需要的功能、⽤户能以何种表达⽅式与这些功能产⽣链接。强化“工具”能力让大模型自主完成指令,在场景应用中能够解决非常大的问题。
陈昀彰以百融云创企业内部的应用场景为例进行了进一步解释,公司员工提出请假需求是常见的场景之一,通过百融对话大模型,能够直接找到发起审批流程,极大地压缩了中间沟通过程带来的信息损耗。
据了解,BR-LLMs百融⼤模型采⽤MoE模型路由⽅案,将不同场景的请求分发给不同的模型,这其中包括对话⼤模型、编程⼤模型、扩散模型等⽣成式模型和判别式模型,在保证应⽤效果的同时可以降低训练成本,全面提升业务转化效果。
大模型将在更多垂直领域落地
在采访过程中,陈昀彰多次强调,企业建立大模型要结合具体的应用场景才能发挥最大效率。但需要注意的是,大模型在向外输出的过程中,不仅仅面临准确性、稳定性方面的考验,在隐私数据保护上也是市场关注的焦点。
对于百融大模型如何解决数据隐私这一问题,陈昀彰指出,百融云创的定位并不是大模型的厂商,而是将大模型的能力包装成业务场景应用。在其他业务与银行等金融机构的合作中,通过有效授权让百融大模型的运转更顺畅、成本更低。
“其次大模型的训练是不断沉淀的过程,面对金融行业的使用场景中,我们考虑将大模型工具和行业大模型给到银行,银行根据其具体业务在开发工具下进行微调,这样能保证数据在银行系统内部流转。”陈昀彰补充道。
事实上,大模型并非是行业内的全新概念,从最初的智能客服到如今的生成式AI、决策式AI,科技助力下大模型能力实现跨越式提升,也满足了更多金融场景的使用需求,进一步加快了金融行业的数字化进程。
对于下一阶段大模型的发展,陈昀彰认为,生成式AI和决策式AI的有机融合发展料将是一大方向。比如针对生成式AI在权衡一些对冲性的信息时,不能做出正确取舍的弊端,可以在模型建设中加入决策式AI的决策树等算法,通过引入显性的逻辑规则来判断相互矛盾的信息,进而给出最优解。
陈昀彰指出,目前整个AI产业呈现出“百模大战”的格局,随着技术的演进发展,行业也将发展出几大不同的路径,即以科技巨头为主的通用型大模型、新兴创业公司主导的各类“小模型”,以及像百融云创这样的AI科技公司研发的行业大模型。后续,外界对于大模型的关注将转向其在垂直领域的落地,行业大模型势必将迸发更多势能,垂类应用和模型能力的结合也会更为紧密。
此外,陈昀彰透露,目前公司正与⾏业中的各个合作伙伴紧密沟通拆解场景。预计百融大模型会在⾦融⾏业的营销、客服、合规审查、报告⽣成、信息总结等多个场景中进⾏应⽤。