ChatGPT爆火之后，大模型落地金融场景难在哪？如何解决？

　　2023年服贸会期间，大模型在各领域的应用成为热门话题。9月5日，北京商报记者就大模型在金融领域应用的相关内容，对百融云创科技股份公司(以下简称“百融云创”)AI创新负责人陈昀彰进行了专访。

　　陈昀彰直言，当前大模型应用还存在诸多难点，提升算力、优化算法等技术手段之外，从业机构还需要充分的行业Know-how，注重对大模型落地场景的深入挖掘，“模型-行业理解-应用”将决定大模型企业的成败，未来垂直类场景应用和模型能力的结合将更为紧密。

　　深入挖掘落地场景

　　2022年末，ChatGPT横空出世，在金融圈、科技圈掀起狂潮。AIGC、⽣成式⼈⼯智能、语⾔模型、⼤模型等概念层出不穷。进入2023年后，业内多家金融科技公司也加入到大模型领域的比拼中。

　　根据北京商报记者过往采访的情况，当前金融科技领域大模型的应用大多还停留在智能交互层面，距离其大范围落地还有一定距离。其中，生成式AI更是存在“模型崩溃”“机器幻觉”等弊端。

　　针对这一现状，陈昀彰告诉北京商报记者，从技术上来说，大模型的应用难点有很多。例如模型训练的数据存在一定偏差、模型具有“黑箱”特性以及在涌现行为出现的同时还存在“预测困境”等。

　　“生成式AI模型通过机器学习会生成一些事实性错误。”陈昀彰表示。例如，对于大模型的训练数据中未曾覆盖到的信息，大模型会按照上下文的概率进行事实编造，从而导致发生大模型“幻觉”的问题。

　　如何应对上述技术难点，陈昀彰也给出了自己的答案。陈昀彰指出，提升算力、优化算法之外，还需要充分的行业Know-how、行业知识库以及对于落地场景的深入挖掘。简而言之，“模型-行业理解-应用”将决定大模型企业的成败。

　　在陈昀彰看来，当前在大模型真正落地的环节，更多用户还是将其当作“玩具”，还不足以作为“工具”使用。但实际上，⼤模型建设的业务拆解中最重要的是确定应⽤场景，这决定了⽤户所需要的功能、⽤户能以何种表达⽅式与这些功能产⽣链接。强化“工具”能力让大模型自主完成指令，在场景应用中能够解决非常大的问题。

　　陈昀彰以百融云创企业内部的应用场景为例进行了进一步解释，公司员工提出请假需求是常见的场景之一，通过百融对话大模型，能够直接找到发起审批流程，极大地压缩了中间沟通过程带来的信息损耗。

　　据了解，BR-LLMs百融⼤模型采⽤MoE模型路由⽅案，将不同场景的请求分发给不同的模型，这其中包括对话⼤模型、编程⼤模型、扩散模型等⽣成式模型和判别式模型，在保证应⽤效果的同时可以降低训练成本，全面提升业务转化效果。

　　大模型将在更多垂直领域落地

　　在采访过程中，陈昀彰多次强调，企业建立大模型要结合具体的应用场景才能发挥最大效率。但需要注意的是，大模型在向外输出的过程中，不仅仅面临准确性、稳定性方面的考验，在隐私数据保护上也是市场关注的焦点。

　　对于百融大模型如何解决数据隐私这一问题，陈昀彰指出，百融云创的定位并不是大模型的厂商，而是将大模型的能力包装成业务场景应用。在其他业务与银行等金融机构的合作中，通过有效授权让百融大模型的运转更顺畅、成本更低。

　　“其次大模型的训练是不断沉淀的过程，面对金融行业的使用场景中，我们考虑将大模型工具和行业大模型给到银行，银行根据其具体业务在开发工具下进行微调，这样能保证数据在银行系统内部流转。”陈昀彰补充道。

　　事实上，大模型并非是行业内的全新概念，从最初的智能客服到如今的生成式AI、决策式AI，科技助力下大模型能力实现跨越式提升，也满足了更多金融场景的使用需求，进一步加快了金融行业的数字化进程。

　　对于下一阶段大模型的发展，陈昀彰认为，生成式AI和决策式AI的有机融合发展料将是一大方向。比如针对生成式AI在权衡一些对冲性的信息时，不能做出正确取舍的弊端，可以在模型建设中加入决策式AI的决策树等算法，通过引入显性的逻辑规则来判断相互矛盾的信息，进而给出最优解。

　　陈昀彰指出，目前整个AI产业呈现出“百模大战”的格局，随着技术的演进发展，行业也将发展出几大不同的路径，即以科技巨头为主的通用型大模型、新兴创业公司主导的各类“小模型”，以及像百融云创这样的AI科技公司研发的行业大模型。后续，外界对于大模型的关注将转向其在垂直领域的落地，行业大模型势必将迸发更多势能，垂类应用和模型能力的结合也会更为紧密。

　　此外，陈昀彰透露，目前公司正与⾏业中的各个合作伙伴紧密沟通拆解场景。预计百融大模型会在⾦融⾏业的营销、客服、合规审查、报告⽣成、信息总结等多个场景中进⾏应⽤。