ChatGPT与保险：四个ChatGPT回答不出来的本质问题

　　为了较系统地分析ChatGPT对保险的影响，本文首先从ChatGPT的能力出发——明确其能力上限和优势，然后介绍ChatGPT能力在保险公司应用的价值层次——明确其应用产生价值的路径，接着介绍ChatGPT思想对于保险行业的启示，最后阐述说明以ChatGPT为代表的AIGC技术普及的未来，保险行业可能的变化。必须声明的是，本文并没有使用ChatGPT——因其能力局限尚不满足本文写作需求。

　　一、ChatGPT的能力如何评价?

　　为了分析ChatGPT的能力可以从其内在机制和外在表现两个视角入手。

　　首先看内在机制，内在机制决定了ChatGPT的上限

　　这里面涉及到许多人工智能具体技术，我这里尽量简化并介绍清楚。实际上迄今为止，OpenAI并没有公开相关ChatGPT的完整技术细节，相关ChatGPT技术原理都是从ChatGPT“出生证”介绍上获得的(图1)。这段话说明几个含义：

　　第一， ChatGPT类似于InstructGPT(sibling model)，这意味着可以从公开的InstructGPT分析ChatGPT;

　　第二， ChatGPT通过交互对话方式训练的;

　　第三， ChatGPT能够回答问题、承认并纠正错误且能够拒绝不适当的回答等(能力)。

　　而InstructGPT是有公开资料的(图2)，这是一个完整的三阶段步骤，这是一种混合“强化学习“和”模仿学习/比较学习“的方案：类强化学习是体现在第二步构造奖励模型(函数)并用于第三步;模仿学习一是因为其第二部训练方式采用了排序(偏好)方法(InstructGPT原始论文)，第二是其对损失函数的构造包含了一部分(权重)调整的GPT3输出(即以GPT3作为目标，这形成了迭代升级关系)。可以设想，New Bing所使用的GPT4也是在ChatGPT(GPT3.5)上进一步提升形成了。从人工智能视角，这又是一种系统性的增量学习过程。

　　GPT缩写是Generative Pre-trained Transformer，大名鼎鼎的Transformer大有一统江湖的气势——尽管它现在被MLP阻击中，其对模型的语义元素的相关性提取能力发挥到了极致，更重要的是构建的多层Transformer可以抽取相关性的相关性特征，这是GPT具有我们钦佩的“写作创作“能力的来源，但重点是它仍然本质上训练语料的各种特征组合后的条件分布的排序，这决定了它的能力的两个上限：

　　不具有超域概念、实体和元素，例如新的理论概念和知识，需要注意的是，因为新的理论概念知识仍然表现为最小的“语素“(英文是单词，中文是字)，ChatGPT仍然可以依据”条件分布“排序生成合理的结果，是定域逻辑和语素组合结果。

　　不具低语料依赖的逻辑推理和分析，例如数学。但需要注意的是这里数学能力除了数学知识外还包括推理和分析等，如果单看数学知识和概念，那是无法评价的——因为只需要训练语料足够广泛(例如数学博士论文纳入)就可以无限扩展。

　　GPT的上限非常简单，然而基于定域概念试题元素构建的知识其实已经覆盖了人类是生产生活的大部分场景，某些特定领域实际上是排斥超域概念试题和元素(或者不承认)如法律、大部分金融行业以及强化同行认同的论文报告生成。接下来我们看一看ChatGPT实际表现。

　　ChatGPT的能力表现

　　由于上述原理中第三步的存在，ChatGPT的能力实际上是不断迭代升级的，这里以本文写作时间(2023年2月10日)的ChatGPT的能力进行说明。

　　首先我们看一下ChatGPT数学能力如何——毕竟其内在机制决定了应该很弱，这甚至可以直接问ChatGPT自己，它很坦诚说相当于小学六年级的水平。具体如何那?我使用了标准数学能力测试标准题库，为了防止已经有人“教育过“它，我进行了叙述和数字的修改，大体上能够在数学5年级水平上取得及格以上成绩，确实就如我想，就解题能力来说，恐怕距离中国的小学六年级也有段距离——当然数学知识它应该要懂得多的多。

　　例如这道题：

　　一共有11个托盘，上面共有370个包裹，相邻的托盘包裹数不能一样。但是任意三个相邻的包裹数合计99。问第六个托盘上的包裹数是多少?

　　在我的一顿启发下，ChatGPT开始各种胡乱蒙(条件概率生成)。为了尊重ChatGPT的“人权”，咱们暂定它的数学能力(分析推理)就是小学六年级，注意区分这不是数学知识掌握程度的判断，数学知识可以通过语料覆盖到所有可能的级别，然而如同我们都学了实变函数，但掌握的其实不多一样。

　　这个结论实际上并没有降低多少ChatGPT在工作中替代人类的可能性——因为大多数工作其实小学五年级的数学就够了，多少工作人士已经忘记了微积分和二次函数。

　　因为后面要分析它对保险的影响(注意不仅仅是保险行业)，接着我们看看ChatGPT的金融保险能力，这方面确实是个优等生。我使用了不同学科的规范试卷(经济学基础、金融学、保险学等六门课程试题)并与学生人工作答的试卷进行了比对，最后的结论是：如果不考虑金融中的数学知识，ChatGPT基本上可以达到研究生的水平，所以国外英文评测ChatGPT通过MBA考试是毫不稀奇的——英文语料决定了其英文水平更强大，所以ChatGPT在中文生成使用了P-翻译技术提高可用性。

　　以下是一些截图，答得不好的题目：

　　答得相对及格的例子：

　　此外在其他领域ChatGPT的能力也大约在大学或研究生水平(图)。这意味着在许多场景下，ChatGPT确实相当于一个对应专业的本科毕业生或者研究生，能够完成对应的工作。

　　但必须补充两点：

　　第一点基于前面机制分析，ChatGPT不具有超域概念试题以及知识能力，例如当问及我提出的生命质量理论时，它是“一脸懵”的，尽管该理论已经被AGT泰康平安等国内外公司深度应用，并在全球配置了上千亿的资产影响了几十万人。原因是相关通用生命质量理论目前还局限在全世界高净值人群、较少公司范围内，我们的相关授课讲座也没有形成固定文本，所以对应的语料极少，自然也就没有了“分析”能力——条件概率为0，哎，ChatGPT不懂我啊。

　　我们总结一下ChatGPT的能力表现：

　　强大的文字再综合能力;

　　类人的语义提炼和叙述能力;

　　定域知识的加工和延申能力;

　　补充的第二点，New Bing使用GPT4要比ChatGPT(GPT3.5)效果更好，例如对于经济学题目判断更加准确。

　　我们再举一个上面ChatGPT回答过的问题来感受GPT4的强大，这个回答几乎可以给满分。

　　二、ChatGPT的能力对保险公司价值几何?

　　ChatGPT的能力很强大，自然就有各种可能的应用，这里我们主要聚焦于保险公司，看看ChatGPT能够产生哪些价值。分析某技术对企业的价值，当然可以罗列很多场景，但这其实不能界定它的潜力和方向，更好的方式是用知识经济价值周期论与场景结合。

　　科技对保险的价值周期分为三个层次，分别是赋能、增能、产能：赋能是被动引入行业主导技术升级，互联网其实就是这一类;增能是以价值为导向主动技术判断和融入，一些大数据技术和隐私计算的上限属于此类;产能是技术融合创造价值，保险里目前大多数科技或者说保险科技的上限离此都有距离。

　　为了分析ChatGPT对保险公司的价值上限，我们从两个角度探讨，一个角度是其当前的表现，另外一个角度是其内在机制决定的能力上限带来的价值上限。

　　从当前具有的能力看：

　　ChatGPT可以潜在提升保险公司全流程运营效率。市场端营销获客、有效问答捕获客户当然是ChatGPT的本行;公司运营的渠道管理、产品设计、精算、封控、财务人事、监管沟通等在某些有限角度可以使用ChatGPT辅助提升效率，请注意这里我用的词语是“有限角度”，一会我会进行详细解释;在公司的理赔过程包括定损、客户沟通、相关增值服务、关键性文件支持、相关文书撰写等，ChatGPT也能够胜任一些工作。

　　ChatGPT缓解保险公司“流量焦虑”和人力销售成本压力，特别是对寿险公司来说。代理人体系尽管正在经历巨大变革，但仍然是保险公司重要的渠道，现有代理人专业程度、基本法体系与客户需求升级过程中的专业需求以及服务需求的矛盾成为人身险发展的主要矛盾，ChatGPT可以缓解这一矛盾：在业务实践中，ChatGPT可向客户介绍公司所提供的保险产品信息;客户有关于保险产品的问题，也可以向类ChatGPT应用寻求解答与帮助，并可以使用类ChatGPT应用提供的相关知识，帮助自身了解保险行业相关信息进行决策等;ChatGPT的光环还可以帮助普及风险管理知识、提升居民的保险意识等。

　　从以上可以看到，ChatGPT当前能力对保险公司的价值上限可以超越赋能，达到增能阶段。但上限不代表可以做到，ChatGPT类应用如果要达到增能价值，需要解决这样几个关键性问题：

　　第一，ChatGPT的可信性问题，对应于上文我提到的“有限角度”，这从广义上是人工智能的可信性障碍。ChatGPT的对话能力实际作为流程关键要素嵌入，需要确保其方案、输出以及方式符合保险公司规范和监管要求，否则其只能发挥“赋能”作用，仍然需要人员作为主要业务节点。基于人工智能应用的经验，这个问题其实在保险行业类公司其实相对容易解决，这是因为专业部门的可信性障碍是容易解决的，即使在机制上没有办法保证，也有办法通过流程重构跨过这个门槛。

　　第二， ChatGPT的数学能力障碍需要跨越。保险中的精算等需要超过高中的数学能力，这使得ChatGPT(包括New Bing的GPT4)目前无法发挥实质性作用。该障碍的跨越是可能的，大约有两种方式：第一种是目前推理机制融合方式，这是人工智能目前新的关注点，包括我们在内的一些团队已经将自动推理机制引入加强非语料依赖推理能力;第二种是专业软件输出对象重塑为ChatGPT类的产品，与ChatGPT这类应用相反，大多数流程中的专业化规则化工作已经存在对应的专业软件，这类软件的重新定义重塑输出，可以与ChatGPT比较好配合，一定程度可以跨越这个障碍，我预测这类新的应用或者服务很快就会席卷市场。

　　第三， ChatGPT的专业适应化。在目前ChatGPT展示的能力中，其专业化能力仍然有所欠缺，例如针对保险较复杂的专业安排等，这需要ChatGPT针对保险业进行微调，这种微调更有可能基于提示学习(Prompt learning)，类似于我们已经做的针对医疗和金融的调整。但通过我对New bing的GPT4研究，发现这方面进化极大，或许在GPT4发布之后，这个障碍就自然可解了。

　　我们再来看内在机制角度，结论是直接的，内在机制决定的ChatGPT能力上限说明其作为工具很难形成产能价值;当然GPT本身机制也会调整，并可以通过解决上述三个障碍来接近逼近上限，但即使如此其单独作为产能工具的条件仍然是不具备的。

　　结论：ChatGPT为代表的AIGC技术可以为保险业提供从赋能到增能的支持，距离产能还有一段路要走。

　　三、ChatGPT蕴含的思想对于保险的启示

　　如果只把ChatGPT看做一种工具，那么在保险公司中应用ChatGPT的能力就够了;但如果把ChatGPT看作一种新的生产方式，我们则应该看到ChatGPT蕴含的思想对保险的影响。

　　ChatGPT的思想可以从其训练过程以及发布后的公众反应进行总结，大体上可以按照知识经济学可以分为三个层次：

　　第一个层次是数据要素创造价值的新模式的到来，即以泛数据为代表的、非监督学习/强化学习/模仿学习为主要特征提取方式的模式。该思想来自于ChatGPT的内在机制和公众使用的判断。保险科技的深入已经让保险行业意识到数据作为要素的重要性和地位，并在以监督学习为代表的框架下创造了第一类价值，例如欺诈识别、非标题定价、巨灾模型等等。但ChatGPT使得要素价值创造模式发生了改变，这种改变使得人工智能从弱人工智能迈向通用人工智能——一些人认为是强人工智能的必然阶段。这种思想于保险行业也非常重要，可以预见类似于合规风险、理赔定损、客户服务等业务中可以构建类似的稳定模式，形成新的价值，这一类价值的特点是不以替代人类劳动为目标，而是创造新的价值空间为目标，但由于其自身不能直接构建价值，会需要更多的人类协作，所以，这应该很受员工欢迎——AI是朋友而不是敌人。

　　第二个层次是增量知识的偏好增长。该思想来自于ChatGPT训练过程。ChatGPT所基于的InstructGPT基于偏好构建奖励模型，并使得后续能力养成过程中泛知识有序增长。这种方法也体现在许多复制GPTf3的模型中(如APO)，其产生的较好效果说明其思想的重要性。如果把保险公司产品迭代看作“增量知识“，那么可以说保险公司其实迭代时考虑“偏好”是不足的，渠道所反馈的特征信息收到三重谬误影响：幸存者需求(存量客户)、中介激励限制(代理人激励)以及惯性认知(固有而陈旧的市场需求分析)。现实情况是，在不同层次上，保险公司的“增量知识”与真实的需求偏差很大：公司和客户层面上，以健康险为例，公司看到的是险(保险)，客户看到的是健康;在代理人和客户层面上，客户看到的是生命质量需求，代理人看到的是金融产品等等。

　　第三个层次是需求目标的“第一性“。该思想来自于ChatGPT的推广及应用。它对保险行业发展以及保险公司数字化转型有重要的启示意义，原因在于：保险行业尚未实质性融入到生命质量经济体系中，而生命质量经济是保险的逻辑基础;保险公司数字化转型并没有以构建三流合一机制为目标，而是局限在赋能尺度上做文章。这使得保险公司需要重新审视新的经济特征、新的需求特征以及新的数字要素价值。这里牵涉较多专业而细微的内容，这里从略。