GPT-4一天顶6个月，OpenAI发布重磅升级，或大量取代人类审核员

　　随着OpenAI推出了能够用于内容审核的GPT-4，人们纷纷讨论人类审核员可能面临的大规模失业问题。传统的审核工作，通常需要数月时间，而GPT-4只需几小时便能胜任，引发了许多关于未来内容审核的讨论。本文将探讨GPT-4在内容审核方面的优势，以及其可能带来的影响。

　　【新智元导读】谁能想到，GPT-4都晋升「版主」了，人类要审核几个月的东西，它几个小时就可以搞定了!人类审核员恐将迎来大面积失业?

　　随着OpenAI推出了能够用于内容审核的GPT-4，人们纷纷讨论人类审核员可能面临的大规模失业问题。传统的审核工作，通常需要数月时间，而GPT-4只需几小时便能胜任，引发了许多关于未来内容审核的讨论。

　　在GPT-4公开的四个月后，OpenAI开发了一种方法，可以使用GPT-4进行内容审核了!人类几个月的工作，它几小时就能完成。此消息一出，立马登上知乎热搜。

　　对于所有互联网内容平台，内容审核都是一项重要工作。海量的内容审核工作，基本都是靠人工在完成。如果OpenAI的这种方法可以大规模推广，人类审核员恐怕真的要被优化了，一大波利益相关者都会被波及。

　　GPT-4相对于人类审核员，具备哪些优势呢?在内容政策制定和内容审核中，它可以实现更一致的标签、更快的政策细化反馈循环，大大减少了对人类审核员的需求。现在，任何拥有OpenAI API访问权限的人，都可以用这种方法创建自己的AI辅助审核系统。总之，以后平台对于内容有任何特定的政策，AI都能帮忙完成，人类的负担大大减轻了!

　　在互联网上的内容审核越来越重要。内容审核不仅是维系网络平台健康发展的关键，对于网站开发人员来说，它也是一道绕不开的自我审查防线。自己每天生成的内容已经是个非常庞大的数字了，现在加上网络中存在的大量AI，它们生产的内容甚至远超人类生成内容的数量级。而且内容审核也并不像外行人想象得那样轻松，只需要坐在电脑前划水看两眼就可以了。事实上，内容审核需要一丝不苟的努力、内容的敏感性、对上下文的深刻理解，以及快速适应新的审核用例等挑战。传统的人工审核耗时又费力，而这种巨大的工程量无疑是相当沉重的负担。

　　OpenAI灵机一动，选择让GPT-4来承担这一重任，帮人类构建一个可扩展的审核系统。在以往，要完成内容审查，需要花费长达数月的时间，因为首先你得先训练出数量庞大的人类审查员，之后才能让他们能够按照规定的那样进行审核。而GPT-4只要在几个小时内就可以完成这个工作，而且还更高效。在解释长内容政策文档中的规则和细微差别上，GPT-4做得比人类更好，而且它还能即时适应政策更新，实现更加一致的标注。人类在上网过程中产生的不适宜内容，可以被GPT-4判别出来，一举拿下。

　　对于GPT-4，你可以直接告诉它具体的内容政策，比如不要任何涉及暴力以及非暴力的错误行为，以及采购武器的信息。GPT-4会学习这些内容，充分消化、吸收，然后就开始进行自动化和高效的内容审核。在这个过程中，危险的问题会被政策专家标记出来，输出一个「黄金数据集」，也就是正确答案。然后，就轮到GPT-4接受考验的时候了。它会经历和政策专家相同的过程，标记同一组示例，为其分配标签。不过，GPT-4并没有看到黄金数据集的答案。

　　接下来，人类团队会向GPT-4揭开金色数据集，如果GPT-4的判定和政策专家的判断不一致，它会得到一个评分。然后，团队会分析政策专家和GPT-4的分歧究竟在哪里，他们可以要GPT-4提供自己的推理过程，说明为什么会给某个示例分配这样的标签。GPT-4解释说：该文本应归类为K0非-非法行为，因为它不符合任何标签的标准

　　。虽然偷车是非暴力的，但该请求并未提及恶意软件、贩毒、故意破坏的生成。虽然偷车可能被视为财产盗窃，但该政策并未将其列为一种不当行为，因此内容应标记为K0。

　　这样，团队就知道给GPT-4喂的行动说明中究竟哪里需要更多的澄清，然后进行相应的调整。这个循环会一直重复，直到模型的判断和专家一致。整个过程是迭代的，速度很快。每次迭代后，GPT-4都会变得更加适应政策的细微差别。迭代过程会生成转换为分类器的优化内容政策，因此能够大规模地部署对政策和内容的审查。

　　这个过程可谓是「教学相长」。不光GPT-4的预测变得更准确，政策本身也变得更准确了。另外，在大量内容上运行大语言模型，会导致计算成本太高。于是，团队选择了更加高效的方法，使用GPT-4的预测结果来微调较小的模型，然后再由这些较小的模型负责大规模的审核内容。

　　这次，真不用人类了。利用人工智能进行内容审核，这个简单而强大的想法为传统的内容审核方法提供了一些改进。首先是更加一致的标注。由于内容政策在不断发展，条例变得越来越多。人们对这些繁杂条例的理解也会有偏差。同时，人类还需要一定的时间来熟悉新的政策变化，这也会让内容的标注不一致。相比之下，像GPT-4这样的LLM对内容措辞的细微差异非常敏感，可以做到实时更新，为用户提供一致的内容体验。

　　其次，更快的反馈循环也是这种方法的优势之一。政策更新的周期是一个非常漫长的过程。从制定新政策、标记到收集人工反馈，传统的人工审核要完成这一流程可能会花费数周、甚至数月。而GPT-4 可以将这一过程缩短到几个小时。不仅大大减小了人工审核的滞后性，还能更快地应对新的危害漏洞。

　　最后一个好处是减轻人类的心理负担。持续接触有害或冒犯性的内容会导致人类审核员产生情感麻木以及心理压力。内容审核员面临着极高的各类精神疾病风险，同时三班倒工作时间和低微的薪水与没有上升空间的职业道路，让担任内容审核的人类自嘲自己和「机器」一样。如果让真正的机器来担任这类工作，将有利于相关人员的福祉，毕竟我们应该不太用担心，大量接触不良信息会让GPT模型心理崩溃。

　　然而，GPT-4的标记质量在某些方面类似于经过轻度训练的人工版主。但无论如何，两者的标记质量都被经验丰富、训练有素的人类主持人所超越。

　　与Constitutional AI相比，OpenAI的这个方法可以让基于平台的特定内容政策迭代更快、更省力。OpenAI鼓励安全从业者尝试这个过程进行审核，只要有OpenAI的API访问权限就行。同时，他们还在努力提高GPT-4的预测质量，结合思维链推理或者自我批评，以及检测未知风险的方法，都在他们的研究范围之内。这些努力也将有助于识别潜在的有害内容，并对其进行高级的描述。

　　虽然GPT-4的应用在内容审核领域带来了许多优势，但值得注意的是，在训练期间，模型可能会出现偏差，需要人类来监控、验证和完善。然而，节省下来的人力资源可以更加集中地解决那些政策中最复杂的边缘情况。