AI能看完整年报了！OpenAI竞品最新模型“记性”比GPT-4强3倍

　　财联社5月12日讯(编辑史正丞)美国当地时间5月11日，由OpenAI前员工创立、背靠谷歌的Anthropic，发布了最新的Claude模型，最大的升级亮点就是语境窗口支持的token数量一口气从9000提升至10万。

　　(来源：Anthropic官网)

　　这项升级的意义在哪里呢?还得从OpenAI的GPT-4开始说起。

　　在OpenAI两个月前发布GPT-4时，《大西洋》杂志提出了一个致命的问题：这些大模型的记忆力，普遍都不太行。

　　“告诉ChatGPT你的名字，再复制数千个随便拼凑的单词，然后再去问机器人你的名字是啥时，它就完全不记得了。”——《GPT-4有着金鱼一样的记忆力》

　　这里需要先为OpenAI解释一下，GPT-4的升级中就包含了“记忆力”的提升，标准GPT-4版本的语境窗口已经翻了一倍至8192 tokens(简单来说，1000 tokens对应750个英文单词)，同时GPT-4模型还支持最高3.2万tokens的API(官方称为50页文本)，价格也要比标准模型翻一倍。

　　根据官方解释，一旦对话长度超出token数量限制，AI模型可能会生成一些不连贯且无意义的内容，也就是俗称的“胡说八道”。

　　记性更好的AI大有用途

　　虽然普通用户平日里使用大模型，差不多接近5000字的记忆力上限大致够用，但对于有处理长文本(上市公司年报、技术文档)需求的专业用户而言，这个限制就使得现有的大模型多少有些鸡肋了。用股民能理解的话来解释，50页的限制大致能处理季报，但动辄上百页的年报就有心无力了。

　　Anthropic表示，10万个token大概等同于7.5万个英文单词。对于母语者来说，光读一遍差不多就要5个小时，而消化、记忆和分析这些信息要花的时间还会更长。

　　在演示中，Claude扮演了一名商业分析师的角色，接到的指令是处理奈飞公司的年报10-K表，从85页的信息中“找到资产负债表中对潜在投资者最重要的信息，并解释为何重要”，并按照先给表格罗列数据，再提供总结分析的格式呈现。

　　(来源：Anthropic)

　　对于解读奈飞资产负债表的任务来说，Claude已经能完成攫取信息和解释信息的能力，不仅能罗列出数据，还能挑出财报中提到的数据变动原因。虽然距离人类分析师融汇古今、遣词造句的能力尚有差别，但已经达到商业化工具的要求。

　　当然，面对10万token的“记忆容量”，能够解锁的玩法远远不止读上百页文档。美国音频AI平台AssemblyAI特意做一个视频，“商业互吹”Claude的意义。

　　AssemblyAI介绍称，现在用户可以把一本书直接丢进AI，然后布置诸如总结、解释和搜索的任务。举例而言，知名游戏开发者约翰·卡马克的一集博客，差不多有5.8万字(7.8万tokens)，8部星球大战一共讲了6.5万字的台词(8.7万tokens)，现在都可以扔进Claude，用1分钟时间就能“读完”整个文件，并回答一系列原本需要人类数十小时才能完成的总结、分析类问题。

　　以约翰·卡马克长达5小时的播客为例，通过AssemblyAI进行转写后，Claude不仅成功回答了“总结卡马克谈论过由他开发的游戏”——Doom、Quake等，同时还额外列出卡马克在播客中提及，但并不是由他开发的游戏，如超级马里奥、星球大战等。

　　(来源：AssemblyAI)

　　Anthropic总结称，支持10万token的模型，对于经济、法律等经常需要分析超长文本的行业极为有用。不仅能够归纳和解释上市公司财报、研究报告等长文件，提供股票投资的基本面和风险分析，还能阅读晦涩难懂的法律文件和程序开发文档，快速地给出答案。

　　目前，最新的Claude已经通过API向商业用户开放，100K tokens版本定价与此前9k tokens版本一致。