本来是ChatGPT的抢滩赛,现在变成了OpenAI抢滩赛?继王慧文之后,懂技术的李志飞也来了。
李志飞何许人也?
根据公开资料,李志飞是美国约翰霍普金斯大学计算机系博士,前Google总部科学家,世界级自然语言处理(NLP)及人工智能专家,世界主流机器翻译开源软件Joshua主要开发者。
由此可见,与“小白”王慧文不同,李志飞可以说是技术大牛。
ChatGPT爆火之后,李志飞往美国“取经”后得出结论,AI大模型的元年来了。之后,李志飞下定决心投身其中,想做中国的OpenAI。
前有百度、阿里、科大讯飞等公司进军ChatGPT,后有王慧文、李志飞剑指OpenAI,ChatGPT和OpenAI的引发了国内新的创业潮。
GPT-3大模型也在国内火过
在ChatGPT爆火之前,2022年10月,有一位红杉的投资者对李志飞说,“你的时代到了,你知道吗?在美国,红杉所有的管理合伙人只讨论AIGC,别的项目都不看了。”
之所以说是李志飞的时代到了,是因为ChatGPT是NLP领域的结晶,而李志飞是世界级自然语言处理(NLP)及人工智能专家。
说到这里,也许很多人还搞不清AIGC、ChatGPT和AI大模型的区别。
三者最底层是AI通用大模型,上面可以做AIGC,比如说Midjourney可以画画,Jasper可以写文案等;也可以基于底层模型做对话机器人,比如基于ChatGPT。
2020年,当OpenAI推出1750亿参数的GPT-3大模型的时候,李志飞看到了通往AGI(通用人工智能)的可能性,于是着手开发 GPT-3 中文版 UCLAI。
在UCLAI的基础上,李志飞还做了文言文和白话文翻译、古画生成、音乐合成等方面的实践,其中就包括配音产品魔音工坊等。
当时,GPT-3在国内也热过一波,至于为什么大家没有持续不断地做?
李志飞认为一部分人对于AGI(通用人工智能)的没有信仰,而自己由于不坚决和资金缺乏等原因。
另一边,OpenAI在GPT-3早期测试结束后,就开始尝试对其进行商业化,付费用户通过API(Application Programming Interface 应用程序编程接口)使用该模型完成所需语言任务,比如前文提到Jasper就是GPT-3的客户。
有了GPT-3大模型,后来才慢慢有了ChatGPT的故事。现在,李志飞想要重新加入队伍。
玩家扎堆,浴血厮杀
在最近的一条朋友圈中,李志飞深度地分析了国内版ChatGPT的潜在参赛选手。
巨头派包括字节、百度、阿里、腾讯;大佬派包括一些已经退休或转VC的大佬们,王慧文应该算作其中之一;剩下的还有海归/大厂高管派、小创业公司转型派、教授派以及打酱油派。
“能经过初筛的估计有20多个,会有接近10家拿到门票参加竞争,未来几年的AI通用大模型江湖一定是血雨腥风、波澜壮阔。”
在竞争者当中,李志飞自己也应该算作一个。
在过去几年,国内的模型参数有很多,但都是语音识别、TTS、人脸识别都单独做一套,好的大规模的AI大模型很少。
阿里巴巴达摩院在2020年推出了M6大模型,百度在2021年推出了文心大模型,腾讯在2022年推出了混元AI大模型。
对于复现属于自己的AI大模型,李志飞大概知道路线是什么样子,但没有特别精准的地图。
“现在要争分夺秒拿到参赛资格,想太多只会让你犹豫。”
对于自己是否也要继王慧文做中国版的 OpenAI?
李志飞回答,“中国版 OpenAI 只是让向公众描述这件事更容易。但最核心,我看好的还是通用的认知模型本身。”
写在最后:有些时候“偏执”也是一种好事
在国内,功能性、专用的 AI 很早就在各个场景里应用了,但是大家更多去考虑应用场景,对大模型的革命力并没有更多的想象。
在美国,有一批财务自由的人,总是要干一些跟别人不一样、超级不确定的东西,甚至非常偏执。OpenAI 前三年在毫无营收的前提下,每年烧 5 亿美金。而国内对不确定性的东西,天然比较恐惧。
ChatGPT火是GPT-3等大模型埋下的种子,在 ChatGPT 出现之前,OpenAI 就已经从 GPT-3 中拆出了两个模型。一个是优化编程能力的 CodeX,另一个是去年掀起 AIGC (人工智能生成内容)潮流的 DALL-E2。
当ChatGPT席卷全球的时候,大家似乎已经忘记了去年扎堆、今年空巷的元宇宙了,但谁又会知道Meta和扎克伯格的一时失意,未来不会伴随元宇宙冲天而起?