0°

快评GPT-4:OpenAI不open了,机器视觉不存在了

  今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。

  眼花缭乱的技术迭代和全新功能毫无疑问再次带给我们巨大震撼,但在冷静之后,本次发布的一些细节也让我们感到担忧:这家将“open”写在公司名称里的科技企业,似乎正在朝着close的方向疾驰而去。

  与此同时,GPT-4新加入的图像识别也让研究人员感叹:机器视觉(CV)不存在了。

  01

  OpenAI不open了

  OpenAI在创立之初将自己定位为一家非营利机构,并将保障AI安全视为己任,基于此目标,open是必不可少的,道理很简单,像AI这样能够引发生产力爆炸的革命性技术,如果只掌握在少数大公司手中,极大可能会造成社会不公,甚至因缺乏监管引发AI智械危机(芝加哥大学教授约翰贝尔在九十年代初提出了“智械危机”,指的是机器智能的快速发展会导致人类失去控制的局面)。

  但理想美好,现实却骨感。非营利机构的定位导致OpenAI早期资金紧张,且效率低下。即使美好的愿景吸引了无数业界顶尖人才屈尊加入,但公司“非营利”的组织模式带来了组织架构松散、目标不明确、推进效率低下等一系列问题始终无法得到解决。

  在生死存亡面前,OpenAI更换了CEO,将公司定位从非营利机构转变为半营利机构,一字之差,千里之别,最明显的变化是,OpenAI引入了微软的投资。

  可以说如果没有微软的介入,OpenAI可能早就进入了历史的尘埃,当然也不会有今日的GPT。但资本向来是把双刃剑,微软的真金白银救活了OpenAI,却也让这家公司离初心渐行渐远。

  在微软将必应接入ChatGPT之时,社会便已开始担忧,这项会对全人类产生巨大变革的技术会不会成为微软的私家武器。伴随GPT-4的发布,这个担忧开始变得越来越真实了。

  GPT-4于本周发布的新闻,正是由微软高管透露的消息;GPT-4一发布,微软副总裁兼消费者首席营销官Yusuf Mehdi就迫不及待地发文确认新必应搜索引擎正在运行GPT-4。

  这次GPT-4的发布,OpenAI貌似宣传了众多新功能和使用指南,但在其公布的技术报告中,对关键的模型架构硬件、算力等方面的更多信息讳莫如深,而这些才是能体现其open的关键。

  也许,后世会把GPT-4视作OpenAI变为“CloseAI”的转折点。

  02

  机器视觉不存在了

  GPT-4 除了可以接受文本形式的prompt之外,还新增了接受图形prompt的能力(关于prompt,可详见《LoRA、Prompt…学这几个AI新词,在AI圈风生水起》),新能力与纯文本设置并行,允许用户指定任何视觉或语言任务。

  结合GPT本就强大的逻辑交互能力,新功能可以说是本次版本迭代的“王炸”。

  比如给 GPT-4 一张梗图,问这为什么可笑?

  GPT-4 回答:VGA 线充 iPhone。

  也就是说,GPT-4通过这张图片,识别出了:1.这是一个需要lightning充电口的iphone;2.充电线是VGA规格;3.正在用VGA给lightning充电;4.这很好笑。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论