0°

在知乎,看见ChatGPT变革的第一束光

  搜索「ChatGPT」,仿佛瞬息挪移到能听见号角的最前线:

  创新工场董事长李开复总结后 ChatGPT 时代拯救自己职业的通用法则;

  DeepLearning.AI 创始人吴恩达警醒人们,将伦理与法律追问置于狂热之前;

  一流科技创始人袁进辉觉得一个迫在眉睫的需要研究的问题是,怎么区分由人类生成的文本和 ChatGPT 生成的文本?

  《数字化生存》作者、北大新闻传播学院胡泳则在「知聊八点半」圆桌直播中提出,人工智能的发展方向并不一定要「类人」,而应该是提升人的能力;

  ……

  透过问答、话题、圆桌、想法、热点直播,行业大佬接连现身中文互联网的高质量问答社区;投资人、科研人员、创业者和从业者彼此联结,一同探索 ChatGPT 前沿的一切面向,并思考他们的发现对未来的影响。

  短短四个月,知乎「ChatGPT」话题热度已经打破 2015 年以来「AlphaGo」话题创下的纪录,当前讨论累计 22 万,总浏览量高达 3.8 亿。

  话题热度爆表,呈现方式也是全方位、多维度。

  一、首发的力量

  2023年1月2日,一位普林斯顿大学计算机科学专业的学生发布了GPTZero,这个程序可以「快速有效地」破译一篇文章的作者是人类还是 ChatGPT。

  看到消息后,知乎答主「蝈蝈」有种被偷袭的感觉。ChatGPT 推出后的第 10 天,「蝈蝈」郭必扬,一位上海财经大学信息管理与工程学院 AI Lab 三年级博士生已经和朋友们着手这项工作,「我们其实是最早开始做 ChatGPT 检测器的团队。」他说。

  GPTZero 发布一周内就有超过三万人试用,应用程序一度崩溃。郭必扬紧张起来。原计划除了检测器,这支八人团队还要做人工测评和语言学的统计分析。显然,眼下不能再等了。

  用现有数据集训练了几个检测器后,1月11日,他们在知乎放出 demo ,这是国内第一个 ChatGPT 检测器。当时临近春节,本应陪家人聊天叙旧的郭必扬一直盯着屏幕,谁都不理。「家人觉得,我们可能是在做什么大事情。」

  处在一个技术迭代越来越快的行业,最可怕的不是技术被外泄,而是没有足够多的人了解你的技术和你,更何况与 ChatGPT 革命性突破有关?

  郭必扬和伙伴分秒必争推出 demo 的时候,一连串与 ChatGPT 相关的工作也陆续出现在知乎。

  人工智能话题优秀答主 PENG Bo,一个公开对标 ChatGPT 的开源项目 ChatRWKV 作者在知乎呼吁更多人参与共建生态。

  2 月底,第一款用自然语言指挥 Excel 工作的作品 ChatExcel 在知乎独家首发。

  不过,接踵而来的社区反馈让郭必扬有些意外。

  发布之前,他们比较过两个检测器,因为接受过数据集训练,他们检测器的实际效果比 GPTZero 好很多。一流科技创始人袁进辉也在知乎上谈到怎么区分由人类生成的文本和 ChatGPT 生成的文本,「是一个迫在眉睫的问题。」

  最初,认为这项工作没有意义的观点接连不断。

  「我们关注的是检测假消息,而不是ChatGPT 生成的假消息。如果说一个分类器只能处理由 ChatGPT 生成的假消息,那我换一个生成器不就完了?」

  也有人认为「我们可以通过润色避免被检测为 ChatGPT。」

  郭必扬决定亲自回应。「可以说我们检测器效果不好,但说检测器没意义,那我可有意见了。法律有漏网之鱼,不法之徒可以钻法律的空子,这说明法律没有意义吗?」

  当人们为了避免被检测出来而对 ChatGPT 内容润色、修改时,检测器的作用已经达到。有一万种方法绕过各种监管,我们能做的只能是增加「不负责任的成本」。

  随着时间的推移,支持和鼓励的声音多了起来。

  「检测器的价值见仁见智,但个人觉得这个数据集是比较有价值的,可以来做一些有意思的事情。」 有人说。

  中国信通院云大所内容科技部研究员呼娜英在知乎「知聊八点半」圆桌直播中表示,反作弊技术目前确实没有 ChatGPT 技术强大,必然会出现「猫鼠游戏」的现象,「但终究魔高一尺道高一丈。」

  其实,决定上知乎发表作品等于选择进入一个复杂性系统。所谓复杂性,是指它不是线性的,不会按照你的预期运作,有很多维度和变量,难以预测,也因此会有一些「猝不及防」,但也有收益甚至意外惊喜。

  现在,郭必扬团队的检测器在 Github 上已有6、700颗星。数据集和模型可能被下载上万次,不到两个月文章就有了 20 个引用。「这些是我们之前想不到的。」他有些感慨,「(文章被引增速)比我之前任何一篇文章都要快。」

  知乎独家首发后没多久,WPS 就联系上 ChatExcel 背后的团队。开源项目 ChatRWKV 也得到了头部科技媒体的报导。

  除了难以预测,知乎系统的复杂性还包括一种自适应性,发布一个作品会改变这个系统,系统也会反过来校准你的产品或者研究。

  2022 年 11 月,谢凌曦所在团队将一份重要论文放到 arXiv 预印本网站后,也立刻发布在了知乎,标题显示某气象大模型,「中长期气象预报精度首次超过传统数值方法。」

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论