0°

讯飞星火升级 3.0:整体超越 ChatGPT,2024 年将实现对标 GPT-4

  距离上一个大版本仅两个月过去,科大讯飞在 1024 对外正式推出讯飞星火认知大模型 3.0 版本。

  今年 5 月,讯飞星火认知大模型刚刚面世时,科大讯飞董事长刘庆峰曾立下 Flag:10 月 24 日,星火认知大模型的能力要全面对标 ChatGPT。

  在今天的发布会上,刘庆峰对外正式宣告,星火 V3.0 已经实现全方位超越 ChatGPT,在中文上实现全面超越,在英文上实现对标。

  相较于上一个版本,讯飞星火 3.0 版本在文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力上继续升级,并且推出了个性化功能。

  多项能力的提升,推动了更多应用场景的落地,落地价值开始彰显。在此次发布会上,讯飞对外介绍了智能编程助手 iFlyCode2.0、星火科研助手、启发互动式英语 AI 答疑辅学、青少年 AI 心理咨询、AI 健康助手等一系列细分场景应用,并对外发布了金融、汽车、运营商、工业、住建、物业、法律等十二个行业模型。

  刘庆峰称,通过与华为在算力上共同合作,讯飞在半年内实现了星火大模型训练和推理效率翻番。讯飞联合华为共同发布 “飞星一号” 大模型算力平台,并启动对标 GPT-4 的更大参数规模的星火大模型训练,2024 年上半年将实现对标 GPT-4。

  七大维度全面升级,整体超越 ChatGPT

  从大模型本身的技术升级来看,这次讯飞星火 V3.0 在其七大核心能力上都有不同程度的提升。

  其中,代码能力、数学能力、主动对话、小样本学习、多模态指令跟随、个性化等能力是此次提升的重点和亮点。

  先从代码能力上看,星火 3.0 版本进一步提高了代码的项目级理解能力,大模型能够理解和执行更复杂的代码生成要求,适用场景增多,降本增效效果更加明显。

  发布会上,刘庆峰展示了一个简单的 Python 生成 Prompt,要求大模型 “用 Python 代码画出一个大大的心形,然后里面大大小小的五颜六色的很多星星逐步呈现出来。”新版本大模型在代码能力上的项目理解能力被强化,不再只能执行单一的任务要求。

  在全新的星火大模型对话页面,Python 能力也被单独归纳成为一个小组件,可供用户在单独环境下使用。

  由于发布会上介绍,升级过后的星火大模型在 Python 代码生成能力上已经超越了 ChatGPT,但距离 GPT-4 还有一定差距。

  机器之心第一时间体验了讯飞星火 V3.0,接下来我们选取一个 Python 问题 ——“编写一个 Python 程序,实现一个简单的聊天机器人,能够回答用户的问题”,分别让 ChatGPT 以及星火 3.0 进行生成,最后用 GPT-4 对这两者的答案进行检验和点评。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论