0°

ChatGPT又又又更新了,多模态GPT-4大模型发布

  GPT(Generative Pre-trained Transformer)是一系列基于Transformer架构的预训练语言模型,由OpenAI推出。它们在自然语言处理任务中表现出色,尤其是在生成式任务(如机器翻译、对话生成、文章摘要等)方面。

  GPT系列的主要模型:

  1. GPT:发布于2018年,是第一个GPT模型,使用了12层Transformer结构,预训练语料库为WebText,包含8亿个单词。

  2. GPT-2:发布于2019年,使用了更大的模型和更多的数据,包括40GB的文本数据和1.5亿个参数。GPT-2在多项自然语言处理任务中表现出色,但由于其能够生成高质量的假新闻和误导性内容,OpenAI选择不公开其完整模型。

  3. GPT-3:发布于2020年,是目前最大的GPT模型,包含1750亿个参数。GPT-3在多项自然语言处理任务中表现出色,特别是在生成式任务中表现突出,如语言生成、问答、翻译等。它还可以执行一些简单的计算任务,如加法、减法等。也是在2022年底爆火的一个模型,当chatgpt爆火的时候,很多人基于GPT-3开发了很多相关的应用。

  GPT-3.5:发布于2022年,也是因为此模型,OpenAI瞬间爆红,此模型也是官方chat官网使用的模型,在2023年3月份发布官方API接口。

  GPT-4:发布于2023年3月14号,也是GPT模型最新版本模型,此模型支持多模态(接受图像和文本输入,输出文本内容),官方原话是:“OpenAI创建了 GPT-4,这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,然后文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上已经达到了人类水平的表现。”

  GPT-4在各个专业水平上的模拟考试

  GPT-4

  GPT-4 比以往任何时候都更具创造性和协作性。它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。其模型为多模态模型,不仅可以像ChatGPT一样,输入文本进行问题的回答,还可以支持图片的输入。

  输入:我可以用这些原料做什么?如下是用户输入的一张图片

  输出

  你可以用这些原料做很多选择!

  一些可能性包括: – 煎饼或华夫饼 – 可丽饼 – 法式吐司 –

  煎蛋卷或菜肉馅煎蛋饼 – 乳蛋饼 – 奶油冻或布丁 –

  蛋糕或纸杯蛋糕 – 松饼或面包 – 饼干或饼干 这些只是几个例子,

  但可能性是无穷无尽的!

  GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。

  https://cdn.openai.com/papers/gpt-4.pdf #GPT-4论文

  GPT-4 的高级推理能力超越了 ChatGPT

  在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。为了了解这两种模型之间的区别,OpenAI在各种基准测试中进行了测试,包括最初为人类设计的模拟考试。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论