0°

ChatGPT深度研究:细探商业模式与供给端决定因素

  1.ChatGPT:以GPT-3.5架构革新AI对话模型,商业化前景仍需探索

  ChatGPT 是美国 OpenAI 公司研发的对话 AI 模型,是由人工智能技术支持的自然语言 处理(NLP,Natural Language Processing)工具,于 2022 年 11 月 30 日正式发布。它 能够学习、理解人类语言,并结合对话上下文,与人类聊天互动,也可撰写稿件、翻 译文字、编程、编写视频脚本等。

  与现存的其他同类产品相比,ChatGPT 的独特优势在于:1)基于 GPT-3.5 架构,运用 海量语料库训练模型,包括真实生活中的对话,使 ChatGPT 能做到接近与人类聊天; 2)应用新技术 RLHF (Reinforcement Learning with Human Feedback,基于人类反馈的 强化学习),从而能更准确地理解并遵循人类的思维、价值观与需求;3)可在同一 阶段内完成模型训练;4)具有强大算力、自我学习能力和适应性,且预训练通用性 较高;5)可进行连续多轮对话,提升用户体验;6)更具独立批判性思维,能质疑用 户问题的合理性,也能承认自身知识的局限性,听取用户意见并改进答案。

  1.1、历经多轮迭代,参数量指数性上升,商业模式已见雏形

  2015 年,特斯拉 CEO 埃隆·马斯克、Y Combinator(美国著名创业孵化器)总裁 Sam Altman、PayPal 联合创始人 Peter Thiel 等投资 10 亿美元,在旧金山创立了非营利性组 织 OpenAI,致力于开发 AI 技术。 2017 年谷歌大脑推出生成式预训练模型 Transformer,经大量数据集训练后成为当时最高水平的 LLM(大型语言模型)。

  Transformer 模型内部创造性地采用了自注意力结构(Self-Attention),相比 NLP 中的 两大主流结构 RNN(Recurrent Neural Network,循环神经网络)、CNN(Convolutional Neural Network,卷积神经网络),每层具有更佳的计算复杂度,能更好地学习语 法、语义等,提高训练和计算效率;由于未采用循环结构,Transformer 处理长序列时 也能避免梯度消失或爆炸。具体而言:1)相比不能并行计算的 RNN,Transformer 允 许并行处理输入序列中的所有位置,可直接计算点乘结果; 2)相比 CNN, Transformer 可使任意两个单词间距离为 1,计算两个位置间关联的操作次数不因距离 而增多,从而解决了 NLP 中长时依赖的难点问题。

  2018 年 OpenAI 公司基于 Transformer 结构推出 GPT-1(Generative Pre-training Transformers, 创造型预训练变换模型),参数量为 1.17 亿个,GPT-1 超越 Transformer 成为业内第一。2019年至2020 年,OpenAI 陆续发布 GPT-2、GPT-3,其参数量分别达 到 15 亿、1750 亿,其中GPT-3 训练过程中直接以人类自然语言作为指令,显著提升 了 LLM 在多种语言场景中的性能。 2019年OpenAI 转型为封顶盈利机构,成立 OpenAi LP 公司,同年 7 月获得微软的10亿美元投资,9 月授予微软 GPT-3 模型的独家使用权(不影响付费用户使用)。2020 年6月,公司发布第一款商业化产品 OpenAI API。2022 年 1 月,OpenAI 在 GPT-3 基础 上进行微调,并在训练中加入人类反馈数据,推出 InstructGPT。

  2022 年 11 月 30 日,OpenAI 推出人工智能对话聊天机器人 ChatGPT(InstructGPT 的兄 弟模型),其训练数据集为开源数据集,且参数量达到 GPT-3 的 10 倍以上,辅以人工 标注数据与强化学习的运用,实现了突破性进展——ChatGPT 能够围绕大量话题进行 对话,拥有更接近人类的逻辑思维,可借助对话反馈强化学习,且能模仿人类的情 绪。例如:1)ChatGPT 不仅通晓古今历史,能识别出问题中的事实性错误,还拥有想 象力和价值判断能力,能够想象古人在现代的生活并从现代价值观视角进行评判,且 语言不乏文学性;2)当用户重复同一提问时,ChatGPT 会分析提问者的反馈,推测其 想法、态度,据此调整回答,并结合普世价值观,给出合理且迎合提问者心理的答 案。同年 12 月 5 日,注册用户数超过 100 万;截至 2023 年 1 月底,ChatGPT 月活用 户已高达 1 亿,成为史上活跃用户规模增长最快的应用。

  2023 年 2 月 2 日,OpenAI 推出 ChatGPT 的付费订阅版 ChatGPT Plus,提供比免费版更 为快速的服务以及新功能优先试用权,月费为 20 美元。同日微软宣布旗下的全线产 品将与 ChatGPT 整合,包括云计算平台 Azure 以及此前已宣布的搜索引擎 Bing(必 应)、Office 等。2023 年 2 月 7 日,微软推出由 ChatGPT 支持的最新版 AI 搜索引擎 Bing 和 Edge 浏览器,次日凌晨宣布已将 GPT-4 整合到 Bing 和 Edge 浏览器中。

  1.2、得益于技术提升,应用层面正突飞猛进

  ChatGPT 的问世得益于近年来 AIGC(AI-Generated Content)技术的持续发展,也对其 他 AIGC 模型具有重要意义,尤其是依托文字、语音模态的类型。未来 OpenAI 可将 ChatGPT与其他 AIGC模型集成,拓展更丰富的功能和应用场景,进而助推 AIGC浪潮、 赋能整个 AI 产业链。Gartner 预计,到 2025 年 AIGC 将占据所有生成数据的 10%。据 Frost & Sullivan 和头豹研究院测算,2021 年中国对话式 AI 市场规模为 82.7 亿元,到 2026 年有望增长至 265.8 亿元,CAGR 达 26.3%。 目前 ChatGPT 已被应用于多种工作职能中,基于其技术逻辑和特点,中短期内拥有多 样化应用方向与场景,兼顾 To B 和 To C,具体主要包括:

  1)应用于内容创作,提升内容生产效率和丰富度:①完成翻译、收集素材、选题策 划、写作稿件等任务(例如美国新媒体巨头公司 Buzzfeed 宣布将用 ChatGPT 辅助内容 创作,美联社使用的 Wordsmith 每秒可完成 2000 篇报道),②在文艺、影视等领 域,协助编写剧本和视频脚本,比如国内海马轻帆旗下的“小说转剧本”工具,已深度 参与了 3 万多集电视剧和 8000 多部电影的剧本创作过程;③与视频类 AIGC 集成,基 于文字合成、剪辑视频以及生成虚拟场景等; 2)在商务场景中,协助培训员工,运用其多轮对话能力担任智能客服协助营销、把 握消费者需求,从而降低公司用人成本,例如亚马逊运用 ChatGPT 生成员工培训文 档;

  3)在办公场景中发挥办公助手、语音转换文字、代码生成等功能,比如微软计划将 Office软件与ChatGPT,推出Microsoft Teams高级版(付费),可自动生成会议笔记; 4)在工业场景中,与图片类 AIGC 整合、基于对话中的关键词辅助制作设计图,减少 工程设计用时,比如 Jasper 旗下的 Stable Diffusion,可基于文本生成图像,采用了目 前全球最大的开放图像-文本对数据集 LAION-5B,且生成效率提高 30 倍,Jasper 的付 费用户目前有 IBM、Autodesk 等; 5)此外,ChatGPT 在教育、工业、医疗等行业中也有较大应用空间,比如在教育场 景中为学生批改作业、答疑、查漏补缺,在医疗场景中为患者预诊、录入电子病历 等。

  海外主要玩家现状: 现阶段海外 AIGC 赛道玩家数量较多,市场格局尚未定型。其中,领先的生成式 AI 公 司除 ChatGPT 之外主要有 Stability AI、Jaspers AI 和 Midjourney 等,在文字、图片、音 频生成等领域拥有独特优势,且已积累一定的用户规模。

  Stability.AI 公司致力于开发 AI 开源工具,于 2022 年 8 月推出了图像生成模型 Stable Diffusion,可根据关键词产生图片,图像文本对数量超过 5000 亿,在消费级显卡上生 成的图像与 DALL·E 2 品质相当,成为其主要竞争对手。Stable Diffusion 的程序代码免 费、开源,允许所有用户使用、调整,也可根据自身需求开发应用,已有超 20 万用 户运用其源码开发了图像、语言、音乐等领域的 AI 工具,目前各渠道的日活用户规模 累计达 1000 万以上。此外,Stability.AI 还发布了 DreamStudio,使用门槛较低,没有 编程背景的用户也能输入提示词精准生成高质量图像,最快仅需几秒,DreamStudio 用户已超过 150 万,生成图像数量超 1.7 亿。目前 Stability.AI 公司估值约 10 亿美元。

  Jaspers AI 成立于 2021 年 1 月,主要针对商业营销用途,为商家和个人用户提供 AI 文 字生成和图片生成功能。其中,文字生成工具 Jasper 可帮助用户生成营销文案、社交 媒体文章、新闻稿、TikTok 视频脚本、邮件等文本,支持 29 种语言;附加功能图片生 成系统 Jasper Art 可根据用户输入的文字生成图像,并能调整画法、风格,且拥有无 版权图片库。据公司数据,使用 Jasper 生成文案初稿可节省 80%的时间,ROI 达 400%。Jasper 和 Jasper Art 均采用付费订阅制,其中,Jasper 订阅服务分为 Starter/Boss Mode/Business Mode 三档,收费标准分别为$29/$59/$499 每月。

  相比同业竞对公司,Jasper AI 的主要优势在于:1)集成大量机器学习模型,包括业界 最新的语言生成模型 GPT-3.5(由 OpenAI 开发)和 BLOOM(由 Hugging Face 开发), 文字出品质量较高;2)针对目标用户群体的需求特点对模型进行微调,提供大量实 用模板、创作工具(例如翻译器、抄袭检验等),通过优化关键词生成更契合 Google SEO 规则的内容,且速度提升 5 倍,帮助用户增大流量曝光、改善营销效果;3)同时 支持图文生成功能,为用户创作营销材料、文艺作品等带来便利,在电商、社媒、视 频制作等多个新兴行业领域具有较高的商业潜力。

  2022 年 10 月,Jasper AI 宣布估值超过 15 亿美元,已获得 1.25 亿美元 A 轮融资,将用 于打造核心产品、与更多应用整合以及收购 Outrite(一款用于检查语法和风格的 AI 软 件,全球用户数已超过 100 万),计划于 2023 年整合两家公司的产品。据公司创始人 透露,截至 2022 年 10 月,Jasper 用户数已超过 10 万;2021 年收入达 4500 万美元, 预计 2022 年实现收入 7500 万美元以上,同比增长约 66%。

  Midjourney 是 AI 绘画赛道近期最受欢迎的应用,能根据输入的关键词生成高质量图 像,现已嵌入 Discord 平台,用户基于该平台的 bot 机制提交 Prompt(即提示词)即 可生成图片,目前已拥有 381 万用户。Midjourney 允许付费用户创作的图像用于商业 用途,但若收益超过每月 2 万美元则需支付 20%作为分成,也可与公司官方协定分成 比例。Midjourney 擅长人像生成,图像接近照片级品质,制作的 3D 艺术品也十分逼 真、精细,在建筑设计、艺术创作等对图像质量、审美要求较高的领域拥有显著优 势,应用前景广阔。据称,目前 Midjourney 每月收入约 200 万美元以上。

  2.细探ChatGPT出圈原因:爆款应用背后,长期技术拐点已现

  ChatGPT 在上线 5 日内突破 100 万注册用户,超越 Facebook 和 Twitter(分别用时 10 个月和 2 年),两个月内突破 1 亿用户,成为全球最快用户破亿的互联网软件,对比 之下,TikTok 和 Instagram 分别用时 9 个月和 2 年半才实现亿级用户量。用户活跃度方 面,据 SimilarWeb 报告显示,ChatGPT 在 1 月的日均访问量达到 1300 万人次。我们分 析,ChatGPT 能够如此迅速火遍全球,主要得益于:1)ChatGPT 长期积累的技术优 势;2)公司大胆尝试得到市场认可; 3)科技巨头纷纷躬身入局,释放重视信号; 4)大趋势上,AIGC 行业逐渐成熟。

  2.1、技术上,多轮迭代训练后已具备先发优势

  由 OpenAI 公司推出的 ChatGPT 在正式面世之前,GPT 家族已有三个基于 Transformer 技术的自然语言处理模型,分别为 GPT-1/2/3,模型每迭代一次,参数量都在几何式 增长,从最初的 1.17 亿增加到第三代的 1750 亿,GPT-3 已成为全球最大的语言模型之 一。ChatGPT 使用的 GPT-3.5 模型是在 GPT-3 的基础上加入 Reinforcement Learning from Human Feedback(RLHF,人类反馈强化学习)技术和近段策略优化算法,其目的是从 真实性、无害性和有用性三个方面优化输出结果,降低预训练模型生成种族歧视、性 别歧视等有害内容的风险。 ChatGPT 训练的过程主要有三个阶段。

  第一步是训练监督策略,人类标注员对随机抽取的提示提供预期结果,用监督学习的 形式微调 GPT-3.5,生成 Supervised Fine-Tuning(SFT)模型,使 GPT-3.5 初步理解指 令,这一步与先前的 GPT-3 模型训练方式相同,类似于老师为学生提供标答的过程。第二步是奖励模型,在 SFT 模型中随机抽取提示并生成数个结果,由人类标注员对结 果的匹配程度进行排序,再将问题与结果配对成数据对输入奖励模型进行打分训练, 这个步骤类似于学生模拟标答写出自己的答案,老师再对每个答案进行评分。

  第三步是 Proximal Policy Optimization(PPO,近段策略优化),也是 ChatGPT 最突出 的升级。模型通过第二步的打分机制,对 SFT 模型内数据进行训练,自动优化迭代, 提高 ChatGPT 输出结果的质量,即是学生根据老师反馈的评分,对自己的作答进行修 改,使答案更接近高分标准。 简而言之,我们分析,ChatGPT 的优势在于,1)使用 1750 万亿参数的 GPT-3 为底层 模型进行预训练,为全球最大的语言模型之一;2)算力上得到微软支持,使用上万 片 NVIDIA A100 GPU 进行训练,模型的运行速度得到保障;3)算法上使用奖励模型和 近端优化策略进行迭代优化, 将输出结果与人类预期答案对齐,减少有害性、歧视性 答案,使 ChatGPT 更拟人化,让用户感觉沟通的过程更流畅。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论