人工智能行业深度报告ChatGPT火爆出圈，AI算力和行业应

10月10日壹世缘投稿

　　（报告出品方：中国平安）焦点：ChatGPT带火AIGC，OpenAI引领技术和生态
　　焦点：凭借AIGC爆款应用ChatGPT，OpenAI强势出圈
　　2022年11月30日，由OpenAI开发的聊天机器人ChatGPT推出并席卷了整个行业，短短5天，注册用户数就超过100万，仅两个月月活用户数已经破亿。2023年1月，全球每天约有1300万独立访问者使用ChatGPT。ChatGPT拥有强大的语言理解和文本生成能力，能够很好地支持聊天对话、代码撰写、文案创作等任务。
　　与之前的AI聊天机器人相比，ChatGPT能够理解上下文并给出合理的回复，对话连续性大幅提升，可以称为人工智能发展史上的划时代产品。凭借着ChatGPT的成功，OpenAI成为全球AI行业关注的焦点。
　　OPENAI：GPT模型技术领先，ChatGPT发布引发变革
　　AIGC（AIGeneratedContent）是人工智能生成内容，也称为生成式AI，涉及无监督和半监督学习算法，能够使计算机用先前创建的内容（诸如文本、音频、视频、图像和代码等）来生成新的内容，以此响应用户输入的提示语。
　　OPENAI是全球领先的AIGC公司。OPENAI成立于2015年，其最初定位为非盈利性研究机构，2018年，OPANAI发布了GPT1模型，2019年，公司改制为有上限的盈利性机构，并于同年发布GPT2模型；2022年3月，OPANAI发布InstructGPT模型；2022年11月，OPENAI发布ChatGPT。此外，公司还拥有自然语言转图片的应用DELLE2。
　　OPENAI：微软持续提供资金、算力和生态支持，助力成就爆款
　　微软高度重视人工智能领域，在资金投入、计算资源、应用开发等方面与OPENAI形成了密切的合作关系，两者优势互补、合作共赢。资金投入：2019年，微软向OPENAI投资10亿美元；2021年，微软再次向OPENAI投资，数额未披露；2023年1月，微软宣布将通过一项花费数年、数十亿美金的投资深化与OPENAI的合作，根据美国财富杂志信息，该投资可能高达100亿美元。计算资源：微软Azure是OPENAI的独家云供应商，且微软将加大在超级计算机方面的投资以支持OPENAI的发展，同时OPENAI也可以反哺增强微软Azure的AI能力，两者能够很好的合作共赢。应用开发：2月8日，微软推出基于OPENAI模型的Edge浏览器和Bing搜索引擎，且微软表示未来所有产品将全线整合ChatGPT，包括Office三件套、Azure云服务、企业定制版产品等。
　　百度：文心大模型国内全面领先，有望打造成国产ChatGPT
　　百度在大模型领域拥有较强的技术实力和平台积累，其文心大模型总体位于行业前列。2019年3月，百度首次发布预训练模型ERNIE1。0，之后针对大模型的技术创新与产业应用持续发力，目前已经实陆续实现了一定程度的突破：2021年，百度发布最新版大模型ERNIE3。0；2022年，百度发布鹏城百度文心大模型，其参数规模达到2600亿，较GPT3参数量高50；2023年2月，百度宣布其最新的大模型文心一言将于三月份完成内测，并面向公众开放。根据IDC对国内大模型市场的评估，百度文心大模型在产品能力、应用能力、生态能力等方面处于全面领先的业界地位。
　　百度：创新性引入大规模知识，文心大模型性能大幅提升
　　百度文心大模型拥有NLP、CV、跨模态、生物计算等大模型组合，具有产业级和知识增强两大特点。文心大模型源于产业、服务于产业，可以满足真实场景中的诸多应用需求，真正发挥大模型驱动AI规模化应用的产业价值；文心大模型在海量文本数据的基础上引入大规模知识图谱，促进了结构化知识和无结构化文本之间的融合与共享，模型能力大幅提升。2021年百度发布了ERNIE3。0模型，首次在百亿级预训练中引入了大规模知识，模型学习效率和可解释性大幅增强。框架方面，ERNIE3。0模型框架分为通用表示和任务表示两层，同时具备语言理解和语言生成两种功能；性能方面，ERNIE3。0刷新了54个中文NLP任务基准，且其英文模型在复杂语言理解任务评测中超过了人类水平0。8个百分点。
　　百度：文心一言生态建设取得进展，具备商用拓展潜力
　　文心NLP大模型面向语言理解、语言生成等场景，具备超强的语言理解、对话生成、文学创作等能力。文心NLP模型将大数据预训练与多源丰富知识相结合，通过持续学习，不断吸收海量文本数据中词汇、结构、语义等方面的新知识，实现模型效果不断进化。文心一言（英文名：ERNIEBot）是百度基于文心大模型技术推出的生成式对话产品。2023年2月7日，百度宣布将于2023年3月份发布文心一言，目前已经有大量下游客户参与文心一言的生态建设，行业覆盖面广泛，包括新闻、传媒、互联网、家装、汽车、金融等，其中新闻传媒业积极性最高，反映出文心一言这类AIGC产品将给媒体创作类行业带来巨大影响。在2023AI工业互联网高峰论坛上，百度智能云宣布文心一言将通过百度智能云对外提供服务，率先在内容和信息相关的行业和场景落地。变革：AIGC与人更为神似，模型和数据是主要助力
　　改变：AIGC实现了从分析预测到生成创造的跨越，AI开始更像人
　　AIGC为人工智能技术带来技术变革。相比于之前的分析式AI，AIGC不再局限于分析已有数据的规律，而是实现了从分析内容到创造生成新内容的跨越，让AI更像人。事实上，早在2014年，随着一种深度学习架构生成对抗网络（GAN）的出现，生成式AI就开始流行。但近年来，生成式AI在模型、数据、算力都大幅度提升和改进，行业进入爆发期，其中模型的演进影响最为深远。
　　突破模型：预训练大模型Transformer助力，AIGC实现里程碑式飞跃
　　预训练大模型为生成式AI带来里程碑式飞跃。2017年Transformer架构的出现改善了循环神经网络（RNN）的局限性，标志性特征是采用了selfattention机制，可为输入数据的各部分分配不同权重，支持GPT3和LaMDA等大型语言模型（LLM）。Transformer模型可并行训练，使GPU性能改善所带来的模型训练效果显著提升，同时可以通过不断增加模型参数量以及预训练使用的数据量来提升模型性能。
　　大模型（又称基础模型）可经过海量、多样化数据（通常无标注文本）的预训练，再针对广泛的下游任务进行微调或适应。针对不同的任务和应用场景，只需要将大模型迁移学习到下游任务即可实现，避免了传统NLP技术需要从头开始训练下游任务的痛点。
　　突破模型：Transformer衍生出三类模型，打下生成式AI算法的基础
　　深度神经网络结构升级引发AIGC技术开发新范式，各类预训练模型层出不穷，可用于NLP（诸如GTP3）、CV（诸如Florence）或多模态领域（诸如StableDiffusion）。以Transformer架构为基础衍生出的典型预训练语言模型大致可以分为三类：1）Encoder模型（以BERT为代表）：又称自编码模型，适用于内容理解任务，例如需要理解输入语义的任务，例如情感分析；2）Decoder模型（以GPT为代表）：又称自回归模型，适用于生成式任务，例如文本生成；3）EncoderDecoder模型（以T5为代表）：又称Seq2Seq模型，通常用于需要内容理解和生成的任务，例如翻译。
　　突破模型：GPT系列大模型演进和应用较快，最终掀起AIGC热潮
　　Transformer三条路线中，GPT模型进展较快：2018年，由OpenAI提出的生成式预训练模型GPT诞生，提出了半监督学习方法，即通过预训练微调的方式让模型通过大量无标注数据学习，从而缓解人工标注数据有限的问题；2019年，GPT2去除finetune，参数量增加，采用zeroshot（零样本）学习，模型的泛化能力提升；2020年，GPT3采用fewshot（小样本），并将训练参数又提升两个数量级，模型准确率和性能再次提升；2022年，InstructGPT在GPT3基础上采用奖励机制，通过人为标注和强化学习的方法提升模型输出结果的真实性、无害性和有用性，13亿参数版本实现了比1750亿参数版本GPT3更好的模型性能。
　　突破数据集：数据量、多样性、数据质量是关键要素
　　语料库的数据量、多样性、数据质量成为训练数据集的关键要素。GPT使用了包含7000本书的BookCorpus数据集；GPT2则收集了更加广泛、数量更多的语料组成数据集，包含800万篇Reddit上高赞的文章网页，大小为40GB，Reddit上的数据会包括各个领域，所以既保证了数据质量、数量又保证了数据的多样性；GPT3则采用了5种语料库（5000亿tokens），大小增至45TB；InstructGPT的预训练和GPT3相同，但用标注数据和提示语进行了微调和优化，OPENAI雇佣了40名标注人员（labeler）且进行了培训，通过指示学习构建训练样本来训练奖励模型，最后通过奖励模型的打分排序来指导强化学习模型的训练。市场：大模型需要大算力，推动AI服务器市场增长
　　算力：ChatGPT是基于InstructGPT模型，大幅扩大数据量级而得到
　　ChatGPT模型训练结合了监督学习和强化学习，具体的训练方法分为三步：1）收集数据集并进行人工标注，输入到GPT3。5模型中进行GPT3。5模型微调，训练输出一个监督模型（SFT）；2）收集SFT模型生成的多输出比较数据集，对诸多答案进行排序打分（人工标注），训练输出一个奖励模型（RM）；3）利用RM模型作为奖励函数，通过PPO算法对SFT模型进行强化学习，持续迭代生成模型，此过程无需人工标注。
　　算力：大模型的实现需要十分强大的算力来支持训练过程和推理过程
　　大模型的实现需要十分强大的算力来支持训练过程和推理过程。根据OPENAI数据，训练GPT3175B的模型，需要的算力高达3640PFdays（即以1PetaFLOPs的效率要跑3640天）。2018年以来，大模型的参数量级已达到数千亿参数的量级规模，对算力的需求将呈现指数级增长。
　　算力：AI芯片的性能提升成为决定大模型从理论实践到大规模应用的关键要素
　　根据《COMPUTETRENDSACROSSTHREEERASOFMACHINELEARNING》研究结果，大模型时代，算力翻倍的需求时间是9。9个月。AI芯片的性能提升成为决定大模型从理论实践到大规模应用的关键要素。在供给端，AI芯片厂商推出了性能越来越强的新产品来应对人工智能发展的算力需求。以英伟达为例，2020年，英伟达推出了A100GPU芯片，相比上一代V100GPU芯片，A100GPU芯片性能大幅提升。针对大模型，A100GPU芯片相比V100GPU芯片可提供高达3倍的训练速度。
　　算力：ChatGPT的训练成本和推理成本高昂
　　在训练端：据报道，2020年，微软宣布与OpenAI合作，建成了一台超级计算机，专门用来在Azure公有云上训练超大规模的人工智能模型。这台为OpenAI开发的超级计算机拥有超过28。5万个CPU核心，拥有超过1万个GPU（V100GPU芯片）。以此规格，如果自建IDC，以A100GPU芯片替代V100GPU芯片，依照A100和V100的性能换算，需要约3000个A100GPU芯片。根据英伟达网站信息，NVIDIADGXA100服务器搭载8块A100芯片，估算需要375台NVIDIADGXA100服务器，每台NVIDIADGXA100服务器的价格为19。9万美元，则自建IDC的训练服务器的算力成本为7462。5万美元。若在云端训练，据LambdaLabs首席科学官Chuanli介绍，拥有1750亿个参数的GPT3单次训练成本达到460万美元。应用：行业将逐步回归理性，能否突破需要看B端
　　AIGC将逐步回归理性，未来23年重点培育应用和教育市场
　　未来23年是AIGC走向成熟的关键时期。类似于计算机视觉等相对成熟的技术，AIGC在经历了近期的炒作热潮结束之后，预计行业将经历一段下沉期，市场趋向理性。AIGC则需要加快开始教育和融入市场，培育产品和应用。如果能够像计算机视觉一样，找到合适的商业化场景，行业后续将逐步得到市场认可，并持续做大；如果不能，这项技术也可能持续停留在低谷期，甚至被市场淘汰。
　　ChatGPT的快速推进，标志着AIGC在C端有着巨大潜力，但B端、G端相关产品应该将是公司的主要收入来源。C端看，主要是来自于内容生成等工具性的需求，一般都是轻应用，尝鲜之后的付费意愿值得观察，主流的产品收费模式将是SaaS应用订阅；B端看，是含金量最大的市场，需要将技术转化成工具和解决方案，为企业和行业赋能，收费模式可能包括项目定制后续订阅收入。
　　国内AIGC垂直应用起步较晚，文本、图像等领域都还是蓝海赛道
　　相较美国市场，国内AIGC在相对成熟的赛道上参与者也不是很多，这和之前的预测性AI趋于红海的市场有着很大的差异。一方面，国内在算法和应用开发上存在差距，同时公有云SaaS发展不足带来的训练数据质量和应用通用性较差，限制了国内应用的大面积铺开；另一方面，国内B端为应用付费的意愿，尤其是AIGC这类新应用付费的意愿并不够强，反而是国内一些ToC的赛道发展的更好一点。
　　从趋势上看，AIGC最终的市场依然是B端，但是考虑到中美市场的差异，国内企业依靠单一通用应用去打所有市场的可能性比较小，需要通过垂直化、行业定制化的开发AIGC方案，早期可能只面向1个或者几个行业赛道，有积累之后持续拓展其他行业。报告节选：
　　（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）
　　精选报告来源：【未来智库】。链接

投诉评论

一觉醒来辽篮传喜讯！曝八旬老帅重回辽宁，功勋外援举行退役仪式北京时间1月25日，大年初4，值此新春佳节之际，祝福各位网友朋友们身体健康，万事顺意！让我们来继续关注中国篮球，关注CBA联赛。在202223赛季CBA联赛前两个阶段的比赛中，……杜锋摊牌不是故意垫脚，孙铭徽霸气回应宏远，郭艾伦最新表态杜锋摊牌发声！孙铭徽戳穿非故意垫脚的谎言，郭艾伦最新表态北京时间1月16日，针对广东男篮对阵浙江广厦的比赛，曾繁日在第二节末尾垫脚孙铭徽一事，宏远主帅杜锋进行了摊牌发声，……年龄大需戒菊花？提醒年满46岁，牢记2喝2不喝，喝对益处多导语：年龄大需戒菊花？提醒：年满46岁，牢记2喝2不喝，喝对益处多梅花、兰花、竹子以及菊花在我国被称为四君子。其中，菊花因为可以被制作成菊花茶，当作饮品饮用，而受到广泛的……晚餐适当喝点红酒，可以降低患糖尿病风险调查发现，对于目前的饮酒者来说，在用餐时饮酒，尤其是葡萄酒，与患2型糖尿病风险降低有关。适度饮酒对葡萄糖代谢有益以前的研究集中在人们喝了多少酒，结果好坏参半，但很少有研究……让乡村书店成为文化粮仓来源：人民日报乡村书店要实现持续健康发展，不应简单照搬城市书店模式，其生命力在于积极融入乡村振兴事业，对优秀乡土文化进行创造性转化、创新性发展。走进浙江德清县干山村……人工智能行业深度报告ChatGPT火爆出圈，AI算力和行业应（报告出品方：中国平安）焦点：ChatGPT带火AIGC，OpenAI引领技术和生态焦点：凭借AIGC爆款应用ChatGPT，OpenAI强势出圈2022年11月3……经营好你的2023这五句话里藏着新一年最好的状态好的心态会让你遇到更好的自己有一句扎心的话这样说过：成年人的世界里，谁不是一边崩溃大哭，一边抹干眼泪，继续生活。是的，没有人的生活永远一帆风顺，总会遇到一些不如意的……阿里又干大好事了，这次真正为社会输出人才阿里又要干大好事了，这是为社会培养科技人才最直接最有效的方法，不出10年，我国科技一定突飞猛进，突破国外的钳制。突破国外科技的钳制近日，阿里公布了2022研究型实习……嫦娥三号根本没有核电池，着陆8年半了还活着？质量杠杠的2013年12月2日，3。78吨的嫦娥三号月球探测器成功从西昌卫星发射中心升空，并于当月14日顺利实现月面软着陆，随后释放玉兔号月球车。不知不觉中，这个时间，距今已快8年半了，……扫地机器人排名，家用扫地机器人十大排名分析冰尊扫地机器人是世界扫地机器人十大排名领导品牌。自从扫地机器人的出现，越来越多的人能从家务中解脱出来。家用扫地机器人可以说是懒人和上班族家中必备的神器了。但市面上扫地机器……厚道人！霍华德理解斯图尔特的做法换做是我也会愤怒詹姆斯与斯图尔特的冲突已经过去3天，联盟也对此事开出过罚单，詹姆斯禁赛1场，斯图尔特禁赛2场。外界对于此事的评价也是各不相同。詹姆斯认为自己不该被禁赛，而浓眉、威少则抨击了斯图……天赐良基日报第131期丨知名基金经理隐形持仓曝光基金经理称新每经记者：叶峰每经编辑：肖芮冬一、今日基金新闻速览1、知名基金经理隐形持仓曝光上市公司陆续披露2022年年报，多名顶流基金经理的最新持仓变化浮出水面。数据显示……

<<<<<<－>>>>>>

妇科炎症距离你只有网上赚钱项目之卖抖音高粉丝账号年赚千万乳胶漆墙面脏了怎么办让我来教教大家为什么网站页面设计会影响搜索引擎优化三国志战略版抽卡技巧，如何抽到好卡那一次我真开心深层探索恐怖的电子双缝干涉实验，我们所看到的真实都是幻象？毒舌老妈欲哭无泪哇新手开店如何做自然搜索小卖家该如何获得流量百年牡丹上海这里最多！花期仅半个月，快来！该校造句用该校造句大全胡乱地给自己养生，后果很严重信用卡新玩法乐趣多双筍石二缺孩子没救了现代老年人有哪些常见心理问题孕期子宫破裂有什么症状关于环境的作文保护地球的每个生物坐月子期间应特别注意的事项与重点有哪些给海燕T241收音机加装调频波段电脑上可以查微信聊天记录（微信怎么看聊天记录）怎样挑选小白菜从29层坠落的一块大玻璃错了别怕从头再来

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找