大模型重构百度

2023-08-23 09:51:53 来源: 互联网

新的时代已然开启。


(资料图片仅供参考)

文丨齐介仑

在ChatGPT掀起大模型热潮后,国内各大科技厂商已争先恐后步入这一领域。

入场的新玩家日益增多:快手于近日开始内测自研大模型快意,字节也在相近时间上线大模型独立APP、AI对话产品豆包。

老玩家则纷纷高效迭代,引人注目的有华为7月发布的盘古大模型3.0、百度6月推出的文心大模型3.5等。

当下之势说是“百模大战”毫不夸张。科技部直属科研机构中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至2023年5月28日,国内10亿级参数规模以上的大模型已经发布了79个,数量位列全球第二,仅次于美国。据公开数据,2023年8月,国内发布的大模型已超过100款。

在AI领域有着众所周知深厚积累的百度走在了大模型行业的前列。百度于2019年3月发布了文心大模型1.0,2023年3月发布了对标ChatGPT的产品文心一言,2023年6月文心大模型已进展到3.5版本。调研机构IDC发布的《AI大模型技术能力评估报告2023》显示,文心大模型3.5在算法、生态、服务能力等12项指标中获得7项满分,综合评分、算法模型、行业覆盖均为第一。

发展技术的同时,百度亦在探索大模型的应用场景。2023年8月,文心一言已上线基于文档交互的览卷文档、基于图片交互的说图解画、文字转视频的一镜流影等5个插件,且支持一次同时使用3个插件。这意味着文心一言功能性和场景自由度再次延展。

百度最新发布的财报能够说明这种成绩。财报显示,2023年第二季度,百度集团营收341亿元,同比增长15%;百度核心收入264亿元,同比增长14%;归属百度的净利润(non-GAAP)80亿元,同比增长44%,超市场预期。

正在重构百度生态的大模型已成为百度可持续性和高成长性的根基。无论是从技术本身还是基于技术的业务来看,百度都已来到崭新阶段。

01

大模型底层蓄势

大模型的市场空间有目共睹。

调研机构艾媒咨询《2023年中国AIGC行业发展研究报告》提到,2020年中国人工智能核心产业规模已达1500亿元,预计2025年将达4000亿元,中国有望发展为全球最大的AI市场;2022年后,AIGC(生成式人工智能)高速发展。

AIGC的发展不止在于产业本身,更在于能革新现有生产方式。高盛2023年7月5日发布的一份研报指出,AIGC的变革潜力已经开始起效,在某些情况下AIGC可以使开发人员的工作效率提升15%-20%。

百度较早投入大模型亦着眼于此。在2019年3月推出1.0版本后,文心大模型历经4年研发迭代,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等成果。在文心大模型3.5训练中,百度采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,采用多种策略优化数据源及数据分布,极大加快了模型的迭代速度。

如今的文心大模型已建起了从基础大模型到任务大模型、行业大模型的完整体系。基础大模型包括NLP(自然语言处理)大模型、CV(计算机视觉)大模型、跨模态大模型;任务大模型包含对话、搜索、信息抽取、生物计算等多个典型任务;行业大模型则与各个行业中的头部企业、机构联合研发。

以文心大模型的基础模型能力,叠加对海量行业数据的挖掘和行业实际业务积累的样本数据、特有知识,百度才能够提升大模型对行业应用的适配性。目前百度已联合行业客户发布了涵盖电力、燃气、金融、航天、传媒、城市等领域的11个行业大模型。

文心一言也交出了漂亮的成绩单。2023年8月,新华社研究院中国企业发展研究中心发布了《人工智能大模型体验报告2.0》,在包括语言能力在内的基础能力部分,文心一言表现最为抢眼;以综合指数计,文心一言更是少有的超过1000分的主流大模型。

将大模型注入全盘商业布局的不止百度。例如阿里将通义大模型应用到了软硬件系列产品和教育、智慧医疗、智慧城市等多个领域,华为的盘古大模型则已与鸿蒙生态密切结合。

相较之下,打磨时间更长的百度,布局更为全面。方正证券2023年6月30日发布的一份研报指出,百度已经实现了从底层芯片昆仑芯到深度学习框架飞桨,再到文心大模型以及搜索、自动驾驶、小度智能家居等应用4个层面的全产业链布局。

从往年财报看,百度2017-2021年研发投入从129亿元上升至221亿元,2022年为214亿元,6年研发投入已达1100亿元;而当下,2023年第一季度,百度研发投入为54亿元,第二季度为64亿元。马拉松式的真金白银研发投入使百度在芯片层、框架层、模型层、应用层搭建起了全栈式AI架构,这也是百度在大模型机会中保持领先地位的重要原因。

02

智能云空间打开

大模型的训练底层依托GPU算力资源、高性能的存储与网络,其发展与云计算息息相关。

在云计算概念IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)后,大模型又带来了新概念MaaS(模型即服务)——不同行业、企业由于业务、技术、流程、行业规则等方面的差异,对大模型的需求有所区别,模型本身就可以作为服务提供给客户。

大模型平台的诞生即是MaaS的体现之一。2023年3月,在文心一言正式发布后不久,百度智能云就推出了一站式企业级大模型平台文心千帆大模型平台。据海克财经了解,文心千帆是全球首个一站式企业级大模型平台,不但提供包括文心一言在内的大模型及第三方大模型服务,还提供大模型开发和应用的整套工具链,可帮助企业解决大模型开发和应用过程中的诸多问题。

到了2023年8月,文心千帆已全面接入Llama2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个大模型,成为国内拥有大模型最多的平台。而且,接入的模型经过文心千帆的二次性能增强,模型推理成本最高可降低50%。

之所以能够在短时间内取得如此硕果,是因为文心千帆拥有来自百度智能云的澎湃能量。早在2021年,百度就已提出“云智一体”,希望打造AI原生云时代。这使百度智能云面向AI场景开始提供极致弹性的高性能异构算力,打造简洁、高效的AI应用开发架构。

财报显示,2023年第一季度,百度智能云已经实现了季度盈利,收入42亿元,同比增长8%;2023年第二季度收入已达45亿元,同比增长5%,业务健康度持续提升。

据IDC发布的《中国AI公有云服务市场份额2022》,2022年中国AI公有云服务市场增速为80.6%,其中百度智能云市场份额占比第一,增速达69.7%。而这也是百度智能云连续4年获得第一。

百度智能云为模型的训练提供了算力和基础架构支撑,合作模式吸引了大量同行者。在2023年5月2023百度智能云合作伙伴大会上,百度签约了28家生态伙伴,一方面携手探索大模型平台在各领域的创新应用,一方面合力打造产业标杆案例,希望能够在各个行业有标准化、规模化复制。

国信证券2023年7月16日发布的一份研报提到,依托文心千帆大模型平台,百度智能云已与超过300家生态伙伴在400多个场景中取得了相当不错的测试效果,覆盖金融、政务、互联网、教育等多个行业。

大模型平台及百度智能云的多行业应用成效已获认可,来自中国高科集团的合作即为一例。7月14日,百度智能云与中国高科集团正式签署战略合作协议,双方将围绕AIGC、公有云服务、产教融合等方面开展深入合作,由此推动教育领域数智化升级。

高盛也在近日研报中对百度重申了买入评级,且给出了2025年百度生成式AI大模型应用未来收入潜力的预测:C端通过广告及Plug-in分成,将达到141亿元;B端通过公有及私有云部署将达到51亿元,占智能云收入的15%。

03

广告力再下一城

正如高盛研报提到的那样,在百度智能云之外,营销作为百度业务重要组成部分,同样受到了AIGC发展的稳健拉动。

财报显示,2023年第一季度,百度核心收入230亿元,其中在线营销收入166亿元,同比增长6%,非在线营销收入64亿元,同比增长11%;2023年第二季度,百度核心收入264亿元,其中在线营销收入196亿元,同比增长15%,非在线营销收入68亿元,同比增长12%。

就外部而言,经济大环境的复苏无疑带动了广告业的回暖,促使在线营销增长;而根本因素来自内部即百度移动生态等多方面的持续拓展。财报显示,2023年第一季度,百度APP 的MAU(月活跃用户数)已达6.57亿,同比增长4%;2023年第二季度,这两个数字分别为6.77亿和8%。

生态繁荣体现在多个维度。2022年,百度APP的视频用户数增长了38%,直播用户增幅更是超过了2倍;每天通过平台发起的咨询量超过了500万次,同比增长155%,付费咨询次数超过2亿;百度联盟搜索流量上涨21%,百度联盟入口请求量突破千亿,变现能力提升30%。

而在已然进入的全新发展阶段里,搜索加推荐和AIGC已成为百度移动生态继续着力发展的强劲驱动引擎。在2023年5月2023万象百度移动生态大会上,百度已宣布AIGC能力将全面接入百度内容生态产品矩阵;百家号将全新升级为AI创作经营平台,通过引入AI笔记、AI成片、AI作画、AI BOT、AI写作、AI数字人等6件创作工具拥抱AI革命;同时百度内容生态还推出了AI共创计划,预计未来1年将扶持10万创作者收入超30亿元。

AIGC能够直接提升营销效率。2023年6月,百度推出了AIGC商业创意平台擎舵。擎舵能够通过多模态内容生成,轻松实现文案生成、图片生成和数字人视频制作的生产功能。据海克财经了解,该平台2分钟就能生成100条创意文案,3分钟生成一个数字人建模,5分钟即可制作一条完整的数字人口播视频。

这样的提质增效并不仅仅作用于百度内部。2023年618期间,京东联合百度文心一格将AIGC应用到了电商营销之中,进行了电商行业首次大规模AI线下广告尝试。得益于此,京东营销团队通过对人物特性的不同描述,可生成差异化海报效果。据百度测算,常规情况下这样一组海报,从模特、服装到设计、排版的整体单张成本接近1万元,AI则使制作周期缩短了70%,制作成本节省了约80%。

通过坚持科技长期主义,百度已从不同业务线的产品到合作伙伴乃至整个生态链路形成了闭环。

以智能驾驶业务为例,百度自动驾驶及智能化解决方案亦受到了AIGC的显著推动。

百度自动驾驶出行服务平台萝卜快跑单位经济效益持续优化,在2023年第二季度提供了71.4万次乘车服务,同比增长149%。据海克财经了解,截至2023年6月底,萝卜快跑累计向公众提供的乘车服务达到了330万次。

同样截至2023年6月底,百度Apollo汽车智能化解决方案已在31个汽车品牌、211款车型量产,累计搭载超900万辆;近期百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践。

在智能驾驶上的投入和成效又能推动百度智能云于汽车行业的落地。在2023年5月22日IDC发布的《中国汽车云市场跟踪研究22H2》中,百度智能云在自动驾驶研发解决方案市场中以35.9%的市场份额排名第一,相比2022年同期,实现了162%的超高速增长,在国内汽车云市场中处于龙头地位。

高盛给出的判断是,百度的收益将继续处于向上修正周期,在一系列催化剂的支持下,百度估值倍数将有较大扩张空间。

而我们将时间维度拉远观察可见,深耕技术已为百度夯实了基本面,一切都在指向属于百度的最好时代正在到来。

标签:

相关热词搜索:

[责任编辑:]

相关阅读

最近更新