文丨项贺
出品丨牛刀财经(niudaocaijing)
百模大战已经实质性进入到下半场。
尽管上半年推出大模型的企业超过80家,但能继续迭代、坚持投入的肯定会越来越少。
成本就是一道越不过的坎儿。
语言模型的训练并不是普通公司所能承受的,资料显示跑通一次100亿以上参数量的模型,算力至少需要1000张GPU,按照一张GPU五万元的市场均价计算,1000张GPU意味着单月至少5000万的成本。
被成本、效率、落地击垮,大模型将会越来越是大企业的竞争。
百模大战是技术储备战,也是生态对抗战,国内百“模”大战下,究竟谁实力最强?无论是算法模型还是应用,百度都走在了大模型的领先地位。
1、百度拿下三个第一
综合评分第一,算法模型第一,行业覆盖第一,这是百度大模型最新的战绩。
全球领先的IT市场研究和咨询公司IDC最新发布的《AI大模型技术能力评估报告,2023》显示,百度文心大模型3.5拿下12项指标的7个满分,并以综合评分、算法模型和行业覆盖三个绝对第一体现了百度文心大模型的基础技术深度和产业应用覆盖广度。
考量大模型的能力,现在必须要考量两个方面,一个是技术要牛,如果还有代际差距,那后续的追赶希望并不大;一个是要落地要快,大模型才是真正的烧钱,如果还希望凭借后发优势,那无论对于怎样体量的企业都有巨大的压力。
IDC的主要考核也是围绕产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。
产品技术能力中,“算法模型”维度是重中之重,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。
只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。
行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。
“算法模型”、“行业覆盖”两个核心指标有其内在的关联性,行业覆盖的广度是算法模型通用领先性的集中体现,也将为算法模型能力持续提升提供源源不断的正向反馈,形成持续迭代提升的飞轮。
本次评估中,百度文心大模型两项指标在众多厂商中均获得唯一满分,充分体现了文心大模型产品技术最为领先、行业应用最为广泛深入。
2、百模大战,为什么是百度?
不久前,百度正式发布文心大模型3.5版本,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,新版本在效果、功能、性能全面提升。
百度AI大模型整体竞争力位于领先水平,是这场大模型技术突破者和应用引领者。百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。
为何百度能在此次大模型的评估中脱颖而出,其实理由也很简单,那就是深度的技术积累和广泛的应用触角。
其实AI对于国内的科技企业也并不陌生。
早在2018年前后,中国的科技企业就大范围地布局AI,从新闻资讯到电商平台,AI在国内互联网产品中的含量并不低。
当然,现在很多的大模型企业,也和AI热潮下的企业有较高的重合。
此后,AI迎来泡沫,商业化程度并未达到预期,成为很多AI企业此后对技术路径选择差异的因素。
我们看百度之所以能够在国内以极快的速度推出大模型,并在此次国内主流大模型14家厂商参与的评估中获得领先,也源自于百度对于大模型的持续技术投入。
早在chatGPT火遍全网之前,百度就开始对生成式AI进行技术投入。
百度自2019年开始深耕预训练模型研发,先后发布知识增强文心系列模型。
尤其是百度的数字人、智能整合搜索等方面有长期、深度的积累,这对于将技术和经验迁移到大模型上有积极的帮助。
比如百度和浦发联合开发的数字人,早在2019年就上线开始面向消费者服务。
可以说,百度持续在大模型和相关技术进行投入,才给自己积累和奠定了基础。
3、技术和应用生态的对决
之前傅盛和朱啸虎关于创业公司是否值得投入大模型进行激烈的辩论,实际上,核心在于大模型的研发和应用,都是一场资金和资源的较量。
业界测算,gpt-3单次训练成本至少460万元。所以国内也只有百度等为数不多的几家公司有这个财力和人力去进行研发。
近些年来,百度作为国内研发投入最多的科技公司之一,其技术上的投入和积累是当下能够领跑大模型的基础。
财报显示,近十年累计研发投入超过 1000 亿元,2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。如此高的研发投入,在国内的互联网大厂中凤毛麟角。
另外,持续的技术投入,可以给百度带来太多的软硬件的技术领先。
文心大模型取得“第一”还得益于百度“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。
百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理;飞桨与文心的协同优化,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍;知识增强作为文心大模型的核心特色之一,实现了更高的效率、更好的效果、更强的可解释性。
目前,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度有超过750万开发者基础,20万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。
IDC评估结果显示,百度文心大模型在行业覆盖上获得唯一满分成绩,在能源、金融、教育、医疗等领域已经实现广泛业务布局和落地场景探索。
此外,文心大模型已经拥有中国最大的产业应用规模,目前有15万家企业申请接入文心一言测试。百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果。
AI大模型已经从拼参数发展到拼应用,进入大规模可复制的产业落地阶段。
百度文心大模型源于产业实践,服务于产业实践,业内首次提出了行业大模型的落地思路,联合国家电网、浦发银行、泰康、吉利、哈尔滨市、深圳燃气、TCL、上海辞书出版社等企业单位,合作发布了11个行业大模型,是业内最早和广泛深入推动行业大模型的厂商。
原文标题 : 百度拿下三个第一:总分第一、算法模型第一、行业覆盖第一