大模型“暴力计算”时代,中国如何突围算力之困?

2024年3月19日,在NVIDIA 2024 GPU技术大会(GTC)上,黄仁勋带来了搭载B200芯片的GB200 Grace Blackwell超级芯片系统,再次引发了全球对人工智能计算系统的讨论。芯片发布后,英伟达的股价在盘中一度上涨超过5%,随后在盘中回落,并在3月22日的周末以新的收盘价停止上涨。

在过去的两周内,NVIDIA的股价就像坐过山车一样,一次暴跌一次飙升。当它暴跌时,它可能会在一夜之间下跌9000亿元人民币,当它飙升时,它可能会反弹所有跌幅。这无疑反映了外界认为这家公司的前景和估值略有矛盾的观点。

2023年8月,独立投资研究公司CFRA的股票分析师安吉洛·齐诺表示,在未来5-10年内,英伟达可能会成为人类文明最重要的公司。

几个月后,2023年12月,我和一个云计算厂商的朋友出去吃饭,他在这句话后面又加了半句。

-如果美国商务部没有对中国大陆发布GPU禁令,中国就不需要英伟达。

当时,中国大多数公司都买不到NVIDIA在11月刚刚发布的AI芯片H200。即使是上一代H100的阉割版H800也已被美国商务部于2023年10月发布的新一轮禁令所切断。

2023年12月2日,美国商务部长雷蒙多在出席由美国军工联合体牵头的里根国防论坛时非常明确地表示,禁令的目的是封锁中国的计算能力,限制中国开发和训练AI大模型。

第三方数据分析机构IDC发布的《2021-2022年全球计算力指数评估报告》显示,从美国、中国等15个重点国家的数字经济发展情况来看,如果计算力指数(根据计算能力、计算效率、应用水平和基础设施等指标计算)平均提高1个点,国家数字经济和GDP将分别增长3.5‰和1.8‰。

简而言之,在数字经济逐渐开始占据国民经济增长主导地位的历史阶段,计算力资源的水平可以与国民经济直接挂钩。

雷蒙德说,他想阻止中国的计算能力,事实上,他的意思是阻止中国的技术和经济发展。

那么中国的计算产业真的像她想象的那样停滞不前吗?义乌拟永久性禁售槟榔店名单公示

答案是:当然不会。

今天,京东云还在深圳发布了“春风计划”,并设立了“10亿比价基金”。在保证产品竞争力和开放性的前提下,特定云厂商的价格应在最低实际交易单价的基础上降低10%。

算力是未来非常注重成本的行业。它通常不像消费品那样以溢价反映品牌竞争力。算力更像是基础能源,就像水电和煤炭一样。越便宜越能支撑整个社会的高速运转。在当今的竞争环境下,制造商可以宣布长期降价和比价,这对中国的计算行业来说绝对不是坏消息。

AI大模型需要重组算力产业格局

在过去的一年里,我与许多业内人士进行了交流。在国产GPU的使用上,大家都不避讳它没有那么好用的现实。甚至有国产芯片供应商坦言:“性能和发展生态的建设确实有差距。我们不能撒谎,但进展已经非常快了,生态应该共建。”

罗马不是一天建成的。局长这几年一直在说,要在硬指标上赶上世界最先进的芯片产业有多难。GPU也是芯片,想要在短时间内赶上NVIDIA的GPU水平显然是不现实的。

幸运的是,实际输出的计算能力水平绝不是只与GPU挂钩的东西。

ChatGPT在大众层面彻底引爆AI一年后,全世界达成了一个共识:人类的未来将取决于你如何使用AI,而AI发展的水平取决于计算能力。

算力靠什么?

在过去的一年里,许多人认为这是一个芯片。因此,英伟达在2023年成为“世界上最重要的公司”。所有制造大型模型的公司都将开始发送一份草案,说明当它们达到一定规模时,它们已经购买了多少NVIDIA GPUs。

但这只是借助资本市场的误解。

AI大模型是必须要应用的东西,支撑大模型的算力也是如此:这意味着整个算力产业从硬件到软件、到调度、到产业应用的接入,都是一个非常复杂和系统的综合工程。各环节的能耗、效率和成本将直接影响最终算力的实际产出。

最终使用的是计算能力。

过去,大多数知名的计算资源来源是面向市场的云计算供应商和各种技术制造商。然而,随着中国算力产业建设作为数字基础设施建设的一部分被提升到国家战略的高度,中国算力产业出现了新格局。影驰gts250黑将

首先是地方政府。目前,中国有30多个城市正在建设或提出建设智能计算中心,与计算力相关的规划和政策也相继出台。

同时,自2021年以来,中国移动、中国联通和中国电信的资本支出重点逐渐从5G转向计算能力。根据公开招标信息,中国移动将在2021 -2022年采购约21万台服务器。中国电信2022 -2023年服务器集中采购项目总规模超过20万台。这几乎相当于几家大型科技公司每年购买的服务器数量。

各种科技巨头主要利用云计算切入产业链,其中华为、阿里、腾讯和JD.COM是最好的,他们在对接产业方面有自己的独特技能,发展也非常迅速。

其中,地方政府最大的作用是推动建设和提供环境支持;运营商承担了全国算力网络一体化建设的规划任务,各科技巨头在运营和降本增效方面发挥了非常重要的作用。

计算中心建成后如何用好、运营好,是最终能否达到算力建设目的的关键。对于运营商和地方政府来说,这是一个无法回避的问题:他们在系统层面的研发明显不如科技巨头。

换句话说,充分发挥中国智能计算中心实力的最佳方式是合作:不仅要充分发挥具有国资背景的运营商和地方政府的资源调度能力,还要通过华为、阿里和JD.COM等市场化公司丰富的产业对接经验和R&D运营能力,实现算力效率的最大化,从而真正获得新的优质生产力。

计算能力军备竞赛的最大目的是降低成本。

2024年2月29日,阿里云宣布“史上最大降价”,100多款核心产品平均降价20%。它涉及云服务器、大数据实例、对象存储等产品。京东云立即跟进,相当干脆地打出了“就这么滴,比到底!”Slogan甚至在海报横幅上写了一句所有中国人都会非常熟悉的电子商务口号:“如果全网比价,你就输了。”。

一个行业能否在疫情后长期生存下去,关键不在于利润,而在于成本。

今天,人工智能未能迅速颠覆各行业,尤其是各大搜索引擎的核心原因是,今天智能计算能力的成本真的太高了。

互联网行业之所以能够超高速发展,与千行百业深度融合,一个重要原因是规模效应下的增长边际成本不断趋近于零。例如,在社交网络上,在脸书用户从10万增加到100万的过程中,成本增加很少。

但AI不是。每次计算大型模型都会消耗一个算力,这个成本是省不下来的。根据相关研究报告,每次谷歌搜索的成本约为2美分。如果搜索改为大语言模型问答,单次反馈的成本将至少是普通搜索的7倍。根据一次搜索仅转换为一个问题和答案的计算,这笔费用每年也将为谷歌带来数百亿美元的额外支出。

谷歌和微软无法支撑如此高的计算成本,更不用说其他行业的小公司了。没有算力成本的全面降低,AI大规模赋能产业就是一个伪命题。

如今全世界关于算力的军备竞赛本质上只有一个目的:降低算力成本,从而在产业应用中实现生产力的量变和质变。

这就是为什么看到中国云厂商因为降价而再次“卷了起来”,我有点放心了。因为大厂商的降价对行业来说是一个信号:他们已经找到了进一步降低算力成本的方法。这意味着AI为行业带来从量变到质变的拐点又近了一步。

用JD.COM集团技术委员会主席、京东云业务部总裁曹鹏的话说,价格不是全部。只有全面改善产品、价格和服务,云计算才能真正成为“水电煤”,让用户不再担心,全心全意发展业务。

经常看星海的朋友对阿里云都有一定的了解。我们在之前的文章中已经介绍过了,所以我在这里不再重复。京东云是近两年迅速崛起的龙年春晚的技术服务商。据我所知,目前已经有知名银行和券商在使用这一计算解决方案,超大型项目的智能支撑能力也得到了一定程度的验证。

几年前京东云的声音并不响亮,但近年来发展迅速。其看家本领是自研的混合多云操作系统“云船”和统一存储平台“云海”。在国内软硬件结构还比较混乱的时期,给出了具有高兼容性的系统和计算模块,以及离线混合技术和存储-计算分离技术。

这些特征和相应的技术都与京东相关联。COM自己的事业。它拥有数万个自营商品SKU和1500多个物流仓库。如果不制造高度兼容的计算模块,您甚至无法满足自己的需求。同时,由于自身业务需要,京东。COM的自研存储产品起步早于云计算业务,因此未来做“云海”时更愿意开发存储和计算分离的结构是合乎逻辑的。

在AI时代,因为海量数据要同时并行计算,所以在综合算力水平上,存储能力也是一个非常重要的指标,这恰好成为京东云的机会。根据其官方数据,基于存储和计算的分离,京东云的计算资源利用率可以提高30%以上。

云船的vGPU功能可提供一站式GPU算力池化能力,在不增加GPU服务器的情况下支持更智能的使用场景并发处理,GPU利用率提升高达70%,大幅降低大模型的推理成本。

而所有效率的提高都意味着成本的降低。自我管理可能会成就JD。COM对供应链的理解比其他传统互联网制造商要深刻得多。对于那些在行业中等待AI和计算能力赋能的人来说,拥有更了解行业并有助于推动产业升级的玩家当然是受欢迎的。hosts文件内容

美国的智能计算能力建设是硬件驱动的,但并不意味着中国必须走美国的道路。

对于中国来说,软件的开发和落入行业后应用的推广是更具优势的路径。

以京东云为某科技公司打造的智慧计算中心为例。公司基于自身在GPU卡供应链资源方面的优势,计划自建智能计算中心或为其提供整体建设方案。在智慧计算中心的建设过程中,其希望借助云厂商的能力提供全栈技术支持,确保多个智慧计算中心项目的落地和稳定运行。京东云从投资测算、定价模型、IDC选型、硬件配置选型、组网规划、平台能力规划、运营策略等方面提供护航服务。,并将“阿尔法”智能计算模块的高功率密度解决方案应用于智能计算中心的建设,不仅满足了从20kW到100kW/机柜的高密度算力部署需求,还实现了0.07的惊人散热系数。

在摩尔定律因边际成本递增而逐渐失效的时代,硬件层面的算力进化很可能面临瓶颈。应用程序和软件之间的效率竞争将变得越来越重要。

中美在这方面的差距比芯片的差距要小得多。目前,包括京东云在内的各个厂商正在通过提高兼容性,为国产软硬件在计算行业的发展提供充足宽松的环境。据我所知,JD.COM已经兼容了全系列的国产软硬件,并与国内所有主流国产平台做出了兼容、互认和全球无锁的架构。

这种兼容性可以帮助国产硬件在业务场景中开展实际应用和真实测试,为国产硬件创造良好的应用生态环境和体验获取渠道。在硬件处境艰难,还需要时间和发展空之间的阶段,通过软件能力补齐短板是中国计算体系建设中一个非常重要的拼图。

京东云一位内部人士表示,通过对底层平台和业务的全面优化,JD.COM集团已经在多个生产业务中以1: 1的资源替代了非国产芯片。比如我们原来用的是8核非国产芯片,现在用8核国产芯片可以支持同样的流量。

实践是检验进步的唯一标准。

去年6月,王小川去了硅谷,发现美国的一群工程师已经在研究如何连接1000万个图形处理器来构建模型架构,但英伟达每年只生产100万个图形处理器…

然而,美国工程师通常没有申请该行业的经验。一旦他们从技术延伸到应用,王小川的评价是:“能力真的不太好。”

而通过应用实现高速技术扩散恰好是中国人最擅长的领域。从电商到物流,从手机到移动支付,都是非常典型的案例。

即使中国人在英伟达买不到最先进的GPU芯片,但中国推动人工智能赋能产业的努力并不比其他国家慢,甚至比世界上任何其他地方都更全面。

我们曾在《大逃杀中的AI大模型》一文中提到,大模型的商业化终点是行业,而落入行业通常有两个条件:

1.它拥有自己的产业资源,并通过自己的业务辐射和赋能行业;

2.掌握可触达产业资源的平台接口或渠道,通过自身软硬件技术实力助力产业升级。

它也适用于计算机行业。前面提到的JD.COM倾向于第一种,例如京东云的颜夕人工智能开发计算平台,该平台专注于零售、金融和供应链物流,这些都是JD.COM拥有的典型业务。基于多年的积累,JD.COM构建了丰富的行业知识库,并以此为“桥梁”连接底层算力与上层模型开发,无缝衔接从数据准备到模型部署的全流程,并预设了100多个优化工具,一键部署即可释放90%的推理成本。

这里有一个已经初见成效的应用,那就是京东健康基于单词和犀牛自研的大模型“京医千问”。京东健康整合在服务患者过程中积累的高质量健康档案和大规模健康知识图谱,加上大量临床实践指南、最新医学文献和专家知识,将“京医问诊”作为支撑行业应用的底座进行培训。在京东云的支持下,完成从数据准备、模型训练到模型部署的全过程,耗时不到一周。它不仅减少了患者的等待时间,还提高了医生的工作效率,并明显降低了远程医疗的成本,使京东健康互联网医院的日问诊量已超过45万。

第二种类型,也是比较典型的,就是阿里做了一个通用的大模型。目前比较流行的一种做法是嵌入钉钉,依托钉钉本身的平台属性,从底层调动原始数据,对机器人和数字化员工进行提问。切入企业服务领域。

当然,还有一个分类叫华为,这是一个硬件和软件都要硬的模型。通过其优秀的通信硬件技术和配套的软件计算基础设施,已逐步连接到采矿和制造等各种工业系统,并有盘古系列衍生的各种工业模型进行合作。例如,盘古气象模型的研究成果已在国际顶级学术期刊《自然》上发表。

当然,还有一个特殊的百度,它不像JD.COM那样深入产业链和供应链,也缺乏钉钉和飞书等杀手级企业应用。目前,通用模型文心一言已经推出,基于营销需求的AI数字人也已实现;此外,百度的重中之重是自动驾驶。

汽车行业可能是除了大模型行业本身之外最迫切需要计算能力的行业。自动驾驶的视觉解决方案必须处理数量惊人的视频数据,现在自动驾驶已经进入了一个没有图形的时代,迫切需要智能驾驶。

这就是为什么特斯拉从一大早就开始制造自己的芯片和超级计算,现在小鹏已经制造了自己的智能计算中心。

虽然JD.COM不生产自己的汽车,但它在无人仓储和物流方面积累了很多,并在这方面取得了很大进展。举个例子,我知道国内一家从事车联网和重卡干线自动驾驶模型研发的自动驾驶科技公司,使用的是京东云提供的AI训练平台、存储、计算和网络的整体公有云解决方案。

人类和科技命运的交汇点

第一次工业革命的核心是马力,帮助人类解放了交通、纺织等行业的生产力;第二次工业革命的核心是电力,电力带动了冶金、钢铁、重工业等耗能行业的爆发式增长,再次释放了生产力;第三次工业革命的核心是传递信息的能力。从3G到5G,成为我们这一代人见证的传奇,生产力以互联网的形式提升到了一个新的高度。

第四次工业革命的核心将是计算能力。它将通过AI和大数据对全社会和全行业的生产力和生产关系带来颠覆性的进步。即使这种成本量变引起质变的时刻尚未到来,也只是时间问题。

对于今天的中国来说,我们的缺点很明显:发展时间太短;硬件水平相对落后。

但是,我们也有自己的解决方案:硬件不够,软件一起来。中国是一群强大的软件制造商,可以通过软件的调度和支持功能帮助缩小差距。

产业升级和算力应用的实践将进一步带来产品迭代和技术扩散,这是中国破局的利器。

我曾在《大国之锁》一书中把中国互联网的崛起称为“14亿人的胜利”。庞大的用户群体带来了高频的应用、海量的数据反馈、庞大的资金以及极其广阔的应用场景和商业前景。

这种通用层和应用层的相互反哺,一旦滚雪球就会爆发出巨大的能量。这是中国在AI时代的独特优势。它也是一张通往未来的车票,是中国国运和命运的关键节点。

所有在中国建设数字基础设施的制造商、地方、部门甚至普通人都在打一场战争,从西方世界手中夺回中国的发展权。

您可能还喜欢...