为企业打造数字分身!解密联想的一大关键挑战、三大硬核技术


作者|程倩

编辑|沙漠阴影

今天,联想集团发布2023/24财年第二财季业绩,整体营收达到1044亿人民币,净利润近20亿人民币,连续两个季度增长。

其中,IDG(智能设备业务)PC出货量市场份额近24%;SSG(解决方案服务业务)营收和营业利润再创新高,联想集团正在打造混合AI专业服务;可为生成式人工智能全生命周期提供服务的ISG(基础设施解决方案业务)受到多重风险制约,存储业务市场份额仍升至全球第三

众所周知,生成式人工智能带来的产业变革已经席卷全球各行各业,由此引发的技术变革也成为当前业界关注的焦点。

10月24日,在联想创新科技大会上,联想集团提出了AI for All的战略。在联想集团董事长兼首席执行官杨看来,AI for All就是让AI惠及每一个人。

同时,在联想创新科技大会上,联想集团展示了AI设备产品组合,并阐述了其对生成式人工智能时代的理解——个人和企业人工智能双胞胎。

在本次财报发布之际,联想集团还创新性地发布了一段视觉科普视频,在展望生成式人工智能下一个里程碑的同时,用AI重塑Enterprise Twin,同时层层拆解其对AI行业的深刻理解。

在这个节点上,智东熙有幸与联想研究院人工智能实验室业务与运营总监陈刚、联想研究院人工智能实验室主任王就降低大模型培训成本等话题进行了对话,深入探讨了联想集团如何把握AI发展与落地的重要突破口。

第一,AI很快在重塑企业。培训模式问题的解决方案是什么?

自去年11月底以来,生成式人工智能引发的技术创新愈演愈烈,工业热情被充分点燃。在空之前这场迫在眉睫的竞争中,以企业为主体的典型代表已经跃跃欲试,试图在新兴技术浪潮中抢占先机。

这场风暴的起点最早可以追溯到人类“火种”的诞生。此后,生产力工具的每一次变革都推动了社会发展。几十万年代代相传。如今,在深度学习技术的驱动下,AI在人类生产力的变革中发挥着重要作用。

火、钟、汽车…短短20多秒,视频生动地还原了火焰的物理效果,同时身临其境地带着观众在不同的背景中来回穿梭,最终让深度学习神经网络“点燃”。

产业转型以来,企业成为生成式人工智能下一个里程碑的重要主体。这是今年联想集团在联想创新科技大会上提出的企业孪生概念。

企业在AI世界的数字化身中能做什么?首先,它具有AI强大的学习和表达能力,可以基于企业专属、私有的知识进行训练;其次,可以为之前严重依赖人类经验的任务提供数据和清晰的逻辑;最后还能以文字、图片等形式输出与企业商业策划相关的内容。

视频中建立在城市中大大小小的建筑和上千家企业上的视觉数字形象是最恰当的体现。

然而,就像图中的黑匣子缓缓旋转,隐隐散发出一点微光,企业在热切拥抱AI的同时,需要深厚的技术功底和高瞻远瞩的行业视角,真正突破黑匣子,感知AI给企业自身带来的颠覆性革命。这一点尤为关键。

第一个黑盒是“训练模型”。计算能力需求飙升的背后是真金白银的AI芯片,很少有公司能独立支撑如此大的支出。

大规模模型训练的三大关键要素是计算能力、算法和数据,其中数据也是“Enterprise Twin能真正听到企业完整的独立思考和内心独白”的关键,是打造其大脑的重中之重。

可以看到,市面上大模型参数的规模是几百亿、上千亿,转化为运营、生产、销售的每一个细节。

视频中以手机和民用飞机发动机的叶片为例,在零件可视化的同时,清晰展示了背后庞大的数据规模。当手机被一层一层剥离,每个生产环节中的信息都可能转化为数据;发动机上的叶片还涉及到数百万个零件的供应链系统。

海量数据的处理,数月的培训时间,返工的风险,都是摆在企业面前的难题。

但可以肯定的是,企业主动拥抱大模式是必然趋势,联想集团为这场不可预知的创新革命点亮了指路明灯。

二、企业数字头像普及的杀手锏:让模型可用、好用、好用。

这是联想自主研发的AI开发运营平台提炼AI大师,涵盖了打造Enterprise Twin的所有流程。

爱联大师拥有图像识别、语音识别、物体检测等九大基础模型,层层剥离模型训练的所有环节,不仅包含所需的庞大数据,还能灵活处理企业业务不同环节所需的多模态、多语言数据。

针对企业培训模式的核心痛点,结合AI大师的能力,联想集团将面向企业的超脑培训模式总结为三个要点,即保证被培训的模型准确可用,培训成本可控,能够摆脱通用模型的千亿级庞大身躯

技术路径、文案、视频内容的结合,呈现了联想集团在帮助企业降低大模特培训成本方面的核心思路。

在保证训练好的模型的准确性和可用性方面,一般来说,为了保证知识的广度,通用模型会预加载综合学科、语料库等基础数据,AI高手会根据具体行业和企业实际需求进行筛选。

另一个关键是如何让企业尽快发现模特培训中的问题。基于此,联想集团制定了培训和测试的流程。王解释说,大模型的训练和测试要交替进行,可以通过测试中间环节大模型的表演效果来综合判断实际效果。如有问题,将及时停止审查。

此外,为了给企业在大规模模型训练时的数据匹配提供参考,联想集团将自己采样和抽取的常用操作集成到框架中,可以帮助企业按照一定的规则从大数据集生成自己的数据公式。

王表示,由于数据质量对大模型的准确性影响很大,联想集团人员正在研发一种可视化的方式来呈现混乱的数据,便于企业筛选和剔除劣质数据,从而进一步提高模型训练的效率。

其次,更关键的是降低培训成本。联想集团开发了一个 LLLM大模型框架,专门进行大模型的二次预训练和微调,其中模型可以通过3D并行分布式训练方案中的流水线并行、模型并行和数据并行更快地运行。

通过视频中可视化的数据、服务器、GPU层层剥离该方案的实现路径,并通过动态的具体操作过程说明其在降低大模型训练成本方面的意义。

王表示,联想已经将他们在加速预训练和微调方面的经验整合到了LeLLM大模型框架中,这个框架也正在整合到AI master平台中。

最后一步是剪枝,一种帮助企业摆脱一般大模型千亿参数庞大身躯的技术。剪枝可以剔除大模型中与企业无关的参数,从700亿到70亿甚至10亿。

王介绍,他们有两种方案,一种是量化,将浮点数从32bit转换为16bit、8 bits或4 bits,从而达到大模型缩小数倍的目的;由于大模型内部与人脑相似,存在视觉、听觉等分离的区域,所以他们针对某个场景,尝试将无关区域切掉,观察其对大模型精度的影响,这也是他们的第二种方案。

归根结底,联想集团要做的是提高企业培训模式的成功率,降低成本。之后大模型训练、压缩、推理、计算设施等一系列环节已经完成,意味着企业已经有了拥抱AI的信心。

第三,联想“内生外化”的心态,为企业拥抱大模式铺路。

联想期待生成式人工智能的下一个里程碑,用AI重塑Enterprise Twin的背后,是其多年技术和经验积累的证明。

其实AI大师平台的研发可以追溯到2016年,现在已经迭代到6.0版本。这个平台是联想集团和企业客户在AI开发过程中的经验“集大成者”。陈刚说,提炼AI高手的路线很清晰,就是AI训练推理一站式平台。之前版本和之前版本的区别在于,AI炼法师主要是针对中小型号的。去年大机型爆炸后,联想集团迅速整合了其在大机型领域的工程方法。

除了技术,还有联想一贯的“内生外化”的思路。

基于上述培训方法,联想集团在公司内部创建了一个大规模的模型供当地试用。王透露,联想集团部分业务部门可以直接登录,与大模型进行对话,或者调用API实现企业级客服助理、知识管理等应用。

如今,这部分能力正在联想内外爆发出巨大的生命力。陈刚说,对于联想来说,他们自己就是大机型的第一批用户。因此,联想集团在积极推动内部产品迭代升级的同时,也在积极将这部分能力外化。

王说,联想集团这背后的核心理念主要集中在两点。一是不是任何一家公司都有从零开始训练大模型的能力,二是进一步提升计算能力的有效利用率,让企业少走弯路。

这也是联想集团在生成式人工智能行业变革之际,积极加速AI普及的有力举措。

结论:联想加AI+计算,带动爱普会。

如视频所示,生产力工具通过几十万年薪代代相传,现在他们的火炬已经传到了AI身上。生成式人工智能强大的生成和理解能力,不断拓宽了其在数千个行业的应用边界。目前,由AI驱动的各种应用正在改变人们的工作、生活和学习。

联想自2017年开始智能转型布局以来,积累了大量技术,拥有从口袋到云的全产品组合和能力。目前已经进入AI战略收获期的联想,将围绕计算和AI两大关键“锚”技术,加速AI的普及。