作者|彭云
编辑|心形边缘
就在智能手机出货量跌至十年来最低点的时候,AI大模式直接给大家带来了新的机会。
最近,摩根士丹利的一份深度研究报告指出,边缘AI技术的发展将为智能手机和PC行业注入新的活力。他们预测智能手机行业将在2024年止跌企稳,逐步迎来复苏,出货量将迎来4%的同比增长。
4%,对于销量频频跌至新低的智能手机行业来说,来之不易。
▲2011-2022年全球智能手机年度出货量统计,来源:Counterpoint。
正如摩根士丹利报告所指出的,今天的AI大模型带来的AIGC浪潮正在深刻地洗礼着智能手机行业。最近短短一个月,小米、vivo、OPPO、三星相继亮相十余款AI机型,从十亿到百亿到1300亿。
值得一提的是,这些大型号几乎都是打着“自研”的旗号,似乎并不是业界讨论已久的“开源版”。
ChatGPT的流行才一年左右。除了荣耀,国内头显手机厂商都把AI大模型技术放到自己的手机里了,这并不令人不快。
毫无疑问手机AI大模型之战已经开始。
▲最近手机厂商AI大机型发布了。
AI大模型可能对各类智能设备的交互范式和服务提供形式产生颠覆性影响,智能手机行业也将深度卷入这场大模型大战。对于各厂商来说,这似乎是一场不能输的战役。
面对如此剧烈的行业变革,厂商如何布局大模型技术,又是如何实现的?为什么厂商会选择在相似的时间点发布,各大机型有何异同?智能手机上使用AI大模型真的是“智能进化”还是“噱头”?我们会深入每一个大型号产品,与厂商相关负责人对话,努力寻找答案。
第一,在手机上用AI大模型真的不是噱头。
ChatGPT诞生之初,人们就在想象它在各行各业的应用。因为ChatGPT的原始形态是用自然语言与人对话,所以当我们把它与智能手机结合起来,就不难想到智能语音助手。当时有很多关于手机智能语音助手是否会被取代的讨论。
但是技术的飞速发展甚至没有给我们思考的时间。还没等我们给出答案,事实就摆在了我们面前。智能语音助手这个词确实已经成为过去。
在AI的大模式来到手机的今天,智能语音助手并没有消失,而是从底层完成了一次“质变”,成为用户接触AI的核心入口之一。他们的名字里也去掉了“声音”这个词。
无独有偶,如今的手机厂商在发布会上都称之为“智能助手”、“智能助手”或“智能助手”。在AI大模型带来的“多模态”能力下,我们与AI的交互不再停留在语音,甚至文字上,交互的形式变得更加多样,AI输出的信息也变得更加丰富。
只是我们在与AI交互的过程中总需要一个“接口”或“入口”,各种智能助手成为了信息输入输出的平台,而背后真正的“大脑”是大AI模型。
说了这么多,在AI大模式的加持下,手机体验有什么改变?
从华为、小米、vivo、OPPO发布的一系列AI机型,以及其落地手机对应的产品和应用服务来看,最直观的变化就是和我们第一次接触ChatGPT非常相似。这个手机上的AI终于变得“聪明”了。
这个聪明可以简单的分为两个方面。一是可以理解,二是可以做好。
要理解这一块,形象地说,在AI这个大模型加入之前,AI的语言理解能力让我们不得不把自己想象成一个AI,用AI的语气说话或者输入文字,语言需要表达得非常清晰准确,不能有错别字或者漏字。
加入AI大模型后,我们不仅可以像正常人一样直接与AI对话,即使我们输入的信息不完整,甚至有错别字,AI也能很好地理解我们想要什么。
手机上的AI真的变聪明了,可以像人一样正常交流,理解我们。
▲华为小易通过自然语言对话设置手机天气壁纸。
但仅仅了解只是第一步,你真正能做的才是最核心的区别。
说到能做什么,这里有一个核心问题——在手机上使用AI宏模型和直接在手机上下载ChatGPT App以及各种基于AI宏模型的App有什么区别?
在此,我们不妨通过几个例子直观感受一下两者的区别。
对于AI模式的手机智能助手,我们可以直接让它帮我们设置各种手机功能,比如换一张符合今天天气的动态壁纸,比如安排一个属于我们的提醒模式,提醒我们在特定的时间以特定的方式做某件事,比如一句话就能快速开启方便残障人士的各种无障碍模式。
▲华为小易设置“晨跑现场”
AI模型可以针对手机的使用进行优化。让AI知道手机的各种功能,也就是说小白也可以成为“玩家”,每一部手机,不同的品牌,不同的操作系统,设置功能的具体方式可能都不一样,这是ChatGPT无法完成的。
再者,在手机使用场景下,有很多能力是ChatGPT不具备的。
比如我们可以让我们的智能助理根据备忘录中的信息写一封明天见面的邀请邮件,也可以让助理根据我们的口头描述直接在我们手机的本地相册中找到一张我在下雨天抱着一只猫的照片。
▲vivo小V助手搜索图
在一些厂商开发的功能中,AI可以学习用户的外貌特征,直接“创造”一些照片。即使我们没有去过一些景点,AI仍然可以在这些地方生成我们的“旅行照片”。
▲小米相册的AI创作图片功能
此外,AI还会根据我们日历中一些关键日期上的标记,提供主动的智能服务,比如在结婚纪念日的前几天,提前向我们推荐一些购物、餐饮和娱乐服务。
▲华为小易在关键节日、纪念日提供主动提醒和服务。
可以说这种本地化、个性化、主动化的智能服务体验,是AI模式在手机上的落地带给我们最直观的感受,也是手机智能助手区别于ChatGPT的主要特征之一。
当然,另一部分直观能力与ChatGPT非常接近,比如文本创建、文本摘要、图像生成等。这些能力也是AI大模型的核心优势,但今天我们对这些能力并不陌生。
▲华为小易进行文字总结。
帮我们写一份餐厅的餐赞,为我们写一句新年的问候,写一份会议纪要的思维导图总结,把一张照片转换成不同风格的图像,或者帮我们写一个简单的程序,生成一些代码。
▲小米AI大模型进行文字创作
综合来说,用一句话总结,ChatGPT能做的,它能做ChatGPT不能做的。AI大型号智能手机的落地,相当于给了大家一个更智能、更有能力的全能助手,与以往的智能语音助手体验完全不同。
二、华米OV的大模特有什么异同?
讲了这么多AI模型在手机中的应用,每个手机厂商的AI模型能实现这些功能和能力吗?各家的大AI模型有什么异同?
从目前发布会上各厂商的演示和实际表现来看,各厂商的大机型在功能性上并没有明显的区别。基本上你能做的我都能做,看不出明显的“没人有我”的优势。
现在各家的做法更像是打好基础,搭建舞台。具体AI大模型如何表现更好?一方面取决于厂商的后续优化,另一方面取决于三方生态的构建。还能有更多的手机app可以应用到这些AI大模型上吗?
值得一提的是,虽然在功能上没有明显的区别,但在AI大型号落地手机的具体形式、参数尺度、型号、自研深度、开源程度等方面,还是有一些差异的。
比如从形式上来说,华为在这里的载体就是自己的美术小助手。在发布会上,华为展示的AI大模型能力基本都是以小美术能力的形式,从知识获取、逻辑推理、任务规划、记忆扩展、工具调用到创意辅助。
与华为类似,vivo和OPPO也以自身智能助手能力的形式展现AI大模型落地带来的变化,比如vivo的蓝心小V和OPPO的小布助手。
小米这边,虽然萧艾同学必然会成为用户接触AI大模型的关键入口之一,但在发布会上,小米强调了AI大模型技术在整个系统层面的应用,尤其是在各类app中的应用。
▲小米在WPS上推出的PPT生成功能。
比如将文字创作的功能应用到输入法上,将写摘要、总结PPT的功能与WPS结合,将AI搜图、创图的能力集成到相册中。
值得一提的是,除了蓝心小V,vivo还发布了一款将以公版App的形式在Android和iOS手机应用市场推出的产品,名为蓝心千问,是一款自然语言对话机器人。
这相当于手机厂商基于自己的AI大模型能力,又做了一个“ChatGPT”。华为、小米、OPPO都没看到vivo。
说完了形式,我们再来看尺度。首先,并不是每个厂商都在发布会上详细介绍了自己AI模型的详细参数、架构和关键特性,所以我们只能从公布的信息中寻找答案。
从发布的机型数量来看,vivo在发布会上提到了六款大机型,是发布数量最多的一款。模型参数从10亿、70亿、130亿、700亿、1300亿到1750亿不等,1750亿已经符合GPT-3.5的参数。
在vivo的规划中,10亿、70亿大规模模型主要用在端侧,语言理解、文字创作、文字总结等能力基本可以实现,而700亿参数大规模模型主要用在云端,可以进行更复杂的角色扮演、知识问答、自然对话。
值得一提的是,vivo的蓝心大机型-7B是目前手机界首款开源大机型,vivo也发布了相应的开发套件BlueKit。
虽然华为在发布新版小艺术的同时并没有介绍盘古大模型,但是在今年的华为开发者大会上,我们可以看到更多关于盘古大模型的详细信息。比如最新的盘古大模型已经迭代到3.0版本,华为也是几个头部手机厂商中最早布局AI大模型,产品迭代相对成熟的一个。
不过华为的盘古大机型并不是专门用于智能终端产品的大机型,更多的是面向行业应用。华为将其定位为“行业大机型”,智能手机只是其应用领域之一。
盘古3.0还有100亿、380亿、710亿、1000亿等几个不同参数尺度的基础大模型。基本涵盖了多模态大模型的知识问答、副本生成、代码生成、图像生成、图像理解等常见且必要的能力。
目前OPPO有三种不同规模的AI大模型:Tiny、Turbo和Titan,其中用于端侧的Tiny参数约为70亿,Turbo和Titan主要用于云端。
虽然OPPO没有明确提到其他大型号的参数,但是在AI大型号测试C-Eval的排名中我们可以看到AndesLM研发的AndesLM-13b,参数130亿。
相对于华为、vivo、OPPO,小米关于自研AI模型的详细信息最少。在C-Eval排名中,我们可以看到13亿参数的小米AI型号MiLM-1.3B和60亿参数的MiLM-6B。
值得一提的是,从目前各厂商发布的机型来看,大型机型登陆手机端的参数规模通常在60-70亿左右,目前最大参数量在130亿左右。这也与高通、联发科等手机芯片厂商发布芯片时提到的信息一致。
从每个模型的特点来看,vivo给出的描述是最详细的,vivo还提出了他们认为一个优秀的大模型应该具备的五个特点,包括大而全、算法强、安全性高、自进化、开源。大主要是指数据规模大,模型参数大,知识丰富,都主要是指场景覆盖要完整,要提供多模态支持。
端云结合也是各种AI机型落地手机的典型特征。目前基本都是采用端云协同的方式落地大模型。按照官方的说法,这主要是因为成本、计算能力、效率、安全等诸多因素。
最后,值得注意的是华为、小米、vivo在发布会上都明确提到了“自研大机型”的概念,而OPPO则使用了“自研”一词,在整个发布会中并未提及“自研”。
在排行榜中,小米和vivo机型的主要研究对象是小米和vivo,而OPPO的主要研究对象是AndesLM。
综合来看,虽然目前各大型号的落地功能没有区别,但在参数、架构、关键特性上可能还是各有侧重。
三、一年实现大模型落地,人才、数据、算力缺一不可。
ChatGPT已经流行了一年多,各个手机厂商能在这么短的时间内实现AI模型在手机上的落地,可见其技术实力。
虽然国内的百模大战、千模大战早已上演,甚至很多玩家已经离开,但相比这些一个个做出“试制品”的创业公司或互联网巨头,华为、小米、vivo、OPPO面对的是数以亿计的终端用户,这背后涉及的技术研发量不可小觑。
说到技术研发,人才肯定是第一位的。
目前,小米和vivo公布了更多具体的R&D团队规模。小米集团总裁陆曾在财报电话会议上提到,小米是2023年4月成立的AI实验室大型模型团队。目前,在人工智能领域约有1200名R&D人员。
相比之下,公布的vivo的AI专家团队在1000人左右。目前AI相关专利超过700项,AI峰会论文超过70篇。
当然,各手机厂商在AI领域的布局要比AI大机型的出现早很多。比如小米就是较早布局AI技术的几家头部手机厂商之一。2016年,小米探索实验室成立,在VR和智能机器人方面的技术开始布局,而我们熟悉的小米萧艾同学智能语音助手也在次年3月诞生。
Vivo也从2018年开始在AI领域进行布局,成立了AI全球研究院和人工智能图谱研究院。截至目前,其13000t多模态数据和2800t中文文本数据已成为AI大模型研发的重要数据资源。
Vivo在发布会上提到,将2800T中文文本数据清洗压缩后产生的15T高质量训练数据用于蓝心模型的训练,这15T数据相当于2.5个中国国家图书馆的藏书。
当然,作为同样在AI领域布局较早的华为,华为云在2020年就开始了盘古大模型的研发,是较早的模型之一。在其2021年4月发布的盘古系列大模型中,包含了数千亿参数的汉语言预训练模型。当时,华为还在现场展示了对话机器人产品。
OPPO方面,从公开信息来看,OPPO可能更侧重于产学研结合,而非自主研发。2018年,OPPO与浙江大学联合成立了创新中心。届时,人工智能已经成为双方的重点技术创新领域,包括机器视觉、嵌入式AI、感知计算等。
2022年,OPPO与中科大共建智能计算联合实验室,AI大模型是其重要研究领域之一。
除了人才和数据,计算能力也是AI大模型开发和落地应用的关键环节。对于目前国内AI芯片市场面临的困境,vivo高层曾在发布会上坦言,他们压力很大,在算力建设和部署上差距很大,高端芯片买不到,需要用更多的技术创新来应对算力差距,提高培训效率。由于芯片的限制,vivo搭建的计算集群规模更大,耗能更多。
可以看到,如今手机厂商的AI机型纷纷落地,其实与各厂商提前多年在AI领域的布局密不可分。各手机厂商智能语音助手多年来在实际应用中积累的数据和研发经验,也成为手机厂商做AI模型的优势。
第四,AI技术的迭代日新月异。大机型会成为国产手机的创新之光吗?
目前AI大模型在手机中的应用还处于初级阶段,很多功能还处于测试状态,并没有真正落地。但从上一篇文章提到的各种功能和模型规模来看,AI大模型在手机中的应用还有很多方向。
头部手机厂商相关技术负责人告诉知止记者,目前AI大模型技术本身及其应用场景都处于快速迭代发展中,从底层AI大模型到上层应用的进一步探索还需要时间。
虽然目前各家的功能并没有明显差距,但在他看来,各家在应用上其实可以发挥不同的作用,因为各家的产品、技术、生态侧重点都不一样。比如华为是鸿蒙系统的生态,最重要的是手机+汽车。小米目前在推广“人车”概念,生态产品规模最大,OPPO和vivo更多是自家生态设备的落地应用。
随着应用场景和主要应用设备的不同,AI大模型对应的调整和技术难度也不同。
业内人士表示,虽然参数数量很重要,但未来随着算法的迭代、训练方法的优化以及更高质量训练数据的应用,在实际应用中对模型参数的依赖会越来越少。
从目前AI大模型在手机上的应用来看,一个“超级助手”+N个应用了AI大模型技术的app的模式已经成为主流。
当然,在未来的技术迭代中空会有很大的差距。比如AI模型,目前离真正的“智能”还很远,尤其是能在本地运行的AI模型。同时,随着未来AI模型的能力越来越强,需要处理的任务越来越复杂,其对芯片计算能力的要求也会更高。
值得一提的是,虽然国内头部智能手机厂商已经积极参与到AI大机型的争夺战中,但作为全球智能手机技术“风向标”的苹果似乎还在观望,或者说是真的慢了。
虽然之前有各种关于苹果AI模式的新闻报道,但苹果内部AI团队动荡,人才频频流失也是不争的事实。对于苹果来说,快速跟进可能“绰绰有余”。
虽然三星上个月也发布了自己自主研发的AI模型“高斯”,但其在手机中的最早应用还要等到明年Galaxy S24系列发布之后。
在技术创新方面,至少在AI大模式的浪潮中,国产手机确实是领先的。[/s2/]
结语:手机机型之战已经开始,好戏还在后头。
从国内的华米OV到海外的三星,智能手机巨头们都在积极的冲进AI大机型的战斗中,智能手机也在AI大机型的加持下经历着新一轮的“智能化”洗礼。当年,智能语音助手没能实现梦想。AI大模型对他们来说似乎是圆的。
但纵观AI大模型在手机上的落地,功能和应用的开发还处于早期,尤其是在主动智能和个性化方面。[/k0/]目前各种手机应用的AIGC功能,大部分还是需要云端大模型的支持,未来大模型本地化还需要时间。
当然,未来苹果的进入也是一大看点。苹果能否赶上甚至搅动行业充满不确定性,但我们可以肯定的是,AI大模式时代已经到来,手机大模式之战才刚刚开始。
未经允许不得转载:科技让生活更美好 » 手机大模型之战,只差苹果了