大模型之争：华为暂时领先苹果

ai导航-热门ai工具网友投稿2年前 (2024)更新热门ai平台网友投稿收录

在人工智能的浪潮下，所有应用都值得用大模型重做一遍。这种观点已经逐渐在全球范围内得到认可。而在这个趋势中，华为成为手机行业中首个给出大模型具体落地时间表的厂商。

近期，华为的HarmonyOS4.0系统接入了盘古大模型能力，使得华为手机的语音助手小艺成为首个具备AI大模型能力的智能助手。按照这个进度，即将在下半年发布的华为Mate60系列也将顺利搭载大模型能力，并有望成为对抗苹果iPhone15系列的一大卖点。

在大模型之前，5G芯片一度被视为华为对抗iPhone15新品的秘密武器。然而，尽管有消息称华为5G手机有望在今年10月份回归，但是其推出时间仍面临诸多不确定性。高通和联发科已经表态，称尚未获得美国政府批准向华为出售芯片组。因此，如果华为5G手机真的回归，很可能是通过与中芯国际合作实现彻底的国产化替代方案，其制程技术最多只能达到7nm水平，相比iPhone15搭载的3nm技术在技术迭代上差了两个时代。

相比落后的5G芯片现状，在大模型上，华为却实实在在领先了苹果一筹。尽管苹果CEO库克也认可人工智能在产品中的重要性，但是苹果对大模型的开发却显得颇为谨慎。据彭博科技记者马克·古尔曼爆料，苹果内部正在悄悄研发AI产品，并建立了自己的大模型框架“Ajax”，但苹果暂时还没有向消费者发布“苹果GPT”的计划。大模型的普及和应用不仅会改变人们的生活方式，也会对市场竞争格局产生重大影响。作为又一次新的产品变革机遇，大模型会成为推动国产手机厂商走向大众化的“全面屏时刻”，还是囿于小众的“折叠屏困境”，仍有待观察。不过，可以肯定的是，直接内置在手机系统中的大模型产品，相比在云端处理数据的APP，具有更强的隐私安全保障。在今年3月，ChatGPT的一个开源库的bug漏洞引发了缓存问题，最终导致上亿ChatGPT Plus用户的支付信息泄露，包括姓名、电子邮件地址、信用卡号码的后四位数字和信用卡过期日期等。为此，美国联邦贸易委员会在7月份开始追查ChatGPT是否违反消费者保护法，并要求其提供大量记录，涉及处理个人数据、向用户提供不准确信息的可能性以及对消费者造成损害（包括声誉损害）的风险。

为了打消信息泄露的担忧，手机端的本地化部署应运而生，这使得用户可以更放心地提供更多个人数据给大模型。这也是手机自带大模型产品的第二重优势，即打造真正的个性化私人助理。此外，手机自带的大模型产品具有更稳定的运行环境。

今年4月份，ChatGPTPlus被爆因“需求量过大”导致算力资源出现缺口，暂停付费。借助本地化部署，手机自带的大模型将大大削弱对云端算力资源的依赖程度，从而避免“宕机”事件的发生，甚至还可以做到在断网情况下，离线运行。

语音助手成为手机厂商落地大模型能力的优先级入口。在大模型能力加持下，语音助手可以帮助用户自动生成文案、自动编写回复邮件、自动生成文章摘要、自动翻译等。甚至借助插件功能，大模型加持下的语音助手还能完成跨APP的功能调用，如调动地图类应用、旅游类应用和天气类应用等，帮助用户制定一个出行计划或者预定餐厅等。

相比十多年前诞生的一批语音助手，大模型仿佛一针催化剂，直接带领Siri们进化到了2.0版本，有望解决人们常抱怨语音助手“人工智障”的难题。

当ChatGPT问世后，微软CEO萨蒂亚·纳德拉曾吐槽道：“无论是Cortana、Alexa、Google Assistant还是Siri，这些语音助手笨得像块石头。”据媒体爆料，苹果工程师希望将大模型与Siri结合，目标是推出更聪明的Siri。

人工智能专家丁磊博士指出，上一代语音助手不智能的一大原因是背后的技术体系不同。Siri1.0版本可以视为是决策式AI，主要工作是对已有数据“打标签”，对不同类别的数据做区别，一旦外部请求超出既有标签库，语音助手就会回复“我回答不了”或“我还在学习”等托底式回答，以延续对话。而Siri2.0版本则是生成式AI，会在归纳分析已有的数据后，“创作”出新的内容，实现“举一反三”的效果，在延续对话的同时，还能兼顾用户的使用体验。除了华为和苹果，许多其他手机制造商也对在大模型领域进行了积极的投资和开发。

小米是华为之外对大模型最为重视的手机制造商之一。今年4月份，小米正式组建了一个规模达30余人的大模型团队，并计划在今年三季度将其产品落地。

另外，OPPO也被爆出正在基于阿里大模型，打造手机端的大模型产品。荣耀CEO赵明也表示，未来将率先将大模型引入手机端。

更令人惊讶的是，三星甚至考虑将其手机默认搜索引擎从谷歌更改为微软必应，以抢先在手机上搭载大模型产品。为了挽回三星的出逃之心，谷歌正在尝试对现有搜索引擎进行升级，加入大模型能力，同时从系统底层融入大模型产品。

今年5月份，谷歌发布的新一代大模型PaLM2中，包括了一个最小参数级的壁虎（Gecko）方案。按照谷歌CEO皮查伊的说法，“壁虎”将在手机上运行，且速度足够快。今年下半年，谷歌旗下新款Pixel机型中将融入最新的PaLM2大模型壁虎版。

除了系统开发商的努力外，芯片厂商也在为手机使用大模型而努力。联发科预计今年10月发布的天玑9300将支持大模型运行，而高通则表示，年内将能够支持参数达100亿的生成式AI模型在手机上运行。高通高管表示，“100亿-150亿参数级别的模型可以覆盖绝大多数生成式AI的用例。如果终端已经可以支持这一参数级别，那么运算可全部在终端上进行，无需云端处理运算。届时手机会成为真正的个人助理。”此外，高通还计划与Meta合作，在2024年推出“手机版Llama2”，帮助客户构建智能虚拟助手、生产力应用、内容创作工具和娱乐等用例。相比云端千卡、万卡并行的集群服务器算力，智能手机本地化部署虽然具有便携性和实时性的优势，但算力扩张方面却受到了限制。

Meta开源的Llama大模型最小版本也有70亿参数，远远超出了现有智能手机的内存和处理能力。因此，部分模型只能在手机闪存中运行，导致反应速度缓慢。

此前，有开发者尝试将Llama大模型移植到手机上，但反馈过程最长需要等待十分钟以上，极大地影响了用户体验。

为了提高反馈效率，开发商开始采取一系列措施来瘦身手机端的大模型，包括但不限于剪枝、量化、蒸馏等手段。这些方法旨在尽可能减少模型所需的资源和能耗，同时保持尽可能高的精度。大模型之争：华为暂时领先苹果