大模型之争:华为暂时领先苹果
在人工智能的浪潮下,所有应用都值得用大模型重做一遍。这种观点已经逐渐在全球范围内得到认可。而在这个趋势中,华为成为手机行业中首个给出大模型具体落地时间表的厂商。
近期,华为的HarmonyOS4.0系统接入了盘古大模型能力,使得华为手机的语音助手小艺成为首个具备AI大模型能力的智能助手。按照这个进度,即将在下半年发布的华为Mate60系列也将顺利搭载大模型能力,并有望成为对抗苹果iPhone15系列的一大卖点。
在大模型之前,5G芯片一度被视为华为对抗iPhone15新品的秘密武器。然而,尽管有消息称华为5G手机有望在今年10月份回归,但是其推出时间仍面临诸多不确定性。高通和联发科已经表态,称尚未获得美国政府批准向华为出售芯片组。因此,如果华为5G手机真的回归,很可能是通过与中芯国际合作实现彻底的国产化替代方案,其制程技术最多只能达到7nm水平,相比iPhone15搭载的3nm技术在技术迭代上差了两个时代。
相比落后的5G芯片现状,在大模型上,华为却实实在在领先了苹果一筹。尽管苹果CEO库克也认可人工智能在产品中的重要性,但是苹果对大模型的开发却显得颇为谨慎。据彭博科技记者马克·古尔曼爆料,苹果内部正在悄悄研发AI产品,并建立了自己的大模型框架“Ajax”,但苹果暂时还没有向消费者发布“苹果GPT”的计划。大模型的普及和应用不仅会改变人们的生活方式,也会对市场竞争格局产生重大影响。作为又一次新的产品变革机遇,大模型会成为推动国产手机厂商走向大众化的“全面屏时刻”,还是囿于小众的“折叠屏困境”,仍有待观察。不过,可以肯定的是,直接内置在手机系统中的大模型产品,相比在云端处理数据的APP,具有更强的隐私安全保障。在今年3月,ChatGPT的一个开源库的bug漏洞引发了缓存问题,最终导致上亿ChatGPT Plus用户的支付信息泄露,包括姓名、电子邮件地址、信用卡号码的后四位数字和信用卡过期日期等。为此,美国联邦贸易委员会在7月份开始追查ChatGPT是否违反消费者保护法,并要求其提供大量记录,涉及处理个人数据、向用户提供不准确信息的可能性以及对消费者造成损害(包括声誉损害)的风险。
为了打消信息泄露的担忧,手机端的本地化部署应运而生,这使得用户可以更放心地提供更多个人数据给大模型。这也是手机自带大模型产品的第二重优势,即打造真正的个性化私人助理。此外,手机自带的大模型产品具有更稳定的运行环境。
今年4月份,ChatGPTPlus被爆因“需求量过大”导致算力资源出现缺口,暂停付费。借助本地化部署,手机自带的大模型将大大削弱对云端算力资源的依赖程度,从而避免“宕机”事件的发生,甚至还可以做到在断网情况下,离线运行。
语音助手成为手机厂商落地大模型能力的优先级入口。在大模型能力加持下,语音助手可以帮助用户自动生成文案、自动编写回复邮件、自动生成文章摘要、自动翻译等。甚至借助插件功能,大模型加持下的语音助手还能完成跨APP的功能调用,如调动地图类应用、旅游类应用和天气类应用等,帮助用户制定一个出行计划或者预定餐厅等。
相比十多年前诞生的一批语音助手,大模型仿佛一针催化剂,直接带领Siri们进化到了2.0版本,有望解决人们常抱怨语音助手“人工智障”的难题。
当ChatGPT问世后,微软CEO萨蒂亚·纳德拉曾吐槽道:“无论是Cortana、Alexa、Google Assistant还是Siri,这些语音助手笨得像块石头。”据媒体爆料,苹果工程师希望将大模型与Siri结合,目标是推出更聪明的Siri。
人工智能专家丁磊博士指出,上一代语音助手不智能的一大原因是背后的技术体系不同。Siri1.0版本可以视为是决策式AI,主要工作是对已有数据“打标签”,对不同类别的数据做区别,一旦外部请求超出既有标签库,语音助手就会回复“我回答不了”或“我还在学习”等托底式回答,以延续对话。而Siri2.0版本则是生成式AI,会在归纳分析已有的数据后,“创作”出新的内容,实现“举一反三”的效果,在延续对话的同时,还能兼顾用户的使用体验。除了华为和苹果,许多其他手机制造商也对在大模型领域进行了积极的投资和开发。
小米是华为之外对大模型最为重视的手机制造商之一。今年4月份,小米正式组建了一个规模达30余人的大模型团队,并计划在今年三季度将其产品落地。
另外,OPPO也被爆出正在基于阿里大模型,打造手机端的大模型产品。荣耀CEO赵明也表示,未来将率先将大模型引入手机端。
更令人惊讶的是,三星甚至考虑将其手机默认搜索引擎从谷歌更改为微软必应,以抢先在手机上搭载大模型产品。为了挽回三星的出逃之心,谷歌正在尝试对现有搜索引擎进行升级,加入大模型能力,同时从系统底层融入大模型产品。
今年5月份,谷歌发布的新一代大模型PaLM2中,包括了一个最小参数级的壁虎(Gecko)方案。按照谷歌CEO皮查伊的说法,“壁虎”将在手机上运行,且速度足够快。今年下半年,谷歌旗下新款Pixel机型中将融入最新的PaLM2大模型壁虎版。
除了系统开发商的努力外,芯片厂商也在为手机使用大模型而努力。联发科预计今年10月发布的天玑9300将支持大模型运行,而高通则表示,年内将能够支持参数达100亿的生成式AI模型在手机上运行。高通高管表示,“100亿-150亿参数级别的模型可以覆盖绝大多数生成式AI的用例。如果终端已经可以支持这一参数级别,那么运算可全部在终端上进行,无需云端处理运算。届时手机会成为真正的个人助理。”此外,高通还计划与Meta合作,在2024年推出“手机版Llama2”,帮助客户构建智能虚拟助手、生产力应用、内容创作工具和娱乐等用例。相比云端千卡、万卡并行的集群服务器算力,智能手机本地化部署虽然具有便携性和实时性的优势,但算力扩张方面却受到了限制。
Meta开源的Llama大模型最小版本也有70亿参数,远远超出了现有智能手机的内存和处理能力。因此,部分模型只能在手机闪存中运行,导致反应速度缓慢。
此前,有开发者尝试将Llama大模型移植到手机上,但反馈过程最长需要等待十分钟以上,极大地影响了用户体验。
为了提高反馈效率,开发商开始采取一系列措施来瘦身手机端的大模型,包括但不限于剪枝、量化、蒸馏等手段。这些方法旨在尽可能减少模型所需的资源和能耗,同时保持尽可能高的精度。
然而,即使在瘦身后,主动降低了精度,手机端的大模型仍然面临着生成虚假内容的问题。丁磊博士指出,目前的大模型产品,如ChatGPT等,生成的内容仍存在很多错误和逻辑不清的情况,部分场景下无法精确到执行层面被直接应用。
如果手机端的大模型频繁出现错误,为用户制定的出行计划或餐厅预定信息频频出错,势必会影响用户的使用频率。这方面,ChatGPT已经提供了前车之鉴。
第三方网站SimilarWeb的监测数据显示,今年6月份,ChatGPT的网站与移动客户端的全球流量环比下降9.7%,这是自2022年11月30日发布以来,ChatGPT首次出现流量负增长。
在前OpenAI科学家肯尼斯·斯坦利看来,当前的大模型产品还没有达到iPhone时刻。“生成式人工智能无疑已经席卷了世界,确实有人每天都在使用它,但我认为我们仍然处于探索阶段,正在弄清楚我们如何个体地使用它。如果我们都找到了一个非常强烈的理由去随时使用它,那应该将会是iPhone时刻。”