文丨邱庭编辑丨程述白2011年10月4日,蒂姆·库克(Tim Cook)第一次以苹果CEO身份主持发布会——
这也是Siri在苹果的第一次亮相。十五年后,2026年6月9日,库克站在WWDC(苹果全球开发者大会)的舞台中央,外界普遍认为这是他任内最后一届开发者大会。
Siri又一次成为了焦点。只是,它已经不是当年的Siri了。
尽管受制于监管要求,新版Siri以及其他新的苹果AI智能功能还无法在中国大陆地区上线,但它还是让不少人兴奋了起来。
在一镜到底的演示中,这个“新siri”能在绝大部分场景下直接调用、索引并读取聊天记录,支持跨应用执行任务,还能通过自然语言生成浏览器插件与快捷指令。
但驱动它思考的,已经不完全是苹果自己的能力。发布会上,苹果首次明确将Google Gemini纳入Apple Foundation架构。
据彭博社报道,苹果为此需每年向Google支付10亿美元。
● 苹果的第三代Apple Foundation Models(AFM)。
图源:发布会截图与此同时,苹果同步推出Core AI框架,ChatGPT、Claude等第三方模型也能借此接入Siri和苹果系统。
过去十五年里,Siri始终代表着苹果对人工智能的理解:封闭、自研、谨慎,一切能力都生长在苹果生态内部,2024年苹果首次提出的Apple Intelligence构想也是全自研AI架构。
但在AI模型的竞赛里,苹果没能跑在前列。十五年前,Siri开启了语音助手时代;十五年后,它再次成为苹果命运转折点的见证者。
只是这一次,苹果不再是先锋,而是追赶者了。新的Siri今年WWDC上,苹果用了大半场发布会的时间讲AI。
站在舞台上的,是迈克•洛克威尔(Mike Rockwell)。
这位长期负责Vision Pro系统架构的高管,在2025年初接手了Siri重构项目。
苹果展示了一组新的AI同心圆架构:用户位于中心,中层是多模态与执行工具,最外层则是Siri、软件与系统生态。
● 苹果新的AI架构。图源:发布会截图Siri的新功能可以大致分为屏幕感知、图片理解、文字处理、应用协同等几大部分。
用户不再需要在不同应用之间来回切换:刷到一个图片,可以直接识别图片地点;看到一个地址,可以直接询问Siri规划路线;浏览网页时,可以直接选中文字向Siri提问;收到活动邀请,可以直接让Siri识别时间并加入日历。
这种变化的重点不在更聪明,而在更丝滑与便捷。在Mac上,用户可以直接选中多个文件提问,无需上传;在iPhone上,可以通过摄像头直接向Siri提问现实世界中的物体;在照片、邮件、备忘录、Safari等应用中,AI被直接嵌入原有工作流,给拍摄好的照片重新设置构图、整理浏览器标签页、把校对和优化功能嵌入键盘随时调用。
● Siri在iPhone与Mac端的调用。图源:发布会截图更重要的是,旧版Siri的逻辑是单轮问答,而新版系统则开始尝试理解用户“正在做什么”,它可以根据聊天对象与过往聊天记录采用不同的交谈语气,可以基于邮件内容主动提示下一步操作,或在跨应用场景中预判用户意图,从而提前给出执行路径。
苹果试图重新定义Siri,把它从一个客服转化为调度中心,并推出了独立的Siri应用。
这也意味着苹果推翻了很多以前的坚守:原本不想做聊天机器人,现在做了;原本对照片使用AI修图持保留态度,现在也加了。
过去,苹果在Siri到底使用自研模型还是外部模型的问题上摇摆不定。
而现在,团队放弃了完全自研Apple Foundation Models的方案,转而选择整合外部技术。
在洽谈合作的Google、Anthropic PBC和OpenAI三家公司里,苹果最终选择了Google。
如今的第三代Apple Foundation Models包含2款端侧模型和3款运行在私有云计算平台上的模型,其中多款借助Google Gemini模型进行“精炼”。
本地模型与私有云架构,是为保证数据不会被苹果与其他第三方公司访问。
今年WWDC传递的信号是,Siri学会了看屏幕、总结网页以及理解照片。
但更关键的是苹果战略的转变:在AI时代,它不再执着于做底层能力的提供者,而更倾向于成为这些能力的组织者。
从不被重视,到寄予厚望回到2011年,Siri还是一个被赋予想象力的产品。
它的起点不在苹果,而是Siri.Inc开发的独立App,2010年在App Store上线,定位是可以帮你订餐厅、查天气、做信息整合的“个人秘书”。
其基础技术来自于美国国防高级研究计划局从2003年起,就开始投入约1.5亿美元资金资助的虚拟代理人技术开发项目。
Siri上线3周后,苹果创始人史蒂夫·乔布斯(Steve Jobs)对它产生了兴趣,邀请创始人会面。
两个月后,苹果宣布以2亿美元收购Siri,并整合进了2012年面世的iPhone 4S里,成为了后者最重要的功能之一。
然而,2011年至2015年间,Siri的更新几乎都是微调,例如增加多语言支持、简单信息查询、百科内容接入、“嘿Siri”唤醒等。
甚至在iOS 15中,苹果还删除了Siri中涉及笔记、照片、叫车、支付等的功能。
到今天,Siri上利用率最高的功能,仍然是2011年刚亮相时就具备的能力——设个闹钟。
Siri的技术护城河并不牢固。2012年三星S Voice在功能层面已与Siri接近;2014年的对比测试中,Google Now在信息理解与推荐能力上反超Siri;
到2017年,美国科技媒体The Verge直接评价Siri“明显落后于时代”,它的领先窗口期实际上极为短暂。
2018年,美国科技媒体The Information披露了一份关于Siri团队变动的长篇报道。
据受访前员工回忆,在初期,Siri是在还没准备好的情况下面世的,后端架构并未适配大规模用户流量,一位苹果员工后来重写了一段代码,才让Siri某后端组件的服务器需求从约500台缩减到了5台。
苹果内部对Siri的定位也未达成一致。一派认为,Siri的核心应该是搜索与检索,另一派则坚持,Siri必须成为真正的助手。
一位前苹果员工说,“乔布斯在Siri推出后的第二天去世了,苹果也由此失去了前进的方向。”
于是Siri的研发长期处于一种分裂的状态,一部分人负责语音识别,一部分人负责系统集成,还有一部分人负责体验层优化。
在这种背景下,Siri团队各自为战,缺乏统一演进逻辑。
这种割裂也延伸到产品层面。要把Siri搭载至HomePod的消息,Siri团队2015年才得知。
那时候,苹果为了与2014年底亚马逊发布的Echo竞争,匆忙把Siri应用到了项目之中。
发布后,《纽约时报》评价:“HomePod 上的Siri拉垮得令人尴尬”。
后续HomePod的市场表现不佳,也被内部部分人士认为是Siri团队能力不足的缘故。
● 2017年,苹果推出的内置Siri智能音箱“HomePod ”。
图源:Unsplash与此同时,隐私争议成为Siri长期阴影。
2019年,Siri被指在用户未主动唤醒时录音,并将片段发送给外包商人工收听,遭集体诉讼。
2025年初,美国加州法院批准了苹果就该案达成的和解协议,最终符合条件的用户每台设备获赔约8.02美元,单人最高赔付不超过40.1美元。
Siri项目在苹果内部也曾多次经历领导权调整。从最初的iOS团队主导,到2012年由比尔·斯塔西奥(Bill Stasior)带领独立团队运作,再到2018年机器学习团队介入......直到生成式AI浪潮到来,Siri的重要性重新提前。
新Siri命运的转折点,在2025年初的一场会议。
这场会议聚集了除CEO库克以外大部分苹果核心领导,会议确认Apple Intelligence的表现未达预期,新一代Siri的迭代也将推迟。
那时,库克对时任AI负责人约翰•詹南德雷亚(John Giannandrea)失去信心。
主导了Vision Pro新产品诞生的洛克威尔主动请缨,接下了Siri。
之后,洛克威尔把曾经负责Vision Pro和VisionOS操作系统的团队带来作为Siri的新负责团队,并立即启动使用第三方模型的方案。
Siri的新路线由此确立了。不做软件,回归硬件苹果与谷歌的这次合作,苹果每年需向Google支付约10亿美元,用于使用其AI技术与基础设施能力。
过去二十年,苹果的技术路径几乎建立在芯片自研、系统自研、服务自建的原则上。
这一次使用Gemini,官方解释是基于技术评估后的结果,认为Gemini提供了当前“最有能力的基础模型”。
2022年,苹果内部团队构建的好几个大语言模型,但因公司高层质疑“实用性不足”被搁置。
此后,苹果在AI上的投入节奏与规模也显得保守。2025财年(2024.9–2025.9)其研发投入约345亿美元,而同时期Meta约573.72亿美元,谷歌约610.87亿美元。
在Siri多次延期之后,苹果实质上放弃了做全栈大模型的执着,转而回归其根植于硬件的生态优势。
下一任苹果CEO热门候选人约翰•特努斯(John Ternus)也正是如今的苹果硬件工程高级副总裁。
对苹果而言,原来的赛道更稳定,也更安全,即便不掌握模型本身,仍然可以在分发层获益。
据报道,2025年苹果仅靠App Store就从生成式AI应用中抽成了近9亿美元佣金,2026年预计突破10亿美元。
● 多款AI应用上架App Store。图源:Unsplash如今,苹果还在加码AI投入,只是方向变了。
今年第一季度财报显示,苹果30年以来,研发支出占收入比例首次超过10%,单季度研发支出达到114亿美元,同比增长34%。
库克谈及研发数据时表示,公司加大投资部分原因是其看到的人工智能增长潜力。
不过,苹果的投入结构与Google、Microsoft或Meta的路径明显不同。
有分析认为,这部分的研发投入增长很大程度上可能与人才培训、建模实验、设备内AI、私有云计算、定制芯片、隐私保护有关,而非大规模数据中心部署,是端侧优先的AI战略,而不是云端模型竞赛。
至于为何最终选择Google Gemini,或许是出于整体战略的考虑。
据2026年5月官方披露,Google Gemini月活跃用户已经达到9亿,在非英语地区的流量规模已经接近ChatGPT的七成。
Google算过一笔账:如果企业将80%的顶级模型调用替换为最新一代Gemini 3.5 Flash,一年可以节省10亿美元。
此外,Gemini已经被系统性嵌入谷歌搜索、地图、Gmail、YouTube、Chrome等核心产品。
就在苹果发布会前几周,Google在自己的开发者活动上,将操作系统上的Gemini新功能重新命名为“Gemini Intelligence”,想要把Gemini从一个聊天机器人转变为跨手机、浏览器、汽车和笔记本电脑的运作方。
另一个备选是OpenAI。但双方关系并不稳定,据彭博社报道,一位匿名的OpenAI高管表示:“我们已经从产品角度做了所有事情。他们没有,更糟的是,他们甚至没有真正努力过。”
而且,OpenAI去年以来为了发展硬件,挖角了数十名iPhone、Vision Pro头显、音频技术以及几乎所有硬件和设计部门的苹果工程师,这在某种程度上削弱了双方长期合作的意愿。
相比之下,Google在合作上也显得更积极也更具连续性。
在AI从工具转向代理的过程中,谁掌握系统级入口,谁就掌握分发权,而iOS是全球最稳定的高价值入口之一。
作为长期搜索合作伙伴,双方早已在iOS搜索入口、广告分发与流量结构上形成稳定关系。
苹果以系统入口置换技术能力,谷歌借iPhone落地AI野心。
两家公司正通过软硬件的深度捆绑,试图在AI主导的下一代终端里,掌握系统级入口的控制权。
封面来源:pexels参考资料凤凰网科技:《一场没有惊喜的苹果发布会,和一次必须成功的认输》云见 Insight:《苹果AI往事》InfoQ:《出道即巅峰,十年后却“泯然众人矣”,苹果拿什么拯救 Siri?
》摩登AI:《苹果打破30年铁律,库克交棒前按下一个按钮》Bloomberg:《Inside Apple’s Secret Meeting That Led It to Finally Take AI Seriously》《Apple-OpenAI Alliance Frays, Setting Up Possible Legal Fight》《Google Unveils New Android AI Features Ahead of Apple’s Siri Revamp》《Apple Pivots Its AI Strategy to App Store, Search-Like Platform Approach》《Apple Must Face Claim That Siri Violates Privacy, Judge Says》CNBC:《Google races to put Gemini at the center of Android before Apple’s AI reboot》《Tech Apple’s R&D investments top 10% of sales as AI race creates ‘sense of urgency’》古明地正俊、长谷佳明:《AI人工智能的现在‧未来进行式》【版权声明】所有内容著作权归属镜相工作室,未经书面许可,不得转载、摘编或以其他形式使用,另有声明除外,如需联系镜相可后台留言。 继续阅读:
苹果把Siri交给了Gemini