1、Gemini3、TPU、端侧AI应用更新报告本报告导读:模型:预训练ScalingLaw仍然成立;算力:TPU助谷歌构建全栈AI生态,长期或与英伟达GPU互补;应用:多模态推理能力为端侧GUI操控提供可能,豆包手机助手率先落地,看好谷歌全栈集成、苹果系统掌控、阿里模型能力。投资要点:推荐标的:谷歌(GOOG.O)、英伟达(NVDA.O)、台积电(TSM.N)、博通(AVGO.O)、苹果(AAPL.O)、阿里巴巴(9988.HK)。Gemini验证了预训练ScalingLaw仍旧成立,谷歌具备全栈技术+全面场景的生态优势。Gemini3能力的大幅跃迁主要得益于预训练的突破,一方面证明了谷歌预训练
2、上的算力投入不再保守,侧面证明了预训练的ScalingLaw依旧成立;另一方面谷歌拥有搜索、YouTube、Chrome等生态产生的独家且不可迁移的用户行为数据,数据构成了理解用户意图和上下文的强大壁垒,侧面验证了谷歌在AI全栈技术+全面应用场景的独特生态优势。Gemini着重优化多模态能力,屏幕理解能力大幅提升,为GUI操控手机验证可能性,豆包手机助手率先落地。Gemini重点强化多模态能力,屏幕理解表现亮眼(ScreenSpot-Pro测试得分72.7%,远超GPT-5.1的3.5%与ClaudeSonnet4.5的36.2%),逐渐具备视觉智能与界面逻辑理解能力,为端侧AIAgent实现
3、GUI操控提供可能。豆包手机助手已率先落地(如跨APP比价本质即GUI模拟人类操作)。谷歌坐拥安卓系统+模型+Pixel硬件入口+应用全家桶的全栈集成能力,端侧AI落地具备天然优势。除了TPU惯有的高性价比、扩展性、灵活性优势外,谷歌着重优化了TPU生态,大幅提升了外部可用性。1)谷歌2025年加速优化了TPU生态,原生支持PyTorch,并在vLLM的TPU支持上进行大规模工程投入,接入开放推理生态,大幅提升TPU的外部可用性;2)TCO优势突出,TPUv7内部使用时TCO较GB200服务器低44%,对外租赁时TCO较GB200低30%、较GB300低41%;3)集群扩展性及灵活性领先,集群
4、通过ICI3DTorus网络支持最大9216颗芯片,OCS技术实现数千种拓扑组合,适配多样并行需求且故障可快速重构。我们认为,TPU对谷歌更为重要的意义在于构建全栈AI生态,而非出售TPU本身:通过芯片与模型架构协同设计,实现算力成本与效率最优,并赋能云业务,利用较低成本的TPU赚取高于其他云服务商的利润。长期竞争格局来看,我们认为TPU完全颠覆英伟达GPU的概率较小,而较大概率作为英伟达GPU的补充,服务特定属性的客户群体:1)英伟达凭借规模优势深度绑定供应链,在获取供应链资源方面具备最强的优先级和议价权;2)谷歌XLA编译器未完全开源,GPU开箱即用属性更受中小客户青睐;3)TPUv8升级
5、幅度有限,而英伟达Rubin系列升级显著,缩小了TCO差距,且英伟达过去已证明了一年一迭代的能力,后续Feynman接力Rubin维持一年一迭代节奏,英伟达技术领先性有望持续领跑。端侧隐私风险。相关报告1Gemini3、Banana模型重塑谷歌领先优势,多模态能力实现关键跃升1.1推理能力、上下文、代码能力等全方位提升百万token上下文窗口提升输出质量,赋能企业级应用。Gemini3实现高达1百万tokens超大上下文窗口与64ktokens输出能力,远超竞争对手,配合自研TPU算力支撑,提升长文本理解深度和信息准确性,在法律合同审查、学术文献综述等场景中优势显著。MRCRv2基准测试中,G
6、emini3在128k上下文长度下取得77.0%的平均得分,远超ClaudeSonnet4.5(47.1%)和GPT-5.1(61.6%);即使在1M长度下仍保持26.3%的逐点得分,长文本和复杂任务处理方面表现出色。(divcenter)图1:Gemini3超大上下文窗口,文本分析优势显著(/divcenter)Gemini过去薄弱的编程能力得以跃升。Gemini3Pro展现出接近专业竞赛级程序员的水平。在LiveCodeBenchPro(接近ICPC/Codeforces难度)上,其Elo得分达2439,显著高于GPT-5.1(2243)和Claude4.5(1418),尤其在高难度算法与