海外科技行业Gemini 3、TPU、端侧AI应用更新报告：模型多模态升级加速端侧AI落地TPU冲击算力格局-251202-三个皮匠报告

1、Gemini3、TPU、端侧AI应用更新报告本报告导读：模型：预训练ScalingLaw仍然成立；算力：TPU助谷歌构建全栈AI生态，长期或与英伟达GPU互补；应用：多模态推理能力为端侧GUI操控提供可能，豆包手机助手率先落地，看好谷歌全栈集成、苹果系统掌控、阿里模型能力。投资要点：推荐标的：谷歌(GOOG.O)、英伟达(NVDA.O)、台积电(TSM.N)、博通(AVGO.O)、苹果(AAPL.O)、阿里巴巴(9988.HK)。Gemini验证了预训练ScalingLaw仍旧成立，谷歌具备全栈技术+全面场景的生态优势。Gemini3能力的大幅跃迁主要得益于预训练的突破，一方面证明了谷歌预训练

2、上的算力投入不再保守，侧面证明了预训练的ScalingLaw依旧成立；另一方面谷歌拥有搜索、YouTube、Chrome等生态产生的独家且不可迁移的用户行为数据，数据构成了理解用户意图和上下文的强大壁垒，侧面验证了谷歌在AI全栈技术+全面应用场景的独特生态优势。Gemini着重优化多模态能力，屏幕理解能力大幅提升，为GUI操控手机验证可能性，豆包手机助手率先落地。Gemini重点强化多模态能力，屏幕理解表现亮眼（ScreenSpot-Pro测试得分72.7%，远超GPT-5.1的3.5%与ClaudeSonnet4.5的36.2%)，逐渐具备视觉智能与界面逻辑理解能力，为端侧AIAgent实现

3、GUI操控提供可能。豆包手机助手已率先落地(如跨APP比价本质即GUI模拟人类操作）。谷歌坐拥安卓系统+模型+Pixel硬件入口+应用全家桶的全栈集成能力，端侧AI落地具备天然优势。除了TPU惯有的高性价比、扩展性、灵活性优势外，谷歌着重优化了TPU生态，大幅提升了外部可用性。1）谷歌2025年加速优化了TPU生态，原生支持PyTorch，并在vLLM的TPU支持上进行大规模工程投入，接入开放推理生态，大幅提升TPU的外部可用性；2）TCO优势突出，TPUv7内部使用时TCO较GB200服务器低44%，对外租赁时TCO较GB200低30%、较GB300低41%；3）集群扩展性及灵活性领先，集群

4、通过ICI3DTorus网络支持最大9216颗芯片，OCS技术实现数千种拓扑组合，适配多样并行需求且故障可快速重构。我们认为，TPU对谷歌更为重要的意义在于构建全栈AI生态，而非出售TPU本身：通过芯片与模型架构协同设计，实现算力成本与效率最优，并赋能云业务，利用较低成本的TPU赚取高于其他云服务商的利润。长期竞争格局来看，我们认为TPU完全颠覆英伟达GPU的概率较小，而较大概率作为英伟达GPU的补充，服务特定属性的客户群体：1）英伟达凭借规模优势深度绑定供应链，在获取供应链资源方面具备最强的优先级和议价权；2）谷歌XLA编译器未完全开源,GPU开箱即用属性更受中小客户青睐;3)TPUv8升级

5、幅度有限，而英伟达Rubin系列升级显著，缩小了TCO差距，且英伟达过去已证明了一年一迭代的能力,后续Feynman接力Rubin维持一年一迭代节奏，英伟达技术领先性有望持续领跑。端侧隐私风险。相关报告1Gemini3、Banana模型重塑谷歌领先优势，多模态能力实现关键跃升1.1推理能力、上下文、代码能力等全方位提升百万token上下文窗口提升输出质量，赋能企业级应用。Gemini3实现高达1百万tokens超大上下文窗口与64ktokens输出能力，远超竞争对手，配合自研TPU算力支撑，提升长文本理解深度和信息准确性，在法律合同审查、学术文献综述等场景中优势显著。MRCRv2基准测试中，G

6、emini3在128k上下文长度下取得77.0%的平均得分,远超ClaudeSonnet4.5(47.1%）和GPT-5.1（61.6%)；即使在1M长度下仍保持26.3%的逐点得分，长文本和复杂任务处理方面表现出色。(divcenter)图1:Gemini3超大上下文窗口，文本分析优势显著(/divcenter)Gemini过去薄弱的编程能力得以跃升。Gemini3Pro展现出接近专业竞赛级程序员的水平。在LiveCodeBenchPro（接近ICPC/Codeforces难度）上，其Elo得分达2439，显著高于GPT-5.1（2243）和Claude4.5（1418），尤其在高难度算法与

海外科技行业Gemini 3、TPU、端侧AI应用更新报告：模型多模态升级加速端侧AI落地TPU冲击算力格局-251202（18页）.pdf

相关报告