1、相关研究大模型推理需求井喷,AI基建投资成胜负手.模型:Coding商业化变现初具规模,Agent模型打开新空间。2026年以来,大模型推理需求进入井喷期,核心平台tokens调用量4个月增长超4倍;Anthropic凭借Coding能力的绝对优势,年化收入(ARR)4个月内从90亿美元突破300亿美元,与OpenAI形成行业双寡头格局,其中ClaudeCode产品线ARR已达25亿美元,6个月跨过10亿美元门槛,企业端付费客户翻倍增长;Gemini则依托自有生态分发优势实现用户规模稳步增长。应用层面,AI以代码开发为核心,向金融、法律、咨询等全白领场景快速渗透,对高技能、高复杂度任务的提效价
2、值尤为突出。.算力:AI基建高速扩张,以满足未来推理需求。全球数据中心资本支出预计从2024年的4500亿美元增至2030年的3万亿美元,年复合增长率达37%。融资端,行业已从有需求就能融资的粗放扩张阶段,转向电力、长约、抵押品缺一不可的精细化阶段,低成本资金持续向头部强信用主体、有稳定长约支撑的算力资产集中。上游零部件:架构创新与系统配套升级成为关键。2021-2026年中国智能算力规模年复合增长率预计达52.3%,增速显著高于通用算力;2025年国产AI加速卡市场份额已超41%,英伟达一家独大的垄断格局被打破,华为以近半数的国产份额领跑行业,超节点架构创新成为国产算力突围的核心方向,国内头
3、部厂商已推出差异化产品,实现以架构换性能的跨越式追赶。风险提示:资本开支不及预期,算力租赁价格大幅下行,下游应用商业化不及预期。引言2026年以来,以Openclaw+Claude为代表的Clawbot掀起应用热潮,头部模型厂商ARR快速增长,Anthropic凭借Coding能力的绝对优势年化收入(ARR)4个月内从90亿美元突破300亿美元,与OpenAl形成行业双寡头格局,其中ClaudeCode产品线ARR已达25亿美元。模型能力的突跳带动了算力需求的井喷式增长,本篇报告将从模型、算力、上游零部件部分一一展开。一、中外模型进展,应用场景扩张(一)大模型竞争进入白热化,Coding能力定
4、义定价权OpenRouter平台tokens调用量4个月翻逾4倍,开源模型领跑。据OpenRouter平台数据,全平台周调用tokens从2026年1月5日的6.42万亿快速攀升至3月30日的27万亿,4个月增长逾4倍,反映大模型推理需求进入井喷期。结构上看,阿里Qwen3.6Plus(4.6T)、小米MiMo-V2-Pro(3.08T)跃居榜首,国产开源模型领跑;ClaudeSonnet4.6、Opus4.6也突破1万亿,闭源头部稳健放量。(divcenter)图1、ArtificialAnalysis大模型排行榜(/divcenter)商业化能力来看,B端领先C端。作为消费级AI龙头,Ch
5、atGPT自2025年10月以来移动端+网页端日活稳定在4-5.5亿日活跃用户区间,呈典型工作日周期性波动但整体趋势平稳。OpenAl2026年2月披露周活跃用户达9亿、付费企业用户突破900万家,显示其用户盘已基本进入稳态期,未来增量更多依靠订阅升级与企业API变现,C端获客增速显著放缓。而以B端商业化为代表的Claude日活跃用户数从2025年10月的约500万快速攀升至2026年4月的近2800万,6个月增长近5倍,加速度全球领先。核心驱动来自ClaudeCode与ClaudeCowork两款拳头产品:前者开发者迁移趋势明显;后者将Coding式工作流扩展至金融、法律、咨询等白领场景。同
6、时Anthropic与Deloitte(覆盖47万员工)、Accenture等签订大单,企业渠道全面打开。B端商业化场景中,Coding+Agent成主要方向,Claude凭借Coding能力较强而领先。从HuggingFaceArenaLeaderboard排行榜上看,Anthropic的ClaudeOpus系列模型在Coding能力上占据明显领先地位,其中ClaudeOpus4.7Thinking位列榜首,Coding能力优势显著。今年大模型tokens调用量增长的核心在于coding与agent场景;Anthropic披露ClaudeCode产品线ARR已达25亿美元,6个月即跨过10亿