1、新载体,新交互以“端”为核心,重塑 AI 时代的行业应用祁晓龙|蚂蚁数科移动科技及具身智能科技总经理祁晓龙蚂蚁数科移动科技及具身智能科技 总经理蚂蚁数科在移动技术与人工智能领域的关键领军人物。作为移动开发平台mPaaS的核心缔造者,带领团队将其打造为服务全球超过200家金融机构的行业级端智能方案,成功支撑亿级用户的稳定服务,并助力客户将研发周期缩短50%以上。同时,也是一位将前沿AI技术成功产品化的创新者。主导打造了业内首个“AI原生”App,推动了“对话即服务”的全新交互范式,促成金融服务从传统的“人找服务”向“服务找人”实现突破性转型,为行业提供了一个可规模化复制的范本,将复杂的AI技术真
2、正落地为提升核心业务价值的强大引擎。支付宝移动技术演进路线工具型APP单点能力沉淀移动开发平台APP平台引擎mPaaS移动开发平台小程序开放平台多主体协同,双在线构建私域场景生态互动体验型互动技术成熟化移动新媒体运营载体更新AI智能化 多终端AI原生App建设智能生成、智能助理1.0(2015以前)2.0(2015-2018)3.0(2019-2022)4.0(2022-2024)5.0(2024-至今)支付宝AI大模型应用场景蚂小财政务助手出行助手蚂蚁阿福灵光AI 时代下蚂蚁数科的探索应用模型基础设施芯片能源企业级 AI 应用ChatBotsAI Coding具身智能智能体应用实践MaaS
3、平台基础设施建设基础设施建设:大小模型结合是高性价比方案95.5299.564.9982.2396.9199.5869.1584.85IntentSlottingRerankingTime ExtractLing-mini with Single-Task-FTLing-mini-Finance76.82 91.39 59.21 37.29 66.18 82.9790.4662.944.1370.12 90.1495.5872.5583.5785.46 96.2999.8370.8180.2186.79 96.9199.5870.1584.8587.87 IntentSlottingReran
4、kingTime ExtractOverAllQwen3.5-4BQwen3.5-9BQwen3.5-397B-A17BQwen3.5-9B-FinanceLing-mini-Financevs.Qwen3.5-9Bvs.Qwen 3.5 397B-A17Bvs.单任务微调vs.Qwen3.5 4B速度更快成本更低能力更全效果更好Ling-DT-Fin-Mini-2.516B A1.4B共20+任务金融智能体子任务金融智能体存在大量高并发子任务,Ling-DT-Fin-Mini 2.5(based on Ling Mini 2.5)尤其适合Ling-DT-Fin-Mini-2.5:更快、更优、
5、更轻https:/huggingface.co/inclusionAI/Ling-2.5-1T推理速度 Ling mini 2.5 VS Qwen 3.5 4B:H200H200SXM 推理框架 SGLang 059 混合线性注意力机制(MLA+Lightning Linear Attention)、高性能融合算子优化、FP8加速尤其适合金融子任务(高并发、长context、短output)单卡可部署模型架构推理阶段-1:Prefill推理阶段-2:Decode金融场景子任务端到端吞吐为Qwen 3.5 4B的 2倍FP8加速打开,可进一步提升20%相比Qwen 3.5 9B进一步提升50%M
6、aaS:开箱即用的一站式 AI 调度平台DTClaw公有云服务AI应用异构算力调度华为|沐曦|寒武纪|灵犀推理引擎优化PD分离|kv cache|Sglang Token 运营中心模型供应商|codingPlan|pay as you go|额度|调度 模式三自研模型Ling|Agentar-Fin 模式二开源模型Kimi|miniMax|智谱模型推理用量|部署|监控|限流|告警 模型训练数据|调优|评测 DTClaw SaaSAgent市场Computrix智算平台MaaS Hub模型市场模型服务MaaS公有云服务中台产品模式一HUB接入Claude|