1、工具到伙伴:发布首张中国AI+研发进化图谱朱少民|软件工程 3.0作者/CCF 杰出会员AiDD 技术委员会成员朱少民软件工程 3.0作者/CCF 杰出会员/AiDD 技术委员会成员同济大学特聘教授、CCF杰出会员、软件绿色联盟标准评测组组长,近三十年来一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖,已出版了二十多部著作和4本译作,代表作主要有软件工程3.0、软件测试方法和技术、全程软件测试、敏捷测试等,并经常在国内外学术会议或技术大会上发表演讲,曾任思科(中国)软件有限公司QA高级总监、IEEE ICST2019工业论坛主席、IEEE ICST、QRS、DAS等国际学术会议
2、的程序委员、软件学报审稿人等。目 录CONTENTSI.LLM如何引发软件工程的范式革命?II.2025年度AI+研发调查汇报III.中国AI+研发进化图谱IV.洞察:机遇与挑战LLM如何引发软件工程的范式革命?今天的大模型不同于以往的AI01智能的工程学突破从手工规则到数据驱动,从模块化到端到端经典符号AI:智能=显式知识表示+逻辑推理深度学习:智能=分布式表征+统计学习+涌现符号操作+逻辑规则模块化架构:感知 推理 规划 执行组合搜索:指数级复杂度,需要启发式剪枝专门设计:大量人工特征工程高维模式匹配:连续向量空间中的几何操作端到端统一:成为处理E2E中不同任务的统一模型并行推理:充分利用
3、GPU并行性,在给定上下文窗口内高吞吐近似推断涌现能力:规模突破临界点后自发产生新能力知识的表征创新从符号到向量、从离散到连续,知识成了分布在高维空间中的几何结构传统符号知识:结构清晰但扩展成本高,难以处理模糊性 大模型:知识=高维几何结构,可规模化获取离散表示:IF-THEN规则,语义网络显式编码:专家手工提取知识脆性推理:规则冲突导致系统崩溃局部知识:独立模块,难以关联分布式表征:概念向量,关系几何变换自监督学习:从大规模数据中自动提取统计规律与表征连续插值:(在数据/提示等合适时)支持类比推理和创造性组合多模态对齐:通过各模态编码器与投影,在可互操作的表示空间对齐,实现(部分)空间共享理
4、解的边界拓展理解的本质 从语法到语义、从单模态到多模态,形成“模式共振”传统AI:理解=符号操作正确性大模型:理解=分布式表征和注意力机制捕捉语义关联语法解析:构建语法树规则匹配:激活相应处理程序机械执行:按预定算法处理表面理解:只处理明确定义的关系多层激活:语法语义语用跨模态上下文调制:动态更新理解状态类比推理:跨领域结构映射统计性补全:基于训练数据中的模式,填补缺失信息为什么LLM具备强大的生成、理解、推理能力?生成能力的源泉统计插值+模式完成理解能力的飞跃分布式表征+多层抽象推理能力的突破模式识别+序列建模连续空间优势:在概念空间中smooth插值生成上下文建模:上下文窗口内捕获较长依赖
5、关系多样性采样:通过温度参数控制创造性程度条件生成:根据提示动态调整生成策略层次化理解:从token 短语 句子 段落 语篇注意力机制:动态分配计算资源到相关信息跨模态对齐:视觉-语言表征空间的深度融合涌现语义:大规模预训练中自发形成的语义结构隐式推理链:通过next token prediction学会了一些推理模式上下文学习:从示例中快速学习推理模式,依赖提示/示例设计思维链涌现:自然产生step-by-step思考过程类比推理:在抽象空间中进行结构映射为什么LLM具备强大的生成、理解、推理能力?深层原理 LLM=统计模型+推理引擎+生成器关键成功因素学到了世界的(部分)统计规律,在许多任
6、务上可功能性地扮演简化的世界模型在高维向量空间中进行进行模式匹配和插值计算,产生“直觉式”推理将理解转化为连续的生成过程规模效应(Scaling Laws):参数量数据量计算量的幂律关系自监督学习:语言建模目标包含了丰富的世界知识Transformer架构:并行处理+全局注意力的有效融合涌现现象:量变引起质变的临界点突破一场范式革命AI的发展从早期依赖符号主义(如专家系统)的“小数据、大知识”模式,转向了当前依赖连接主义(神经网络)的“大数据、小知识”模式,人工智能发生了一场范式革命,也导致软件工程产生了新范式022025RESEARCH REPORT软件研发应用大模型国内现状调研报告拥抱AI