1、12024 年年第第11 期期2大模型技术专利态势大模型技术专利态势编者按编者按AI 大模型是通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。大模型按照功能可分为自然语言处理(NLP)大模型、计算机视觉(CV)大模型、科学计算大模型和多模态大模型四类。目前,AI 大模型是实现通用人工智能(AGI)的重要路径。AI 大模型已成为优化算力瓶颈、放大数据优势、发展数字经济的重要拼图。据统计,亚洲已成为 AI 大模型技术的主要产出区,中国为 AI 大模型专利最多产出国,粤港澳大湾区 AI 大模型专利位居四大湾区之首。美国 IBM 领跑生成式人工智能(GenAI
2、)专利,Meta 公开了大模型代码 Code Llama,华为公开了可保护 AI大模型版权的专利。专利应用领域,韩国发布了世界首个超大型专利领域大语言模型,3智慧芽已实现 AI 大模型在专利等垂直领域应用等。笔者从知识产权的角度,梳理了大模型技术全球发展动态、国内发展动态、挑战与思考,供读者参考。目目4录录全球发展动态全球发展动态.3大模型主要分四大功能类型.3IBM 公司领跑 GenAI 专利.5亚洲成为AI大模型技术的主要产出区.8Meta 公开大模型代码 Code Llama.9韩国发布世界首个超大型专利领域大语言模型.9国内发展动态国内发展动态.10我国大模型专利申请总数突破4万余件.
3、10粤港澳大湾区AI大模型专利位居四大湾区之首.13智慧芽实现AI大模型在专利等垂直领域应用.15华为公开可保护AI大模型版权的专利.16挑战与思考挑战与思考.17AI基础模型与知识产权.17OpenAI 因 AI模型训练面临版权诉讼.195全球发展动态全球发展动态大模型分为大模型分为 NLP、CV、科学计算、多模态大模型四类、科学计算、多模态大模型四类人工智能大模型是在参数和架构的基础上构建起来的一种结构,是人工智能迈向通用智能的里程碑技术,通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微
4、调+人类反馈”方式,可以实现一个模型应用在很多不同领域。基础模型是一种机器学习模型,它在广泛的数据基础上进行训练,从而可以应用于各种用例。基础模型改变了人工智能(AI),为 ChatGPT 等著名的生成式人工智能应用提供了动力。基础模型是一种通用技术,可以支持各种不同的用例。建立基础模型通常是高度资源密集型的,最昂贵的模型需要花费数亿美元来支付所需的底层数据和计算费用。6图1 大模型技术原理按照功能可分为 NLP 大模型、CV 大模型、科学计算大模型和多模态大模型。NLP(Natural Language Processing,自然语言处理)大模型:LLM为 NLP 大模型的一种,主要用于处理
5、自然语言文本数据,具备强大的语言理解和生成能力,帮助人奏完成问答、创作、文本等工作,例如 OpenAI 的 GPT 系列模型;CV(Computer Vision,计算机视觉)大模型:主要用于处理图像和视频数据,具备强大的围像识别和视频分析能力,如人脸识别、物体检测等,具体可以在智能驾驶、安防等领圾进行利用,例如腾讯的PCAM 大模型;科学计算大模型:主要用于解决科学领圾的计算问题,如生物信息学、材7科科学、气侯模拟等,需要处理大规模教值数据,例和华为的盘古气象模型;多模态大模型:可以同时处理多种类型的模态数据,如文本、围像、语音等,实现跨模态搜索、跨模态生成等任务,已有的渗透应用具休包括搜索
6、引学、办公工具、全融电商等,例如谷歌的Vision Transformer 模型。表 1 AI 大模型基本分类资料来源:中航证券 资料来源:中航证券 2024-01-24 研究报告研究报告IBM公司领跑公司领跑 GenAI 专利专利在整个人工智能领域中,有一个子集生成式人工智能(Generative AI,GenAI),不仅经过训练可以识别模式,而且还被赋予了类似人类的能力,可以生成自己的内容,无论是文字、图片还是视频。据估计,人工智能领域约有22%的专利与 GenAI 有关。这些技术的核心是生成对抗网络(机器学习的一8种)、大型语言模型和被称为生成预训练转换器的神经网络模型(GPT 缩写背后