当前位置:首页 > 报告详情

CMF:2023中国宏观经济专题报告:大模型:原理、进展及其影响(94页).pdf

上传人: 报*** 编号:142799 2023-10-16 94页 7.19MB

下载:

1、大模型:原理、进展及其影响主 办 单 位:中 国 人 民 大 学 国 家 发 展 与 战 略 研 究 院、中 国 人 民 大 学 经 济 学 院、中 诚 信 国 际 信 用 评 级 有 限 公 司承 办 单 位:中 国 人 民 大 学 经 济 研 究 所大模型:原理、进展及其影响报告人:文继荣中国人民大学信息学院院长中国人民大学高瓴人工智能学院执行院长国家高层次人才2023年9月目 录一、大模型的背景和原理二、大模型的飞速发展及趋势三、大模型的深刻影响 OpenAI 公司开发的大型语言模型通过从大规模语料库中学习语言规律,从而生成与人类语言相似的输出表现为一个对话机器人,能够理解自然语言,进行

2、高质量的多轮对话拟人化程度惊人,被认为是人工智能里程碑式的突破ChatGPT开启了大模型浪潮比尔盖茨:ChatGPT的重要性不亚于互联网的发明2022年11月30日发布,5天获得100万用户,今年1月份月活跃用户数达1亿ChatGPT的特点 上知天文、下知地理,不仅能写文章、还能写代码知识广博 能有逻辑地组合知识形成答案,具有一定的推理能力有条有理 能准确理解用户意图,三观比较正,并且承认自己不知道善解人意 在多轮对话中不走神,交互聚焦主题交互能力强理解人类语言是人类探索文明发展的重要目标6哲学计算机假设:世界知识和人类认知能力蕴含在人类语言中问题:可以对人类语言建模吗?语言模型是否能作为世界

3、知识模型?语言模型是否具有人类认知能力?世界与语言高瓴人工智能学院是中国人民大学下属学院高瓴人工智能学院是中国人民大学下属学院人脑(神经网络)语言模型(人工神经网络)生成训练生成语言模型是对人脑的反向工程语言智能的探索历程8符号规则统计机器学习神经网络预训练语言模型超大规模语言模型给定一组人工设定的规则,计算机通过对数据应用这些规则来模拟自然语言理解在人工标注的数据上进行特征工程,训练机器学习模型参数,并将模型应用于测试数据上用神经网络在大量数据上训练,使得网络自主学会提取特征,并可以灵活搭建模型基于无标注文本预训练语言模型,通过“预训练-微调模式”工作,有监督学习通过扩展语言模型规模,可以通

4、过提示学习、情境学习等无需微调方式求解任务有监督学习任务泛化性弱 仍需要监督学习任务泛化性改善 无/弱监督学习一定的通用能力初始的自动化解决尝试语言模型的演进图9统计语言模型神经语言模型预训练语言模型大语言模型任务求解能力1990s201320182022word2vec、RNN-LM可以生成流畅文本自动学习特征特征缺乏知识、泛化性差n-gram 模型具备一定生成能力辅助解决部分任务数据稀疏影响严重ELMO、BERT、GPT-1/2任务泛化能力提升统一的任务求解范式仍然需要监督数据微调GPT-3/4、ChatGPT、Claude良好的任务泛化能力通用的任务求解途径学习成本高、灵活性差困难 组合

5、爆炸,无法考虑较宽的上下文 泛化性差,字词之间没有关联 数据、算力不够统计语言模型(Statistical Language Model)突破 引入注意力机制解决长程上下文依赖问题 多层神经网络抽象解决泛化问题 海量数据训练、巨大算力支持生成式语言模型(Generative Language Model)l下一个词预测:文字接龙lThe chef cooked the meal.lThe chef cooked the meal.GPT掩码语言模型(Masked Language Model)l文本Mask:完形填空lThe chef cooked the meal.lThe chef coo

6、ked the meal.BERTWord2VecChatGPT的发展路径2017年年2013年年2022年年2021年年2018年年2020年年2019年年TransformerGPTGPT-2GPT-3BERTCodexWebGPTChatGPT预训练语言模型元年首个千亿级模型引入代码能力和思维链能力引入搜索能力引入对话能力InstructGPT能理解人类指令ChatGPT的法宝之一:大!(自主学习)lChatGPT:大力出奇迹的典范,大数据、大模型、大算力lGPT-3:1750亿参数量,训练一次消耗1200万美元各种预训练模型的参数量对比(单位:十亿)参数量越多,人区分新闻是否由AI生成

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要内容概括如下: 1. 介绍了大模型的背景和原理,包括ChatGPT的特点、语言智能的探索历程以及ChatGPT的优势。 2. 讨论了大模型的飞速发展及趋势,包括GPT-4的发布、多模态支持、自主智能体等。 3. 分析了大模型的深刻影响,包括对产业界、学术界的影响,以及对脑力劳动、数字世界与物理世界的影响。 4. 专家们对大模型未来的发展方向、人工智能的发展对经济的意义等问题进行了讨论。 5. 漆远指出大模型能更好地泛化,推动产业发展,提升用户交互水平。 6. 黄铁军认为大模型开启了智业革命的时代,未来将构建一个全新的生态体系。 7. 沈建光以京东为例,阐述了人工智能大模型在营销、诊断和物流控制等领域的应用。 8. 李超认为人工智能将降低主权债务危机和战争的风险,推动经济发展。 9. 刘陈杰认为人工智能将成为一轮供给侧结构性改革2.0版本,特别是在发挥全要素生产力方面人工智能将发挥特别重要的不可替代的作用。
ChatGPT如何实现人类语言的建模? 大模型如何影响人类认知能力的发展? 人工智能大模型如何推动第四次工业革命?
客服
商务合作
小程序
服务号
折叠