1、SAMSAM动态跟踪:通用的图像分割方法,降本拓新,赋能工业、动态跟踪:通用的图像分割方法,降本拓新,赋能工业、自动驾驶、安防等领域自动驾驶、安防等领域证券研究报告证券研究报告 行业动态报告行业动态报告发布日期:2023年4月9日本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。分析师:于芳博分析师:于芳博SAC编号:S1440522030001分析师:金戈分析师:金戈SAC编号:S1440517110001SFC编号:BPD352分析师
2、:分析师:阎贵成阎贵成SAC编号:S1440518040002SFC编号:BNS315 核心观点:核心观点:Meta发布发布SAM,成为成为CV图像分割领域的基础模型图像分割领域的基础模型,引起产学界较大反响引起产学界较大反响。SAM使用提示工程进行任务学习使用提示工程进行任务学习,能够通过交互式点击等操作实现图像物体的分割能够通过交互式点击等操作实现图像物体的分割,并且具有模糊感知能力并且具有模糊感知能力,很好解决了分割过程中产生的歧义问题很好解决了分割过程中产生的歧义问题,SAM在下游任务的零样本学习表现上成绩优秀在下游任务的零样本学习表现上成绩优秀,使得两种应用领域有了新的变化:一是原来
3、采用计算机视觉技术使得两种应用领域有了新的变化:一是原来采用计算机视觉技术,但是因为长但是因为长尾场景多尾场景多,需要大量标签数据需要大量标签数据,因此训练成本较高因此训练成本较高,有了大模型后可以大幅降低定制化开发产品成本有了大模型后可以大幅降低定制化开发产品成本,带来毛利率提升带来毛利率提升,比如工业中的机器视觉比如工业中的机器视觉、自动驾驶自动驾驶、安防等行业;二是原来没有用计算机视觉技术的领域安防等行业;二是原来没有用计算机视觉技术的领域,主要因为过去样本少难以应用主要因为过去样本少难以应用深度学习等深度学习等AI算法算法,由于由于SAM在零样本或者少量样本上表现优秀在零样本或者少量样
4、本上表现优秀,一些新的应用领域将被拓展一些新的应用领域将被拓展,比如从代码驱动变为视觉比如从代码驱动变为视觉驱动的机器人领域驱动的机器人领域、流程工业场景等流程工业场景等。4月月5日日,Meta发布发布Segment Anything Model,即即SAM,用来处理用来处理CV领域的图像分割领域的图像分割,引起学界引起学界/业界较大反响业界较大反响。SAM由一由一个图像编码器个图像编码器、一个提示编码器和一个掩码解码器组成一个提示编码器和一个掩码解码器组成,具有以下特点:具有以下特点:1)使用提示工程进行任务学习使用提示工程进行任务学习,交互式点击交互式点击、选选择框甚至文本操作进行物体分割
5、;择框甚至文本操作进行物体分割;2)具有模糊感知功能具有模糊感知功能,面对分割对象存在歧义时面对分割对象存在歧义时,可以输出多个有效掩码;可以输出多个有效掩码;3)与与ChatGPT类似类似,SAM巧妙的巧妙的将人工标注与大数据结合将人工标注与大数据结合(数据引擎数据引擎),最终实现了最终实现了“分割一切分割一切”的功能的功能。SAM在下游任务在下游任务领域表现优秀领域表现优秀,虽然在某些领域虽然在某些领域不如当前最优模型的表现不如当前最优模型的表现,但其良好的但其良好的zerozero-shotshot泛化能力依旧证明该模型性能的强悍泛化能力依旧证明该模型性能的强悍。英伟达人工智能科学家英伟
6、达人工智能科学家JimJim FanFan更是认为更是认为SAMSAM是是CVCV的的“GPTGPT-3 3时刻时刻”之一之一。我们认为我们认为SAM的提出对于的提出对于CV领域具有重要意义领域具有重要意义,会成为和会成为和CLIP一样同等重要的基础模型:一样同等重要的基础模型:图像分割是计算机视觉一个非图像分割是计算机视觉一个非常重要领域常重要领域,是当前该领域的前沿是当前该领域的前沿,甚至可以说是该领域的核心研究问题甚至可以说是该领域的核心研究问题,SAM的提出的提出,使得图像分割领域有了基础模型使得图像分割领域有了基础模型(foundation model),预计未来基于预计未来基于SA