当前位置:首页 > 报告详情
精选文档

2023SAM模型发展现状及SAM与其衍生模型赋能场景分析报告.pdf

上传人: 9**** 编号:142389 2023-10-10 27页 7.01MB

1、2023 年深度行业分析研究报告 内容目录内容目录SAMSAM 模型模型:CVCV 领域的领域的 C ChatGPThatGPT.5 5SAM:“分割一切”的 AI 新模型.5Prompt:将 ChatGPT 的学习思维应用在 CV 领域.5ZSL:零样本学习降本增效,提高模型泛化能力.9SA-1B:迄今为止最大的分割数据集,助力模型增效.10SAM 核心优势:减少训练需求,提升分割性能.12基于基于 SAMSAM 二次创作,衍生模型提升性能二次创作,衍生模型提升性能.1313SEEM:交互、语义更泛化,分割质量提升.13MedSAM:提升感知力,应用医学图像分割.15SAM-Adapter:

2、阴影检测再升级,伪体分割更精准.16SAM-Track:扩展 SAM 应用领域,增强视频分割性能.18SAMSAM 及衍生模型赋能多场景应用及衍生模型赋能多场景应用.1818基于 3D 重建,赋能 AR、游戏.18跟踪运动物体,赋能安防监控.19解决长尾难题,赋能自动驾驶.20提高分割性能,赋能遥感图像.21算力应用驱动,赋能机器视觉.24图表图表目录目录图1:SAM 模型官方文章.5图2:自然语言处理(NLP)的常用算法和模型.6图3:预训练模型(PLM)的发展阶段和特征.6图4:基于提示的学习(prompt-based learning)各分支.7图5:传统的预训练+微调模型以及 prom

3、pt 范式.7图6:Fine-tune 和 prompt 两种范式的区别.8图7:预训练+下游任务微调(PLM+Fine-tuning)处理情感分类任务(写影评).8图8:零样本学习(ZSL)示例.9图9:SAM 的零样本学习能力在 CT 影像中的应用.10图10:SAM 使用数据引擎(data engine)渐进式收集数据示意图.10图11:SA-1B 比现有分割数据集多 400 倍.11图12:SA-1B 掩码标注速度更快.11图13:SA-1B 数据集的跨区域代表性较强.12图14:SAM 的可提示分割模型分为三部分.13图15:框选分割(BOX).13图16:全选分割(Everythi

4、ng).13图17:SEEM 在交互和语义空间上都比 SAM 更具泛化性.14图18:SEEM 根据用户输入的点和涂鸦进行图像识别.14图19:SEEM 根据用户输入的文本进行图像分割.14图20:SEEM 根据参考图像对其他图像进行分割.15图21:SAM 分割医学影像测试的详细框架.15图22:测试 SAM 对医学影像分割性能的数据集 COSMOS 553K 及分割效果.16图23:MedSAM 示意图.16图24:SAM 模型不能很好地感知自然场景中的伪体.17图25:SAM 在工业场景中缺陷检测能力较差.17图26:SAM-Adapter 示意图.17图27:SAM 可在 AR 眼镜中

5、识别日常物体.19图28:SAM 的 3D 重建功能.19图29:SEEM 在跑酷、运动、游戏视频中可以准确分割参考对象.20图30:城市道路场景中长尾场景较多.21图31:遥感图像处理发展阶段.22图32:大模型应用于遥感图像处理.22图33:基于锚点的 prompter.23图34:基于查询的 prompter.23图36:机器视觉四大功能及难度.24图37:机器视觉发展历程.24图38:基于 AI 的轻量级人脸识别网络,可用于视频实时分析、安防监控等.25图39:OVD 目标检测基本流程.26图40:AI 大模型驱动空天信息产业发展.26图41:天权大模型技术路线.27图42:中科星图“

6、空天灵眸”大模型.27SAMSAM 模型模型:CVCV 领域的领域的 C ChatGPThatGPTSAMSAM:“分割一切分割一切”的的 AIAI 新模型新模型2023 年 4 月,Meta 发布了全新的 AI 模型 Segment Anything Model,即 SAM。官网对该模型的描述为:“只需一次点击,便可在任何图像中分割出任何物体”。Segment Anything 文章指出,SAM 建立了一个基础图像分割模型,并在一个巨大的数据集上进行训练,从而试图解决一系列下游任务,成为一种通用的模型。论文的关键词包含了:prompt(基于提示学习)、task(下游任务)、zero-shot

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了SAM模型在计算机视觉领域的应用。SAM模型是一种高效的图像分割模型,可以自动分割图像中的任何物体。它的核心优势在于减少训练需求,提升分割性能。SAM模型使用了迄今为止最大的分割数据集SA-1B,包含1100万张图像和11亿个掩码,比任何现有的分割数据集多400倍。此外,SAM模型还具有零样本学习能力,可以在没有任何训练数据的情况下,完成一些任务。SAM模型已经在多个领域得到了应用,如工业机器视觉、AR/VR、自动驾驶、安防监控等。未来,随着技术的不断进步和应用场景的不断扩展,SAM模型在计算机视觉领域的应用将会更加广泛。
SAM模型如何实现图像分割? SAM模型在哪些领域有应用? SAM模型如何赋能机器视觉?
客服
商务合作
小程序
服务号
折叠