当前位置:首页 > 报告详情

机器人行业系列深度研究之12:大模型迭代智能驾驶、机器人算法进化-230919(35页).pdf

上传人: 散** 编号:141237 2023-09-25 35页 2.39MB

1、大模型迭代,智能驾驶、机器人算法进化机器人系列深度研究之12证券分析师:洪依真 A0230519060003 施鑫展 A0230519080002 刘洋 A0230513050006王珂A0230521120002 戴文杰A0230522100006 黄忠煌A0230519110001 胡雪飞A0230522120002屠亦婷A02305120800032023.9.192模型模型AIAI小结:理解不同参与者的环节小结:理解不同参与者的环节检测跟踪Tracking映射地图Mapping运动预测Motion占用预测Occupancy路径规划(含防碰撞)Planner控制执行尝试视觉+4D成像为主

2、的传感器大模型:谷歌/微软/Tesla/Meta等发力尝试 人车互动/人机互动/自动行走局部尝试大模型AI的端对端自动驾驶传感器摄像头视觉激光雷达毫米波雷达超声波雷达传动部件减速器/丝杠/其他等控制器电机伺服/步进/空心杯传感器电流环控制/力矩/被动力控制/视觉GPUDSA(Tesla DOJO为例)ASIC/边缘计算处理器MCU高速连接器高压传感器光芯片定位导航IMU等其他连接器电子和半导体范畴通信范畴大机械范畴大汽车范畴软件互联网AI范畴图例大机器人具身智能大智联汽车3XgVnXgVaXnVnRqMrM7NcM7NsQqQoMoNkPqQwPlOmOrM7NrQoOuOnOtNNZnMqM

3、3大模型大模型AIAI小结:理解不同参与者的环节小结:理解不同参与者的环节检测跟踪Tracking映射地图Mapping运动预测Motion占用预测Occupancy路径规划(含防碰撞)Planner控制执行尝试视觉+4D成像为主的传感器推理+理解:例如谷歌PaLM-E传感器摄像头视觉激光雷达毫米波雷达超声波雷达传动部件减速器/丝杠/其他等控制器电机伺服/步进/空心杯传感器电流环控制/力矩/被动力控制/视觉GPUDSA(Tesla DOJO为例)ASIC/边缘计算处理器MCU高速连接器高压传感器光芯片定位导航IMU等其他连接器电子和半导体范畴通信范畴大机械范畴大汽车范畴软件互联网AI范畴图例大

4、机器人具身智能大智联汽车2020-2022年硬件预埋理解+运动。如UCLA两篇机器人相关论文Design of a Highly Dynamic Humanoid Robot、Development and Real-Time Optimization-based Control of a Full-sized Humanoid for Dynamic Walking and RunningAI端到端(CVPR 2023最佳论文为代表):局部尝试大模型AI的端对端自动驾驶谷歌/微软/Tesla/Meta等发力,尝试 人车互动/人机互动/自动行走2022年机器人硬件AI 视觉的3D化:Nerf/

5、BEV/占用网络AI视觉大模型:脸书:SAM/dinoV2ViT/MAE/Swin视觉+理解+运动:泛化+零样本例如谷歌RT-1/RT-2,例如李飞飞VoxPoser主要内容主要内容1.智能驾驶:端到端的算法新范式2.视觉泛化:大模型带来何种改变3.机器人:从google看算法迭代4.投资机会和标的选择451.11.1 AIAI感知:机器人感知:机器人+驾驶驾驶+具身智能的智能化曾都卡在这里具身智能的智能化曾都卡在这里检测跟踪Tracking映射地图Mapping运动预测Motion占用预测Occupancy路径规划(含防碰撞)Planner检测-激光雷达检测-毫米波雷达检测-摄像头雷达感知算

6、法毫米波雷达感知算法摄像头感知算法原始数据Raw data原始数据Raw data原始数据Raw data识别结果1识别结果2识别结果3融合算法预测&决策算法控制执行控制执行检测-激光雷达检测-毫米波雷达检测-摄像头端到端融合算法原始数据Raw data原始数据Raw data原始数据Raw data数据融合预测&决策算法控制执行检测跟踪预测L1-L2时代,大约2018年以前后融合ADAS算法L2+L3时代多种传感器崛起ADAS域控制器崛起前融合ADAS算法传感器感知算法尝试视觉+4D成像为主的传感器L3-L4时代尝试 人车互动局部尝试大模型AI的端对端自动驾驶61.21.2 AIAI感知:以

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要内容概括如下: 1. 智能驾驶:端到端的算法新范式。文章提到大模型AI的端对端自动驾驶,如谷歌/微软/Tesla/Meta等公司发力尝试,以及人车互动/人机互动/自动行走的局部尝试。 2. 视觉泛化:大模型带来何种改变。文章指出大模型AI在视觉方面的泛化能力,如谷歌PaLM-E、SAM、dinoV2等模型,以及其在自动驾驶和机器人领域的应用。 3. 机器人:从google看算法迭代。文章分析了谷歌在具身智能、AI NLP+运动控制等方面的研究,如PaLM-E、RT-1、RT-2等模型,以及其在机器人控制和导航中的应用。 4. 投资机会和标的选择。文章给出了计算机、汽车&机械、电子、通信等领域的相关公司,如德赛西威、中科创达、经纬恒润、裕太微、北京君正等,并对其进行了估值和风险分析。
智能驾驶如何实现端到端算法新范式? 大模型如何改变视觉泛化能力? 谷歌如何通过算法迭代推动机器人发展?
客服
商务合作
小程序
服务号
折叠