《4.AI + AR的实践与趋势-许德刚.pdf》由会员分享,可在线阅读,更多相关《4.AI + AR的实践与趋势-许德刚.pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、蚂蚁终端体验科技大会AI+AR 的实践与趋势许德刚 Rokid 产品负责人/01/02/03AR 眼镜是 AI 的最佳载体Rokid 产品实践AI+AR 的软硬件趋势 AR眼镜可以作为人体器官的延伸,看人所看,听人所听,通过自然对话完成人机交互。基于Rokid Glasses,Rokid在C端用户场景、B端行业场景的一些典型实践。Rokid通过对自身产品的落地探索,结合行业大趋势,总结未来几年内的软硬件趋势。GUICLINUI需求 命令 服务需求 应用 服务需求 AI 服务人机交互技术的进步是计算平台迭代的根本动力CLIGUINUIxUI 承载的命令少多界面的信息含量少多输入的指令类型指令触摸
2、/点击多模态人机交互趋势AR眼镜是AI的最佳载体感官神经纤维数量估计信息带(bps)占比估算(基于带宽)视觉约100万106-10880%(常见估计)听觉3万-5万约 3x10610%(常见估计)触觉数亿神经末梢约 108约 10%(剩余感官)嗅觉约2000万受体细胞约 107约 5%(剩余感官)味觉约1万味蕾约 106约 1%(剩余感官)感官模态的宽带(基于神经纤维数量的粗略比较)*来源为多篇综述与科普汇总,基于受体/纤维数量与典型放电率的数量级估算,精确测量参数Rokid Glasses(视觉模态)音频耳机(听觉模态)输入时间10秒10秒处理时间1.3秒1.3秒传输时间10秒(播报完毕)总
3、时间约12秒约22秒传输特性一次性显示逐字播报视觉和听觉在翻译场景下信息传递速度的对比一副全功能AR眼镜的零部件构成Rokid Glasses爆炸图户眼镜视觉DisplayCamera听觉SpeakerMic触觉Touch/Button-嗅觉-味觉-取舍让AI眼镜形态百花齐放穿戴体验性能续航续航尿崩美丽废物不存在笨重压头AR眼镜不可能三角Bolon AI 智能眼镜 Mic Speaker CameraRokid Glasses Speaker Mic Camera Display华为智能眼镜 2 Mic SpeakerEven G2 Mic Display好眼镜 好耳机 好相机 好助手科技时尚
4、 潮酷有型Rokid联合BOLON全新美学设计,时刻有型全功能智能眼镜看、拍、听、说全都有,真正的全功能智能眼镜单光机双眼显示半导体光学技术,清晰舒服,全天候佩戴舒适感近视散光都能持不同视群镜定制,拆装便,体性强好眼镜沉浸式定向声场 只属于您的乐厅 洪亮|韵律|博客,声精准精准定向拾 嘈杂环境对话依然清晰近场|远场|全向,不同场景定向拾全天候续航 乐不间断 随时在线经典使场景8时,多种续航解决案*语唤醒关闭中等频次使好机抓拍美好瞬间 记录精彩活特有竖向摄像头布局,专为记录活打造天很出,夜晚也清晰点击下,抓拍美好瞬间解放双,记录精彩活第视,所即所得多场景适应智能分辨率,兼顾效果、延迟和功耗好相机
5、Rokid Glasses 搭载多模态AI大模型,助力你生活的每一个瞬间贴身 好友 时刻助力左右AI实用工具短信、钉钉、支付宝、微信.检票、打车、快递、外卖 正常消息不打扰 重要消息不错过演讲时需要提词器 迷路时需要导航 与外国人交谈时需要翻译 实用工具一网打“镜”一句话打车、买票、点外卖 取快递、交停车费、生活缴费 支付功能和地理位置 是生活服务的入口重要消息生活服务不做基座大模型,Rokid做什么?Mobile OS以户为核的操作系统导航问答天气音乐 AI OS以AI为核的操作系统AI备忘时钟导航天程翻译题词用户用户户意图情景上下具调智能体平台能基建AI OS提示词第轮 第轮 情景上下历史
6、对话当前位置期时间天备忘录程语 图 视频流户请求LLMToolAgentAppMemoryPlatform基础模型视觉模型对话模型设置通义千问 豆包 DeepSeek 智谱通义千问 豆包 智谱连续对话 语音唤醒 清除历史对话 快捷指令Rokid搭建了意图分发、工具调用、外挂知识库、全局记忆、情景识别等能力,各家大模型都可以方便快捷的接入到Rokid Glasses电池续航基础模型响应时间Token成本已有的模态不是针对眼镜的使用场景训练的 视觉模型的 functionCall