1、处不在的语AI:创新发展与价值创造李威阿巴巴达摩院语实验室资深算法专家Contents目录01阿语AI业表现02阿语AI社会价值03产品案例:悦听智学04产品案例:智能救援技术合作0501阿语AI业表现0102国际权威研究机构IDC发布中国智能软件及应市场研究报告-2020,阿AI在语语义领域表现强劲,市场规模年增率达96.6%,在中国主要语语义商中排名第,同时,总营收跻身中国前。图来源:IDC中国智能软件及应市场研究报告-2020 阿语语义市场增速第阿AI语语义市场增速96%,中国第阿语AI、对话式AI市场份额再次位居第国际权威研究机构IDC发布中国AI云服务市场半年度研究报告,2020H1
2、。报告显示,得益于对达摩院的期投,阿AI在各技术领域增迅猛,尤其在语语领域表现强劲,其语AI、语技术、对话式AI获评7项第。继2019年H2后,阿语AI、对话式AI市场份额再次位居位。03阿语AI社会价值0204致于下代机语交互基础理论、关键技术和应系统研究作,研究领域包括语识别、语合成、语唤醒、声学设计及信号处理、声纹识别、频事件检测等。形成了覆盖电 商、新零售、司法、交通、制造等多个业的产品和解决案,为消费者、企业和政府提供质量的语交互服务。达摩院语实验室语交互智能的下个五年 处不在的语交互智能屋 公共空间 机界的变迁推动全新的硬件形态、硬件与互联的关系将被再次重塑达摩院:技术创造新商业商
3、业产品技术愿景:为阿巴巴经济体提供处不在的语交互能05产品案例 智能救援0306智能接处警解决案语音识别警情填报案背景:公安、消防、应急指挥中等单位每天会有量的事件接报,传统接处警流程为接听报警电话,确认发地点、针对主要事件等关键内容并进记录,同时基于这些信息进判断处置,调派警处置。现状问题:电话接警过程中,案件数量多、案情复杂、信息量、地址信息模糊等各种原因,极易导致警情处置慢,调配易出错等问题。解决案:通过智能语+然语处理的能,将报警电话语转写为案件结构化本,利算法段进关键信息提取,对本中的员情况、案件类型、地址信息等进抽取、纠错、补全;可通过规则要素抽取,成案情信息,从完成接处警的智能辅
4、助。覆盖省份:江苏、四川、湖北、上海、河北、吉林、浙江、安徽、东、海南、贵州、云南、陕、藏、新疆、重庆案亮点:精准的语识别引擎 持专属业、区域、场景的模型定制化 持21省以上识别 持私有化、信创环境部署 算强、并发、硬件成本低 警情分析精准,抽取填报便捷 地址、地标数据精准、完整、规范 业务分类精细度 频、热点事件统计维度 信息智能纠错能强07产品案例 悦听智学0408悦听智学-沉浸式同频互动教学体化AI打造有温度的“三个课堂”核教育产品,让每个孩都能享受优质教育资源。随着国家针对教育”双减“政策的推进,K-12教育更加明确“课堂是教学的核阵地”,更加强调“普惠性”、“公平性”和“创新性”,阿
5、沉浸式同频互动教学系列产品,深度聚焦跨域多教室常态化互动教学、OMO体化教学场景下“听得清”、“看的明”“沉浸式互动”三核需求,将达摩院智能语、声学、视觉AI技术的多年沉淀、创新和突破进度集成化封装,以“可感、可知、可”的软硬体产品,提供全空间差异清拾、智能频优化(全新RTC-3A算法)、拟化智能导播以及沉浸式视频互动新体验,助构建普惠公平的区域教学共同体。数智技术助教育公平,创造社会公益和市场价值。悦听智以PVT状态,完成个商业化项的中标和交付验收,共计89套,超20万GAAP计收;930前,协同阿云教育团队,完成四个县级项中标,共计286套克阵列产品的商业化交付;围绕国家”三个课堂“、”创
6、新课堂“等教育信息化政策,协同合作伙伴探索和构建各类应场景的产品解决案和试点样板0910技术合作05持续在语合成和语识别领域进合作 基于联邦学习的个性化TTS:提出了FedSpeech系统,利模型结构设计和两阶段串训练解决数据孤岛问题,获得了接近联邦学习的上限结果。表现情感TTS:提出了EMSpeech算法,采本到情感预测和本、情感到频的两步思路,在情感表现和控制能上获得了明显超越基线系统的效果。前正在进表现通TTS系统和向会议场景的ASR系统进深合作。Ziyue Jiang