自如回应“租客喝了7个月中水”:已修复,将沟通补偿方案 台风“海神”逐步北上 后期或将影响东北 快手8.0版本上线!品牌与产品全面升级 支持1080P视频上传和播放 200余名防疫人员为服贸会做现场保障 参会人员配发中药预防饮 【地评线】京彩好评:更新技术出口目录是应时应势之举 2020年服贸会9月4日开幕:参展企业数量超往年 个人可提前两天预约参观 最新数据持续向好引海外点赞中国经济复苏 全国消费扶贫月:农产品流通过程中的税收优惠政策了解一下 徐州三十一中女教师殴打辱骂多名学生 已被停职 塑料书皮真“有毒”吗?哪种最安全?听专家怎么说 正当防卫认定新规来了,5张图带你看明白! 阿达来提·艾再孜:民法典将护佑“全面小康”行稳致远 【桂声漫画】防疫学业两手抓——大学,我来了! 我国成为3月份以来全球主要服务贸易国中唯一出口增长国家 中央财政对受灾困难群体予以倾斜和优先保障 防汛救灾工作有力有序 王毅:维护南海稳定,携手化解挑战 【地评线】京彩好评:更新技术出口目录是应时应势之举 中国改革低保等现行社会救助制度 打造多层次分类救助体系 疫情之下“审判执行不停摆” 中国最高法要求确保完成全年审判执行任务 商务部:愿与日本深化防疫和经济社会发展合作 中方再驳蓬佩奥涉华无端指责:蓬佩奥之流的险恶用心早已被世人识破 2020年服贸会9月4日开幕 设置7类活动 东北抗联遗址“云展播” 感受传承历史培育家国情怀 木里矿区非法开采为镜鉴 青海层层出手宣示生态保护决心 昨天,今天!胜利,唯有胜利! 中国创新发展目标明确 在人工智能和先进制造业等方面有规划 世界旅游合作与发展大会将在京开幕 促旅游业再繁荣 美国国务院限制中国在美外交活动 外交部回应 商务部回应印度禁用中国118款APP:严重关切 坚决反对 北京开展有限空间专项执法检查 持续至9月11日 中央财政对受灾困难群体予以倾斜和优先保障 防汛救灾工作有力有序 云南省原副省长赵廷光逝世 享年89岁 应急管理部消防救援局前方指挥部完成各项任务正式撤离四川 男童泳池排便被索赔1.5万元 家长回应:不接受赔偿数额 商务部:调整发布《中国禁止出口限制出口技术目录》不针对具体企业 宇宙全尺度暗晕什么模样?8个“放大镜”接力模拟出清晰图像 250万贫困人口遭受洪涝灾害 官方紧急施措防范因灾返贫致贫 西银高铁陕西段联调联试正式启动 应急管理部自然灾害工程救援成都基地挂牌成立 跨境服务贸易负面清单何时推出?商务部:年底前将出台 内蒙古推荐50项国家重点研发计划项目获国家立项支持 “日军细菌战罪证”上线,让历史说话! 中方回应美方限制中国在美外交活动:于法无据、于理不合、于情不通 疫情阴霾渐散 外媒感受“中国式”热闹 实验室设计、人员培训……中国抗疫医疗专家组在几内亚分享这些经验 中科院科研人员在新型半导体激光器研发上取得进展 王毅将出席金砖国家外长视频会晤 三部门:防卫过当应兼具两个条件,缺一不可 5G手机首次击穿千元关口 上游芯片厂商芯片迭代速度加快 二战以来首次!CBO:美国政府债务明年将超过经济规模
您的位置:首页 >股票 >

阿里语音AI“被集成+自学习”双轮驱动

2020-07-15 18:11:57来源:第一财经

对智能音箱说“唱首歌”,一首欢快的歌会播放;对地图App说“去虹桥机场”,关于行程的路径规划会出现......

日常生活中这些新兴的应用场景,都离不开语音AI技术。

7月14日,第三方研究机构IDC公布《中国AI云服务市场半年度研究报告,2019H2》,报告显示,阿里语音AI在市场上占据主导地位,阿里语音AI在智能语音、对话式AI两个领域市场份额均为第一,市占率分别为44%和57%。

阿里云达摩院语音实验室负责人鄢志杰对第一财经记者记者总结道,阿里语音AI这几年迅速崛起,离不开两个关键词:“被集成”+“自学习”。

传统语音厂商一般做的是端到端的场景智能化,场景相对单一。以政务领域典型的庭审场景为例,语音厂商的主要任务是把整个庭审的过程转换成文字,变得结构化,然而非AI的成分在这个场景里也有很多,比如需要做法官办案系统、卷宗管理系统、开庭时屏幕展示内容的应用系统等,这一部分会分散语音厂商大量的精力。

与“自产自销”的传统语音厂商相比,阿里采用了“被集成”模式。“被集成是我们在实践中摸索出来的,指我们不去过多做非AI的内容,比如在司法领域,我们同华宇、云嘉等行业内拥有深厚积累的头部集成商合作,然后做出一套综合的法院应用系统。”鄢志杰表示。

阿里云语音的另一个特点是“自学习”。阿里云探索出来的模式是,先做出行业通用模型(比如金融、政务、手机),加上细分行业里边的数据和知识,可以迅速做出一个领域的定制化模型。

鄢志杰表示,每个行业都有资深的实践者,他们常年深耕一个领域,拥有大量的知识、数据和经验的积累,阿里云不可能快速掌握,如果所有事情都由阿里云完成,阿里云会变成实践中的“瓶颈”。因此,在语音技术落地的过程中,阿里云转变思路,升级推出“自学习”产品,即便行业实践者没有很多语音领域的专业知识,也能够用阿里云自学习的产品,通过灌注入行业内的数据和知识,就能够获得所在行业不错的语音交互效果。

“我们的颗粒度会选择到领域通用模型,加上自学习,这就是我们的边界。”鄢志杰举例称,一家银行可以先把金融领域模型拷贝过来,客户利用自学习灌一些自己的数据进去,一键训练、一键部署,这就是专门为该银行定制的金融模型。

机器需要不断训练才能提高语音交互的准确率,针对语音AI部署在何处这一行业热点话题,鄢志杰表示:“具体是由客户来发起训练的,(训练计算)跑的软件是阿里云整套的软件,如果在公共云上,硬件是在阿里云上跑的;如果在专有云,可以部署到专有云的机器里边去跑。训练出来的模型也是属于客户自己的。”

截至目前,阿里云拥有5万多家语音客户,包括中移动、中央电视台、招商银行、字节跳动、小I机器人、天猫精灵等,这些客户已通过阿里云自主开发了3万多个语音模型。

第一财经记者了解到,阿里巴巴对语音AI的研发始于iDST(阿里达摩院前身),大致可以分为两个阶段:第一个阶段从2014年底开始,当时主要响应阿里经济体内部对语音AI的巨大需求,比如淘宝、天猫、蚂蚁的客服呼叫中心开始做语音智能化改造;第二个阶段从2017开始,阿里以AI上云的方式对外输出智能语音能力,达摩院内部当时的口号叫“技术零时差上云”,即阿里所有好的AI技术都会在最短时间内通过云的方式,提供给阿里云上所有的客户,而非阿里内部专享。

关于语音技术的准确率是否到了能大规模应用的阶段,IDC分析师卢言霞告诉第一财经记者:“这主要取决于应用的场景。比如智能家居,训练的语音库相对比较简单,95%的准确率用户可能就能接受,但在工业级制造环境中,要求非常高,否则可能导致安全事故,准确率至少要98%以上。”

卢言霞认为,语音AI领域市场前景广阔,还有很多技术有待突破,比如嘈杂环境的语音交互,同时也有很多场景有待落地,除了庭审、客厅、呼叫中心、消费级产品等场景外,语音AI还会在会议服务、医疗诊疗记录转文字、泛工业等领域陆续落地。