科技频道> 网事> 正文

开放110+顶尖能力,百度AI践行开源和开放

2018-07-05 19:48 来源:中华网 
2018-07-05 19:48:40来源:中华网作者:责任编辑:战钊

  在7月4日的百度AI开发者大会上,百度大脑3.0隆重发布。“百度大脑3.0的核心是‘多模态深度语义理解’,”百度高级副总裁、AI技术平台体系总负责人王海峰表示,多模态深度语义理解不仅能让机器听清、看清,更能深度理解真实世界,进而更好地支撑各种应用。

  “多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

  王海峰在现场演示AI如何基于视觉语义化技术看懂看世界杯。机器可以识别出比赛视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件,进而提炼出结构化语义信息。

  此外,百度大脑视觉语义化技术还能被运用到无人超市中去——无人超市等新零售场景中,视觉语义化技术可以准确识别顾客“拿起商品”、“放下商品”、“将商品从A处放到B处”等行为,从而判断用户购买了哪些商品,并在用户离店时通过人脸支付主动扣款。

  “小度小度,我要从三里屯的团结湖地铁站出发路过望京的家乐福然后再去南锣鼓巷最后到我家我要红绿灯少的不堵车的最快的路线你帮我路线规划一下吧!”

  王海峰现场对着百度地图说出了一长串绕口令般的导航需求,百度地图语音智能助手完美识别并给出最佳路线。而李彦宏开场播放的智能客服给参会者打电话的片段,其背后同样是百度大脑的语音语义一体化技术在支撑。语音语义一体化技术,配合WaveNet+拼接情感语义合成技术,可以提高语音识别的流畅度以及自然度。

  “我们研发最顶尖的AI技术,我们也致力于开放最顶尖的AI技术。”王海峰表示,“百度大脑3.0已经对外开放了110多项领先的AI能力。未来百度将继续研发顶尖的AI技术,同时全面赋能开发者,让每一位开发者都能平等便捷地获取AI能力。”

  据悉,从去年11月份百度世界大会到现在,百度语音能力的调用次数增长了94%,视觉能力日调用量增长了416%,自然语言处理日调用次数增长了180%。此外,视觉中的人脸识别技术,调用次数更是涨了近8倍。

[责任编辑:战钊]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有