English

科技频道> 网事> 正文

开放110+顶尖能力,百度AI践行开源和开放

2018-07-05 19:48 来源:中华网 
2018-07-05 19:48:40来源:中华网作者:责任编辑:战钊

  在7月4日的百度AI开发者大会上,百度大脑3.0隆重发布。“百度大脑3.0的核心是‘多模态深度语义理解’,”百度高级副总裁、AI技术平台体系总负责人王海峰表示,多模态深度语义理解不仅能让机器听清、看清,更能深度理解真实世界,进而更好地支撑各种应用。

  “多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

  王海峰在现场演示AI如何基于视觉语义化技术看懂看世界杯。机器可以识别出比赛视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件,进而提炼出结构化语义信息。

  此外,百度大脑视觉语义化技术还能被运用到无人超市中去——无人超市等新零售场景中,视觉语义化技术可以准确识别顾客“拿起商品”、“放下商品”、“将商品从A处放到B处”等行为,从而判断用户购买了哪些商品,并在用户离店时通过人脸支付主动扣款。

  “小度小度,我要从三里屯的团结湖地铁站出发路过望京的家乐福然后再去南锣鼓巷最后到我家我要红绿灯少的不堵车的最快的路线你帮我路线规划一下吧!”

  王海峰现场对着百度地图说出了一长串绕口令般的导航需求,百度地图语音智能助手完美识别并给出最佳路线。而李彦宏开场播放的智能客服给参会者打电话的片段,其背后同样是